busk-ruby-readability 1.2.10 → 1.3
Sign up to get free protection for your applications and to get access to all the features.
- data/Gemfile +4 -2
- data/Gemfile.lock +34 -10
- data/lib/readability.rb +4 -4
- data/ruby-readability.gemspec +6 -6
- data/spec/fixtures/cassettes/pages.yml +7173 -4431
- data/spec/fixtures/samples/globemail-ottawa-cuts-fragments.rb +1 -0
- data/spec/readability_spec.rb +9 -8
- metadata +20 -39
data/spec/readability_spec.rb
CHANGED
@@ -1,3 +1,5 @@
|
|
1
|
+
#encoding: UTF-8
|
2
|
+
|
1
3
|
require File.expand_path(File.join(File.dirname(__FILE__), "spec_helper"))
|
2
4
|
|
3
5
|
describe Readability do
|
@@ -245,26 +247,25 @@ describe Readability do
|
|
245
247
|
|
246
248
|
describe "meio e mensagem" do
|
247
249
|
it "should extract the news from the page" do
|
248
|
-
url = 'http://www.
|
250
|
+
url = 'http://www.meioemensagem.com.br/home/midia/noticias/20110811Revistas-elevam-vendas-e-surpreendem.html'
|
249
251
|
@uri = URI.parse(url)
|
250
252
|
response = Net::HTTP.get_response(@uri)
|
251
|
-
@parsed_page = Readability::Document.new(Nokogiri::HTML(response.body),
|
252
|
-
@uri.host, @uri.request_uri)
|
253
|
+
@parsed_page = Readability::Document.new(Nokogiri::HTML(response.body),@uri.host, @uri.request_uri)
|
253
254
|
@content = @parsed_page.content
|
254
|
-
|
255
|
-
@content.should == "<div>\n<div
|
255
|
+
|
256
|
+
@content.should == "<div><div>\n <div>\n \n \n <div>\n +\n <p>\n A Poder Hispanic foi a revista que mais cresceu, num aumento de 63,63% no período de um ano\n Crédito: Reprodução\n </p>\n </div>\n </div>\n \n <p> (*) Eis a má notícia que todos já esperavam: a circulação de revistas pagas no primeiro semestre caiu 1,35% em assinaturas e 9,15% nas vendas em bancas em relação ao mesmo período do ano passado, conforme dados divulgados pelo Audit Bureau of Circulation. Dessa forma, como é que as revistas que crescem fazem isso?</p> <p>Alguns títulos se expandem simplesmente ao absorver a publicação mais fraca. A revista que mais ganhou, a Poder Hispanic, expandiu sua circulação paga verificada em 63,63% quando a Poder assumiu os assinantes da revista Hispanic, que foi encerrada. Também a Sky, cuja expansão de 10,15% a fez a 14º. maior em crescimento no primeiro semestre, de forma semelhante se beneficiou ao assumir os assinantes da revista Skiing, que era o título-irmão da revista, ambas da Editora Bonnier.</p> <p>No entanto, outras publicações cresceram por uma série de táticas que as afetaram de diversas formas. O segundo título que mais cresceu, a revista Vanidades, aumentou o marketing direto e a publicidade na TV e acrescentou a distribuição em grades varejistas e nos mercados latino-americanos de crescimento acelerado.</p> <p>A revista Game Informer saltou em circulação paga especialmente após a Editora GameStop reforçar o programa de fidelidade, que inclui uma assinatura para o título. “Se a GameStop não tivesse melhorado seu programa de fidelização, a Game Informer não obteria essa exposição”, afirma o editor associado da Game Informer, Rob Borm.</p> <p>“Enjoy Life for Less”, a mensagem da revista All You, continua a ressoar entre os leitores ainda que a economia insista em balbuciar, diz a editora Suzanne Quint. O tráfego para o site da publicação também cresceu e oferece a venda de novas assinaturas. O Walmart também fez uma promoção reversa de preço para a All You no meio de junho, ainda que isso tenha sido válido apenas para uma edição entre seis.</p> <p>Intrigante</p> <p>O mais intrigante, no entanto, foi um programa pelo qual os blogueiros compartilham uma pequena parte da All You em troca de um pequeno valor de todas as vendas geradas. “Reconhecemos que foi aí que as conversas aconteceram”, afirma Suzanne. “Temos fãs reais entre muitos desses blogueiros que estão interessados em falar sobre tudo aos seguidores. E a minha equipe lançou este programa, depois de um grande trabalho. É um outro contribuinte”, diz.</p> <p>Whole Living, o título da Omnimedia conhecido como Body & Soul até o semestre passado, também registrou ganhos, em grande parte por ser comercializado junto com um título-irmão. “Quando mudamos o nome da revista de Body & Soul para Whole Living, em junho do ano passado, descobrimos, por testes, que a venda de Whole Living combinada com Marta Stewart Living (a outra publicação da Omnimedia) foi bem-sucedida”, afirma um porta-voz da editora. A revista Whole Living quase dobrou o número de assinaturas vendidas, combinadas com a publicação Martha Stewart Living, entre o primeiro semestre do ano passado e o primeiro semestre deste ano, explica a fonte.</p> <p>A revista Ebony perdeu a garantia dos anunciantes de novo - um padrão que começou no segundo semestre de 2009 -, mas beneficiou-se da primeira reformulação total desde 1945 e também do trabalho de consultores em circulação convocados para fazer as mudanças. Os consultores haviam diagnosticado que o título tinha campanhas de mala-direta insuficientes e preços que, às vezes, eram mais agressivos do que outras revistas.</p> <p>E a revista OK, que a American Media comprou em junho, superou uma queda de 21% em vendas únicas sobretudo ao autorizar seus agentes terceirizados de vendas de assinaturas a vender mais, avalia o vice-presidente de marketing de consumo da editora, Dave Leckey. Os novos donos, no entanto, não continuarão com essa estratégia que depende de publicidade para compensar os altos custos do papel, de impressão e distribuição. Embora tenha tido expansão, a revista não conseguiu aumentar a circulação o suficiente para garantir anunciantes.</p> <p>“Eles foram muito agressivos no primeiro semestre deste ano ao conquistar um monte de assinaturas”, diz Leckey. “Identificamos a direção a qual não queremos ir. Fomos por esse caminho antes com a revista Star e tivemos que ajustar a taxa de assinantes várias vezes”. A American Media cortou a base de assinantes da revista OK de 800 mil para 625 mil e, provavelmente, a cortará novamente para 525 mil no próximo ano, calcula Leckey.</p> <p>Entre as publicações que mais cresceram de junho do ano passado para junho deste ano estão a Poder Hispanic, com taxa de 63,63%, a Vanidades, com 63,36% de aumento na circulação, a Afar, com 44,65%, a Game Informer Magazine, com 36,45% e a Woodcraft Magazine, com 27,46%.</p> <p>(*) Nat Ives, do Advertising Age.</p>\n</div></div>"
|
256
257
|
end
|
257
258
|
end
|
258
259
|
|
259
260
|
describe "slide share" do
|
260
261
|
it 'should extract the slides' do
|
261
|
-
url = "http://www.slideshare.net/
|
262
|
+
url = "http://www.slideshare.net/shivercube/functional-nodejs"
|
262
263
|
@uri = URI.parse(url)
|
263
264
|
response = Net::HTTP.get_response(@uri)
|
264
265
|
@parsed_page = Readability::Document.new(Nokogiri::HTML(response.body), @uri.host, @uri.request_uri)
|
265
266
|
@content = @parsed_page.content
|
266
|
-
|
267
|
-
@content.should == " <div style=\"width:425px\" id=\"__ss_2606283\">\n <strong style=\"display:block;margin:12px 0 4px\">\n <a href=\"/
|
267
|
+
|
268
|
+
@content.should == " <div style=\"width:425px\" id=\"__ss_2606283\">\n <strong style=\"display:block;margin:12px 0 4px\">\n <a href=\"/shivercube/functional-nodejs\" title=\"Functional node.js\">\n Functional node.js\n </a>\n </strong>\n <object id=\"__sse2606283\" width=\"425\" height=\"355\">\n <param name=\"movie\" value=\"http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=functionalnode-js-101129115159-phpapp02&stripped_title=functional-nodejs\">\n<param name=\"allowFullScreen\" value=\"true\">\n<param name=\"allowScriptAccess\" value=\"always\">\n<embed name=\"__sse2606283\" src=\"http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=functionalnode-js-101129115159-phpapp02&stripped_title=functional-nodejs\" type=\"application/x-shockwave-flash\" allowscriptaccess=\"always\" allowfullscreen=\"true\" width=\"425\" height=\"355\"></embed></object>\n </div>"
|
268
269
|
end
|
269
270
|
end
|
270
271
|
|
metadata
CHANGED
@@ -1,34 +1,24 @@
|
|
1
|
-
--- !ruby/object:Gem::Specification
|
1
|
+
--- !ruby/object:Gem::Specification
|
2
2
|
name: busk-ruby-readability
|
3
|
-
version: !ruby/object:Gem::Version
|
4
|
-
|
5
|
-
prerelease:
|
6
|
-
segments:
|
7
|
-
- 1
|
8
|
-
- 2
|
9
|
-
- 10
|
10
|
-
version: 1.2.10
|
3
|
+
version: !ruby/object:Gem::Version
|
4
|
+
version: '1.3'
|
5
|
+
prerelease:
|
11
6
|
platform: ruby
|
12
|
-
authors:
|
7
|
+
authors:
|
13
8
|
- Fabio Mont Alegre
|
14
9
|
- Rodrigo Flores
|
15
10
|
autorequire:
|
16
11
|
bindir: bin
|
17
12
|
cert_chain: []
|
18
|
-
|
19
|
-
date: 2011-03-10 00:00:00 -03:00
|
13
|
+
date: 2011-08-11 00:00:00.000000000 -03:00
|
20
14
|
default_executable:
|
21
15
|
dependencies: []
|
22
|
-
|
23
16
|
description:
|
24
17
|
email: it-team@busk.com
|
25
18
|
executables: []
|
26
|
-
|
27
19
|
extensions: []
|
28
|
-
|
29
20
|
extra_rdoc_files: []
|
30
|
-
|
31
|
-
files:
|
21
|
+
files:
|
32
22
|
- .gitignore
|
33
23
|
- Gemfile
|
34
24
|
- Gemfile.lock
|
@@ -53,38 +43,29 @@ files:
|
|
53
43
|
has_rdoc: true
|
54
44
|
homepage: http://github.com/busk/ruby-readability
|
55
45
|
licenses: []
|
56
|
-
|
57
46
|
post_install_message:
|
58
47
|
rdoc_options: []
|
59
|
-
|
60
|
-
require_paths:
|
48
|
+
require_paths:
|
61
49
|
- lib
|
62
|
-
required_ruby_version: !ruby/object:Gem::Requirement
|
50
|
+
required_ruby_version: !ruby/object:Gem::Requirement
|
63
51
|
none: false
|
64
|
-
requirements:
|
65
|
-
- -
|
66
|
-
- !ruby/object:Gem::Version
|
67
|
-
|
68
|
-
|
69
|
-
- 0
|
70
|
-
version: "0"
|
71
|
-
required_rubygems_version: !ruby/object:Gem::Requirement
|
52
|
+
requirements:
|
53
|
+
- - ! '>='
|
54
|
+
- !ruby/object:Gem::Version
|
55
|
+
version: '0'
|
56
|
+
required_rubygems_version: !ruby/object:Gem::Requirement
|
72
57
|
none: false
|
73
|
-
requirements:
|
74
|
-
- -
|
75
|
-
- !ruby/object:Gem::Version
|
76
|
-
|
77
|
-
segments:
|
78
|
-
- 0
|
79
|
-
version: "0"
|
58
|
+
requirements:
|
59
|
+
- - ! '>='
|
60
|
+
- !ruby/object:Gem::Version
|
61
|
+
version: '0'
|
80
62
|
requirements: []
|
81
|
-
|
82
63
|
rubyforge_project:
|
83
|
-
rubygems_version: 1.
|
64
|
+
rubygems_version: 1.6.2
|
84
65
|
signing_key:
|
85
66
|
specification_version: 3
|
86
67
|
summary: A rewrite of original ruby-readability
|
87
|
-
test_files:
|
68
|
+
test_files:
|
88
69
|
- spec/fixtures/cant_read.html
|
89
70
|
- spec/fixtures/cassettes/pages.yml
|
90
71
|
- spec/fixtures/folha.html
|