busk-ruby-readability 1.2.10 → 1.3

Sign up to get free protection for your applications and to get access to all the features.
@@ -1,3 +1,4 @@
1
+ # encoding: UTF-8
1
2
 
2
3
  # Originally from http://www.theglobeandmail.com/news/national/ottawa-cuts-already-vacant-positions/article1494400/
3
4
 
@@ -1,3 +1,5 @@
1
+ #encoding: UTF-8
2
+
1
3
  require File.expand_path(File.join(File.dirname(__FILE__), "spec_helper"))
2
4
 
3
5
  describe Readability do
@@ -245,26 +247,25 @@ describe Readability do
245
247
 
246
248
  describe "meio e mensagem" do
247
249
  it "should extract the news from the page" do
248
- url = 'http://www.mmonline.com.br/noticias!noticiasOpiniao.action?idArtigo=4184'
250
+ url = 'http://www.meioemensagem.com.br/home/midia/noticias/20110811Revistas-elevam-vendas-e-surpreendem.html'
249
251
  @uri = URI.parse(url)
250
252
  response = Net::HTTP.get_response(@uri)
251
- @parsed_page = Readability::Document.new(Nokogiri::HTML(response.body),
252
- @uri.host, @uri.request_uri)
253
+ @parsed_page = Readability::Document.new(Nokogiri::HTML(response.body),@uri.host, @uri.request_uri)
253
254
  @content = @parsed_page.content
254
-
255
- @content.should == "<div>\n<div> \n <p> \n \n 21/02/2011\n \n </p>\n \n Um novo jogo se desenha\n \n Edi\347\343o 1447 do Meio &amp; Mensagem\n \n <p></p>\n <p>A principal reportagem desta edi\347\343o traz um interessante panorama sobre a disputa pelos direitos de transmiss\343o do maior produto de m\355dia da televis\343o brasileira, em virtude da decis\343o do Clube dos 13 de promover um leil\343o para as emissoras de TV aberta interessadas em transmitir o Campeonato Brasileiro no tri\352nio 2012-14. Est\341 prevista para esta semana a publica\347\343o de um edital estabelecendo as regras dessa concorr\352ncia. O que est\341 sacramentado, at\351 por conta de uma decis\343o do Cade de outubro do ano passado, \351 a divis\343o desses direitos em cinco plataformas: TV aberta, TV por assinatura, pay-per-view, internet e telefonia m\363vel.H\341 uma apreens\343o geral do mercado publicit\341rio em torno da possibilidade da transmiss\343o do Brasileir\343o migrar da Globo, onde est\341 h\341 quase duas d\351cadas, para a Record, que, com muita compet\352ncia, alardeia pelos quatro cantos que tem caminh\365es de dinheiro para bancar o aumento da oferta inicial do Clube dos 13 &#8211; de R$ 250 milh\365es para R$ 500 milh\365es, s\363 para TV. Valor inicialmente recha\347ado pela Globo.O pacote de futebol da emissora l\355der \351 o mais valorizado do mercado e tem como ponto forte justamente a entrega de m\355dia que a rede possibilita aos seus cotistas. A migra\347\343o do futebol para a Record deixa s\351rias d\372vidas:1o) se o mercado ir\341 bancar os altos investimentos necess\341rios feitos pela emissora para transmitir o campeonato, e,2o) se a segunda televis\343o do Pa\355s tem uma grade de programa\347\343o atraente a ponto de sustentar um pacote t\343o rent\341vel como hoje \351 o do futebol da Globo.A despeito da polaridade entre Globo e Record pelos direitos de transmiss\343o da TV, esse leil\343o do Clube dos 13 pode mudar de uma forma ainda maior a configura\347\343o do jogo da m\355dia atual. Ao disponibilizar a divis\343o desses direitos em cinco modalidades, entre as quais internet e telefonia celular, abre-se uma grande oportunidade para as empresas de telecomunica\347\365es entrarem para valer nesse neg\363cio.Em um cen\341rio no qual os dispositivos m\363veis como os tablets crescem de forma exponencial no Brasil e no mundo &#8211; s\363 para se ter uma ideia, no Mobile World Congress, realizado semana passada em Barcelona, cerca de 50 fabricantes lan\347aram concorrentes do iPad &#8211;, e o governo tem como prioridade na \341rea de comunica\347\365es democratizar o acesso \340 banda larga, a mobilidade \351 um ponto important\355ssimo a ser levado em conta no cipoal de possibilidades que se desenha neste cen\341rio. Por raz\365es \363bvias, as empresas de telecomunica\347\365es podem se tornar ainda mais poderosas caso passem a abarcar em seus pacotes de oferta tamb\351m os jogos do Brasileir\343o. Terra/Telef\364nica e iG/Oi j\341 se sentaram com os caciques do Clube dos 13 para apresentarem suas propostas sobre o assunto.Nessas discuss\365es todas, parece que uma parte fundamental deste neg\363cio est\341 sendo deixada de lado: o torcedor. N\343o h\341 d\372vida de que o mundo digital e, em especial, as m\355dias sociais, deram muito mais poder aos torcedores, transformando a rela\347\343o antes linear entre f\343s, \355dolos, clubes e marcas. Experi\352ncias internacionais e algumas ainda incipientes por aqui demonstram que eles est\343o dispostos a pagar por algo que enxerguem como valor. Diante disso, saber a melhor forma de se relacionar com eles \351 mais do que estrat\351gico, \351 fundamental nesse novo jogo que se desenha.</p>\n <div>\n <p>Publicidade</p>\n <div>\n \n \n \n </div>\n </div>\n \n \n \n </div>\n<div>\n Editorial\n <p>\n Regina Augusto\n </p>\n \n \n \n \n </div>\n</div>"
255
+
256
+ @content.should == "<div><div>\n <div>\n \n \n <div>\n +\n <p>\n A Poder Hispanic foi a revista que mais cresceu, num aumento de 63,63% no período de um ano\n Crédito: Reprodução\n </p>\n </div>\n </div>\n \n <p> (*) Eis a notícia que todos esperavam: a circulação de revistas pagas no primeiro semestre caiu 1,35% em assinaturas e 9,15% nas vendas em bancas em relação ao mesmo período do ano passado, conforme dados divulgados pelo Audit Bureau of Circulation. Dessa forma, como é que as revistas que crescem fazem isso?</p> <p>Alguns títulos se expandem simplesmente ao absorver a publicação mais fraca. A revista que mais ganhou, a Poder Hispanic, expandiu sua circulação paga verificada em 63,63% quando a Poder assumiu os assinantes da revista Hispanic, que foi encerrada. Também a Sky, cuja expansão de 10,15% a fez a 14º. maior em crescimento no primeiro semestre, de forma semelhante se beneficiou ao assumir os assinantes da revista Skiing, que era o título-irmão da revista, ambas da Editora Bonnier.</p> <p>No entanto, outras publicações cresceram por uma série de táticas que as afetaram de diversas formas. O segundo título que mais cresceu, a revista Vanidades, aumentou o marketing direto e a publicidade na TV e acrescentou a distribuição em grades varejistas e nos mercados latino-americanos de crescimento acelerado.</p> <p>A revista Game Informer saltou em circulação paga especialmente após a Editora GameStop reforçar o programa de fidelidade, que inclui uma assinatura para o título. “Se a GameStop não tivesse melhorado seu programa de fidelização, a Game Informer não obteria essa exposição”, afirma o editor associado da Game Informer, Rob Borm.</p> <p>“Enjoy Life for Less”, a mensagem da revista All You, continua a ressoar entre os leitores ainda que a economia insista em balbuciar, diz a editora Suzanne Quint. O tráfego para o site da publicação também cresceu e oferece a venda de novas assinaturas. O Walmart também fez uma promoção reversa de preço para a All You no meio de junho, ainda que isso tenha sido válido apenas para uma edição entre seis.</p> <p>Intrigante</p> <p>O mais intrigante, no entanto, foi um programa pelo qual os blogueiros compartilham uma pequena parte da All You em troca de um pequeno valor de todas as vendas geradas. “Reconhecemos que foi aí que as conversas aconteceram”, afirma Suzanne. “Temos fãs reais entre muitos desses blogueiros que estão interessados em falar sobre tudo aos seguidores. E a minha equipe lançou este programa, depois de um grande trabalho. É um outro contribuinte”, diz.</p> <p>Whole Living, o título da Omnimedia conhecido como Body &amp; Soul até o semestre passado, também registrou ganhos, em grande parte por ser comercializado junto com um título-irmão. “Quando mudamos o nome da revista de Body &amp; Soul para Whole Living, em junho do ano passado, descobrimos, por testes, que a venda de Whole Living combinada com Marta Stewart Living (a outra publicação da Omnimedia) foi bem-sucedida”, afirma um porta-voz da editora. A revista Whole Living quase dobrou o número de assinaturas vendidas, combinadas com a publicação Martha Stewart Living, entre o primeiro semestre do ano passado e o primeiro semestre deste ano, explica a fonte.</p> <p>A revista Ebony perdeu a garantia dos anunciantes de novo - um padrão que começou no segundo semestre de 2009 -, mas beneficiou-se da primeira reformulação total desde 1945 e também do trabalho de consultores em circulação convocados para fazer as mudanças. Os consultores haviam diagnosticado que o título tinha campanhas de mala-direta insuficientes e preços que, às vezes, eram mais agressivos do que outras revistas.</p> <p>E a revista OK, que a American Media comprou em junho, superou uma queda de 21% em vendas únicas sobretudo ao autorizar seus agentes terceirizados de vendas de assinaturas a vender mais, avalia o vice-presidente de marketing de consumo da editora, Dave Leckey. Os novos donos, no entanto, não continuarão com essa estratégia que depende de publicidade para compensar os altos custos do papel, de impressão e distribuição. Embora tenha tido expansão, a revista não conseguiu aumentar a circulação o suficiente para garantir anunciantes.</p> <p>“Eles foram muito agressivos no primeiro semestre deste ano ao conquistar um monte de assinaturas”, diz Leckey. “Identificamos a direção a qual não queremos ir. Fomos por esse caminho antes com a revista Star e tivemos que ajustar a taxa de assinantes várias vezes”. A American Media cortou a base de assinantes da revista OK de 800 mil para 625 mil e, provavelmente, a cortará novamente para 525 mil no próximo ano, calcula Leckey.</p> <p>Entre as publicações que mais cresceram de junho do ano passado para junho deste ano estão a Poder Hispanic, com taxa de 63,63%, a Vanidades, com 63,36% de aumento na circulação, a Afar, com 44,65%, a Game Informer Magazine, com 36,45% e a Woodcraft Magazine, com 27,46%.</p> <p>(*) Nat Ives, do Advertising Age.</p>\n</div></div>"
256
257
  end
257
258
  end
258
259
 
259
260
  describe "slide share" do
260
261
  it 'should extract the slides' do
261
- url = "http://www.slideshare.net/plataformatec/classificao-de-textos-dev-in-sampa-28nov2009"
262
+ url = "http://www.slideshare.net/shivercube/functional-nodejs"
262
263
  @uri = URI.parse(url)
263
264
  response = Net::HTTP.get_response(@uri)
264
265
  @parsed_page = Readability::Document.new(Nokogiri::HTML(response.body), @uri.host, @uri.request_uri)
265
266
  @content = @parsed_page.content
266
-
267
- @content.should == " <div style=\"width:425px\" id=\"__ss_2606283\">\n <strong style=\"display:block;margin:12px 0 4px\">\n <a href=\"/plataformatec/classificao-de-textos-dev-in-sampa-28nov2009\" title=\"Classifica\303\247\303\243o de textos - Dev in Sampa - 28nov2009\">\n Classifica\303\247\303\243o de textos - Dev in Sampa - 28nov2009\n </a>\n </strong>\n <object id=\"__sse2606283\" width=\"425\" height=\"355\">\n <param name=\"movie\" value=\"http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=devinsampa-2009mini-091129060000-phpapp01&amp;stripped_title=classificao-de-textos-dev-in-sampa-28nov2009\">\n<param name=\"allowFullScreen\" value=\"true\">\n<param name=\"allowScriptAccess\" value=\"always\">\n<embed name=\"__sse2606283\" src=\"http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=devinsampa-2009mini-091129060000-phpapp01&amp;stripped_title=classificao-de-textos-dev-in-sampa-28nov2009\" type=\"application/x-shockwave-flash\" allowscriptaccess=\"always\" allowfullscreen=\"true\" width=\"425\" height=\"355\"></embed></object>\n </div>"
267
+
268
+ @content.should == " <div style=\"width:425px\" id=\"__ss_2606283\">\n <strong style=\"display:block;margin:12px 0 4px\">\n <a href=\"/shivercube/functional-nodejs\" title=\"Functional node.js\">\n Functional node.js\n </a>\n </strong>\n <object id=\"__sse2606283\" width=\"425\" height=\"355\">\n <param name=\"movie\" value=\"http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=functionalnode-js-101129115159-phpapp02&amp;stripped_title=functional-nodejs\">\n<param name=\"allowFullScreen\" value=\"true\">\n<param name=\"allowScriptAccess\" value=\"always\">\n<embed name=\"__sse2606283\" src=\"http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=functionalnode-js-101129115159-phpapp02&amp;stripped_title=functional-nodejs\" type=\"application/x-shockwave-flash\" allowscriptaccess=\"always\" allowfullscreen=\"true\" width=\"425\" height=\"355\"></embed></object>\n </div>"
268
269
  end
269
270
  end
270
271
 
metadata CHANGED
@@ -1,34 +1,24 @@
1
- --- !ruby/object:Gem::Specification
1
+ --- !ruby/object:Gem::Specification
2
2
  name: busk-ruby-readability
3
- version: !ruby/object:Gem::Version
4
- hash: 11
5
- prerelease: false
6
- segments:
7
- - 1
8
- - 2
9
- - 10
10
- version: 1.2.10
3
+ version: !ruby/object:Gem::Version
4
+ version: '1.3'
5
+ prerelease:
11
6
  platform: ruby
12
- authors:
7
+ authors:
13
8
  - Fabio Mont Alegre
14
9
  - Rodrigo Flores
15
10
  autorequire:
16
11
  bindir: bin
17
12
  cert_chain: []
18
-
19
- date: 2011-03-10 00:00:00 -03:00
13
+ date: 2011-08-11 00:00:00.000000000 -03:00
20
14
  default_executable:
21
15
  dependencies: []
22
-
23
16
  description:
24
17
  email: it-team@busk.com
25
18
  executables: []
26
-
27
19
  extensions: []
28
-
29
20
  extra_rdoc_files: []
30
-
31
- files:
21
+ files:
32
22
  - .gitignore
33
23
  - Gemfile
34
24
  - Gemfile.lock
@@ -53,38 +43,29 @@ files:
53
43
  has_rdoc: true
54
44
  homepage: http://github.com/busk/ruby-readability
55
45
  licenses: []
56
-
57
46
  post_install_message:
58
47
  rdoc_options: []
59
-
60
- require_paths:
48
+ require_paths:
61
49
  - lib
62
- required_ruby_version: !ruby/object:Gem::Requirement
50
+ required_ruby_version: !ruby/object:Gem::Requirement
63
51
  none: false
64
- requirements:
65
- - - ">="
66
- - !ruby/object:Gem::Version
67
- hash: 3
68
- segments:
69
- - 0
70
- version: "0"
71
- required_rubygems_version: !ruby/object:Gem::Requirement
52
+ requirements:
53
+ - - ! '>='
54
+ - !ruby/object:Gem::Version
55
+ version: '0'
56
+ required_rubygems_version: !ruby/object:Gem::Requirement
72
57
  none: false
73
- requirements:
74
- - - ">="
75
- - !ruby/object:Gem::Version
76
- hash: 3
77
- segments:
78
- - 0
79
- version: "0"
58
+ requirements:
59
+ - - ! '>='
60
+ - !ruby/object:Gem::Version
61
+ version: '0'
80
62
  requirements: []
81
-
82
63
  rubyforge_project:
83
- rubygems_version: 1.3.7
64
+ rubygems_version: 1.6.2
84
65
  signing_key:
85
66
  specification_version: 3
86
67
  summary: A rewrite of original ruby-readability
87
- test_files:
68
+ test_files:
88
69
  - spec/fixtures/cant_read.html
89
70
  - spec/fixtures/cassettes/pages.yml
90
71
  - spec/fixtures/folha.html