RubyGems - rfeedreader - Versions diffs - 0.1.0 → 0.9.0 - Mend

rfeedreader 0.1.0 → 0.9.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (7) hide show

data/History.txt CHANGED Viewed

@@ -1,3 +1,8 @@
+== 0.9.0 2007-09-01
+* Beta release, ready for production test
+* All unit test working
 == 0.1.0 2007-09-01
 * Initial release

data/lib/rfeedreader/version.rb CHANGED Viewed

@@ -1,7 +1,7 @@
 module Rfeedreader #:nodoc:
   module VERSION #:nodoc:
     MAJOR = 0
-    MINOR = 1
+    MINOR = 9
     TINY  = 0
     STRING = [MAJOR, MINOR, TINY].join('.')

data/lib/rfeedreader.rb CHANGED Viewed

@@ -15,6 +15,7 @@ module Rfeedreader
     def initialize(link, hpricot_doc)
       @link = link
+      puts "link: #{link}"
       read_title hpricot_doc
       read_charset hpricot_doc
       @entries = []
@@ -61,6 +62,7 @@ module Rfeedreader
       @charset = hpricot_doc.to_s.scan(/encoding=['"]?([^'"]*)['" ]/)
       @charset = @charset[0] if @charset.is_a? Array
       @charset = @charset.to_s.downcase
+      @charset = 'utf-8' if @charset.empty?
     end
     def read_title(hpricot_doc)
@@ -78,73 +80,79 @@ module Rfeedreader
   end
   class Entry
-    attr_accessor :title, :link, :description, :charset
+    attr_accessor :title, :link, :description, :charset, :hpricot_item
     def initialize(item, charset)
+      @hpricot_item = item
       @charset = charset
-      @link = read_link item
-      @title = read_title item
-      @description = read_description item
+      # Setup attributes
+      read_link
+      read_title
+      read_description
     end
     # Return the rss item link
-    def read_link(item)
-      post_url = nil
-      if link = item.search("link:first")
-        post_url = link.text
-        post_url = link.to_s.scan(/href=['"]?([^'"]*)['" ]/).to_s if (post_url.nil? or post_url.empty?)
+    def read_link
+      @link = nil
+      if link = (@hpricot_item/"link")[0]
+        @link = link.to_s.scan(/(http:\/\/.[^<\"]*)/).to_s
       end
-      return post_url
     end
-    def read_title(item)
-      return TextyHelper::convertEncoding((item/:title).text, @charset).downcase
+    def read_title
+      @title = TextyHelper::convertEncoding((@hpricot_item/:title).text, @charset).downcase
     end
-    def read_description(item)
-      description = (item/"description|summary|content|[@type='text']").text
-     if description.include? "&lt;"
-        description = HTMLEntities.decode_entities(description)
-      else
-        description = HTMLEntities.encode_entities(description, :named, :decimal) if @charset == 'utf-8'
+    def read_description
+      @description = ""
+      @description = (@hpricot_item/"content").text
+      @description = (@hpricot_item/"content\:encoded").text if @description.empty?
+      @description = (@hpricot_item/"description|summary|[@type='text']").text if @description.empty?
+      unless @description.empty?
+        @description = HTMLEntities.encode_entities(@description, :named, :decimal)
+        @description.gsub!("&#10;", "")
+        @description.gsub!("&#13;", "")
+        @description.strip!
+        @description = TextyHelper::clean(TextyHelper::convertEncoding(@description, @charset), 200)
+        @description.gsub!(/((https?):\/\/([^\/]+)\/(.*))/, '[<a href=\'\1\'>link</a>]')
+        @description.strip!
       end
-      description = TextyHelper::clean(TextyHelper::convertEncoding(description, @charset), 200) unless description.empty?
-      description.gsub!(/((https?):\/\/([^\/]+)\/(.*))/, '[<a href=\'\1\'>link</a>]') unless description.empty?
-      return description.strip
     end
     def to_s
-      "Entry: title: #{title} - link: #{link}\n\rdescription: #{description}"
+      "Entry: title: #{@title} - link: #{@link}\n\rdescription: #{@description}"
     end
   end
   class Entry_Flickr<Entry
-    def read_description(item)
-      image = item.search("media:thumbnail").to_s.scan(/url=['"]?([^'"]*)['" ]/).to_s
-      image = item.search("content|description").text.scan(/(http:\/\/farm.*_.\.jpg)/).to_s if image.nil? or image.empty?
+    def read_description
+      image = @hpricot_item.search("media:thumbnail").to_s.scan(/url=['"]?([^'"]*)['" ]/).to_s
+      image = @hpricot_item.search("content|description").text.scan(/(http:\/\/farm.*_.\.jpg)/).to_s if image.nil? or image.empty?
       image.gsub!(/_.\.jpg/,"_t.jpg")
-      return "<a href='#{@link}' class='image_link'><img src='#{image}' class='flickr_image'/></a><br/>"
+      @description = "<a href='#{@link}' class='image_link'><img src='#{image}' class='flickr_image'/></a><br/>"
     end
   end
   class Entry_Fotolog<Entry
-    def read_description(item)
-      image = item.search("media:thumbnail").to_s.scan(/url=['"]?([^'"]*)['" ]/).to_s
-      return "<a href='#{@link}' class='image_link'><img src='#{image}' class='post_image'/></a>"
+    def read_description
+      image = @hpricot_item.search("media:thumbnail").to_s.scan(/url=['"]?([^'"]*)['" ]/).to_s
+      @description = "<a href='#{@link}' class='image_link'><img src='#{image}' class='post_image'/></a>"
     end
   end
   class Entry_Google_Video<Entry
-    def read_description(item)
-      image = item.search("media:thumbnail").to_s.scan(/url=['"]?([^'"]*)['" ]/).to_s.gsub(/&amp;/, '&')
-      return "<a href='#{@link}' class='image_link'><img src='#{image}' class='google_video_image' width='160px' height='160px'/></a><br/>"
+    def read_description
+      image = @hpricot_item.search("media:thumbnail").to_s.scan(/url=['"]?([^'"]*)['" ]/).to_s.gsub(/&amp;/, '&')
+      @description = "<a href='#{@link}' class='image_link'><img src='#{image}' class='google_video_image' width='160px' height='160px'/></a><br/>"
     end
   end
   class Entry_Jumpcut<Entry
-    def read_description(item)
-      image = item.search("description").to_s.scan(/src=['"]?([^'"]*)['" ]/).to_s
-      return "<a href='#{@link}' class='image_link'><img src='#{image}' class='jumpcut_image' width='160px' height='120px'/></a><br/>"
+    def read_description
+      image = @hpricot_item.search("description").to_s.scan(/src=['"]?([^'"]*)['" ]/).to_s
+      @description = "<a href='#{@link}' class='image_link'><img src='#{image}' class='jumpcut_image' width='160px' height='120px'/></a><br/>"
     end
   end
@@ -158,13 +166,14 @@ module Rfeedreader
   def read(uri, nb_posts=10)
     link = Rfeedfinder::feed(uri)
-    doc = open_doc(link)
+    unless link.nil?
+      doc = open_doc(link)
-    unless doc.nil?
-      feed = Feed.new(link, doc)
-      entries = feed.parse_entries(doc, nb_posts)
+      unless doc.nil?
+        feed = Feed.new(link, doc)
+        entries = feed.parse_entries(doc, nb_posts)
+      end
     end
     return feed
   end

data/test/test_helper.rb CHANGED Viewed

@@ -5,4 +5,12 @@ def read_feed(feed_url)
   feed = Rfeedreader.read(feed_url)
   assert_not_nil feed
   return feed
+end
+def read_first(feed_url)
+  puts "Read first from #{feed_url}"
+  feed = Rfeedreader.read_first feed_url
+  assert_not_nil feed
+  assert_equal 1, feed.entries.size
+  feed.display_entries
 end

data/test/test_rfeedreader.rb CHANGED Viewed

@@ -41,118 +41,75 @@ class TestRfeedreader < Test::Unit::TestCase
     feed.display_entries
   end
-  def test_read_lots
-    feed = Rfeedreader.read_first "http://rss.jumpcut.com/rss/user?u_id=17C65AB8A6EF11DBBE093EF340157CF2"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://rss.jumpcut.com/rss/user?u_id=db9ec418fdaf11db8198000423cef5f6"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://organizandolaesperanza.blogspot.com"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://skblackburn.blogspot.com/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://nadapersonal.blogspot.com"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://diariodeunadislexica.blogspot.com/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://diputadodelosverdes.blogspot.com/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://cinclin.blogspot.com/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://claudiaramos.blogspot.com/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://lacomunidad.elpais.com/krismontesinos/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://www.becker-posner-blog.com/index.rdf"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://rss.slashdot.org/Slashdot/slashdot"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://planeta.lamatriz.org/feed/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://edubloggers.blogspot.com/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://www.deugarte.com/feed/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://www.twitter.com/alx/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://alemama.blogspot.com"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://seedmagazine.com/news/atom-focus.xml"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://bitacora.feevy.com"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://www.enriquemeneses.com/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://ianasagasti.blogs.com/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://www.ecoperiodico.com/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://bloc.balearweb.net/rss.php?summary=1"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://www.antoniobezanilla.com/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://www.joselopezorozco.com/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://minijoan.vox.com/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://www.dosdedosdefrente.com/blog/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://www.deugarte.com/blog/fabbing/feed"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://www.papelenblanco.com/autor/sergio-fernandez/rss2.xml"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://sombra.lamatriz.org/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://tristezza0.spaces.live.com/feed.rss"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://lacoctelera.com/macadamia"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://www.liberation.fr"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://juxtaprose.com/posts/good-web-20-critique/feed/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://www.gara.net/rss/kultura"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://davicius.wordpress.com/feed/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://www.cato-at-liberty.org/wp-rss.php"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://creando.bligoo.com/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://feeds.feedburner.com/37signals/beMH"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://www.takingitglobal.org/connections/tigblogs/feed.rss?UserID=251"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://www.rubendomfer.com/blog/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://www.arfues.net/weblog/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://www.lkstro.com/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://www.lorenabetta.info"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://www.adesalambrar.info/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://www.bufetalmeida.com/rss.xml"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://dreams.draxus.org/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://mephisto.sobrerailes.com/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://www.fotolog.com/darth_fonsu/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://www.fotolog.com/darth_fonsu/feed/main/rss20"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://www1.fotolog.com/mad_lux"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://www1.fotolog.com/kel_06/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://video.google.com/videosearch?hl=en&safe=off&q=the+office"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://voxd.blogsome.com/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://andreja666.bloger.hr/"
-    assert_equal 1, feed.entries.size
-    feed = Rfeedreader.read_first "http://blog.zvents.com/"
-    assert_equal 1, feed.entries.size
+  def test_read_from_feevy
+    # read_first "http://rss.jumpcut.com/rss/user?u_id=17C65AB8A6EF11DBBE093EF340157CF2"
+    # read_first "http://rss.jumpcut.com/rss/user?u_id=db9ec418fdaf11db8198000423cef5f6"
+    # read_first "http://organizandolaesperanza.blogspot.com"
+    # read_first "http://skblackburn.blogspot.com/"
+    # read_first "http://nadapersonal.blogspot.com"
+    # read_first "http://diariodeunadislexica.blogspot.com/"
+    # read_first "http://diputadodelosverdes.blogspot.com/"
+    # read_first "http://cinclin.blogspot.com/"
+    # read_first "http://claudiaramos.blogspot.com/"
+    # read_first "http://lacomunidad.elpais.com/krismontesinos/"
+    # read_first "http://www.becker-posner-blog.com/index.rdf"
+    # read_first "http://rss.slashdot.org/Slashdot/slashdot"
+    # read_first "http://planeta.lamatriz.org/feed/"
+    # read_first "http://edubloggers.blogspot.com/"
+    # read_first "http://www.deugarte.com/feed/"
+    # read_first "http://www.twitter.com/alx/"
+    # read_first "http://alemama.blogspot.com"
+    # read_first "http://seedmagazine.com/news/atom-focus.xml"
+    # read_first "http://bitacora.feevy.com"
+    # read_first "http://www.enriquemeneses.com/"
+    read_first "http://ianasagasti.blogs.com/"
+    read_first "http://www.ecoperiodico.com/"
+    read_first "http://bloc.balearweb.net/rss.php?summary=1"
+    read_first "http://www.antoniobezanilla.com/"
+    read_first "http://www.joselopezorozco.com/"
+    read_first "http://www.dosdedosdefrente.com/blog/"
+    read_first "http://www.deugarte.com/blog/fabbing/feed"
+    read_first "http://www.papelenblanco.com/autor/sergio-fernandez/rss2.xml"
+    read_first "http://sombra.lamatriz.org/"
+    read_first "http://tristezza0.spaces.live.com/feed.rss"
+    read_first "http://www.liberation.fr"
+    read_first "http://juxtaprose.com/posts/good-web-20-critique/feed/"
+    read_first "http://www.gara.net/rss/kultura"
+    read_first "http://davicius.wordpress.com/feed/"
+    read_first "http://www.cato-at-liberty.org/wp-rss.php"
+    read_first "http://creando.bligoo.com/"
+    read_first "http://feeds.feedburner.com/37signals/beMH"
+    read_first "http://www.takingitglobal.org/connections/tigblogs/feed.rss?UserID=251"
+    read_first "http://www.rubendomfer.com/blog/"
+    read_first "http://www.arfues.net/weblog/"
+    read_first "http://www.lkstro.com/"
+    read_first "http://www.lorenabetta.info"
+    read_first "http://www.adesalambrar.info/"
+    read_first "http://www.bufetalmeida.com/rss.xml"
+    read_first "http://dreams.draxus.org/"
+    read_first "http://mephisto.sobrerailes.com/"
+    read_first "http://video.google.com/videosearch?hl=en&safe=off&q=the+office"
+    read_first "http://voxd.blogsome.com/"
+    read_first "http://blog.zvents.com/"
+  end
+  def test_read_content_encoded
+    read_first "http://www.lacoctelera.com/macadamia/feeds/rss2"
+  end
+  def test_read_link_empty
+    read_first "http://minijoan.vox.com/library/posts/atom.xml"
+  end
+  def test_read_type_error
+    read_first "http://www0.fotolog.com/darth_fonsu/feed/main/rss20"
+  end
+  def test_read_twitter
+    read_first "http://twitter.com/statuses/friends_timeline/534023.rss"
+  end
+  def test_encoding_error
+    read_first "http://www.adesalambrar.info/feed/"
   end
-end
+end

data/website/index.html CHANGED Viewed

@@ -33,7 +33,7 @@
     <h1>rfeedreader</h1>
     <div id="version" class="clickable" onclick='document.location = "http://rubyforge.org/projects/rfeedreader"; return false'>
       <p>Get Version</p>
-      <a href="http://rubyforge.org/projects/rfeedreader" class="numbers">0.1.0</a>
+      <a href="http://rubyforge.org/projects/rfeedreader" class="numbers">0.9.0</a>
     </div>
     <h2>What</h2>

metadata CHANGED Viewed

@@ -3,7 +3,7 @@ rubygems_version: 0.9.4
 specification_version: 1
 name: rfeedreader
 version: !ruby/object:Gem::Version
-  version: 0.1.0
+  version: 0.9.0
 date: 2007-09-01 00:00:00 +02:00
 summary: Feed parser to read feed and return first posts of this feed. Special parsing from sources like Flickr, Jumcut, Google video, ...
 require_paths: