RubyGems - webscour - Versions diffs - 0.1 → 0.1.1 - Mend

webscour 0.1 → 0.1.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (6) hide show

data/README.md ADDED

@@ -0,0 +1,18 @@
+WebScour
+=======
+*WebScour* is a little DSL web scraping tool.
+    require 'webscour'
+    blog = WebScour.parse('http://example.com') do
+      element :title
+    end
+    blog.title
+    #=> "Hello World"
+[See Nibbler][nibbler] for more `element` examples.
+[nibbler]: http://github.com/mislav/nibbler

data/lib/webscour.rb ADDED

@@ -0,0 +1,30 @@
+require 'rubygems'
+require 'nibbler'
+require 'nokogiri'
+require 'faraday'
+class WebScour
+  attr_accessor :uri, :document, :klass
+  def self.parse(uri, &block)
+    new(uri, &block)
+  end
+  def initialize(uri, &block)
+    @document, @uri = fetch uri
+    @klass = Class.new(Nibbler) { instance_eval(&block) }.parse(@document.body)
+  end
+  def method_missing(m)
+    @klass.send(:"#{m}")
+  end
+  private
+  def fetch(uri)
+    response = Faraday.get uri
+    if [301,302].include?(response.status)
+      uri = response.headers['location']
+      response = fetch(uri).first
+    end
+    [response, uri]
+  end
+end

data/lib/webscour/version.rb ADDED

@@ -0,0 +1,3 @@
+class WebScour
+  VERSION = "0.1.1"
+end

data/spec/spec_helper.rb ADDED

@@ -0,0 +1,5 @@
+require 'rubygems'
+require 'rspec'
+require 'fakeweb'
+require File.dirname(__FILE__) + "/../lib/webscour"

data/spec/webscour_spec.rb ADDED

@@ -0,0 +1,53 @@
+require File.dirname(__FILE__) + "/spec_helper"
+describe "WebScour" do
+  before do
+    @data = <<-HTML
+<html>
+  <head>
+    <title>Hello World</title>
+  </head>
+  <body>
+    <p>This is testing.</p>
+    <ul>
+      <li>A</li>
+      <li>B</li>
+      <li>C</li>
+    </ul>
+  </body>
+</html>
+    HTML
+    FakeWeb.register_uri(:any, "http://www.example.com", :body => @data)
+  end
+  it "should have data" do
+    @data.should_not be_nil
+    @data.should_not be_empty
+  end
+  it "should have content" do
+    resp = Faraday.get "http://www.example.com/"
+    resp.body.should_not be_empty
+    resp.body.should == @data
+  end
+  it "should have title" do
+    html = WebScour.parse("http://www.example.com/") do
+      element :title
+      element './/body/p' => :body
+      elements :ul => :list do
+        element:li => :text
+      end
+    end
+    html.title.should == "Hello World"
+    html.body.should =~ /This is testing\./
+    html.list.should be_kind_of(Array)
+    html.list.first.text.should == "A"
+  end
+end

metadata CHANGED

@@ -1,12 +1,13 @@
 --- !ruby/object:Gem::Specification
 name: webscour
 version: !ruby/object:Gem::Version
-  hash: 9
+  hash: 25
   prerelease: false
   segments:
   - 0
   - 1
-  version: "0.1"
+  - 1
+  version: 0.1.1
 platform: ruby
 authors:
 - Bryan Goines
@@ -14,7 +15,7 @@ autorequire:
 bindir: bin
 cert_chain: []
-date: 2010-11-01 00:00:00 -05:00
+date: 2010-11-06 00:00:00 -05:00
 default_executable:
 dependencies:
 - !ruby/object:Gem::Dependency
@@ -123,8 +124,12 @@ extensions: []
 extra_rdoc_files: []
-files: []
+files:
+- README.md
+- lib/webscour.rb
+- lib/webscour/version.rb
+- spec/spec_helper.rb
+- spec/webscour_spec.rb
 has_rdoc: true
 homepage: http://rubygems.org/gems/webscour
 licenses: []