RubyGems - preadly-bulbasaur - Versions diffs - 0.1.0 - Mend

preadly-bulbasaur 0.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (21) hide show

checksums.yaml +7 -0
data/Rakefile +11 -0
data/bulbasaur.gemspec +23 -0
data/lib/bulbasaur/extract_text_from_html.rb +7 -0
data/lib/bulbasaur/extracts/extract_images_from_all_resources.rb +44 -0
data/lib/bulbasaur/extracts/extract_images_from_html.rb +43 -0
data/lib/bulbasaur/extracts/extract_images_from_vimeo.rb +34 -0
data/lib/bulbasaur/extracts/extract_images_from_youtube.rb +32 -0
data/lib/bulbasaur/replaces/replace_by_tag_image.rb +21 -0
data/lib/bulbasaur/utils/normalize_url.rb +21 -0
data/lib/bulbasaur/version.rb +10 -0
data/lib/bulbasaur.rb +13 -0
data/spec/bulbasaur/extracts/extract_images_from_all_resources_spec.rb +42 -0
data/spec/bulbasaur/extracts/extract_images_from_html_spec.rb +91 -0
data/spec/bulbasaur/extracts/extract_images_from_vimeo_spec.rb +60 -0
data/spec/bulbasaur/extracts/extract_images_from_youtube_spec.rb +59 -0
data/spec/bulbasaur/replaces/replace_by_tag_image_spec.rb +58 -0
data/spec/bulbasaur/utils/normalize_url_spec.rb +79 -0
data/spec/bulbasaur_spec.rb +13 -0
data/spec/spec_helper.rb +14 -0
metadata +126 -0

checksums.yaml ADDED Viewed

@@ -0,0 +1,7 @@
+---
+SHA1:
+  metadata.gz: 18d9a3fbb6070fcd08bef48ec132e2aad608844a
+  data.tar.gz: 76a06d3388fb891a8ce067f9e8305a5ef6c317af
+SHA512:
+  metadata.gz: 347b7a826abc28ddedeb50985b09794f5199a9361c15fce10833831ff4b24adde43b83a7f23921a90aa284e77151761ce23ae4e7dcb40b3e84c5102e013f14a9
+  data.tar.gz: eb94820268a8855a67bbfec08a47e4de513cc5d5cbd3967885dfa96e76b45396a8381fdfdd4f36aa670ef4804327da26272dbb8d9583b6121a0271d23b7b4cba

data/Rakefile ADDED Viewed

@@ -0,0 +1,11 @@
+require 'bundler/gem_tasks'
+$stdout.sync = true
+desc 'Open Bulbasaur pry console'
+task :console do
+  require 'pry'
+  require 'bulbasaur'
+  ARGV.clear
+  Pry.start
+end

data/bulbasaur.gemspec ADDED Viewed

@@ -0,0 +1,23 @@
+# coding: utf-8
+lib = File.expand_path('../lib', __FILE__)
+$LOAD_PATH.unshift(lib) unless $LOAD_PATH.include?(lib)
+require './lib/bulbasaur/version'
+Gem::Specification.new do |spec|
+  spec.name          = "preadly-bulbasaur"
+  spec.version       = Bulbasaur::Version::STRING
+  spec.authors       = ["Magno Costa"]
+  spec.email         = ["magnocosta.br@gmail.com"]
+  spec.description = spec.summary = %q(Bulbasaur is a helper for crawler operations used in Pread.ly)
+  spec.homepage      = "https://github.com/preadly/bulbasaur"
+  spec.files         = Dir["{lib/**/*.rb,README.rdoc,spec/**/*.rb,Rakefile,*.gemspec}"]
+  spec.test_files    = spec.files.grep(%r{^(test|spec|features)/})
+  spec.require_paths = ["lib"]
+  spec.add_development_dependency "bundler", "~> 1.6"
+  spec.add_development_dependency "rake", "~> 10.4"
+  spec.add_development_dependency "rspec", "~> 3.3"
+  spec.add_dependency "nokogiri", "~> 1.6"
+end

data/lib/bulbasaur/extract_text_from_html.rb ADDED Viewed

@@ -0,0 +1,7 @@
+module Operations::ExtractTextFromHtml
+  require "nokogiri"
+  def self.call(html)
+    Nokogiri::HTML(html).inner_text.to_s
+  end
+end

data/lib/bulbasaur/extracts/extract_images_from_all_resources.rb ADDED Viewed

@@ -0,0 +1,44 @@
+module Bulbasaur
+  class ExtractImagesFromAllResources
+    def initialize(html)
+      @html = html
+    end
+    def call
+      images = Array.new
+      images = images + extract_images_html(@html)
+      images = images + extract_images_youtube(@html)
+      images = images + extract_images_vimeo(@html)
+      images
+    end
+    private
+    def extract_images_youtube(html)
+      begin
+        Bulbasaur::ExtractImagesFromYoutube.new(html).call
+      rescue Exception => e
+        []
+      end
+    end
+    def extract_images_html(html)
+      begin
+        Bulbasaur::ExtractImagesFromHTML.new(html).call
+      rescue Exception => e
+        []
+      end
+    end
+    def extract_images_vimeo(html)
+      begin
+        Bulbasaur::ExtractImagesFromVimeo.new(html).call
+      rescue Exception => e
+        []
+      end
+    end
+  end
+end

data/lib/bulbasaur/extracts/extract_images_from_html.rb ADDED Viewed

@@ -0,0 +1,43 @@
+module Bulbasaur
+  class ExtractImagesFromHTML
+    CSS_IMPORT_URL_REGEX = /(?<=url\()['"]?.+?['"]?.+?(?=\))/
+    IMG_CANDIDATE_URL_REGEX = /https?:\/\/\S*\.(?:png|jpg|jpeg)(?!\.\S)/i
+    def initialize(html)
+      @html = html
+    end
+    def call
+      images = Array.new
+      images = images + extract_images_by_tag_image
+      images = images + extract_images_by_tag_style
+      images
+    end
+    private
+    def extract_images_by_tag_image
+      images = Array.new
+      Nokogiri::HTML(@html).xpath("//img").each do |item|
+        url = item.xpath("@src").text
+        alt = item.xpath("@alt").text
+        images << create_struct(url, alt)
+      end
+      images
+    end
+    def extract_images_by_tag_style
+      images = Array.new
+      @html.scan(CSS_IMPORT_URL_REGEX).each do |url|
+        images << create_struct(url)
+      end
+      images
+    end
+    def create_struct(url, alt=nil)
+      {url: url, alt: alt }
+    end
+  end
+end

data/lib/bulbasaur/extracts/extract_images_from_vimeo.rb ADDED Viewed

@@ -0,0 +1,34 @@
+module Bulbasaur
+  class ExtractImagesFromVimeo
+    # Sizes available: small '100x75', medium '200x150', large '640'.
+    DEFAULT_SIZE = '640'
+    EXTRACT_URL_PATTERN = /player\.vimeo\.com\/(?:v\/|.+?&v=|video\/)\w+/i
+    EXTRACT_VID_PATTERN = /(?<=v\/|video\/)(?<vid>\w+)/i
+    def initialize(html)
+      @html = html
+    end
+    def call
+      images = Array.new
+      @html.scan(EXTRACT_URL_PATTERN).each do |video|
+        vid = get_vid(video)
+        url_image = image_url_for(vid)
+        images << { url: url_image }
+      end
+      images
+    end
+    private
+    def get_vid(video)
+      EXTRACT_VID_PATTERN.match(video)[:vid]
+    end
+    def image_url_for(vid)
+      "https://i.vimeocdn.com/video/#{vid}_#{DEFAULT_SIZE}.webp"
+    end
+  end
+end

data/lib/bulbasaur/extracts/extract_images_from_youtube.rb ADDED Viewed

@@ -0,0 +1,32 @@
+module Bulbasaur
+  class ExtractImagesFromYoutube
+    EXTRACT_URL_PATTERN = /www\.youtube\.com\/(?:v\/|.+?&v=|embed\/)\w+/i
+    EXTRACT_VID_PATTERN = /(?<=v\/|embed\/)(?<vid>\w+)/i
+    def initialize(html)
+      @html = html
+    end
+    def call
+      images = Array.new
+      @html.scan(EXTRACT_URL_PATTERN).each do |video|
+        vid = get_vid(video)
+        url_image = image_url_for(vid)
+        images << { url: url_image }
+      end
+      images
+    end
+    private
+    def get_vid(video)
+      EXTRACT_VID_PATTERN.match(video)[:vid]
+    end
+    def image_url_for(vid)
+      "http://img.youtube.com/vi/#{vid}/0.jpg"
+    end
+  end
+end

data/lib/bulbasaur/replaces/replace_by_tag_image.rb ADDED Viewed

@@ -0,0 +1,21 @@
+module Bulbasaur
+  class ReplaceByTagImage
+    def initialize(html, image_replaces = [])
+      @html = html
+      @image_replaces = image_replaces
+    end
+    def call
+      nokogiri = Nokogiri::HTML::DocumentFragment.parse(@html)
+      nokogiri.css('img').each do |item|
+        url = item.xpath("@src").text
+        replace = @image_replaces.select{ |r| r[:original_image_url] == url }.first
+        item.set_attribute("src", replace[:url]) unless replace.nil?
+      end
+      nokogiri.to_s
+    end
+  end
+end

data/lib/bulbasaur/utils/normalize_url.rb ADDED Viewed

@@ -0,0 +1,21 @@
+module Bulbasaur
+  class NormalizeURL
+    def initialize(base_url, context_url)
+      @base_url = base_url
+      @context_url = context_url
+    end
+    def call
+      if @context_url =~ /^https?:\/\//
+        URI::encode @context_url
+      else
+        URI::join(@base_url, @context_url).to_s
+      end
+    rescue
+      raise ArgumentError, "Not possible normalize url, check the params [base_url: #{@base_url}, context_url: #{@context_url}]"
+    end
+  end
+end

data/lib/bulbasaur/version.rb ADDED Viewed

@@ -0,0 +1,10 @@
+module Bulbasaur
+  module Version
+    MAJOR = 0
+    MINOR = 1
+    PATCH = 0
+    STRING = "#{MAJOR}.#{MINOR}.#{PATCH}"
+  end
+end

data/lib/bulbasaur.rb ADDED Viewed

@@ -0,0 +1,13 @@
+require "nokogiri"
+require "bulbasaur/extracts/extract_images_from_youtube"
+require "bulbasaur/extracts/extract_images_from_vimeo"
+require "bulbasaur/extracts/extract_images_from_html"
+require "bulbasaur/extracts/extract_images_from_all_resources"
+require "bulbasaur/replaces/replace_by_tag_image"
+require "bulbasaur/utils/normalize_url"
+require "bulbasaur/version"
+module Bulbasaur
+end

data/spec/bulbasaur/extracts/extract_images_from_all_resources_spec.rb ADDED Viewed

@@ -0,0 +1,42 @@
+require "spec_helper"
+RSpec.describe Bulbasaur::ExtractImagesFromAllResources do
+  subject do
+    described_class.new(html).call
+  end
+  describe "#call" do
+    let(:html) do
+        %Q(
+          <p>
+            <iframe width="560" height="315" src="https://www.youtube.com/embed/video0" frameborder="0" allowfullscreen></iframe>
+          </p>
+          <iframe width="560" height="315" src="https://www.youtube.com/embed/video1" frameborder="0" allowfullscreen></iframe>
+          <iframe width="560" height="315" src="https://www.youtube.com/embed/video2" frameborder="0" allowfullscreen></iframe>
+          <iframe width="560" height="315" src="https://www.youtube.com/embed/video3" frameborder="0" allowfullscreen></iframe>
+          <p>
+            <iframe src="https://player.vimeo.com/video/test0" width="500" height="281" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>
+            <iframe width="560" height="315" src="https://www.youtube.com/embed/video0" frameborder="0" allowfullscreen></iframe>
+          </p>
+          <iframe src="https://player.vimeo.com/video/test1" width="500" height="281" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>
+          <iframe src="https://player.vimeo.com/video/test2" width="500" height="281" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>
+          <iframe src="https://player.vimeo.com/video/test3" width="500" height="281" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>
+          <p>Hello world</p>
+           <img src='image-0.jpg' alt='image-0' />
+          <img src='image-1.png' alt='image-1' />
+          <div style='backgroung-image: url(image-2.jpg)'>
+            hello Ruby
+            <img src='image-3.png' alt='image-3' />
+          </div>
+          <div style='background: url(image-4.png)'></div>
+          <img src='image-5.png' alt='image-5' />"
+        )
+    end
+    it "Does return 15 itens" do
+      expect(subject.size).to eq 15
+    end
+  end
+end

data/spec/bulbasaur/extracts/extract_images_from_html_spec.rb ADDED Viewed

@@ -0,0 +1,91 @@
+require "spec_helper"
+RSpec.describe Bulbasaur::ExtractImagesFromHTML do
+  subject do
+    described_class.new(html).call
+  end
+  describe "#call" do
+    context "When send html without images" do
+      let(:html) do
+        "<p>Hello world</p>"
+      end
+      it "Does return nil object" do
+        expect(subject.size).to be_zero
+      end
+    end
+    context "When send html with a image tag" do
+      let(:html) do
+        "<p>Hello world</p>
+        <img src='image-name.jpg' alt='image alt test' />"
+      end
+      it "Does return a image array with 1 item" do
+        expect(subject.size).to eq 1
+      end
+      it "Does return the image url" do
+        expect(subject.first[:url]).to eq "image-name.jpg"
+      end
+      it "Does return the image alt" do
+        expect(subject.first[:alt]).to eq "image alt test"
+      end
+    end
+    context "When send html with a image style inline" do
+      let(:html) do
+        "<p>Hello world</p>
+        <div style='backgroung-image: url(inline-image.jpg)'>
+          hello Ruby
+        </div>"
+      end
+      it "Does return a image array with 1 item" do
+        expect(subject.size).to eq 1
+      end
+      it "Does return the image url" do
+        expect(subject.first[:url]).to eq "inline-image.jpg"
+      end
+      it "Does return the image alt" do
+        expect(subject.first[:alt]).to be_nil
+      end
+    end
+    context "When send html with many images" do
+      let(:html) do
+        "<p>Hello world</p>
+        <img src='image-0.jpg' alt='image-0' />
+        <img src='image-1.png' alt='image-1' />
+        <div style='backgroung-image: url(image-2.jpg)'>
+          hello Ruby
+          <img src='image-3.png' alt='image-3' />
+        </div>
+        <div style='background: url(image-4.png)'></div>
+        <img src='image-5.png' alt='image-5' />"
+      end
+      it "Does return a image array with 6 items" do
+        expect(subject.size).to eq 6
+      end
+      it "Does return the image url of 6 itens" do
+        expect(subject.map { |item| item[:url] }).to include "image-0.jpg", "image-1.png", "image-2.jpg", "image-3.png", "image-4.png", "image-5.png"
+      end
+      it "Does return the image alt of 4 itens" do
+        expect(subject.map { |item| item[:alt] }).to include "image-0", "image-1", "image-3", "image-5"
+      end
+    end
+  end
+end

data/spec/bulbasaur/extracts/extract_images_from_vimeo_spec.rb ADDED Viewed

@@ -0,0 +1,60 @@
+require 'spec_helper'
+RSpec.describe Bulbasaur::ExtractImagesFromVimeo do
+  subject do
+    described_class.new(html).call
+  end
+  describe "#call" do
+    context "When there is not vimeo images" do
+      let(:html) do
+        "<p>Lorem ipsum dolor sit amet</p>"
+      end
+      it "Does return empty array" do
+        expect(subject.size).to be_zero
+      end
+    end
+    context "When has one vimeo video" do
+      let(:html) do
+        %Q(<iframe src="https://player.vimeo.com/video/123456789" width="500" height="281" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>)
+      end
+      it "Does return array with 1 image" do
+        expect(subject.size).to eq 1
+      end
+      it "Does return vime url" do
+        expect(subject.first[:url]).to eq "https://i.vimeocdn.com/video/123456789_640.webp"
+      end
+    end
+    context "When many vimeo videos" do
+      let(:html) do
+        %Q(
+          <p>
+            <iframe src="https://player.vimeo.com/video/test0" width="500" height="281" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>
+            <iframe width="560" height="315" src="https://www.youtube.com/embed/video0" frameborder="0" allowfullscreen></iframe>
+          </p>
+          <iframe src="https://player.vimeo.com/video/test1" width="500" height="281" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>
+          <iframe src="https://player.vimeo.com/video/test2" width="500" height="281" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>
+          <iframe src="https://player.vimeo.com/video/test3" width="500" height="281" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>
+        )
+      end
+      it "Does return array with 4 images" do
+        expect(subject.size).to eq 4
+      end
+      it "Does return vimeo urls" do
+        expect(subject.map{ |video| video[:url] }).to include "https://i.vimeocdn.com/video/test0_640.webp",  "https://i.vimeocdn.com/video/test1_640.webp",  "https://i.vimeocdn.com/video/test2_640.webp", "https://i.vimeocdn.com/video/test3_640.webp"
+      end
+    end
+  end
+end

data/spec/bulbasaur/extracts/extract_images_from_youtube_spec.rb ADDED Viewed

@@ -0,0 +1,59 @@
+require 'spec_helper'
+RSpec.describe Bulbasaur::ExtractImagesFromYoutube do
+  subject do
+    described_class.new(html).call
+  end
+  describe "#call" do
+    context "When there is not youtube images" do
+      let(:html) do
+        "<p>Lorem ipsum dolor sit amet</p>"
+      end
+      it "Does return empty array" do
+        expect(subject.size).to be_zero
+      end
+    end
+    context "When has one youtube video" do
+      let(:html) do
+        %Q(<iframe width="560" height="315" src="https://www.youtube.com/embed/123idfake321" frameborder="0" allowfullscreen></iframe>)
+      end
+      it "Does return array with 1 image" do
+        expect(subject.size).to eq 1
+      end
+      it "Does return youtube url" do
+        expect(subject.first[:url]).to eq "http://img.youtube.com/vi/123idfake321/0.jpg"
+      end
+    end
+    context "When many youtube video" do
+      let(:html) do
+        %Q(
+          <p>
+            <iframe width="560" height="315" src="https://www.youtube.com/embed/video0" frameborder="0" allowfullscreen></iframe>
+          </p>
+          <iframe width="560" height="315" src="https://www.youtube.com/embed/video1" frameborder="0" allowfullscreen></iframe>
+          <iframe width="560" height="315" src="https://www.youtube.com/embed/video2" frameborder="0" allowfullscreen></iframe>
+          <iframe width="560" height="315" src="https://www.youtube.com/embed/video3" frameborder="0" allowfullscreen></iframe>
+        )
+      end
+      it "Does return array with 4 image" do
+        expect(subject.size).to eq 4
+      end
+      it "Does return youtube urls" do
+        expect(subject.map{ |video| video[:url] }).to include "http://img.youtube.com/vi/video0/0.jpg",  "http://img.youtube.com/vi/video1/0.jpg",  "http://img.youtube.com/vi/video2/0.jpg", "http://img.youtube.com/vi/video3/0.jpg"
+      end
+    end
+  end
+end

data/spec/bulbasaur/replaces/replace_by_tag_image_spec.rb ADDED Viewed

@@ -0,0 +1,58 @@
+require "spec_helper"
+RSpec.describe Bulbasaur::ReplaceByTagImage do
+  subject do
+    described_class.new(html, image_replaces).call
+  end
+  describe "#call" do
+    context "When there is not tag img" do
+      let(:html) do
+        "<p>Hello</p><div> Welcome </div>"
+      end
+      let(:image_replaces) do
+        [{original_image_url:"test.jpg", url: "new-image.png"}]
+      end
+      it "Does return html" do
+        expect(subject).to eq "<p>Hello</p><div> Welcome </div>"
+      end
+    end
+    context "When there are many img tags" do
+      let(:html) do
+        "<p>Lorem inpsu</p>
+        <img src='test-0.jpg' alt='hello'>
+        <img src='test-1.jpg' alt='hello'>
+        <img src='test-1.jpg' alt='hello'>
+        <img src='test-3.jpg' alt='hello'>
+        <img src='test-2.jpg' alt='hello'>".gsub(/\n/," ")
+      end
+      let(:image_replaces) do
+        [
+         {original_image_url:"test-0.jpg", url: "new-image-0.png"},
+         {original_image_url:"test-1.jpg", url: "new-image-1.png"},
+         {original_image_url:"test-2.jpg", url: "new-image-2.png"}
+        ]
+      end
+      it "Does return html parsed" do
+        expect(subject).to eq(
+        '<p>Lorem inpsu</p>
+        <img src="new-image-0.png" alt="hello">
+        <img src="new-image-1.png" alt="hello">
+        <img src="new-image-1.png" alt="hello">
+        <img src="test-3.jpg" alt="hello">
+        <img src="new-image-2.png" alt="hello">'.gsub(/\n/," "))
+      end
+    end
+  end
+end

data/spec/bulbasaur/utils/normalize_url_spec.rb ADDED Viewed

@@ -0,0 +1,79 @@
+require "spec_helper"
+RSpec.describe Bulbasaur::NormalizeURL do
+  subject do
+    described_class.new(base_url, context_url).call
+  end
+  let(:base_url) do
+    "http://pread.ly"
+  end
+  let(:context_url) do
+    "http://www.test.com/hello.jpg"
+  end
+  describe "#call" do
+    context "When use url normalized url: http://www.test.com/hello.jpg" do
+      it "Does return url normalized: http://www.test.com/hello.jpg" do
+        expect(subject).to eq "http://www.test.com/hello.jpg"
+      end
+    end
+    context "When use url unnormalized url: test.jpg" do
+      let(:context_url) do
+        "test.jpg"
+      end
+      it "Does return url normalized: http://pread.ly/test.jpg" do
+        expect(subject).to eq "http://pread.ly/test.jpg"
+      end
+    end
+    context "When use url https normalized: https://www.test.com/hello.jpg" do
+      let(:context_url) do
+        "https://www.test.com/hello.jpg"
+      end
+      it "Does return url https normalized: https://www.test.com/hello.jpg" do
+        expect(subject).to eq "https://www.test.com/hello.jpg"
+      end
+    end
+    context "When use url not normalized with slash on base: hello.jpg" do
+      let(:base_url) do
+        "https://www.test.com/"
+      end
+      let(:context_url) do
+        "hello.jpg"
+      end
+      it "Does return url normalized: https://www.test.com/hello.jpg" do
+        expect(subject).to eq "https://www.test.com/hello.jpg"
+      end
+    end
+    context "When base url not valid" do
+      let(:base_url) do
+        "test/httml"
+      end
+      let(:context_url) do
+        "hello.html"
+      end
+      it "Does throws exception argument error" do
+        expect{subject}.to raise_error ArgumentError
+      end
+    end
+  end
+end

data/spec/bulbasaur_spec.rb ADDED Viewed

@@ -0,0 +1,13 @@
+require "spec_helper"
+RSpec.describe "test" do
+  describe "#teste" do
+    it "hello" do
+      expect("test").to eq "test"
+    end
+  end
+end

data/spec/spec_helper.rb ADDED Viewed

@@ -0,0 +1,14 @@
+if ENV['CODECLIMATE_REPO_TOKEN']
+  require 'codeclimate-test-reporter'
+  CodeClimate::TestReporter.start
+end
+require "bundler/setup"
+Bundler.setup
+require "bulbasaur"
+require "simplecov"
+RSpec.configure do |config|
+end

metadata ADDED Viewed

@@ -0,0 +1,126 @@
+--- !ruby/object:Gem::Specification
+name: preadly-bulbasaur
+version: !ruby/object:Gem::Version
+  version: 0.1.0
+platform: ruby
+authors:
+- Magno Costa
+autorequire:
+bindir: bin
+cert_chain: []
+date: 2015-07-13 00:00:00.000000000 Z
+dependencies:
+- !ruby/object:Gem::Dependency
+  name: bundler
+  requirement: !ruby/object:Gem::Requirement
+    requirements:
+    - - "~>"
+      - !ruby/object:Gem::Version
+        version: '1.6'
+  type: :development
+  prerelease: false
+  version_requirements: !ruby/object:Gem::Requirement
+    requirements:
+    - - "~>"
+      - !ruby/object:Gem::Version
+        version: '1.6'
+- !ruby/object:Gem::Dependency
+  name: rake
+  requirement: !ruby/object:Gem::Requirement
+    requirements:
+    - - "~>"
+      - !ruby/object:Gem::Version
+        version: '10.4'
+  type: :development
+  prerelease: false
+  version_requirements: !ruby/object:Gem::Requirement
+    requirements:
+    - - "~>"
+      - !ruby/object:Gem::Version
+        version: '10.4'
+- !ruby/object:Gem::Dependency
+  name: rspec
+  requirement: !ruby/object:Gem::Requirement
+    requirements:
+    - - "~>"
+      - !ruby/object:Gem::Version
+        version: '3.3'
+  type: :development
+  prerelease: false
+  version_requirements: !ruby/object:Gem::Requirement
+    requirements:
+    - - "~>"
+      - !ruby/object:Gem::Version
+        version: '3.3'
+- !ruby/object:Gem::Dependency
+  name: nokogiri
+  requirement: !ruby/object:Gem::Requirement
+    requirements:
+    - - "~>"
+      - !ruby/object:Gem::Version
+        version: '1.6'
+  type: :runtime
+  prerelease: false
+  version_requirements: !ruby/object:Gem::Requirement
+    requirements:
+    - - "~>"
+      - !ruby/object:Gem::Version
+        version: '1.6'
+description: Bulbasaur is a helper for crawler operations used in Pread.ly
+email:
+- magnocosta.br@gmail.com
+executables: []
+extensions: []
+extra_rdoc_files: []
+files:
+- Rakefile
+- bulbasaur.gemspec
+- lib/bulbasaur.rb
+- lib/bulbasaur/extract_text_from_html.rb
+- lib/bulbasaur/extracts/extract_images_from_all_resources.rb
+- lib/bulbasaur/extracts/extract_images_from_html.rb
+- lib/bulbasaur/extracts/extract_images_from_vimeo.rb
+- lib/bulbasaur/extracts/extract_images_from_youtube.rb
+- lib/bulbasaur/replaces/replace_by_tag_image.rb
+- lib/bulbasaur/utils/normalize_url.rb
+- lib/bulbasaur/version.rb
+- spec/bulbasaur/extracts/extract_images_from_all_resources_spec.rb
+- spec/bulbasaur/extracts/extract_images_from_html_spec.rb
+- spec/bulbasaur/extracts/extract_images_from_vimeo_spec.rb
+- spec/bulbasaur/extracts/extract_images_from_youtube_spec.rb
+- spec/bulbasaur/replaces/replace_by_tag_image_spec.rb
+- spec/bulbasaur/utils/normalize_url_spec.rb
+- spec/bulbasaur_spec.rb
+- spec/spec_helper.rb
+homepage: https://github.com/preadly/bulbasaur
+licenses: []
+metadata: {}
+post_install_message:
+rdoc_options: []
+require_paths:
+- lib
+required_ruby_version: !ruby/object:Gem::Requirement
+  requirements:
+  - - ">="
+    - !ruby/object:Gem::Version
+      version: '0'
+required_rubygems_version: !ruby/object:Gem::Requirement
+  requirements:
+  - - ">="
+    - !ruby/object:Gem::Version
+      version: '0'
+requirements: []
+rubyforge_project:
+rubygems_version: 2.2.2
+signing_key:
+specification_version: 4
+summary: Bulbasaur is a helper for crawler operations used in Pread.ly
+test_files:
+- spec/bulbasaur/extracts/extract_images_from_all_resources_spec.rb
+- spec/bulbasaur/extracts/extract_images_from_html_spec.rb
+- spec/bulbasaur/extracts/extract_images_from_vimeo_spec.rb
+- spec/bulbasaur/extracts/extract_images_from_youtube_spec.rb
+- spec/bulbasaur/replaces/replace_by_tag_image_spec.rb
+- spec/bulbasaur/utils/normalize_url_spec.rb
+- spec/bulbasaur_spec.rb
+- spec/spec_helper.rb