RubyGems - generalscraper - Versions diffs - 0.0.4 → 0.0.5 - Mend

generalscraper 0.0.4 → 0.0.5

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (3) hide show

checksums.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 SHA1:
-  metadata.gz: 48ee021e7ac6bb45a00308d69003bd6ba379b20b
-  data.tar.gz: d3b631127266dbfaacaee4eb74c2868e48a1f0c8
+  metadata.gz: 21df27ba7416ab3ea410f3c38f0aea43cfa0c5f0
+  data.tar.gz: bbdfaa98d9c7c0600dc626b43da0127a43472b36
 SHA512:
-  metadata.gz: b15d9ce46f5223be79fca5ba74423c0eab88c03dc3ed1e40baef500d30ab9f15c1f364bfb23244ea1dc741edcd91281b779b4ff1170341f0c534859aa174ff94
-  data.tar.gz: 149dadfabb77b586164c4213fd58bca33a5de5d0c64af48c04db6f4e47eaf3c5c1563ceaeedd7e9a97c813e7e5b95cc45a671734b8a5d2b78212db0d30d700ed
+  metadata.gz: f9c37e1e151b37d4eb231fb22304d9f7868eed8a02cb874aa9968756be0f2ad2f555f36c2e8a02977c353579232c6c7a40ee776236ec425e2bef28959f6ce80a
+  data.tar.gz: 57d4a622ed823a0acad91bea00a787e2f341721ed110c3d5a88b93f9c981e267a14d62a0db1c71993a10dd9042d77496833724a5f893123288b15f9d9faf9223

data/lib/parse_page.rb CHANGED Viewed

@@ -23,7 +23,7 @@ module ParsePage
   # Download the page text
   def getHTMLText(url, pagehash)
     html = Nokogiri::HTML(getPage(url).body)
-    pagehash[:text] = html.css("body").text
+    pagehash[:text] = html.css("body").text.encode("UTF-8")
     return pagehash
   end
@@ -35,7 +35,7 @@ module ParsePage
     # OCR PDF and save fields
     u = UploadConvert.new("public/uploads/" + path[path.length-1].chomp.strip)
     pdfparse = JSON.parse(u.handleDoc)
-    pdfparse.each{|k, v| pagehash[k] = v}
+    pdfparse.each{|k, v| pagehash[k] = v.encode("UTF-8")}
     return pagehash
   end
@@ -51,7 +51,7 @@ module ParsePage
     # Get title and meta tag info
     html = Nokogiri::HTML(getPage(url).body) # Eventually modify this
-    pagehash[:title] = html.css("title").text
+    pagehash[:title] = html.css("title").text.encode("UTF-8")
     html.css("meta").each do |m|
       if m
         pagehash[m['name']] = m['content']

metadata CHANGED Viewed

@@ -1,7 +1,7 @@
 --- !ruby/object:Gem::Specification
 name: generalscraper
 version: !ruby/object:Gem::Version
-  version: 0.0.4
+  version: 0.0.5
 platform: ruby
 authors:
 - M. C. McGrath