RubyGems - ids_please - Versions diffs - 2.1.2 → 2.2.0 - Mend

ids_please 2.1.2 → 2.2.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (13) hide show

checksums.yaml +4 -4
data/README.md +1 -0
data/lib/ids_please/grabbers/base.rb +4 -1
data/lib/ids_please/grabbers/facebook.rb +25 -9
data/lib/ids_please/grabbers/google_plus.rb +25 -0
data/lib/ids_please/grabbers/instagram.rb +13 -17
data/lib/ids_please/grabbers/mailru.rb +7 -7
data/lib/ids_please/grabbers/twitter.rb +15 -9
data/lib/ids_please/grabbers/vkontakte.rb +8 -8
data/lib/ids_please/grabbers.rb +2 -0
data/lib/ids_please/version.rb +1 -1
data/spec/ids_please/basic_spec.rb +1 -1
metadata +3 -2

checksums.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 SHA1:
-  metadata.gz: 8da387525f9002e6b61c37a156ab3463eddc1f13
-  data.tar.gz: 1b011d8e71246e51a912afc902b976d9e77bdcaa
+  metadata.gz: cbbb7fdc96da69f11a60cfbda149c1efc18cf3ec
+  data.tar.gz: a32ec832041c194f72d78aae0f410688edbd3239
 SHA512:
-  metadata.gz: a40722b50e4e5105b965feb3ef03264bbde369bec2a5b9d52407111a618cc06e05c7a0eef3ca6fece82f1889f020752a74fa89a05b07b2f95fd28b7481fff18b
-  data.tar.gz: 014973413f0ff8677839a3b82d7ba73896e4d345fdd33ed93b800f8bf91048b29db4918ceaa0f702d4c11226df9071a52cbb76f9f94b3ad7cea1a0e79c3a3e31
+  metadata.gz: e903c0a4695122ade18201fe6f33035644c2193cd13e1f950426da6ba98de85ccb4953f6aab4069288652b202441ed4992b09cd51e13ea34d544e8afe5060ed8
+  data.tar.gz: 94ef374b9075560bad7f53dd829d98a499f3b84d923de4392df9f77a07afeb628a723ef8e977b9fcde2323c94084da47d726e14791c08f3d81997d64905475da

data/README.md CHANGED Viewed

@@ -81,6 +81,7 @@ Social networks supported for grabbing at the moment:
 * [Instagram](http://instagram.com)
 * [Vkontakte](https://vk.com)
 * [Mailru](https://my.mail.ru)
+* [GooglePlus](https://plus.google.com)
 ### Link parsing

data/lib/ids_please/grabbers/base.rb CHANGED Viewed

@@ -8,7 +8,7 @@ class IdsPlease
         links.map { |l| self.new(l).grab_link }
       end
-      attr_reader :avatar, :display_name, :username, :link, :page_source, :network_id, :data
+      attr_reader :avatar, :display_name, :username, :link, :page_source, :network_id, :data, :counts
       def initialize(link)
         @link = link
@@ -45,6 +45,9 @@ class IdsPlease
         to_s
       end
+      def page_source
+        @page_source ||= open(link).read
+      end
     end
   end
 end

data/lib/ids_please/grabbers/facebook.rb CHANGED Viewed

@@ -3,27 +3,43 @@ class IdsPlease
     class Facebook < IdsPlease::Grabbers::Base
       def grab_link
-        @page_source ||= open(link).read
-        @network_id  = @page_source.scan(/entity_id":"(\d+)"/).flatten.first
-        @avatar = @page_source.scan(/og:image" content="([^"]+)"/).flatten.first
-        @display_name = @page_source.scan(/og:title" content="([^"]+)"/).flatten.first
-        @username = @page_source.scan(/og:url" content="[^"]+\/([^\/"]+)"/).flatten.first
-        @avatar = CGI.unescapeHTML(@avatar.encode('utf-8')) if @avatar
+        @network_id   = page_source.scan(/entity_id":"(\d+)"/).flatten.first
+        @avatar       = page_source.scan(/og:image" content="([^"]+)"/).flatten.first
+        @display_name = page_source.scan(/og:title" content="([^"]+)"/).flatten.first
+        @username     = page_source.scan(/og:url" content="[^"]+\/([^\/"]+)"/).flatten.first
+        @avatar       = CGI.unescapeHTML(@avatar.encode('utf-8')) if @avatar
         @display_name = CGI.unescapeHTML(@display_name.encode('utf-8')) if @display_name
         @data = {}
         {
-          type: @page_source.scan(/og:type" content="([^"]+)"/).flatten.first.encode('utf-8'),
-          description: @page_source.scan(/og:description" content="([^"]+)"/).flatten.first.encode('utf-8')
+          type: page_source.scan(/og:type" content="([^"]+)"/).flatten.first.to_s.encode('utf-8'),
+          description: page_source.scan(/og:description" content="([^"]+)"/).flatten.first.to_s.encode('utf-8'),
         }.each do |k, v|
           next if v.nil? || v == ''
-          @data[k] = CGI.unescapeHTML(v)
+          @data[k] = CGI.unescapeHTML(v).strip
         end
+        @counts = {
+          likes:  likes,
+          visits: visits,
+        }.delete_if {|k,v| v.nil? }
         self
       rescue => e
         p e
         return self
       end
+      def likes
+        page_source.scan(/>([^"]+) <span class=".+">likes/).flatten.first.to_s.tr(',','').to_i
+      rescue => e
+        p e
+        return nil
+      end
+      def visits
+        page_source.scan(/likes.+>([^"]+)<\/span> <span class=".+">visits/).flatten.first.to_s.tr(',','').to_i
+      rescue => e
+        p e
+        return nil
+      end
     end
   end
 end

data/lib/ids_please/grabbers/google_plus.rb ADDED Viewed

@@ -0,0 +1,25 @@
+class IdsPlease
+  module Grabbers
+    class GooglePlus < IdsPlease::Grabbers::Base
+      def grab_link
+        @network_id   = page_source.scan(/data-oid="(\d+)"/).flatten.first
+        @avatar       = 'https:' + page_source.scan(/guidedhelpid="profile_photo"><img src="([^"]+)"/).flatten.first
+        @display_name = page_source.scan(/og:title" content="([^"]+)"/).flatten.first.gsub(' - Google+','')
+        @username     = '+' + page_source.scan(/&quot;https:\/\/plus.google.com\/\+(.+?)&quot;/).flatten.first
+        @data = {
+          description: page_source.scan(/name="Description" content="([^"]+)">/).flatten.first.to_s.encode('utf-8')
+        }
+        @counts = {
+          followers:  page_source.scan(/">([^"]+)<\/span> followers</).flatten.first.to_s.tr(',','').to_i,
+          views: page_source.scan(/">([^"]+)<\/span> views</).flatten.first.to_s.tr(',','').to_i,
+        }
+        self
+      rescue => e
+        p e
+        return self
+      end
+    end
+  end
+end

data/lib/ids_please/grabbers/instagram.rb CHANGED Viewed

@@ -5,29 +5,25 @@ class IdsPlease
     class Instagram < IdsPlease::Grabbers::Base
       def grab_link
-        @page_source ||= open(link).read
-        @network_id  = @page_source.scan(/"user":{.+"id":"(\d+)"/).flatten.first
-        @avatar  = @page_source.scan(/"user":{.+"profile_picture":"([^"]+)"/).flatten.first.gsub('\\', '')
-        @display_name  = @page_source.scan(/"user":{.+"full_name":"([^"]+)"/).flatten.first
-        @username  = @page_source.scan(/"user":{.+"username":"([^"]+)"/).flatten.first.gsub('\\', '')
-        counts = @page_source.scan(/"user":{.+"counts":({[^}]+})/).flatten.first
-        counts = JSON.parse counts
-        @data = {}
-        {
-          bio: @page_source.scan(/"user":{.+"bio":"([^"]+)"/).flatten.first,
-          website: @page_source.scan(/"user":{.+"website":"([^"]+)"/).flatten.first.gsub('\\', ''),
-          counts: counts
-        }.each do |k, v|
-          next if v.nil? || v == '' || !v.is_a?(String)
-          @data[k] = v.gsub(/\\u([\da-fA-F]{4})/) {|m| [$1].pack("H*").unpack("n*").pack("U*")}
-        end
+        @network_id   = page_source.scan(/"user":{.+"id":"(\d+)"/).flatten.first
+        @avatar       = page_source.scan(/"user":{.+"profile_pic_url":"([^"]+)"/).flatten.first.gsub('\\', '')
+        @display_name = page_source.scan(/"user":{.+"full_name":"([^"]+)"/).flatten.first
+        @username     = page_source.scan(/"user":{"username":"([^"]+)"/).flatten.first.gsub('\\', '')
+        @data = {
+          bio: page_source.scan(/"biography":"([^"]+)"/).flatten.first,
+          website: page_source.scan(/"user":{.+"external_url":"([^"]+)"/).flatten.first.gsub('\\', ''),
+        }
+        @counts = {
+          media: page_source.scan(/"media":{"count":(\d+)/).flatten.first.to_i,
+          followed_by: page_source.scan(/"followed_by":{"count":(\d+)/).flatten.first.to_i,
+          follows: page_source.scan(/"follows":{"count":(\d+)/).flatten.first.to_i,
+        }
         @display_name = @display_name.gsub(/\\u([\da-fA-F]{4})/) {|m| [$1].pack("H*").unpack("n*").pack("U*")}
         self
       rescue => e
         p e
         return self
       end
     end
   end
 end

data/lib/ids_please/grabbers/mailru.rb CHANGED Viewed

@@ -5,16 +5,16 @@ class IdsPlease
     class Mailru < IdsPlease::Grabbers::Base
       def grab_link
-        @page_source ||= open(link).read.encode('utf-8')
-        uid_url = "http://appsmail.ru/platform/#{link.split('/')[-2..-1].join('/')}"
-        @network_id  = JSON.parse(open(uid_url).read)['uid']
+        @page_source  ||= open(link).read.encode('utf-8')
+        uid_url         = "http://appsmail.ru/platform/#{link.split('/')[-2..-1].join('/')}"
+        @network_id     = JSON.parse(open(uid_url).read)['uid']
         @username, type = get_name_and_type(link)
-        @avatar = @page_source.scan(/profile__avatar" src="([^"]+)/).flatten.first
-        @display_name = @page_source.scan(/h1.+title="([^"]+)/).flatten.first
-        @display_name = CGI.unescapeHTML(@display_name) if @display_name
+        @avatar         = page_source.scan(/profile__avatar" src="([^"]+)/).flatten.first
+        @display_name   = page_source.scan(/h1.+title="([^"]+)/).flatten.first
+        @display_name   = CGI.unescapeHTML(@display_name) if @display_name
         @data = {
           type: type,
-          description: @page_source.scan(/profile__content_mainInfo" title="([^"]+)/).flatten.first
+          description: page_source.scan(/profile__content_mainInfo" title="([^"]+)/).flatten.first
         }
         @data[:description] = CGI.unescapeHTML(@data[:description]) if @data[:description]
         self

data/lib/ids_please/grabbers/twitter.rb CHANGED Viewed

@@ -3,20 +3,26 @@ class IdsPlease
     class Twitter < IdsPlease::Grabbers::Base
       def grab_link
-        @page_source ||= open(link).read
-        @network_id  = @page_source.scan(/data-user-id="(\d+)"/).flatten.first
-        @avatar = @page_source.scan(/ProfileAvatar-image " src="([^"]+)"/).flatten.first
-        @display_name = @page_source.scan(/ProfileHeaderCard-nameLink[^>]+>([^<]+)</).flatten.first
-        @username = @page_source.scan(/<title>[^\(]+\(@([^\)]+)\)/).flatten.first
+        @network_id   = page_source.scan(/data-user-id="(\d+)"/).flatten.first
+        @avatar       = page_source.scan(/ProfileAvatar-image " src="([^"]+)"/).flatten.first
+        @display_name = page_source.scan(/ProfileHeaderCard-nameLink[^>]+>([^<]+)</).flatten.first
+        @username     = page_source.scan(/<title>[^\(]+\(@([^\)]+)\)/).flatten.first
         @data = {}
         {
-          description: @page_source.scan(/ProfileHeaderCard-bio[^>]+>([^<]+)</).flatten.first.encode('utf-8'),
-          location: @page_source.scan(/ProfileHeaderCard-locationText[^>]+>([^<]+)</).flatten.first.encode('utf-8'),
-          join_date: @page_source.scan(/ProfileHeaderCard-joinDateText[^>]+>([^<]+)</).flatten.first.encode('utf-8'),
+          description: page_source.scan(/ProfileHeaderCard-bio[^>]+>([^<]+)</).flatten.first.to_s.encode('utf-8'),
+          location: page_source.scan(/ProfileHeaderCard-locationText[^>]+>([^<]+)</).flatten.first.to_s.encode('utf-8'),
+          join_date: page_source.scan(/ProfileHeaderCard-joinDateText[^>]+>([^<]+)</).flatten.first.to_s.encode('utf-8'),
         }.each do |k, v|
           next if v.nil? || v == ''
-          @data[k] = CGI.unescapeHTML(v)
+          @data[k] = CGI.unescapeHTML(v).strip
         end
+        @counts = {
+          tweets: page_source.scan(/statuses_count&quot;:(\d+),&quot;/).flatten.first.to_i,
+          following: page_source.scan(/friends_count&quot;:(\d+),&quot;/).flatten.first.to_i,
+          followers: page_source.scan(/followers_count&quot;:(\d+),&quot;/).flatten.first.to_i,
+          favorites: page_source.scan(/favourites_count&quot;:(\d+),&quot;/).flatten.first.to_i,
+          lists: page_source.scan(/listed_count&quot;:(\d+),&quot;/).flatten.first.to_i,
+        }
         self
       rescue => e
         p e

data/lib/ids_please/grabbers/vkontakte.rb CHANGED Viewed

@@ -3,16 +3,16 @@ class IdsPlease
     class Vkontakte < IdsPlease::Grabbers::Base
       def grab_link
-        agent = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.135 Safari/537.36'
+        agent          = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.135 Safari/537.36'
         @page_source ||= open(link, 'User-Agent' => agent).read.encode('utf-8')
-        @network_id  = @page_source.scan(/href="\/wall(-\d+)_/).flatten.first
-        @username = @link.to_s.split('vk.com/').last.gsub('/', '')
-        @avatar = @page_source.scan(/page_avatar.+\n.+src="([^"]+)/).flatten.first
-        @avatar = CGI.unescapeHTML(@avatar) if @avatar
-        @display_name = @page_source.scan(/page_name">([^<]+)/).flatten.first
-        @display_name = CGI.unescapeHTML(@display_name) if @display_name
+        @network_id    = page_source.scan(/href="\/wall(-\d+)_/).flatten.first
+        @username      = @link.to_s.split('vk.com/').last.gsub('/', '')
+        @avatar        = page_source.scan(/page_avatar.+\n.+src="([^"]+)/).flatten.first
+        @avatar        = CGI.unescapeHTML(@avatar) if @avatar
+        @display_name  = page_source.scan(/page_name">([^<]+)/).flatten.first
+        @display_name  = CGI.unescapeHTML(@display_name) if @display_name
         @data = {
-          description: @page_source.scan(/description" content="([^"]+)/).flatten.first
+          description: page_source.scan(/description" content="([^"]+)/).flatten.first
         }
         @data[:description] = CGI.unescapeHTML(@data[:description]) if @data[:description]
         self

data/lib/ids_please/grabbers.rb CHANGED Viewed

@@ -4,6 +4,7 @@ require_relative 'grabbers/vkontakte'
 require_relative 'grabbers/instagram'
 require_relative 'grabbers/twitter'
 require_relative 'grabbers/mailru'
+require_relative 'grabbers/google_plus'
 class IdsPlease
   module Grabbers
@@ -14,6 +15,7 @@ class IdsPlease
       twitter: IdsPlease::Grabbers::Twitter,
       instagram: IdsPlease::Grabbers::Instagram,
       mailru: IdsPlease::Grabbers::Mailru,
+      google_plus: IdsPlease::Grabbers::GooglePlus,
     }
     def self.each

data/lib/ids_please/version.rb CHANGED Viewed

@@ -1,3 +1,3 @@
 class IdsPlease
-  VERSION = '2.1.2'
+  VERSION = '2.2.0'
 end

data/spec/ids_please/basic_spec.rb CHANGED Viewed

@@ -4,7 +4,7 @@ describe IdsPlease do
   recognazible_links = %w(
       https://www.facebook.com/fb_acc
-      https://www.facebook.com/fb_acc2<U+200>
+      https://facebook.com/fb_acc2<U+200>
       http://instagram.com/inst_acc
       http://hi5.com/hi5_acc
       http://www.hi5.com/profile.html?uid=12341234

metadata CHANGED Viewed

@@ -1,14 +1,14 @@
 --- !ruby/object:Gem::Specification
 name: ids_please
 version: !ruby/object:Gem::Version
-  version: 2.1.2
+  version: 2.2.0
 platform: ruby
 authors:
 - gazay
 autorequire:
 bindir: bin
 cert_chain: []
-date: 2015-08-13 00:00:00.000000000 Z
+date: 2015-08-17 00:00:00.000000000 Z
 dependencies:
 - !ruby/object:Gem::Dependency
   name: rake
@@ -56,6 +56,7 @@ files:
 - lib/ids_please/grabbers.rb
 - lib/ids_please/grabbers/base.rb
 - lib/ids_please/grabbers/facebook.rb
+- lib/ids_please/grabbers/google_plus.rb
 - lib/ids_please/grabbers/instagram.rb
 - lib/ids_please/grabbers/mailru.rb
 - lib/ids_please/grabbers/twitter.rb