RubyGems - device_detector - Versions diffs - 0.1.0 → 0.2.0 - Mend

device_detector 0.1.0 → 0.2.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (9) hide show

checksums.yaml +4 -4
data/README.md +14 -2
data/lib/device_detector.rb +13 -2
data/lib/device_detector/bot.rb +15 -0
data/lib/device_detector/parser.rb +4 -1
data/lib/device_detector/version.rb +1 -1
data/regexes/bots.yml +1002 -0
data/spec/device_detector_spec.rb +94 -0
metadata +3 -1

checksums.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 SHA1:
-  metadata.gz: e3756592136cc647379275944c3e5dd622d3204e
-  data.tar.gz: 49abbfad35f18ed4e585ff656369e113da6407e4
+  metadata.gz: 3b1d7d2d1f51f584026667fa8fff86b9d4cf994d
+  data.tar.gz: dc71e14d78d7432fd03ea583fbaaf039a1aa3242
 SHA512:
-  metadata.gz: a296b5604453c8cbcbdc82882e8429900a015eb28567df7dfe7f9eedbf7c5d4f02fce372d11b285eae5c99b8e9680d5ce7d3a58a605cc6ebcf375336c80c5605
-  data.tar.gz: 53bd317b7a28fdbfb3a1386b7989c8aaa77fc78062ba8071f1063520c03ed16aced508b9c2d7935acef8a69f28aac284cf6fd63d4a4489350db69c95e2fc2b74
+  metadata.gz: 956b2f1762edd6106dd96a8c920b88d0e1b323552790ba46d533063028802c4ca91f739a4c49d95a4ade4f273f1abad48a2a73781177ccdfd776857c45e087cc
+  data.tar.gz: 49a4bbc2a254452296f155e11837772afb3a4399308a18eb035c98ab0f7ead38ab850f0650b802043c4701afe077788ebae5a1ae33d52e4a2d2d6926281f6de6

data/README.md CHANGED Viewed

@@ -1,8 +1,20 @@
 # DeviceDetector
-This is a Ruby port of the Universal Device Detection library. You can find the original code here: [https://github.com/piwik/device-detector].
+This is a Ruby port of the Universal Device Detection library.
+You can find the original code here: [https://github.com/piwik/device-detector].
-The Universal Device Detection library will parse any User Agent and detect the browser, operating system, device used (desktop, tablet, mobile, tv, cars, console, etc.), brand and model.
+The Universal Device Detection library will parse any User Agent and detect
+the browser, operating system, device used (desktop, tablet, mobile, tv, cars,
+console, etc.), brand and model.
+## Disclaimer
+This port does not aspire to be a one-to-one copy from the original code, but
+rather an adaptation for the Ruby language.
+Still, our goal is to use the original, unchanged regex yaml files, in order to
+mutually benefit from updates and pull request to both the original and the
+ported versions.
 ## Installation

data/lib/device_detector.rb CHANGED Viewed

@@ -6,13 +6,12 @@ $LOAD_PATH.unshift(File.dirname(__FILE__))
 require 'device_detector/version'
 require 'device_detector/version_extractor'
 require 'device_detector/parser'
+require 'device_detector/bot'
 require 'device_detector/client'
 require 'device_detector/os'
 class DeviceDetector
-  ROOT = Pathname.new(File.expand_path('../..', __FILE__))
   attr_reader :user_agent
   def initialize(user_agent)
@@ -39,8 +38,20 @@ class DeviceDetector
     client.known?
   end
+  def bot?
+    bot.bot?
+  end
+  def bot_name
+    bot.name
+  end
   private
+  def bot
+    @bot ||= Bot.new(user_agent)
+  end
   def client
     @client ||= Client.new(user_agent)
   end

data/lib/device_detector/bot.rb ADDED Viewed

@@ -0,0 +1,15 @@
+class DeviceDetector
+  class Bot < Parser
+    def bot?
+      regex_meta.any?
+    end
+    private
+    def filenames
+      ['bots.yml']
+    end
+  end
+end

data/lib/device_detector/parser.rb CHANGED Viewed

@@ -29,10 +29,13 @@ class DeviceDetector
     def filepaths
       filenames.map do |filename|
-        File.join(DeviceDetector::ROOT, 'regexes', filename)
+        File.join(root, 'regexes', filename)
       end
     end
+    def root
+      Pathname.new(File.expand_path('../../..', __FILE__))
+    end
   end
 end

data/lib/device_detector/version.rb CHANGED Viewed

@@ -1,3 +1,3 @@
 class DeviceDetector
-  VERSION = '0.1.0'
+  VERSION = '0.2.0'
 end

data/regexes/bots.yml ADDED Viewed

@@ -0,0 +1,1002 @@
+###############
+# Device Detector - The Universal Device Detection library for parsing User Agents
+#
+# @link http://piwik.org
+# @license http://www.gnu.org/licenses/lgpl.html LGPL v3 or later
+###############
+- regex: '360Spider(-Image|-Video)?'
+  name: '360Spider'
+  category: 'Search bot'
+  url: 'http://www.so.com/help/help_3_2.html'
+  producer:
+    name: 'Online Media Group, Inc.'
+    url: ''
+- regex: 'Aboundex'
+  name: 'Aboundexbot'
+  category: 'Search bot'
+  url: 'http://www.aboundex.com/crawler/'
+  producer:
+    name: 'Aboundex.com'
+    url: 'http://www.aboundex.com'
+- regex: 'AcoonBot'
+  name: 'Acoon'
+  category: 'Search bot'
+  url: 'http://www.acoon.de/robot.asp'
+  producer:
+    name: 'Acoon GmbH'
+    url: 'http://www.acoon.de'
+- regex: 'AddThis.com'
+  name: 'AddThis.com'
+  category: 'Social Media Agent'
+  url: ''
+  producer:
+    name: 'Clearspring Technologies, Inc.'
+    url: 'http://www.clearspring.com'
+- regex: 'AhrefsBot'
+  name: 'aHrefs Bot'
+  category: 'Crawler'
+  url: 'http://ahrefs.com/robot'
+  producer:
+    name: 'Ahrefs Pte Ltd'
+    url: 'http://ahrefs.com/robot'
+- regex: 'ia_archiver|alexabot|verifybot'
+  name: 'Alexa Crawler'
+  category: 'Search bot'
+  url: 'https://alexa.zendesk.com/hc/en-us/sections/200100794-Crawlers'
+  producer:
+    name: 'Alexa Internet'
+    url: 'http://www.alexa.com'
+- regex: 'AmorankSpider'
+  name: 'Amorank Spider'
+  category: 'Crawler'
+  url: 'http://amorank.com/webcrawler.html'
+  producer:
+    name: 'Amorank'
+    url: 'http://www.amorank.com'
+- regex: 'Curious George'
+  name: 'Analytics SEO Crawler'
+  category: 'Crawler'
+  url: 'http://www.analyticsseo.com/crawler'
+  producer:
+    name: 'Analytics SEO'
+    url: 'http://www.analyticsseo.com'
+- regex: 'archive.org_bot|special_archiver'
+  name: 'archive.org bot'
+  category: 'Crawler'
+  url: 'http://www.archive.org/details/archive.org_bot'
+  producer:
+    name: 'The Internet Archive'
+    url: 'http://www.archive.org'
+- regex: 'Ask Jeeves/Teoma'
+  name: 'Ask Jeeves'
+  category: 'Search bot'
+  url: ''
+  producer:
+    name: 'Ask Jeeves Inc.'
+    url: 'http://www.ask.com'
+- regex: 'Backlink-Ceck.de'
+  name: 'Backlink-Ceck.de'
+  category: 'Crawler'
+  url: 'http://www.backlink-check.de/bot.html'
+  producer:
+    name: 'Mediagreen Medienservice'
+    url: 'http://www.backlink-check.de'
+- regex: 'BacklinkCrawler'
+  name: 'BacklinkCrawler'
+  category: 'Crawler'
+  url: 'http://www.backlinktest.com/crawler.html'
+  producer:
+    name: '2.0Promotion GbR'
+    url: 'http://www.backlinktest.com'
+- regex: 'baiduspider(-image)?|baidu Transcoder|baidu.*spider'
+  name: 'Baidu Spider'
+  category: 'Search bot'
+  url: 'http://www.baidu.com/search/spider.htm'
+  producer:
+    name: 'Baidu'
+    url: 'http://www.baidu.com'
+- regex: 'MSNBot|msrbot|bingbot|BingPreview|msnbot-(UDiscovery|NewsBlogs)|adidxbot'
+  name: 'BingBot'
+  category: 'Search bot'
+  url: 'http://search.msn.com/msnbot.htmn'
+  producer:
+    name: 'Microsoft Corporation'
+    url: 'http://www.microsoft.com'
+- regex: 'Blekkobot'
+  name: 'Blekkobot'
+  category: 'Search bot'
+  url: 'http://blekko.com/about/blekkobot'
+  producer:
+    name: 'Blekko'
+    url: 'http://blekko.com'
+- regex: 'BLEXBot(Test)?'
+  name: 'BLEXBot Crawler'
+  category: 'Crawler'
+  url: 'http://webmeup-crawler.com'
+  producer:
+    name: 'WebMeUp'
+    url: 'http://webmeup.com'
+- regex: 'Bloglovin'
+  name: 'Bloglovin'
+  url: 'http://www.bloglovin.com'
+  category: 'Feed Fetcher'
+  producer:
+    name: ''
+    url: ''
+- regex: 'BountiiBot'
+  name: 'Bountii Bot'
+  category: 'Search bot'
+  url: 'http://bountii.com/contact.php'
+  producer:
+    name: 'Bountii Inc.'
+    url: 'http://bountii.com'
+- regex: 'Browsershots'
+  name: 'Browsershots'
+  category: 'Service Agent'
+  url: 'http://browsershots.org/faq'
+  producer:
+    name: 'Browsershots.org'
+    url: 'http://browsershots.org'
+- regex: '(?<!HTC)[ _]Butterfly'
+  name: 'Butterfly Robot'
+  category: 'Search bot'
+  url: 'http://labs.topsy.com/butterfly'
+  producer:
+    name: 'Topsy Labs'
+    url: 'http://labs.topsy.com'
+- regex: 'CareerBot'
+  name: 'CareerBot'
+  category: 'Crawler'
+  url: 'http://www.career-x.de/bot.html'
+  producer:
+    name: 'career-x GmbH'
+    url: 'http://www.career-x.de'
+- regex: 'CCBot'
+  name: 'ccBot crawler'
+  category: 'Crawler'
+  url: 'http://commoncrawl.org/faq/'
+  producer:
+    name: 'reddit inc.'
+    url: 'http://www.reddit.com'
+- regex: 'Cliqzbot'
+  name: 'Cliqzbot'
+  category: 'Crawler'
+  url: 'http://cliqz.com/company/cliqzbot'
+  producer:
+    name: '10betterpages GmbH'
+    url: 'http://cliqz.com'
+- regex: 'CloudFlare-AlwaysOnline'
+  name: 'CloudFlare Always Online'
+  category: 'Site Monitor'
+  url: 'http://www.cloudflare.com/always-online'
+  producer:
+    name: 'CloudFlare'
+    url: 'http://www.cloudflare.com'
+- regex: 'CommaFeed'
+  name: 'CommaFeed'
+  url: 'http://www.commafeed.com'
+  category: 'Feed Fetcher'
+  producer:
+    name: ''
+    url: ''
+- regex: 'Dazoobot'
+  name: 'Dazoobot'
+  category: 'Search bot'
+  url: ''
+  producer:
+    name: 'DAZOO.FR'
+    url: 'http://dazoo.fr'
+- regex: 'discobot(-news)?'
+  name: 'Discobot'
+  category: 'Search bot'
+  url: 'http://discoveryengine.com/discobot.html'
+  producer:
+    name: 'Discovery Engine'
+    url: 'http://discoveryengine.com'
+- regex: 'DotBot'
+  name: 'DotBot'
+  category: 'Crawler'
+  url: 'http://www.opensiteexplorer.org/dotbot'
+  producer:
+    name: 'SEOmoz, Inc.'
+    url: 'http://moz.com/'
+- regex: 'EasouSpider'
+  name: 'Easou Spider'
+  category: 'Search bot'
+  url: 'http://www.easou.com/search/spider.html'
+  producer:
+    name: 'easou ICP'
+    url: 'http://www.easou.com'
+- regex: 'EMail Exractor'
+  name: 'EMail Exractor'
+  category: 'Crawler'
+  url: ''
+  producer:
+    name: ''
+    url: ''
+- regex: 'Exabot(-Thumbnails|-Images)?|ExaleadCloudview'
+  name: 'ExaBot'
+  category: 'Crawler'
+  url: 'http://www.exabot.com/go/robot'
+  producer:
+    name: 'Dassault Systèmes'
+    url: 'http://www.3ds.com'
+- regex: 'ExactSeek Crawler'
+  name: 'ExactSeek Crawler'
+  category: 'Search bot'
+  url: 'http://www.exactseek.com'
+  producer:
+    name: 'Jayde Online, Inc.'
+    url: 'http://www.jaydeonlineinc.com'
+- regex: 'Ezooms'
+  name: 'Ezooms'
+  category: 'Crawler'
+  url: ''
+  producer:
+    name: 'SEOmoz, Inc.'
+    url: 'http://moz.com/'
+- regex: 'facebookexternalhit|facebookplatform'
+  name: 'Facebook External Hit'
+  category: 'Social Media Agent'
+  url: 'https://www.facebook.com/externalhit_uatext.php'
+  producer:
+    name: 'Facebook'
+    url: 'http://www.facebook.com'
+- regex: 'Feedbin'
+  name: 'Feedbin'
+  url: 'http://feedbin.com/'
+  category: 'Feed Fetcher'
+  producer:
+    name: ''
+    url: ''
+- regex: 'FeedBurner'
+  name: 'FeedBurner'
+  url: 'http://www.feedburner.com'
+  category: 'Feed Fetcher'
+  producer:
+    name: ''
+    url: ''
+- regex: '(Meta)?Feedly(Bot|App)?'
+  name: 'Feedly'
+  url: 'http://www.feedly.com'
+  category: 'Feed Fetcher'
+  producer:
+    name: ''
+    url: ''
+- regex: 'Feedspot'
+  name: 'Feedspot'
+  url: 'http://www.feedspot.com'
+  category: 'Feed Fetcher'
+  producer:
+    name: ''
+    url: ''
+- regex: 'Fever'
+  name: 'Fever'
+  url: 'http://feedafever.com/'
+  category: 'Feed Fetcher'
+  producer:
+    name: ''
+    url: ''
+- regex: 'Genieo'
+  name: 'Genieo Web filter'
+  category: ''
+  url: 'http://www.genieo.com/webfilter.html'
+  producer:
+    name: 'Genieo'
+    url: 'http://www.genieo.com'
+- regex: 'ichiro/mobile goo'
+  name: 'Goo'
+  category: 'Search bot'
+  url: 'http://search.goo.ne.jp/option/use/sub4/sub4-1'
+  producer:
+    name: 'NTT Resonant'
+    url: 'http://goo.ne.jp'
+- regex: 'Google Page Speed Insights'
+  name: 'Google PageSpeed Insights'
+  category: 'Site Monitor'
+  url: 'http://developers.google.com/speed/pagespeed/insights/'
+  producer:
+    name: 'Google Inc.'
+    url: 'http://www.google.com'
+- regex: 'Googlebot(-Mobile|-Image|-Video|-News)?|Feedfetcher-Google|Google-Test|Google-Site-Verification|Google Web Preview|AdsBot-Google(-Mobile)?|Mediapartners-Google|Google.*/\+/web/snippet|GoogleProducer'
+  name: 'Googlebot'
+  category: 'Search bot'
+  url: 'http://www.google.com/bot.html'
+  producer:
+    name: 'Google Inc.'
+    url: 'http://www.google.com'
+- regex: 'heritrix'
+  name: 'Heritrix'
+  category: 'Crawler'
+  url: 'https://webarchive.jira.com/wiki/display/Heritrix/Heritrix'
+  producer:
+    name: 'The Internet Archive'
+    url: 'http://www.archive.org'
+- regex: 'HTTPMon'
+  name: 'HTTPMon'
+  category: 'Site Monitor'
+  url: 'http://www.httpmon.com'
+  producer:
+    name: 'towards GmbH'
+    url: 'http://www.towards.ch/'
+- regex: 'iisbot'
+  name: 'IIS Site Analysis'
+  category: 'crawler'
+  url: 'http://www.iis.net/iisbot.html'
+  producer:
+    name: 'Microsoft Corporation'
+    url: 'http://www.microsoft.com'
+- regex: 'kouio'
+  name: 'Kouio'
+  url: 'http://kouio.com/'
+  category: 'Feed Fetcher'
+  producer:
+    name: ''
+    url: ''
+- regex: 'linkdexbot(-mobile)?|linkdex.com'
+  name: 'Linkdex Bot'
+  category: 'Search bot'
+  url: 'http://www.linkdex.com/bots'
+  producer:
+    name: 'Mojeek Ltd.'
+    url: 'http://www.mojeek.com'
+- regex: 'LinkedInBot'
+  name: 'LinkedIn Bot'
+  category: 'Social Media Agent'
+  url: 'http://www.linkedin.com'
+  producer:
+    name: 'LinkedIn'
+    url: 'http://www.linkedin.com'
+- regex: 'Mail.RU(_Bot)?'
+  name: 'Mail.Ru Bot'
+  category: 'Search bot'
+  url: 'http://help.mail.ru/webmaster/indexing/robots/types_robots'
+  producer:
+    name: 'Mail.Ru Group'
+    url: 'http://corp.mail.ru'
+- regex: 'magpie-crawler'
+  name: 'Magpie-Crawler'
+  category: 'Social Media Agent'
+  url: 'http://www.brandwatch.com/magpie-crawler/'
+  producer:
+    name: 'Brandwatch'
+    url: 'http://www.brandwatch.com'
+- regex: 'MagpieRSS'
+  name: 'MagpieRSS'
+  url: 'http://magpierss.sourceforge.net/'
+  category: 'Feed Parser'
+  producer:
+    name: ''
+    url: ''
+- regex: 'meanpathbot'
+  name: 'Meanpath Bot'
+  category: 'Search bot'
+  url: 'http://www.meanpath.com/meanpathbot.html'
+  producer:
+    name: 'Meanpath'
+    url: 'http://www.meanpath.com'
+- regex: 'MixrankBot'
+  name: 'Mixrank Bot'
+  category: 'Crawler'
+  url: 'http://mixrank.com'
+  producer:
+    name: 'Online Media Group, Inc.'
+    url: ''
+- regex: 'MJ12bot'
+  name: 'MJ12 Bot'
+  category: 'Search bot'
+  url: 'http://majestic12.co.uk/bot.php'
+  producer:
+    name: 'Majestic-12'
+    url: 'http://majestic12.co.uk'
+- regex: 'MojeekBot'
+  name: 'MojeekBot'
+  category: 'Search bot'
+  url: 'http://www.mojeek.com/bot.html'
+  producer:
+    name: 'Mojeek Ltd.'
+    url: 'http://www.mojeek.com'
+- regex: 'NalezenCzBot'
+  name: 'NalezenCzBot'
+  category: 'Crawler'
+  url: 'http://www.nalezen.cz/about-crawler'
+  producer:
+    name: 'Jaroslav Kuboš'
+    url: ''
+- regex: 'Netcraft Web Server Survey'
+  name: 'Netcraft Survey Bot'
+  category: 'Search bot'
+  url: ''
+  producer:
+    name: 'Netcraft'
+    url: 'http://www.netcraft.com'
+- regex: 'Netvibes'
+  name: 'Netvibes'
+  url: 'http://www.netvibes.com/'
+  category: 'Feed Fetcher'
+  producer:
+    name: ''
+    url: ''
+- regex: 'NewsBlur .*(Fetcher|Finder)'
+  name: 'NewsBlur'
+  url: 'http://www.newsblur.com'
+  category: 'Feed Fetcher'
+  producer:
+    name: ''
+    url: ''
+- regex: 'NewsGatorOnline'
+  name: 'NewsGator'
+  url: 'http://www.newsgator.com'
+  category: 'Feed Fetcher'
+  producer:
+    name: ''
+    url: ''
+- regex: 'nlcrawler'
+  name: 'NLCrawler'
+  category: 'Crawler'
+  url: ''
+  producer:
+    name: 'Northern Light'
+    url: 'http://northernlight.com'
+- regex: 'omgilibot'
+  name: 'Omgili bot'
+  category: 'Search bot'
+  url: 'http://www.omgili.com/Crawler.html'
+  producer:
+    name: 'Omgili'
+    url: 'http://www.omgili.com'
+- regex: 'OpenindexSpider'
+  name: 'Openindex Spider'
+  category: 'Search bot'
+  url: 'http://www.openindex.io/en/webmasters/spider.html'
+  producer:
+    name: 'Openindex B.V.'
+    url: 'http://www.openindex.io'
+- regex: 'spbot'
+  name: 'OpenLinkProfiler'
+  category: 'Crawler'
+  url: 'http://openlinkprofiler.org/bot'
+  producer:
+    name: 'Axandra GmbH'
+    url: 'http://www.axandra.com'
+- regex: 'OpenWebSpider'
+  name: 'OpenWebSpider'
+  category: 'Crawler'
+  url: 'http://www.openwebspider.org'
+  producer:
+    name: 'OpenWebSpider Lab'
+    url: 'http://lab.openwebspider.org'
+- regex: 'PaperLiBot'
+  name: 'PaperLiBot'
+  category: 'Search bot'
+  url: 'http://support.paper.li/entries/20023257-what-is-paper-li'
+  producer:
+    name: 'Smallrivers SA'
+    url: 'http://www.paper.li'
+- regex: 'psbot(-page)?'
+  name: 'Picsearch bot'
+  category: 'Search bot'
+  url: 'http://www.picsearch.com/bot.html'
+  producer:
+    name: 'Picsearch'
+    url: 'http://www.picsearch.com'
+- regex: 'Pingdom.com'
+  name: 'Pingdom Bot'
+  category: 'Site Monitors'
+  url: ''
+  producer:
+    name: 'Pingdom AB'
+    url: 'https://www.pingdom.com'
+- regex: 'QuerySeekerSpider'
+  name: 'QuerySeekerSpider'
+  category: 'Crawler'
+  url: 'http://queryseeker.com/bot.html'
+  producer:
+    name: 'QueryEye Inc.'
+    url: 'http://queryeye.com'
+- regex: 'redditbot'
+  name: 'Reddit Bot'
+  category: 'Social Media Agent'
+  url: 'http://www.reddit.com/feedback'
+  producer:
+    name: 'reddit inc.'
+    url: 'http://www.reddit.com'
+- regex: 'rogerbot'
+  name: 'Rogerbot'
+  category: 'Crawler'
+  url: 'http://moz.com/help/pro/what-is-rogerbot-'
+  producer:
+    name: 'SEOmoz, Inc.'
+    url: 'http://moz.com/'
+- regex: 'Screaming Frog SEO Spider'
+  name: 'Screaming Frog SEO Spider'
+  category: 'Crawler'
+  url: 'http://www.screamingfrog.co.uk/seo-spider'
+  producer:
+    name: 'Screaming Frog Ltd'
+    url: 'http://www.screamingfrog.co.uk'
+- regex: 'ScreenerBot'
+  name: 'ScreenerBot'
+  category: 'Crawler'
+  url: 'http://www.screenerbot.com'
+  producer:
+    name: ''
+    url: ''
+- regex: 'SemrushBot'
+  name: 'Semrush Bot'
+  category: 'Crawler'
+  url: 'http://www.semrush.com/bot.html'
+  producer:
+    name: 'SEMrush'
+    url: 'http://www.semrush.com'
+- regex: 'SensikaBot'
+  name: 'Sensika Bot'
+  category: ''
+  url: ''
+  producer:
+    name: 'Sensika'
+    url: 'http://sensika.com'
+- regex: 'SEOENG(World)?Bot'
+  name: 'SEOENGBot'
+  category: 'Crawler'
+  url: 'http://www.seoengine.com/seoengbot.htm'
+  producer:
+    name: 'SEO Engine'
+    url: 'http://www.seoengine.com'
+- regex: 'SeznamBot|SklikBot|Seznam screenshot-generator'
+  name: 'Seznam Bot'
+  category: 'Search bot'
+  url: 'http://www.mapy.cz/cz/seznambot.html'
+  producer:
+    name: 'Seznam.cz, a.s.'
+    url: 'http://www.seznam.cz/'
+- regex: 'ShopWiki'
+  name: 'ShopWiki'
+  category: 'Search tools'
+  url: 'http://www.shopwiki.com/wiki/Help:Bot'
+  producer:
+    name: 'ShopWiki Corp.'
+    url: 'http://www.shopwiki.com'
+- regex: 'SilverReader'
+  name: 'SilverReader'
+  url: 'http://silverreader.com'
+  category: 'Feed Fetcher'
+  producer:
+    name: ''
+    url: ''
+- regex: 'SimplePie'
+  name: 'SimplePie'
+  url: 'http://www.simplepie.org'
+  category: 'Feed Parser'
+  producer:
+    name: ''
+    url: ''
+- regex: 'SISTRIX Crawler'
+  name: 'SISTRIX Crawler'
+  category: 'Crawler'
+  url: 'http://crawler.sistrix.net'
+  producer:
+    name: 'SISTRIX GmbH'
+    url: 'http://www.sistrix.de'
+- regex: '(Sogou (web|inst|Pic) spider)|New-Sogou-Spider'
+  name: 'Sogou Spider'
+  category: 'Search bot'
+  url: 'http://www.sogou.com/docs/help/webmasters.htm'
+  producer:
+    name: 'Sohu, Inc.'
+    url: 'http://www.sogou.com'
+- regex: 'Sosospider|Sosoimagespider'
+  name: 'Soso Spider'
+  category: 'Search bot'
+  url: 'http://help.soso.com/webspider.htm'
+  producer:
+    name: 'Tencent Holdings'
+    url: 'http://www.soso.com'
+- regex: 'Superfeedr bot'
+  name: 'Superfeedr Bot'
+  category: 'Feed Fetcher'
+  url: ''
+  producer:
+    name: 'Superfeedr'
+    url: 'https://superfeedr.com/'
+- regex: 'Spinn3r'
+  name: 'Spinn3r'
+  category: 'Crawler'
+  url: 'http://spinn3r.com/robot'
+  producer:
+    name: 'Tailrank Inc'
+    url: 'http://spinn3r.com'
+- regex: 'Sputnik(Image)?Bot'
+  name: 'Sputnik Bot'
+  category: ''
+  url: ''
+  producer:
+    name: ''
+    url: ''
+- regex: 'SurveyBot'
+  name: 'Survey Bot'
+  category: 'Search bot'
+  url: 'http://www.domaintools.com/webmasters/surveybot.php'
+  producer:
+    name: 'Domain Tools'
+    url: 'http://www.domaintools.com'
+- regex: 'TinEye-bot'
+  name: 'TinEye Crawler'
+  category: 'Search bot'
+  url: 'http://www.tineye.com/crawler.html'
+  producer:
+    name: 'Idée Inc.'
+    url: 'http://ideeinc.com'
+- regex: 'Tiny Tiny RSS'
+  name: 'Tiny Tiny RSS'
+  url: 'http://tt-rss.org'
+  category: 'Feed Fetcher'
+  producer:
+    name: ''
+    url: ''
+- regex: 'TurnitinBot'
+  name: 'TurnitinBot'
+  category: 'Crawler'
+  url: 'http://www.turnitin.com/robot/crawlerinfo.html'
+  producer:
+    name: 'iParadigms, LLC.'
+    url: 'http://www.turnitin.com'
+- regex: 'TweetedTimes Bot'
+  name: 'TweetedTimes Bot'
+  category: 'Crawler'
+  url: 'http://tweetedtimes.com'
+  producer:
+    name: 'TweetedTimes'
+    url: 'http://tweetedtimes.com/'
+- regex: 'TweetmemeBot'
+  name: 'Tweetmeme Bot'
+  category: 'Crawler'
+  url: 'http://tweetmeme.com/'
+  producer:
+    name: 'Mediasift'
+    url: ''
+- regex: 'Twitterbot'
+  name: 'Twitterbot'
+  category: 'Social Media Agent'
+  url: 'https://dev.twitter.com/docs/cards/getting-started'
+  producer:
+    name: 'Twitter'
+    url: 'http://www.twitter.com'
+- regex: 'UptimeRobot'
+  name: 'Uptime Robot'
+  category: 'Site Monitor'
+  url: ''
+  producer:
+    name: 'Uptime Robot'
+    url: 'http://uptimerobot.com'
+- regex: 'URLAppendBot'
+  name: 'URLAppendBot'
+  category: 'Crawler'
+  url: 'http://www.profound.net/urlappendbot.html'
+  producer:
+    name: 'Profound Networks'
+    url: 'http://www.profound.net'
+- regex: 'VSMCrawler'
+  name: 'Visual Site Mapper Crawler'
+  category: 'Crawler'
+  url: 'http://www.visualsitemapper.com/crawler'
+  producer:
+    name: 'Alentum Software Ltd.'
+    url: 'http://www.alentum.com'
+- regex: 'VoilaBot'
+  name: 'Voila Bot'
+  category: 'Search bot'
+  url: 'http://www.voila.fr'
+  producer:
+    name: ''
+    url: ''
+- regex: 'Jigsaw'
+  name: 'W3C CSS Validator'
+  category: 'Validator'
+  url: 'http://jigsaw.w3.org/css-validator'
+  producer:
+    name: 'W3C'
+    url: 'http://www.w3.org'
+- regex: 'W3C_I18n-Checker'
+  name: 'W3C I18N Checker'
+  category: 'Validator'
+  url: 'http://validator.w3.org/i18n-checker'
+  producer:
+    name: 'W3C'
+    url: 'http://www.w3.org'
+- regex: 'W3C-checklink'
+  name: 'W3C Link Checker'
+  category: 'Validator'
+  url: 'http://validator.w3.org/checklink'
+  producer:
+    name: 'W3C'
+    url: 'http://www.w3.org'
+- regex: 'W3C_Validator'
+  name: 'W3C Markup Validation Service'
+  category: 'Validator'
+  url: 'http://validator.w3.org/services'
+  producer:
+    name: 'W3C'
+    url: 'http://www.w3.org'
+- regex: 'W3C-mobileOK'
+  name: 'W3C MobileOK Checker'
+  category: 'Validator'
+  url: 'http://validator.w3.org/mobile'
+  producer:
+    name: 'W3C'
+    url: 'http://www.w3.org'
+- regex: 'W3C_Unicorn'
+  name: 'W3C Unified Validator'
+  category: 'Validator'
+  url: 'http://validator.w3.org/unicorn'
+  producer:
+    name: 'W3C'
+    url: 'http://www.w3.org'
+- regex: 'WeSEE(:Search)?'
+  name: 'WeSEE:Search'
+  category: 'Search bot'
+  url: 'http://www.wesee.com/bot'
+  producer:
+    name: 'WeSEE Ltd'
+    url: 'http://www.wesee.com'
+- regex: 'WebbCrawler'
+  name: 'WebbCrawler'
+  category: 'Crawler'
+  url: 'http://badcheese.com/crawler.html'
+  producer:
+    name: 'Steve Webb'
+    url: 'http://badcheese.com'
+- regex: 'Wotbox'
+  name: 'Wotbox'
+  category: 'Search bot'
+  url: 'http://www.wotbox.com/bot/'
+  producer:
+    name: 'Wotbox'
+    url: 'http://www.wotbox.com'
+- regex: 'yacybot'
+  name: 'YaCy'
+  category: 'Search bot'
+  url: 'http://yacy.net/bot.html'
+  producer:
+    name: 'YaCy'
+    url: 'http://yacy.net'
+- regex: 'Yahoo! Slurp|Yahoo!-AdCrawler'
+  name: 'Yahoo! Slurp'
+  category: 'Search bot'
+  url: 'http://help.yahoo.com/ysearch/slurp'
+  producer:
+    name: 'Yahoo! Inc.'
+    url: 'http://www.yahoo.com'
+- regex: 'Yandex(Bot|Images|Antivirus|Direct|Blogs|Favicons|ImageResizer|News(links)?|Metrika|.Gazeta Bot)'
+  name: 'Yandex Bot'
+  category: 'Search bot'
+  url: 'http://www.yandex.com/bots'
+  producer:
+    name: 'Yandex LLC'
+    url: 'http://company.yandex.com'
+- regex: 'Yeti'
+  name: 'Yeti/Naverbot'
+  category: 'Search bot'
+  url: 'http://help.naver.com/robots/'
+  producer:
+    name: 'Naver'
+    url: 'http://www.naver.com'
+- regex: 'YoudaoBot'
+  name: 'Youdao Bot'
+  category: 'Search bot'
+  url: 'http://www.youdao.com/help/webmaster/spider'
+  producer:
+    name: 'NetEase, Inc.'
+    url: 'http://corp.163.com'
+- regex: 'YRSpider|YYSpider'
+  name: 'Yunyun Bot'
+  category: 'Search bot'
+  url: 'http://www.yunyun.com/SiteInfo.php?r=about'
+  producer:
+    name: 'YunYun'
+    url: 'http://www.yunyun.com'
+- regex: 'Zookabot'
+  name: 'Zookabot'
+  category: 'Crawler'
+  url: 'http://zookabot.com'
+  producer:
+    name: 'Hwacha ApS'
+    url: 'http://hwacha.dk'
+- regex: 'ZumBot'
+  name: 'ZumBot'
+  category: 'Search bot'
+  url: 'http://help.zum.com/inquiry'
+  producer:
+    name: 'ZUM internet'
+    url: 'http://www.zuminternet.com/'
+- regex: 'YottaaMonitor'
+  name: 'Yottaa Site Monitor'
+  category: 'Site Monitor'
+  url: 'http://www.yottaa.com/products/site-monitor'
+  producer:
+    name: 'Yottaa'
+    url: 'http://www.yottaa.com/'
+- regex: 'lycos'
+  name: 'Lycos'
+- regex: 'Slurp'
+  name: 'Inktomi Slurp'
+- regex: 'Speedy Spider'
+  name: 'Speedy'
+- regex: 'ScoutJet'
+  name: 'ScoutJet'
+- regex: 'nrsbot|netresearch'
+  name: 'NetResearchServer'
+- regex: 'scooter'
+  name: 'Scooter'
+- regex: 'gigabot'
+  name: 'Gigabot'
+- regex: 'charlotte'
+  name: 'Charlotte'
+- regex: 'Pompos'
+  name: 'Pompos'
+- regex: 'ichiro'
+  name: 'ichiro'
+- regex: 'PagePeeker'
+  name: 'PagePeeker'
+- regex: 'WebThumbnail'
+  name: 'WebThumbnail'
+- regex: 'Willow Internet Crawler'
+  name: 'Willow Internet Crawler'
+- regex: 'EmailWolf'
+  name: 'EmailWolf'
+- regex: '(nuhk|TsolCrawler|Yammybot|Openbot|Gulper Web Bot|grub-client|Download Demon|SearchExpress|Microsoft URL Control|borg|altavista|teoma|blitzbot|oegp|furlbot|http%20client|polybot|htdig|mogimogi|larbin|scrubby|searchsight|seekbot|semanticdiscovery|snappy|vortex|zao|zeal|fast-webcrawler|converacrawler|dataparksearch|findlinks|BrowserMob|HttpMonitor|ThumbShotsBot|URL2PNG|ZooShot|GomezA|Catchpoint bot|Google SketchUp|Read%20Later|Minimo|RackspaceBot)'
+  name: 'Bot'
+# Generic detections
+- regex: 'Nutch'
+  name: 'Nutch-based Bot'
+  category: 'crawler'
+  url: 'https://nutch.apache.org'
+  producer:
+    name: 'The Apache Software Foundation'
+    url: 'http://www.apache.org/foundation/'
+# Original:
+# - regex: '[a-z0-9-_]*(bot|crawler|archiver|transcoder|spider)'
+#   name: 'Generic Bot'
+#
+# Adapted for Ruby:
+# Note the backslash added in [a-z0-9\-_], it is necessary to avoid
+# warnings from the interpreter
+- regex: '[a-z0-9\-_]*(bot|crawler|archiver|transcoder|spider)'
+  name: 'Generic Bot'

data/spec/device_detector_spec.rb CHANGED Viewed

@@ -48,6 +48,22 @@ RSpec.describe DeviceDetector do
     end
+    describe '#bot?' do
+      it 'returns false' do
+        expect(client.bot?).to eq(false)
+      end
+    end
+    describe '#bot_name' do
+      it 'returns nil' do
+        expect(client.bot_name).to be_nil
+      end
+    end
   end
   context 'unknown user agent' do
@@ -94,5 +110,83 @@ RSpec.describe DeviceDetector do
     end
+    describe '#bot?' do
+      it 'returns false' do
+        expect(client.bot?).to eq(false)
+      end
+    end
+    describe '#bot_name' do
+      it 'returns nil' do
+        expect(client.bot_name).to be_nil
+      end
+    end
+  end
+  context 'bot' do
+    let(:user_agent) { 'Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)' }
+    describe '#name' do
+      it 'returns nil' do
+        expect(client.name).to be_nil
+      end
+    end
+    describe '#full_version' do
+      it 'returns nil' do
+        expect(client.full_version).to be_nil
+      end
+    end
+    describe '#os_name' do
+      it 'returns nil' do
+        expect(client.os_name).to be_nil
+      end
+    end
+    describe '#os_full_version' do
+      it 'returns nil' do
+        expect(client.os_full_version).to be_nil
+      end
+    end
+    describe '#known?' do
+      it 'returns false' do
+        expect(client.known?).to eq(false)
+      end
+    end
+    describe '#bot?' do
+      it 'returns true' do
+        expect(client.bot?).to eq(true)
+      end
+    end
+    describe '#bot_name' do
+      it 'returns the name of the bot' do
+        expect(client.bot_name).to eq('Googlebot')
+      end
+    end
   end
 end

metadata CHANGED Viewed

@@ -1,7 +1,7 @@
 --- !ruby/object:Gem::Specification
 name: device_detector
 version: !ruby/object:Gem::Version
-  version: 0.1.0
+  version: 0.2.0
 platform: ruby
 authors:
 - Mati Sójka
@@ -60,11 +60,13 @@ files:
 - Rakefile
 - device_detector.gemspec
 - lib/device_detector.rb
+- lib/device_detector/bot.rb
 - lib/device_detector/client.rb
 - lib/device_detector/os.rb
 - lib/device_detector/parser.rb
 - lib/device_detector/version.rb
 - lib/device_detector/version_extractor.rb
+- regexes/bots.yml
 - regexes/browser_engines.yml
 - regexes/browsers.yml
 - regexes/feed_readers.yml