RubyGems - trackit_scraper - Versions diffs - 2.0.0 → 2.1.0 - Mend

trackit_scraper 2.0.0 → 2.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (9) hide show

data/lib/trackit_scraper/2003.10.1/lib/login_command.rb +21 -21
data/lib/trackit_scraper/2003.10.1/lib/navigator.rb +11 -11
data/lib/trackit_scraper/2003.10.1/lib/parallel_request_scraper.rb +44 -44
data/lib/trackit_scraper/2003.10.1/lib/request_finder.rb +46 -46
data/lib/trackit_scraper/2003.10.1/lib/request_history_table.rb +24 -24
data/lib/trackit_scraper/2003.10.1/lib/request_info_table.rb +42 -42
data/lib/trackit_scraper/2003.10.1/lib/request_page.rb +30 -31
data/lib/trackit_scraper/2003.10.1/trackit_scraper.rb +55 -55
metadata +7 -17

data/lib/trackit_scraper/2003.10.1/lib/login_command.rb CHANGED Viewed

@@ -1,22 +1,22 @@
-class LoginCommand
-  def initialize(username, password, navigator)
-    @username = username
-    @password = password
-    @navigator = navigator
-  end
-  def execute(b)
-    @navigator.goto 'hd/index.ssp', b
-    login b
-  end
-  private
-  def login(b)
-    b.text_field(name: 'user_id').set @username
-    b.text_field(name: 'user_pwd').set @password
-    b.button(value: 'Log on').click
-  end
+class LoginCommand
+  def initialize(username, password, navigator)
+    @username = username
+    @password = password
+    @navigator = navigator
+  end
+  def execute(b)
+    @navigator.goto 'hd/index.ssp', b
+    login b
+  end
+  private
+  def login(b)
+    b.text_field(name: 'user_id').set @username
+    b.text_field(name: 'user_pwd').set @password
+    b.button(value: 'Log on').click
+  end
 end

data/lib/trackit_scraper/2003.10.1/lib/navigator.rb CHANGED Viewed

@@ -1,12 +1,12 @@
-class Navigator
-  def initialize(base_url)
-    @base_url = base_url
-  end
-  def goto(relative_url, b)
-    url = File.join @base_url, relative_url
-    b.goto url
-  end
+class Navigator
+  def initialize(base_url)
+    @base_url = base_url
+  end
+  def goto(relative_url, b)
+    url = File.join @base_url, relative_url
+    b.goto url
+  end
 end

data/lib/trackit_scraper/2003.10.1/lib/parallel_request_scraper.rb CHANGED Viewed

@@ -1,45 +1,45 @@
-require 'thread'
-require 'watir-webdriver'
-require_relative 'request_page'
-class ParallelRequestScraper
-  def initialize(navigator, login_command, threads)
-    @navigator = navigator
-    @login_command = login_command
-    @threads = threads
-  end
-  def scrape(request_ids, &block)
-    @request_ids = request_ids.clone
-    @semaphore = Mutex.new
-    @threads.times.map { Thread.new { scrape_requests &block } }.each { |t| t.join }
-  end
-  private
-  def scrape_requests
-    b = Watir::Browser.new
-    @login_command.execute b
-    until @request_ids.empty?
-      request = scrape_next_request b
-      yield request
-    end
-    b.close
-  end
-  def scrape_next_request(b)
-    id = next_request_id
-    return unless id
-    @navigator.goto "hd/ticket/euTicketView.ssp?ticket_id=#{id}&log=show", b
-    request_page = RequestPage.new b
-    request_page.get_request
-  end
-  def next_request_id
-    @semaphore.synchronize { return @request_ids.pop }
-  end
+require 'thread'
+require 'watir-webdriver'
+require_relative 'request_page'
+class ParallelRequestScraper
+  def initialize(navigator, login_command, threads)
+    @navigator = navigator
+    @login_command = login_command
+    @threads = threads
+  end
+  def scrape(request_ids, &block)
+    @request_ids = request_ids.clone
+    @semaphore = Mutex.new
+    @threads.times.map { Thread.new { scrape_requests &block } }.each { |t| t.join }
+  end
+  private
+  def scrape_requests
+    b = Watir::Browser.new
+    @login_command.execute b
+    until @request_ids.empty?
+      request = scrape_next_request b
+      yield request if request
+    end
+    b.close
+  end
+  def scrape_next_request(b)
+    id = next_request_id
+    return unless id
+    @navigator.goto "hd/ticket/euTicketView.ssp?ticket_id=#{id}&log=show", b
+    request_page = RequestPage.new b
+    request_page.get_request
+  end
+  def next_request_id
+    @semaphore.synchronize { return @request_ids.pop }
+  end
 end

data/lib/trackit_scraper/2003.10.1/lib/request_finder.rb CHANGED Viewed

@@ -1,46 +1,46 @@
-require 'time'
-require 'watir-webdriver'
-class RequestFinder
-  def initialize(navigator)
-    @navigator = navigator
-  end
-  def get_request_ids_for_users(users, options={})
-    b = Watir::Browser.new
-    requests = users.map { |user| get_requests_for_user user, b }.flatten
-    b.close
-    start_date = options[:start_date]
-    requests.reject! { |r| start_date > r[:submitted_on] } if start_date
-    requests.map { |r| r[:id] }.sort
-  end
-  private
-  def get_requests_for_user(user, b)
-    login_command = LoginCommand.new user[:username], user[:password], @navigator
-    login_command.execute b
-    @navigator.goto 'hd/ticket/euTicketFind.ssp', b
-    get_all_requests b
-  end
-  def get_all_requests(b)
-    b.button(value: 'Find').click
-    rows = b.tables[1].rows.to_a
-    rows.shift 2
-    requests = rows.map do |row|
-      cells = row.cells.to_a
-      next if cells.empty?
-      {
-          id: cells[0].text.to_i,
-          submitted_on: Time.parse(cells[2].text)
-      }
-    end
-    requests.compact
-  end
-end
+require 'time'
+require 'watir-webdriver'
+class RequestFinder
+  def initialize(navigator)
+    @navigator = navigator
+  end
+  def get_request_ids_for_users(users, options={})
+    b = Watir::Browser.new
+    requests = users.map { |user| get_requests_for_user user, b }.flatten
+    b.close
+    start_date = options[:start_date]
+    requests.reject! { |r| start_date > r[:submitted_on] } if start_date
+    requests.map { |r| r[:id] }.sort
+  end
+  private
+  def get_requests_for_user(user, b)
+    login_command = LoginCommand.new user[:username], user[:password], @navigator
+    login_command.execute b
+    @navigator.goto 'hd/ticket/euTicketFind.ssp', b
+    get_all_requests b
+  end
+  def get_all_requests(b)
+    b.button(value: 'Find').click
+    rows = b.tables[1].rows.to_a
+    rows.shift 2
+    requests = rows.map do |row|
+      cells = row.cells.to_a
+      next if cells.empty?
+      {
+          id: cells[0].text.to_i,
+          submitted_on: Time.parse(cells[2].text)
+      }
+    end
+    requests.compact
+  end
+end

data/lib/trackit_scraper/2003.10.1/lib/request_history_table.rb CHANGED Viewed

@@ -1,25 +1,25 @@
-require 'time'
-class RequestHistoryTable
-  def initialize(table)
-    @table = table
-  end
-  def get_resolution_info
-    r = {}
-    rows = @table.trs.to_a
-    resolved_row_index = rows.index { |r| r.text =~ /Resolved by/ }
-    if resolved_row_index
-      row_above = rows[resolved_row_index-1]
-      captures = row_above.text.scan(/(.+) by (.+)/)[0]
-      r[:resolved_on] = Time.parse captures[0]
-      r[:resolved_by] = captures[1]
-    end
-    r[:history] = @table.text
-    r
-  end
+require 'time'
+class RequestHistoryTable
+  def initialize(table)
+    @table = table
+  end
+  def get_resolution_info
+    r = {}
+    rows = @table.trs.to_a
+    resolved_row_index = rows.index { |r| r.text =~ /Resolved by/ }
+    if resolved_row_index
+      row_above = rows[resolved_row_index-1]
+      captures = row_above.text.scan(/(.+) by (.+)/)[0]
+      r[:resolved_on] = Time.parse captures[0]
+      r[:resolved_by] = captures[1]
+    end
+    r[:history] = @table.text
+    r
+  end
 end

data/lib/trackit_scraper/2003.10.1/lib/request_info_table.rb CHANGED Viewed

@@ -1,43 +1,43 @@
-class RequestInfoTable
-  def initialize(table)
-    @cells = table.tds.to_a
-  end
-  def get_request_info
-    {
-        title: cell(0),
-        status: cell(2),
-        service: cell(3),
-        request_type: cell(4),
-        time_spent: cell(5),
-        priority: cell(7),
-        deadline: time_cell(8),
-        submitted_to: cell(10),
-        submitted_by: cell(11),
-        submitted_on: time_cell(12),
-        assigned_to: cell(15),
-        assigned_by: cell(16),
-        assigned_on: time_cell(17),
-        department_id: cell(19),
-        closed_by: cell(20),
-        closed_on: maybe_time_cell(21, 'None')
-    }
-  end
-  private
-  def maybe_time_cell(index, non_time_value)
-    cell(index) { |s| s == non_time_value ? cell(index) : time_cell(index) }
-  end
-  def time_cell(index)
-    cell(index) { |s| Time.parse s }
-  end
-  def cell(index)
-    text = @cells[index].text
-    block_given? ? yield(text) : text
-  end
+class RequestInfoTable
+  def initialize(table)
+    @cells = table.tds.to_a
+  end
+  def get_request_info
+    {
+        title: cell(0),
+        status: cell(2),
+        service: cell(3),
+        request_type: cell(4),
+        time_spent: cell(5),
+        priority: cell(7),
+        deadline: maybe_time_cell(8, 'None'),
+        submitted_to: cell(10),
+        submitted_by: cell(11),
+        submitted_on: time_cell(12),
+        assigned_to: cell(15),
+        assigned_by: cell(16),
+        assigned_on: time_cell(17),
+        department_id: cell(19),
+        closed_by: cell(20),
+        closed_on: maybe_time_cell(21, 'None')
+    }
+  end
+  private
+  def maybe_time_cell(index, non_time_value)
+    cell(index) { |s| s == non_time_value ? cell(index) : time_cell(index) }
+  end
+  def time_cell(index)
+    cell(index) { |s| Time.parse s }
+  end
+  def cell(index)
+    text = @cells[index].text
+    block_given? ? yield(text) : text
+  end
 end

data/lib/trackit_scraper/2003.10.1/lib/request_page.rb CHANGED Viewed

@@ -1,32 +1,31 @@
-require_relative 'request_info_table'
-require_relative 'request_history_table'
-class RequestPage
-  def initialize(b)
-    @b = b
-  end
-  def get_request
-    r = { id: request_id }
-    return r if request_not_found?
-    request_info_table = RequestInfoTable.new @b.tables[1]
-    request_history_table = RequestHistoryTable.new @b.tables[3]
-    r.merge! request_info_table.get_request_info
-    r.merge! request_history_table.get_resolution_info
-    r
-  end
-  private
-  def request_id
-    @b.text[/Request #(\d+)/, 1]
-  end
-  def request_not_found?
-    @b.text =~ /Request #\d+ not found/
-  end
+require_relative 'request_info_table'
+require_relative 'request_history_table'
+class RequestPage
+  def initialize(b)
+    @b = b
+  end
+  def get_request
+    return if request_not_found?
+    request_info_table = RequestInfoTable.new @b.tables[1]
+    request_history_table = RequestHistoryTable.new @b.tables[3]
+    r.merge! request_info_table.get_request_info
+    r.merge! request_history_table.get_resolution_info
+    r
+  end
+  private
+  def request_id
+    @b.text[/Request #(\d+)/, 1]
+  end
+  def request_not_found?
+    @b.text =~ /Request #\d+ not found/
+  end
 end

data/lib/trackit_scraper/2003.10.1/trackit_scraper.rb CHANGED Viewed

@@ -1,56 +1,56 @@
-$stdout.sync = true
-require 'fileutils'
-require 'json'
-require_relative 'lib/login_command'
-require_relative 'lib/navigator'
-require_relative 'lib/parallel_request_scraper'
-require_relative 'lib/request_finder'
-class TrackItScraper
-  def initialize(base_url, username, password, options={})
-    navigator = Navigator.new base_url
-    login_command = LoginCommand.new username, password, navigator
-    threads = options[:threads] || 1
-    @parallel_request_scraper = ParallelRequestScraper.new navigator, login_command, threads
-    @request_finder = RequestFinder.new navigator
-    @output_dir = options[:output_dir] || default_output_dir
-  end
-  def scrape_requests_for_users(users, options={})
-    request_ids = @request_finder.get_request_ids_for_users users, options
-    scrape_requests request_ids
-  end
-  def scrape_requests_in_range(from_id, to_id)
-    request_ids = (from_id..to_id).to_a
-    scrape_requests request_ids
-  end
-  private
-  def scrape_requests(request_ids)
-    FileUtils.mkdir_p @output_dir
-    request_ids = request_ids - existing_request_ids
-    @parallel_request_scraper.scrape(request_ids) { |request| write_request_file request }
-  end
-  def existing_request_ids
-    Dir["#@output_dir/*"].map { |f| File.basename(f, '.json').to_i }
-  end
-  def write_request_file(request)
-    File.write request_file_path(request), request.to_json
-    print '.'
-  end
-  def request_file_path(request)
-    File.join @output_dir, "#{request[:id]}.json"
-  end
-  def default_output_dir
-    File.join 'output', Time.now.strftime('%Y-%m-%d-%H-%M')
-  end
+$stdout.sync = true
+require 'fileutils'
+require 'json'
+require_relative 'lib/login_command'
+require_relative 'lib/navigator'
+require_relative 'lib/parallel_request_scraper'
+require_relative 'lib/request_finder'
+class TrackItScraper
+  def initialize(base_url, username, password, options={})
+    navigator = Navigator.new base_url
+    login_command = LoginCommand.new username, password, navigator
+    threads = options[:threads] || 1
+    @parallel_request_scraper = ParallelRequestScraper.new navigator, login_command, threads
+    @request_finder = RequestFinder.new navigator
+    @output_dir = options[:output_dir] || default_output_dir
+  end
+  def scrape_requests_for_users(users, options={})
+    request_ids = @request_finder.get_request_ids_for_users users, options
+    scrape_requests request_ids
+  end
+  def scrape_requests_in_range(from_id, to_id)
+    request_ids = (from_id..to_id).to_a
+    scrape_requests request_ids
+  end
+  private
+  def scrape_requests(request_ids)
+    FileUtils.mkdir_p @output_dir
+    request_ids = request_ids - existing_request_ids
+    @parallel_request_scraper.scrape(request_ids) { |request| write_request_file request }
+  end
+  def existing_request_ids
+    Dir["#@output_dir/**/*.json"].map { |f| File.basename(f, '.*').to_i }
+  end
+  def write_request_file(request)
+    File.write request_file_path(request), request.to_json
+    print '.'
+  end
+  def request_file_path(request)
+    File.join @output_dir, "#{request[:id]}.json"
+  end
+  def default_output_dir
+    File.join 'output', Time.now.strftime('%Y-%m-%d-%H-%M')
+  end
 end

metadata CHANGED Viewed

@@ -1,7 +1,7 @@
 --- !ruby/object:Gem::Specification
 name: trackit_scraper
 version: !ruby/object:Gem::Version
-  version: 2.0.0
+  version: 2.1.0
   prerelease:
 platform: ruby
 authors:
@@ -9,11 +9,11 @@ authors:
 autorequire:
 bindir: bin
 cert_chain: []
-date: 2013-07-12 00:00:00.000000000 Z
+date: 2013-12-06 00:00:00.000000000 Z
 dependencies:
 - !ruby/object:Gem::Dependency
   name: json
-  requirement: !ruby/object:Gem::Requirement
+  requirement: &70192723069620 !ruby/object:Gem::Requirement
     none: false
     requirements:
     - - ~>
@@ -21,15 +21,10 @@ dependencies:
         version: 1.7.7
   type: :runtime
   prerelease: false
-  version_requirements: !ruby/object:Gem::Requirement
-    none: false
-    requirements:
-    - - ~>
-      - !ruby/object:Gem::Version
-        version: 1.7.7
+  version_requirements: *70192723069620
 - !ruby/object:Gem::Dependency
   name: watir-webdriver
-  requirement: !ruby/object:Gem::Requirement
+  requirement: &70192723069140 !ruby/object:Gem::Requirement
     none: false
     requirements:
     - - ~>
@@ -37,12 +32,7 @@ dependencies:
         version: 0.6.4
   type: :runtime
   prerelease: false
-  version_requirements: !ruby/object:Gem::Requirement
-    none: false
-    requirements:
-    - - ~>
-      - !ruby/object:Gem::Version
-        version: 0.6.4
+  version_requirements: *70192723069140
 description:
 email: matthew-github@matthewriley.name
 executables: []
@@ -78,7 +68,7 @@ required_rubygems_version: !ruby/object:Gem::Requirement
       version: '0'
 requirements: []
 rubyforge_project:
-rubygems_version: 1.8.24
+rubygems_version: 1.8.15
 signing_key:
 specification_version: 3
 summary: Screen scrapes data from the Track-It help desk web application.