RubyGems - remi - Versions diffs - 0.2.2 → 0.2.3 - Mend

remi 0.2.2 → 0.2.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (17) hide show

checksums.yaml +4 -4
data/Gemfile.lock +1 -1
data/lib/remi.rb +4 -3
data/lib/remi/cli.rb +1 -1
data/lib/remi/cucumber/business_rules.rb +21 -1
data/lib/remi/project/features/aggregate.feature +23 -0
data/lib/remi/project/features/step_definitions/remi_step.rb +16 -0
data/lib/remi/project/features/support/env_app.rb +1 -0
data/lib/remi/project/jobs/aggregate_job.rb +20 -0
data/lib/remi/project/jobs/copy_source_job.rb +2 -1
data/lib/remi/project/jobs/sample_job.rb +2 -1
data/lib/remi/refinements/daru.rb +58 -0
data/lib/remi/{core/refinements.rb → refinements/symbolizer.rb} +2 -2
data/lib/remi/version.rb +1 -1
metadata +6 -5
data/lib/remi/core/daru.rb +0 -28
data/lib/remi/core/string.rb +0 -8

checksums.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 SHA1:
-  metadata.gz: 0e96cbd80b9948b85124da0bb1a7b5618c0692ec
-  data.tar.gz: 8eee478cbfdb78fc3c670c5fb2978f076b9d4673
+  metadata.gz: 92b5bf2de20c5287b1879fb4602e39e71da6f6a7
+  data.tar.gz: 05071d5457f84bbc42cf14fc4ee566c658492962
 SHA512:
-  metadata.gz: c355c76c0abbbd1bb9f37ff7d4b384b8c54772bbdfad3d1eff0a4531c3da063e9bb777aca0e69936cd5047c7f059b1f393da889b9ac047cbe0d77411d9e9fc18
-  data.tar.gz: 87df4f46a2f4f1127ccd885baf89e2466829dd56db840ce2d227c2ae8a7a96ec145873aac2ab9220a15b78158b8ff0afde56f314a6ecfa3a8c5a5523df89a154
+  metadata.gz: d41fdb4d52f15b3632538fffc3d987c35b204ddb3a68f06db71ab44073884250ec7be7495531fa2965365a4d41a9508bb346d31dd91c203c877b4ed5821c83d3
+  data.tar.gz: 92be48c0d23b22dbcfbaca25a43e94edda2c89947abf6505425a6439a665b99f39e317daaf6190bf4f0e3c7086ae73178c2dd688c400aeefefd8c736963c7264

data/Gemfile.lock CHANGED Viewed

@@ -1,7 +1,7 @@
 PATH
   remote: .
   specs:
-    remi (0.2.1)
+    remi (0.2.3)
       activesupport (~> 4.2)
       bond (~> 0.5)
       cucumber (~> 2.1)

data/lib/remi.rb CHANGED Viewed

@@ -18,6 +18,8 @@ require 'active_support/core_ext/object/blank'
 require 'active_support/core_ext/object/try'
 require 'active_support/core_ext/object/inclusion'
 require 'active_support/core_ext/string/inflections'
+require 'active_support/core_ext/string/strip'
+require 'active_support/core_ext/string/filters'
 require 'active_support/core_ext/numeric/time'
 require 'active_support/core_ext/numeric/conversions'
 require 'active_support/core_ext/date/calculations'
@@ -30,7 +32,6 @@ require 'salesforce_bulk_api'
 # Remi
 require 'remi/version.rb'
-require 'remi/core/string.rb'
 require 'remi/settings'
 require 'remi/job'
@@ -39,8 +40,8 @@ require 'remi/field_symbolizers'
 require 'remi/data_subject'
 require 'remi/sf_bulk_helper' # separate into SF support package
-require 'remi/core/daru'
-require 'remi/core/refinements'
+require 'remi/refinements/symbolizer'
+require 'remi/refinements/daru'
 require 'remi/extractor/sftp_file'

data/lib/remi/cli.rb CHANGED Viewed

@@ -15,7 +15,7 @@ module Remi
       options = {}
       opt_parser = OptionParser.new do |opts|
-        opts.banner = <<-EOT.unindent
+        opts.banner = <<-EOT.strip_heredoc
           Usage: Command line helpers for Remi.
         EOT

data/lib/remi/cucumber/business_rules.rb CHANGED Viewed

@@ -1,5 +1,5 @@
 module Remi::BusinessRules
-  using Remi::Core::Refinements
+  using Remi::Refinements::Symbolizer
   def self.parse_full_field(full_field_name)
     full_field_name.split(':').map(&:strip)
@@ -230,6 +230,15 @@ module Remi::BusinessRules
       @data_obj.df.size
     end
+    # Public: Converts the data subject to a hash where the keys are the table
+    # columns and the values are an array for the value of column for each row.
+    def column_hash
+      @data_obj.df.to_hash.reduce({}) do |h, (k,v)|
+        h[k.symbolize] = v.to_a
+        h
+      end
+    end
     # For debugging only
     def _df
       @data_obj.df
@@ -429,6 +438,17 @@ module Remi::BusinessRules
       end
       df
     end
+    # Public: Converts a Cucumber::Ast::Table to a hash where the keys are the table
+    # columns and the values are an array for the value of column for each row.
+    def column_hash
+      @table.hashes.reduce({}) do |h, row|
+        row.each do |k,v|
+          (h[k.symbolize] ||= []) << v
+        end
+        h
+      end
+    end
   end

data/lib/remi/project/features/aggregate.feature ADDED Viewed

@@ -0,0 +1,23 @@
+Feature: Tests the aggregate refinement to the Daru library
+  Background:
+    Given the job is 'Aggregate'
+    And the job source 'Source Data'
+    And the job target 'Target Data'
+    And the source 'Source Data'
+    And the target 'Target Data'
+  Scenario: The aggregator should find the minimum year for each 'Alpha'
+    Given the following example record for 'Source Data':
+      | Alpha | Year | something |
+      | a     | 2016 | 1 |
+      | a     | 2018 | 1 |
+      | b     | 2016 | 2 |
+      | b     | 2010 | 3 |
+      | a     | 2017 | 4 |
+    And the following example record called 'expected result':
+      | Alpha | Year |
+      | a     | 2016 |
+      | b     | 2010 |
+    Then the target should match the example 'expected result'

data/lib/remi/project/features/step_definitions/remi_step.rb CHANGED Viewed

@@ -201,6 +201,22 @@ Then /^the target field '(.+)' is the date (.+)$/ do |target_field, date_referen
   step "the target field '#{target_field}' is set to the value \"*#{date_reference}*\""
 end
+Then /^the target '(.+)' should match the example '([[:alnum:]\s]+)'$/ do |target_name, example_name|
+  @brt.run_transforms
+  target_hash = @brt.targets[target_name].column_hash
+  example_hash = @brt.examples[example_name].column_hash
+  common_keys = target_hash.keys & example_hash.keys
+  expect(target_hash.select { |k,v| common_keys.include? k })
+    .to eq example_hash.select { |k,v| common_keys.include? k }
+end
+Then /^the target should match the example '([[:alnum:]\s]+)'$/ do |example_name|
+  target_name = @brt.targets.keys.first
+  step "the target '#{target_name}' should match the example '#{example_name}'"
+end
 ### Transforms

data/lib/remi/project/features/support/env_app.rb CHANGED Viewed

@@ -1,3 +1,4 @@
 require_relative '../../jobs/sample_job'
 require_relative '../../jobs/copy_source_job'
 require_relative '../../jobs/transforms/transform_jobs'
+require_relative '../../jobs/aggregate_job'

data/lib/remi/project/jobs/aggregate_job.rb ADDED Viewed

@@ -0,0 +1,20 @@
+require_relative 'all_jobs_shared'
+class AggregateJob
+  include AllJobsShared
+  using Remi::Refinements::Daru
+  define_source :source_data, Remi::DataSource::DataFrame
+  define_target :target_data, Remi::DataTarget::DataFrame
+  define_transform :main, sources: :source_data, targets: :target_data do
+    mymin = lambda do |field, df, indicies|
+      values = indicies.map { |idx| df.row[idx][field] }
+      values.min
+    end
+    target_data.df = source_data.df.aggregate(by: :alpha, func: mymin.curry.(:year)).detach_index
+    target_data.df.vectors = Daru::Index.new([:alpha, :year])
+  end
+end

data/lib/remi/project/jobs/copy_source_job.rb CHANGED Viewed

@@ -2,11 +2,12 @@ require_relative 'all_jobs_shared'
 class CopySourceJob
   include AllJobsShared
+  using Remi::Refinements::Daru
   define_source :source_data, Remi::DataSource::DataFrame
   define_source :target_data, Remi::DataSource::DataFrame
   define_transform :main, sources: :source_data, targets: :target_data do
-    target_data.df = source_data.df.monkey_dup
+    target_data.df = source_data.df.dup
   end
 end

data/lib/remi/project/jobs/sample_job.rb CHANGED Viewed

@@ -4,6 +4,7 @@ require_relative 'all_jobs_shared'
 class SampleJob
   include AllJobsShared
+  using Remi::Refinements::Daru
   define_source :existing_contacts, Remi::DataSource::Salesforce,
     object: :Contact,
@@ -77,7 +78,7 @@ class SampleJob
   define_transform :map_common_fields, sources: [:sample_file, :existing_contacts], targets: :all_contacts do
     # Exclude all source records with an invalid program name
-    all_contacts.df = sample_file.df.monkey_dup
+    all_contacts.df = sample_file.df.dup
     Remi::SourceToTargetMap.apply(all_contacts.df) do
       map source(:program) .target(:Major__c)
         .transform(Remi::Transform[:lookup][program_name_lookup])

data/lib/remi/refinements/daru.rb ADDED Viewed

@@ -0,0 +1,58 @@
+module Remi
+  module Refinements
+    module Daru
+      refine ::Daru::DataFrame do
+        # Public: Fixes dup issues in the Daru library (vectors not being duped).
+        def dup
+          dupdf = ::Daru::DataFrame.new([], index: self.index)
+          self.vectors.each do |v|
+            dupdf[v] = self[v]
+          end
+          dupdf
+        end
+        # Public: Saves a Dataframe to a file.
+        def hash_dump(filename)
+          File.write(filename, Marshal.dump(self.to_hash))
+        end
+        # Public: Creates a DataFrame by reading the dumped version from a file.
+        def self.from_hash_dump(filename)
+          ::Daru::DataFrame.new(Marshal.load(File.read(filename)))
+        end
+        # Public: Allows the user to define an arbitrary aggregation function.
+        #
+        # by   - The name of the DataFrame vector to use to group records.
+        # func - A lambda function that accepts two arguments - the first argument
+        #        is the DataFrame and the second is the index of the elements belonging
+        #        to a group.
+        #
+        # Example:
+        #   df = Daru::DataFrame.new( { a: ['a','a','a','b','b'], year: ['2018','2015','2019', '2014', '2013'] })
+        #
+        #   mymin = lambda do |field, df, indicies|
+        #     values = indicies.map { |idx| df.row[idx][field] }
+        #     values.min
+        #   end
+        #
+        #   df.aggregate(by: :a, func: mymin.curry.(:year))
+        #
+        #
+        # Returns a Daru::Vector.
+        def aggregate(by:, func:)
+          grouped = self.group_by(by)
+          ::Daru::Vector.new(
+            grouped.groups.reduce({}) do |h, (key, indicies)|
+              h[key.size == 1 ? key.first : key] = func.(self, indicies)
+              h
+            end
+          )
+        end
+      end
+    end
+  end
+end

data/lib/remi/{core/refinements.rb → refinements/symbolizer.rb} RENAMED Viewed

@@ -1,6 +1,6 @@
 module Remi
-  module Core
-    module Refinements
+  module Refinements
+    module Symbolizer
       refine String do
         def symbolize(symbolizer=nil)
           if symbolizer

data/lib/remi/version.rb CHANGED Viewed

@@ -1,3 +1,3 @@
 module Remi
-  VERSION = '0.2.2'
+  VERSION = '0.2.3'
 end

metadata CHANGED Viewed

@@ -1,14 +1,14 @@
 --- !ruby/object:Gem::Specification
 name: remi
 version: !ruby/object:Gem::Version
-  version: 0.2.2
+  version: 0.2.3
 platform: ruby
 authors:
 - Sterling Paramore
 autorequire:
 bindir: bin
 cert_chain: []
-date: 2016-01-21 00:00:00.000000000 Z
+date: 2016-01-22 00:00:00.000000000 Z
 dependencies:
 - !ruby/object:Gem::Dependency
   name: daru
@@ -198,9 +198,6 @@ files:
 - doc/install-rbenv-os_x.md
 - lib/remi.rb
 - lib/remi/cli.rb
-- lib/remi/core/daru.rb
-- lib/remi/core/refinements.rb
-- lib/remi/core/string.rb
 - lib/remi/cucumber.rb
 - lib/remi/cucumber/business_rules.rb
 - lib/remi/cucumber/data_source.rb
@@ -218,6 +215,7 @@ files:
 - lib/remi/field_symbolizers.rb
 - lib/remi/job.rb
 - lib/remi/lookup/regex_sieve.rb
+- lib/remi/project/features/aggregate.feature
 - lib/remi/project/features/examples.feature
 - lib/remi/project/features/formulas.feature
 - lib/remi/project/features/sample_job.feature
@@ -227,6 +225,7 @@ files:
 - lib/remi/project/features/transforms/date_diff.feature
 - lib/remi/project/features/transforms/parse_date.feature
 - lib/remi/project/features/transforms/prefix.feature
+- lib/remi/project/jobs/aggregate_job.rb
 - lib/remi/project/jobs/all_jobs_shared.rb
 - lib/remi/project/jobs/copy_source_job.rb
 - lib/remi/project/jobs/sample_job.rb
@@ -234,6 +233,8 @@ files:
 - lib/remi/project/jobs/transforms/parse_date_job.rb
 - lib/remi/project/jobs/transforms/prefix_job.rb
 - lib/remi/project/jobs/transforms/transform_jobs.rb
+- lib/remi/refinements/daru.rb
+- lib/remi/refinements/symbolizer.rb
 - lib/remi/settings.rb
 - lib/remi/sf_bulk_helper.rb
 - lib/remi/source_to_target_map.rb

data/lib/remi/core/daru.rb DELETED Viewed

@@ -1,28 +0,0 @@
-module Daru
-  class DataFrame
-    def monkey_dup
-      dupdf = Daru::DataFrame.new([], index: self.index)
-      self.vectors.each do |v|
-        dupdf[v] = self[v]
-      end
-      dupdf
-    end
-    def monkey_merge(other)
-      other.vectors.each do |v|
-        self[v] = other[v]
-      end
-      self
-    end
-    def hash_dump(filename)
-      File.write(filename, Marshal.dump(self.to_hash))
-    end
-    def self.from_hash_dump(filename)
-      Daru::DataFrame.new(Marshal.load(File.read(filename)))
-    end
-  end
-end

data/lib/remi/core/string.rb DELETED Viewed

@@ -1,8 +0,0 @@
-class String
-  # Strip leading whitespace from each line that is the same as the
-  # amount of whitespace on the first line of the string.
-  # Leaves _additional_ indentation on later lines intact.
-  def unindent
-    gsub /^#{self[/\A\s*/]}/, ''
-  end
-end