RubyGems - suds - Versions diffs - 0.1.0 - Mend

suds 0.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (41) hide show

checksums.yaml +7 -0
data/.coveralls.yml +1 -0
data/.gitignore +62 -0
data/.rspec +3 -0
data/.ruby-version +1 -0
data/Gemfile +7 -0
data/Gemfile.lock +77 -0
data/Guardfile +7 -0
data/LICENSE.txt +21 -0
data/README.md +68 -0
data/lib/suds.rb +1 -0
data/lib/suds/all.rb +12 -0
data/lib/suds/cleaner.rb +32 -0
data/lib/suds/cleaner/column_converter_cleaner.rb +26 -0
data/lib/suds/cleaner/column_filter_cleaner.rb +26 -0
data/lib/suds/cleaner/downcase_cleaner.rb +21 -0
data/lib/suds/cleaner/regex_cleaner.rb +41 -0
data/lib/suds/cleaner/whitespace_cleaner.rb +9 -0
data/lib/suds/converter.rb +27 -0
data/lib/suds/converter/json_converter.rb +8 -0
data/lib/suds/interpreter.rb +19 -0
data/lib/suds/interpreter/csv_interpreter.rb +28 -0
data/lib/suds/interpreter/file_interpreter.rb +11 -0
data/lib/suds/suds.rb +46 -0
data/lib/suds/version.rb +4 -0
data/spec/lib/suds/all_spec.rb +13 -0
data/spec/lib/suds/cleaner/column_converter_cleaner_spec.rb +29 -0
data/spec/lib/suds/cleaner/column_filter_cleaner_spec.rb +56 -0
data/spec/lib/suds/cleaner/downcase_cleaner_spec.rb +15 -0
data/spec/lib/suds/cleaner/regex_cleaner_spec.rb +52 -0
data/spec/lib/suds/cleaner/whitespace_cleaner_spec.rb +15 -0
data/spec/lib/suds/cleaner_spec.rb +28 -0
data/spec/lib/suds/converter/json_converter_spec.rb +12 -0
data/spec/lib/suds/converter_spec.rb +12 -0
data/spec/lib/suds/interpreter/csv_interpreter_spec.rb +45 -0
data/spec/lib/suds/interpreter_spec.rb +11 -0
data/spec/lib/suds/suds_spec.rb +121 -0
data/spec/spec_helper.rb +87 -0
data/spec/support/cleaner_context.rb +5 -0
data/suds.gemspec +15 -0
metadata +83 -0

checksums.yaml ADDED

@@ -0,0 +1,7 @@
+---
+SHA1:
+  metadata.gz: e0fc3f6bfeb9132463f70ae8bfb07e1ec04c0fa4
+  data.tar.gz: 770b6fe86d994af04989b28d7fd22c4b1d335053
+SHA512:
+  metadata.gz: 116913488fb79c62e8f75ba6bd0adc6232ca1124b23bc0b2598b3709c9419f55d831c948bf2b8585f8857228812e95fe3df499cd5f8ed92bc7035781f39281c0
+  data.tar.gz: c8601f3759c37aa3150ed440e9af5bd0d8d37bbfc428441dfa7e66d73b47b06ddd61df653c70722944bb6cf0df1a4ca6be99d0130427fb16398d947ca9917094

data/.coveralls.yml ADDED

	@@ -0,0 +1 @@
1	+ repo_token: ULz8tz46aXDE4AbHGI2sh3SwgqjJvHLQs

data/.gitignore ADDED

@@ -0,0 +1,62 @@
+data/*
+### Ruby
+*.gem
+*.rbc
+/.config
+/coverage/
+/InstalledFiles
+/pkg/
+/spec/reports/
+/test/tmp/
+/test/version_tmp/
+/tmp/
+## Specific to RubyMotion:
+.dat*
+.repl_history
+build/
+## Documentation cache and generated files:
+/.yardoc/
+/_yardoc/
+/doc/
+/rdoc/
+## Environment normalisation:
+/.bundle/
+/lib/bundler/man/
+# for a library or gem, you might want to ignore these files since the code is
+# intended to run in multiple environments; otherwise, check them in:
+# Gemfile.lock
+# .ruby-version
+.ruby-gemset
+# unless supporting rvm < 1.11.0 or doing something fancy, ignore this:
+.rvmrc
+### Mac
+.DS_Store
+.AppleDouble
+.LSOverride
+# Icon must end with two \r
+Icon
+# Thumbnails
+._*
+# Files that might appear on external disk
+.Spotlight-V100
+.Trashes
+# Directories potentially created on remote AFP share
+.AppleDB
+.AppleDesktop
+Network Trash Folder
+Temporary Items
+.apdisk

data/.rspec ADDED

@@ -0,0 +1,3 @@
+#--warnings
+--color
+--require spec_helper

data/.ruby-version ADDED

	@@ -0,0 +1 @@
1	+ 2.1.3

data/Gemfile ADDED

@@ -0,0 +1,7 @@
+source 'https://rubygems.org'
+group :development, :test do
+  gem 'guard-rspec', require: false
+  gem 'terminal-notifier-guard'
+  gem 'coveralls', require: false
+  gem "codeclimate-test-reporter", group: :test, require: nil
+end

data/Gemfile.lock ADDED

@@ -0,0 +1,77 @@
+GEM
+  remote: https://rubygems.org/
+  specs:
+    celluloid (0.15.2)
+      timers (~> 1.1.0)
+    codeclimate-test-reporter (0.3.0)
+      simplecov (>= 0.7.1, < 1.0.0)
+    coderay (1.1.0)
+    coveralls (0.7.0)
+      multi_json (~> 1.3)
+      rest-client
+      simplecov (>= 0.7)
+      term-ansicolor
+      thor
+    diff-lcs (1.2.5)
+    docile (1.1.5)
+    ffi (1.9.3)
+    formatador (0.2.5)
+    guard (2.6.1)
+      formatador (>= 0.2.4)
+      listen (~> 2.7)
+      lumberjack (~> 1.0)
+      pry (>= 0.9.12)
+      thor (>= 0.18.1)
+    guard-rspec (4.2.10)
+      guard (~> 2.1)
+      rspec (>= 2.14, < 4.0)
+    listen (2.7.9)
+      celluloid (>= 0.15.2)
+      rb-fsevent (>= 0.9.3)
+      rb-inotify (>= 0.9)
+    lumberjack (1.0.7)
+    method_source (0.8.2)
+    mime-types (2.3)
+    multi_json (1.10.1)
+    pry (0.10.0)
+      coderay (~> 1.1.0)
+      method_source (~> 0.8.1)
+      slop (~> 3.4)
+    rb-fsevent (0.9.4)
+    rb-inotify (0.9.5)
+      ffi (>= 0.5.0)
+    rest-client (1.6.7)
+      mime-types (>= 1.16)
+    rspec (3.0.0)
+      rspec-core (~> 3.0.0)
+      rspec-expectations (~> 3.0.0)
+      rspec-mocks (~> 3.0.0)
+    rspec-core (3.0.2)
+      rspec-support (~> 3.0.0)
+    rspec-expectations (3.0.2)
+      diff-lcs (>= 1.2.0, < 2.0)
+      rspec-support (~> 3.0.0)
+    rspec-mocks (3.0.2)
+      rspec-support (~> 3.0.0)
+    rspec-support (3.0.2)
+    simplecov (0.8.2)
+      docile (~> 1.1.0)
+      multi_json
+      simplecov-html (~> 0.8.0)
+    simplecov-html (0.8.0)
+    slop (3.5.0)
+    term-ansicolor (1.3.0)
+      tins (~> 1.0)
+    terminal-notifier-guard (1.5.3)
+    thor (0.19.1)
+    timers (1.1.0)
+    tins (1.3.0)
+PLATFORMS
+  ruby
+DEPENDENCIES
+  codeclimate-test-reporter
+  coveralls
+  guard-rspec
+  terminal-notifier-guard

data/Guardfile ADDED

@@ -0,0 +1,7 @@
+guard :rspec, cmd: "bundle exec rspec"  do
+  watch(%r{^spec/.+_spec\.rb$})
+  watch(%r{^lib/(.+)\.rb$})     { |m| "spec/lib/#{m[1]}_spec.rb" }
+  watch('spec/spec_helper.rb')  { "spec" }
+  notification :terminal_notifier
+end

data/LICENSE.txt ADDED

@@ -0,0 +1,21 @@
+The MIT License (MIT)
+Copyright (c) 2014 HealthWave.
+Permission is hereby granted, free of charge, to any person obtaining a copy
+of this software and associated documentation files (the "Software"), to deal
+in the Software without restriction, including without limitation the rights
+to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
+copies of the Software, and to permit persons to whom the Software is
+furnished to do so, subject to the following conditions:
+The above copyright notice and this permission notice shall be included in all
+copies or substantial portions of the Software.
+THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
+AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
+LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
+OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
+SOFTWARE.

data/README.md ADDED

@@ -0,0 +1,68 @@
+# suds
+Welcome to the suds project. This is very much a work in progress, so please use this at your own risk. I am changing the DSL constantly and rewriting the history.
+This project will become stable fairly soon.
+Suds is a essentially a tool for working with data files. Suds is broken up into three modular components: **interpreters**, **cleaners**, and **converters**.
+**Interpreters** load the data into the `suds` object. This can be in the form of raw text, json, csv, etc. Interpreteres can be chained together, for instance a (fictional) `GoogleDriveInterpreter` can pass it's data to the  `CSVInterpreter`.
+**Cleaners** manipulate the data. You can modify/remove rows/columns (in the context of a CSV file).
+**Converters** export the file either to disk or to a remote location.
+## Requirements
+Ruby `2.0.x` is tested. If you need support for `1.9.3` use the `1.9.3` branch.
+## Installation
+```bash
+gem install suds
+```
+Or if you're using Bundler, include the following line in your Gemfile:
+```ruby
+gem 'suds', git: 'git@github.com:HealthWave/suds.git'
+```
+## Getting started starting
+Initialize your interpreter(s):
+```ruby
+f_interpreter = FileInterpreter.new('./path/to/my/file')
+csv_interpreter = CSVInterpreter.new(f_interpreter.data)
+```
+Create a suds list and add the interpreters to it:
+```ruby
+list = Suds.new( csv_interpreter )
+```
+Add some cleaners to it:
+```ruby
+list.add_cleaner Cleaner.new {|_,v| v.strip! if v } # Inline initialization of a generic cleaner
+# Configuring an existing cleaner
+list.add_cleaner ColumnConverterCleaner.new({
+  company:     :name,
+  nlacno:      :partner_practitioner_id,
+})
+list.add_cleaner ColumnFilterCleaner.new(include_columns: [:name, :partner_practitioner_id, :email])
+list.add_cleaner DowncaseCleaner.new()
+```
+Run all the cleaners:
+```ruby
+list.clean
+```

data/lib/suds.rb ADDED

	@@ -0,0 +1 @@
1	+ require 'suds/suds'

data/lib/suds/all.rb ADDED

@@ -0,0 +1,12 @@
+require 'suds/suds'
+require 'suds/cleaner/column_converter_cleaner'
+require 'suds/cleaner/column_filter_cleaner'
+require 'suds/cleaner/downcase_cleaner'
+require 'suds/cleaner/regex_cleaner'
+require 'suds/cleaner/whitespace_cleaner'
+require 'suds/interpreter/file_interpreter'
+require 'suds/interpreter/csv_interpreter'
+require 'suds/converter/json_converter'

data/lib/suds/cleaner.rb ADDED

@@ -0,0 +1,32 @@
+class Cleaner
+  attr_accessor :data, :action
+  def initialize &b
+    block_given? ? @action = b : raise("The generic Cleaner must be provided a block.")
+  end
+  def self.clean_array array, &b
+    raise "Please provide either a hash or an array as the main parameter" unless Array === array
+    array.each do |row|
+      clean_hash row, &b
+    end
+    return array
+  end
+  def self.clean_hash hash, &b
+    raise "Please provide either a hash or an array as the main parameter" unless Hash === hash
+    hash.each do |k,v|
+      b.call(k,v)
+    end
+    return hash
+  end
+  def clean data
+    @data = data
+    self.class.clean_array(@data) do |k,v|
+      @action.call(k,v)
+    end
+  end
+end

data/lib/suds/cleaner/column_converter_cleaner.rb ADDED

@@ -0,0 +1,26 @@
+require 'suds/cleaner'
+class ColumnConverterCleaner < Cleaner
+  def initialize convert_hash, force_strings = false
+    @force_strings = force_strings
+    @convert_hash = convert_hash
+  end
+  def clean data
+    data.each do |row|
+      keys = row.keys
+      keys.each do |key|
+        if new_key = @convert_hash[key]
+          old_value = row[key]
+          row.delete key
+          if @force_strings
+            new_key = new_key.to_s
+          else
+            new_key = new_key.to_sym
+          end
+          row[new_key] = old_value
+        end
+      end
+    end
+  end
+end

data/lib/suds/cleaner/column_filter_cleaner.rb ADDED

@@ -0,0 +1,26 @@
+require 'suds/cleaner'
+class ColumnFilterCleaner < Cleaner
+  attr_accessor :exclude_columns, :include_columns
+  def initialize exclude_columns:[], include_columns:[]
+    @exclude_columns = [exclude_columns].flatten.map(&:to_s)
+    @include_columns = [include_columns].flatten.map(&:to_s)
+    raise "You must provide include_columns or exclude_columns." if @exclude_columns.empty? and @include_columns.empty?
+  end
+  def clean data
+    if not @include_columns.empty?
+      exclude_columns = data.first.keys.map(&:to_s) - @include_columns
+    else
+      exclude_columns = @exclude_columns
+    end
+    data.each do |row|
+      exclude_columns.each do |col|
+        row.delete col
+        row.delete col.to_sym
+      end
+    end
+  end
+end

data/lib/suds/cleaner/downcase_cleaner.rb ADDED

@@ -0,0 +1,21 @@
+require 'suds/cleaner'
+class DowncaseCleaner < Cleaner
+  def initialize  exclude_columns:[], include_columns:[]
+    @exclude_columns = [exclude_columns].flatten
+    @include_columns = [include_columns].flatten
+  end
+  def clean data
+    Cleaner.clean_array(data) do |k,v|
+      next if v.nil?
+      if !@include_columns.empty?
+        v.downcase if @include_columns.include?(k)
+      elsif !@exclude_columns.empty?
+        v.downcase! unless @exclude_columns.include?(k)
+      else
+        v.downcase!
+      end
+    end
+  end
+end

data/lib/suds/cleaner/regex_cleaner.rb ADDED

@@ -0,0 +1,41 @@
+require 'suds/cleaner'
+class RegexCleaner < Cleaner
+  attr_accessor :regex_map
+  EMAIL_REGEX = /^[a-zA-Z0-9_.+\-]+@[a-zA-Z0-9\-]+\.[a-zA-Z0-9\-.]+$/
+  def initialize regex_map, destroy_row: false
+    @regex_map = {}
+    regex_map.each do |column,regex|
+      if Array === column
+        column.each do |col|
+          @regex_map[col] = regex
+        end
+      else
+        @regex_map[column] = regex
+      end
+    end
+    @columns = @regex_map.keys.map(&:to_s)
+    @destroy_row = destroy_row
+  end
+  def clean data
+    ret_data = data.select do |row|
+      save_row = true
+      row.keys.each do |key|
+        if @regex_map[key]
+          if !(row[key].to_s =~ @regex_map[key])
+            if @destroy_row
+              save_row = false
+            else
+              row.delete key
+            end
+          end
+        end
+      end
+      save_row # for select
+    end
+    return ret_data
+  end
+end

data/lib/suds/cleaner/whitespace_cleaner.rb ADDED

@@ -0,0 +1,9 @@
+require 'suds/cleaner'
+class WhitespaceCleaner
+  def self.clean data, options={}
+    Cleaner.clean_array(data) do |_,v|
+      v.strip! if v
+    end
+  end
+end

data/lib/suds/converter.rb ADDED

@@ -0,0 +1,27 @@
+require 'fileutils'
+class Converter
+  attr_accessor :outfile, :converter, :converted_data
+  def initialize outfile=nil, &b
+    @outfile = outfile
+    @converter = b
+  end
+  def convert data
+    raise "A generic Converter can only convert with a block" unless @converter
+    @converted_data = @converter.call(data)
+  end
+  def convert! data
+    raise "Cannot output to file if outfile is not set." unless @outfile
+    fname = File.expand_path(@outfile)
+    dir = File.dirname fname
+    if !File.directory?(dir)
+      FileUtils.mkdir_p dir
+    end
+    File.open(fname, 'w').write(convert(data))
+  end
+end

data/lib/suds/converter/json_converter.rb ADDED

@@ -0,0 +1,8 @@
+require 'json'
+require 'suds/converter'
+class JSONConverter < Converter
+  def convert data
+    self.converted_data = data.to_json
+  end
+end

data/lib/suds/interpreter.rb ADDED

@@ -0,0 +1,19 @@
+class Interpreter
+  attr_accessor :headers, :data
+  def initialize
+    @headers = []
+    @data = []
+  end
+  def interpret
+    raise "No interpretation defined."
+  end
+  def data
+    interpret if @data.nil? || @data.empty?
+    @data
+  end
+end

data/lib/suds/interpreter/csv_interpreter.rb ADDED

@@ -0,0 +1,28 @@
+require 'csv'
+require 'suds/interpreter'
+class CSVInterpreter < Interpreter
+  attr_accessor :filepath
+  def initialize raw_data
+    @raw_data = raw_data
+    super()
+  end
+  def interpret
+    CSV.parse(@raw_data, headers: true, header_converters: :symbol).each do |row|
+      @headers = row.headers if @headers.nil? || @headers.empty?
+      interpret_unit row
+    end
+    @data
+  end
+  def interpret_unit unit
+    raise "Headers have not be set." if @headers.empty?
+    raise "Invalid data for current headers." if @headers.size != unit.size
+    @data << unit.to_h
+  end
+end

data/lib/suds/interpreter/file_interpreter.rb ADDED

@@ -0,0 +1,11 @@
+class FileInterpreter < Interpreter
+  def initialize filepath
+    # TODO File validation
+    @raw_data = open(filepath, 'r').read
+  end
+  def interpret
+    @data = @raw_data
+  end
+end

data/lib/suds/suds.rb ADDED

@@ -0,0 +1,46 @@
+require 'suds/interpreter'
+require 'suds/cleaner'
+require 'suds/converter'
+class Suds
+  attr_accessor :interpreter, :cleaners, :converters, :data
+  def initialize interpreter
+    @interpreter = interpreter
+    @converters = []
+    @cleaners = []
+  end
+  def add_converter converter
+    raise "#{converter.class} is not a valid Converter." unless converter.is_a?(Converter)
+    @converters << converter
+  end
+  def add_cleaner cleaner
+    raise "#{cleaner.class} is not a valid Cleaner." unless cleaner.is_a?(Cleaner)
+    @cleaners << cleaner
+  end
+  def clean
+    @data = @cleaners.inject(interpreter.data) do |data,cleaner|
+      data = cleaner.clean data
+    end
+  end
+  def convert!
+    @converters.each { |converter| converter.convert! data}
+  end
+  def convert
+    @converters.map { |converter| converter.convert data}
+  end
+  def raw_data
+    interpreter.data
+  end
+  def data
+    @data ||= interpreter.interpret
+  end
+end

data/lib/suds/version.rb ADDED

@@ -0,0 +1,4 @@
+class Suds
+  VERSION = '0.1.0'
+end

data/spec/lib/suds/all_spec.rb ADDED

@@ -0,0 +1,13 @@
+require 'spec_helper'
+require 'suds/all'
+describe "all requires" do
+  it { JSONConverter }
+  it { CSVInterpreter }
+  it { FileInterpreter }
+  it { ColumnConverterCleaner }
+  it { ColumnFilterCleaner }
+  it { DowncaseCleaner }
+  it { RegexCleaner }
+  it { WhitespaceCleaner }
+end

data/spec/lib/suds/cleaner/column_converter_cleaner_spec.rb ADDED

@@ -0,0 +1,29 @@
+require 'spec_helper'
+require 'suds/cleaner/column_converter_cleaner'
+describe ColumnConverterCleaner do
+  subject { ColumnConverterCleaner }
+  let(:convert_hash) { {company: :name} }
+  describe "#initialize" do
+    it "takes a hash of strings mapped to strings" do
+      subject.new convert_hash
+    end
+  end
+  describe "#clean" do
+    let(:data) { [{ company: "uri gorelik" }] }
+    let(:cleaner) { cleaner = subject.new convert_hash, false }
+    it "converts the keys of a hash" do
+      results = cleaner.clean data
+      expect(results.first.keys - convert_hash.values).to eq []
+    end
+    it 'retains the original key type' do
+      results = cleaner.clean data
+      expect(results.first.keys.first).to be_a(Symbol)
+      results = cleaner.clean([{ "company" => "test"}])
+      expect(results.first.keys.first).to be_a(String)
+    end
+  end
+end

data/spec/lib/suds/cleaner/column_filter_cleaner_spec.rb ADDED

@@ -0,0 +1,56 @@
+require 'spec_helper'
+require 'suds/cleaner/column_filter_cleaner'
+describe ColumnFilterCleaner do
+  subject { ColumnFilterCleaner }
+  describe '#initialize' do
+    it 'raises an error if both exclude and include columns are not present or empty' do
+      error_reg = /You must provide include_columns or exclude_columns./
+      expect{ subject.new }.to raise_error(error_reg)
+      expect{ subject.new include_columns: [] }.to raise_error(error_reg)
+      expect{ subject.new exclude_columns: [] }.to raise_error(error_reg)
+      expect{ subject.new include_columns: [], exclude_columns: [] }.to raise_error(error_reg)
+    end
+    it 'makes include columns publicly available' do
+      cleaner = subject.new include_columns: [{}]
+      expect(cleaner).to respond_to(:include_columns)
+    end
+    it 'makes exclude columns publicly available' do
+      cleaner = subject.new exclude_columns: [{}]
+      expect(cleaner).to respond_to(:exclude_columns)
+    end
+  end
+  describe '#clean' do
+    let(:data) { [{row1: 'a', row2: 'b'}] }
+    let(:original_data) { data.clone }
+    it 'excludes certain columns' do
+      cleaner = subject.new exclude_columns: :row2
+      result = cleaner.clean data
+      expect(result.first.keys).to include(:row1)
+      expect(result.first.keys).to_not include(:row2)
+    end
+    it 'only includes the listed columns' do
+      cleaner = subject.new include_columns: :row2
+      result = cleaner.clean data
+      expect(result.first.keys).to_not include(:row1)
+      expect(result.first.keys).to include(:row2)
+    end
+    it 'accepts both strings and symbol arrays' do
+      cleaner = subject.new include_columns: "row2"
+      result = cleaner.clean data
+      expect(result.first.keys).to_not include(:row1)
+      expect(result.first.keys).to include(:row2)
+    end
+  end
+end

data/spec/lib/suds/cleaner/downcase_cleaner_spec.rb ADDED

@@ -0,0 +1,15 @@
+require 'spec_helper'
+require 'cleaner/downcase_cleaner'
+describe DowncaseCleaner do
+  include_context "shared cleaner"
+  subject { DowncaseCleaner }
+  let(:data) { {a: "   Test", b: "Double test   "} }
+  # let!(:original_value) { data.first.last.clone }
+  # it "downcases an array of objects" do
+  #expect(   modified_value ).to match /[^A-Z]/
+  # end
+end

data/spec/lib/suds/cleaner/regex_cleaner_spec.rb ADDED

@@ -0,0 +1,52 @@
+require 'spec_helper'
+require 'suds/cleaner/regex_cleaner'
+describe RegexCleaner do
+  subject { RegexCleaner }
+  context 'constants' do
+    it "has a regex constant for emails" do
+      expect(subject).to be_const_defined(:EMAIL_REGEX)
+    end
+  end
+  describe "#initialize" do
+    it 'accepts a hash that maps column names to regexes' do
+      subject.new({name: /uri/})
+    end
+    it 'accepts arrays mapped to regular expressions' do
+      cleaner = subject.new({[:first_name, :last_name] => /uri/})
+      expect(cleaner.instance_variable_get(:@columns)).to eq(%w[first_name last_name])
+    end
+    it 'accepts a hash that decides whether or not to delete the entire row' do
+      subject.new({name: /uri/}, destroy_row: true)
+    end
+  end
+  describe "#clean" do
+    let(:bad_data) { [{email: "uri"}] }
+    let(:good_data) { [{email: "uri@healthwave.co"}] }
+    let(:cleaner) { subject.new({email: subject::EMAIL_REGEX}) }
+    it 'keeps columns if they match the regex' do
+      results = cleaner.clean good_data
+      expect(results.first.keys).to include(:email)
+    end
+    it 'removes columns if they do not match the regex' do
+      results = cleaner.clean bad_data
+      expect(results.first.keys).to_not include(:email)
+    end
+    it "destroys rows if the regex doesn't match" do
+      cleaner =  subject.new({email: subject::EMAIL_REGEX}, destroy_row: true)
+      results = cleaner.clean bad_data
+      expect(results).to be_empty
+    end
+  end
+end

data/spec/lib/suds/cleaner/whitespace_cleaner_spec.rb ADDED

@@ -0,0 +1,15 @@
+require 'spec_helper'
+require 'cleaner/whitespace_cleaner'
+describe WhitespaceCleaner do
+  include_context "shared cleaner"
+  subject { WhitespaceCleaner }
+  let(:data) { {a: "   Test", b: "Double test   "} }
+  # let!(:original_value) { data.first.last.clone }
+  # it "downcases an array of objects" do
+  #expect(   modified_value ).to match /^[^\s].+[^\s]$/
+  # end
+end

data/spec/lib/suds/cleaner_spec.rb ADDED

@@ -0,0 +1,28 @@
+require 'spec_helper'
+require 'cleaner'
+describe Cleaner do
+  subject { Cleaner.new(){} }
+  it { expect(Cleaner).to respond_to(:clean_array) }
+  it { expect(Cleaner).to respond_to(:clean_hash) }
+  describe "#clean" do
+    let(:data) { [{row1: "TEST"}] }
+    it "runs the provided block" do
+      cleaner = Cleaner.new() do |_,v|
+        v.downcase!
+      end
+      result = cleaner.clean data
+      expect( result.first.to_a.flatten.last ).to match(/[^A-Z]/)
+    end
+  end
+  context "failure" do
+    it "raises an error when an non hash or array is passed in as the data" do
+      expect {Cleaner.clean_array double("Fake")}.to raise_error(/Please provide either a hash or an array as the main parameter/)
+    end
+  end
+end

data/spec/lib/suds/converter/json_converter_spec.rb ADDED

@@ -0,0 +1,12 @@
+require 'spec_helper'
+require 'converter/json_converter'
+describe JSONConverter do
+  subject { JSONConverter }
+  let(:unconverted_data) { [{row1: 1, row2:2}] * 5 }
+  it "converts an array to json" do
+    converter = subject.new(unconverted_data)
+    expect( converter.convert(unconverted_data).class ).to be String
+    expect( JSON.parse(converter.converted_data, symbolize_names: true) ).to eq unconverted_data
+  end
+end

data/spec/lib/suds/converter_spec.rb ADDED

@@ -0,0 +1,12 @@
+require 'spec_helper'
+require 'converter'
+describe Converter do
+  subject { Converter }
+  describe "#convert!" do
+    it "it raises an error if no output file was specified" do
+      expect { Converter.new.convert!(double) }.to raise_error(/Cannot output to file if outfile is not set./)
+    end
+  end
+end

data/spec/lib/suds/interpreter/csv_interpreter_spec.rb ADDED

@@ -0,0 +1,45 @@
+require 'spec_helper'
+require 'interpreter/csv_interpreter'
+describe CSVInterpreter do
+  subject {CSVInterpreter.new("path")}
+  describe "#interpret_unit" do
+    let(:headers) { %w{foo} }
+    let(:row1) { {"foo" => "bar"} }
+    let(:csvint) do
+      csvint = CSVInterpreter.new("path")
+      csvint.headers = headers
+      csvint.interpret_unit row1
+      csvint
+    end
+    context 'success' do
+      subject { csvint.data }
+      it {expect( subject.size ).to eq 1 }
+      context "data" do
+        subject { csvint.data.first }
+        it {expect( subject.keys ).to include(*headers) }
+        it {expect( subject.values ).to include(*row1.values) }
+      end
+    end
+    context 'failure' do
+      subject { csvint }
+      let(:csvint) { CSVInterpreter.new("path") }
+      it "raises an error if the headers aren't set" do
+        expect{subject.interpret_unit %w{too many values}}.to raise_error(/Headers have not be set./)
+      end
+      it "raises an error if the header doesn't match the data" do
+        subject.headers = ["row1"]
+        expect{subject.interpret_unit %w{too many values}}.to raise_error(/Invalid data for current headers./)
+      end
+    end
+  end
+end

data/spec/lib/suds/interpreter_spec.rb ADDED

@@ -0,0 +1,11 @@
+require 'spec_helper'
+require 'interpreter'
+describe Interpreter do
+  subject { Interpreter.new }
+  context "interface" do
+    it { should respond_to :data }
+    it { should respond_to :headers }
+  end
+end

data/spec/lib/suds/suds_spec.rb ADDED

@@ -0,0 +1,121 @@
+require 'spec_helper'
+require 'suds'
+require 'cleaner'
+require 'converter'
+require 'interpreter'
+describe Suds do
+  subject { Suds }
+  describe '#initialize' do
+    subject { Suds.new double("Interpreter") }
+    it { should respond_to(:data) }
+  end
+  context 'plugins' do
+    let(:list) { subject.new double("Interpreter") }
+    describe '#add_cleaner' do
+      it "adds a cleaner" do
+        cleaner = Cleaner.new(){}
+        list.add_cleaner cleaner
+        expect(list.cleaners ).to_not be_empty
+      end
+      it 'raises an error if the added cleaner is not a Cleaner' do
+        cleaner = double
+        expect { list.add_cleaner cleaner }.to raise_error(Regexp.new("#{cleaner.class} is not a valid Cleaner."))
+      end
+    end
+    describe '#add_converter' do
+      it 'adds a converter' do
+        list.add_converter Converter.new([])
+        expect( list.converters ).to_not be_empty
+      end
+      it 'raises an error if the added converter is not a Converter' do
+        converter = double
+        expect { list.add_converter converter }.to raise_error(Regexp.new("#{converter.class} is not a valid Converter."))
+      end
+    end
+  end
+  context 'data manipulation' do
+    let(:data) { {row1: :a, row2: :b} }
+    let(:special_converter) do
+      converter = double("SpecialConverter")
+      allow(converter).to receive(:is_a?).with(Converter).and_return(true)
+      allow(converter).to receive(:convert)
+      allow(converter).to receive(:convert!)
+      allow(converter).to receive(:data).and_return([{a: '1'}])
+      converter
+    end
+    let(:special_cleaner) do
+      cleaner = double("SpecialCleaner")
+      allow(cleaner).to receive(:is_a?).with(Cleaner).and_return(true)
+      allow(cleaner).to receive(:clean).and_return({z: "9"})
+      cleaner
+    end
+    let(:special_interpreter) do
+      interpreter = double("SpecialInterpreter")
+      allow(interpreter).to receive(:is_a?).with(Interpreter).and_return(true)
+      allow(interpreter).to receive(:interpret)
+      allow(interpreter).to receive(:data).and_return(data)
+      interpreter
+    end
+    describe '#clean' do
+      let(:list) { Suds.new(special_interpreter) }
+      before do
+        list.add_cleaner(special_cleaner)
+      end
+      it 'cleans the data' do
+        expect( special_cleaner ).to receive(:clean)
+        list.clean
+        expect( list.interpreter.data ).to_not eq( list.data )
+      end
+    end
+    describe '#convert' do
+      let(:list) { Suds.new(special_interpreter) }
+      before do
+        list.add_converter special_converter
+      end
+      it 'converts the data into a portable type' do
+        expect( special_converter ).to receive(:convert)
+        list.convert
+      end
+      it 'can convert without cleaning first' do
+        allow( special_interpreter ).to receive(:interpret).and_return([])
+        list.convert
+        expect( list.data ).to_not be_nil
+      end
+      it 'returns a list of strings' do
+        allow( special_converter ).to receive(:convert).and_return("converted data")
+        convert = list.convert
+        expect( convert ).to be_an( Array )
+        expect( convert.first ).to be_a( String )
+      end
+    end
+    describe '#convert!' do
+      it 'writes out the data to a file' do
+        expect( special_converter ).to receive(:convert!)
+        list = Suds.new(special_interpreter)
+        list.add_converter special_converter
+        list.convert!
+      end
+    end
+  end
+end

data/spec/spec_helper.rb ADDED

@@ -0,0 +1,87 @@
+# This file was generated by the `rspec --init` command. Conventionally, all
+# specs live under a `spec` directory, which RSpec adds to the `$LOAD_PATH`.
+# The generated `.rspec` file contains `--require spec_helper` which will cause this
+# file to always be loaded, without a need to explicitly require it in any files.
+#
+# Given that it is always loaded, you are encouraged to keep this file as
+# light-weight as possible. Requiring heavyweight dependencies from this file
+# will add to the boot time of your test suite on EVERY test run, even for an
+# individual file that may not need all of that loaded. Instead, make a
+# separate helper file that requires this one and then use it only in the specs
+# that actually need it.
+#
+# The `.rspec` file also contains a few flags that are not defaults but that
+# users commonly want.
+#
+# See http://rubydoc.info/gems/rspec-core/RSpec/Core/Configuration
+$LOAD_PATH.unshift(File.dirname(__FILE__), *%w{.. lib/suds})
+require 'coveralls'
+require "codeclimate-test-reporter"
+CodeClimate::TestReporter.start
+Coveralls.wear!
+Dir["./spec/support/**/*.rb"].sort.each { |f| require f}
+RSpec.configure do |config|
+# The settings below are suggested to provide a good initial experience
+# with RSpec, but feel free to customize to your heart's content.
+=begin
+  # These two settings work together to allow you to limit a spec run
+  # to individual examples or groups you care about by tagging them with
+  # `:focus` metadata. When nothing is tagged with `:focus`, all examples
+  # get run.
+  config.filter_run :focus
+  config.run_all_when_everything_filtered = true
+  # Many RSpec users commonly either run the entire suite or an individual
+  # file, and it's useful to allow more verbose output when running an
+  # individual spec file.
+  if config.files_to_run.one?
+    # Use the documentation formatter for detailed output,
+    # unless a formatter has already been configured
+    # (e.g. via a command-line flag).
+    config.default_formatter = 'doc'
+  end
+  # Print the 10 slowest examples and example groups at the
+  # end of the spec run, to help surface which specs are running
+  # particularly slow.
+  config.profile_examples = 10
+  # Run specs in random order to surface order dependencies. If you find an
+  # order dependency and want to debug it, you can fix the order by providing
+  # the seed, which is printed after each run.
+  #     --seed 1234
+  config.order = :random
+  # Seed global randomization in this process using the `--seed` CLI option.
+  # Setting this allows you to use `--seed` to deterministically reproduce
+  # test failures related to randomization by passing the same `--seed` value
+  # as the one that triggered the failure.
+  Kernel.srand config.seed
+  # rspec-expectations config goes here. You can use an alternate
+  # assertion/expectation library such as wrong or the stdlib/minitest
+  # assertions if you prefer.
+  config.expect_with :rspec do |expectations|
+    # Enable only the newer, non-monkey-patching expect syntax.
+    # For more details, see:
+    #   - http://myronmars.to/n/dev-blog/2012/06/rspecs-new-expectation-syntax
+    expectations.syntax = :expect
+  end
+  # rspec-mocks config goes here. You can use an alternate test double
+  # library (such as bogus or mocha) by changing the `mock_with` option here.
+  config.mock_with :rspec do |mocks|
+    # Enable only the newer, non-monkey-patching expect syntax.
+    # For more details, see:
+    #   - http://teaisaweso.me/blog/2013/05/27/rspecs-new-message-expectation-syntax/
+    mocks.syntax = :expect
+    # Prevents you from mocking or stubbing a method that does not exist on
+    # a real object. This is generally recommended.
+    mocks.verify_partial_doubles = true
+  end
+=end
+end

data/spec/support/cleaner_context.rb ADDED

@@ -0,0 +1,5 @@
+shared_context "shared cleaner" do
+  let(:sample_array) { [data] }
+  let(:result) { subject.clean sample_array }
+  let(:modified_value) { result.first.first.last }
+end

data/suds.gemspec ADDED

@@ -0,0 +1,15 @@
+$:.push File.expand_path("../lib", __FILE__)
+require 'suds/version'
+Gem::Specification.new do |s|
+  s.name        = 'suds'
+  s.version     = Suds::VERSION
+  s.licenses    = ['MIT']
+  s.summary     = "Interpret, clean, and convert lists."
+  s.description = "Suds is a versatile list manipulation library/dsl. It's meant to interpret various difference formats, apply mutations, and then export to various formats."
+  s.authors     = ["Uri Gorelik"]
+  s.email       = 'uri@healthwave.co'
+  s.files       = `git ls-files`.split("\n")
+  s.homepage    = 'https://healthwave.co/'
+  s.require_paths = ["lib"]
+end

metadata ADDED

@@ -0,0 +1,83 @@
+--- !ruby/object:Gem::Specification
+name: suds
+version: !ruby/object:Gem::Version
+  version: 0.1.0
+platform: ruby
+authors:
+- Uri Gorelik
+autorequire:
+bindir: bin
+cert_chain: []
+date: 2014-10-27 00:00:00.000000000 Z
+dependencies: []
+description: Suds is a versatile list manipulation library/dsl. It's meant to interpret
+  various difference formats, apply mutations, and then export to various formats.
+email: uri@healthwave.co
+executables: []
+extensions: []
+extra_rdoc_files: []
+files:
+- ".coveralls.yml"
+- ".gitignore"
+- ".rspec"
+- ".ruby-version"
+- Gemfile
+- Gemfile.lock
+- Guardfile
+- LICENSE.txt
+- README.md
+- lib/suds.rb
+- lib/suds/all.rb
+- lib/suds/cleaner.rb
+- lib/suds/cleaner/column_converter_cleaner.rb
+- lib/suds/cleaner/column_filter_cleaner.rb
+- lib/suds/cleaner/downcase_cleaner.rb
+- lib/suds/cleaner/regex_cleaner.rb
+- lib/suds/cleaner/whitespace_cleaner.rb
+- lib/suds/converter.rb
+- lib/suds/converter/json_converter.rb
+- lib/suds/interpreter.rb
+- lib/suds/interpreter/csv_interpreter.rb
+- lib/suds/interpreter/file_interpreter.rb
+- lib/suds/suds.rb
+- lib/suds/version.rb
+- spec/lib/suds/all_spec.rb
+- spec/lib/suds/cleaner/column_converter_cleaner_spec.rb
+- spec/lib/suds/cleaner/column_filter_cleaner_spec.rb
+- spec/lib/suds/cleaner/downcase_cleaner_spec.rb
+- spec/lib/suds/cleaner/regex_cleaner_spec.rb
+- spec/lib/suds/cleaner/whitespace_cleaner_spec.rb
+- spec/lib/suds/cleaner_spec.rb
+- spec/lib/suds/converter/json_converter_spec.rb
+- spec/lib/suds/converter_spec.rb
+- spec/lib/suds/interpreter/csv_interpreter_spec.rb
+- spec/lib/suds/interpreter_spec.rb
+- spec/lib/suds/suds_spec.rb
+- spec/spec_helper.rb
+- spec/support/cleaner_context.rb
+- suds.gemspec
+homepage: https://healthwave.co/
+licenses:
+- MIT
+metadata: {}
+post_install_message:
+rdoc_options: []
+require_paths:
+- lib
+required_ruby_version: !ruby/object:Gem::Requirement
+  requirements:
+  - - ">="
+    - !ruby/object:Gem::Version
+      version: '0'
+required_rubygems_version: !ruby/object:Gem::Requirement
+  requirements:
+  - - ">="
+    - !ruby/object:Gem::Version
+      version: '0'
+requirements: []
+rubyforge_project:
+rubygems_version: 2.2.2
+signing_key:
+specification_version: 4
+summary: Interpret, clean, and convert lists.
+test_files: []