RubyGems - taxonifi - Versions diffs - 0.1.0 - Mend

taxonifi 0.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (53) hide show

data/.document +5 -0
data/Gemfile +18 -0
data/Gemfile.lock +30 -0
data/LICENSE.txt +20 -0
data/README.rdoc +155 -0
data/Rakefile +53 -0
data/VERSION +1 -0
data/lib/assessor/assessor.rb +31 -0
data/lib/assessor/base.rb +17 -0
data/lib/assessor/row_assessor.rb +131 -0
data/lib/export/export.rb +9 -0
data/lib/export/format/base.rb +43 -0
data/lib/export/format/species_file.rb +341 -0
data/lib/lumper/lumper.rb +334 -0
data/lib/lumper/lumps/parent_child_name_collection.rb +84 -0
data/lib/models/author_year.rb +39 -0
data/lib/models/base.rb +73 -0
data/lib/models/collection.rb +92 -0
data/lib/models/generic_object.rb +15 -0
data/lib/models/geog.rb +59 -0
data/lib/models/geog_collection.rb +28 -0
data/lib/models/name.rb +206 -0
data/lib/models/name_collection.rb +149 -0
data/lib/models/person.rb +49 -0
data/lib/models/ref.rb +85 -0
data/lib/models/ref_collection.rb +106 -0
data/lib/models/species_name.rb +85 -0
data/lib/splitter/builder.rb +26 -0
data/lib/splitter/lexer.rb +70 -0
data/lib/splitter/parser.rb +54 -0
data/lib/splitter/splitter.rb +45 -0
data/lib/splitter/tokens.rb +322 -0
data/lib/taxonifi.rb +36 -0
data/test/file_fixtures/Lygaeoidea.csv +801 -0
data/test/helper.rb +38 -0
data/test/test_exporter.rb +32 -0
data/test/test_lumper_geogs.rb +59 -0
data/test/test_lumper_hierarchical_collection.rb +88 -0
data/test/test_lumper_names.rb +119 -0
data/test/test_lumper_parent_child_name_collection.rb +41 -0
data/test/test_lumper_refs.rb +91 -0
data/test/test_parser.rb +34 -0
data/test/test_splitter.rb +27 -0
data/test/test_splitter_tokens.rb +403 -0
data/test/test_taxonifi.rb +11 -0
data/test/test_taxonifi_accessor.rb +61 -0
data/test/test_taxonifi_geog.rb +51 -0
data/test/test_taxonifi_name.rb +186 -0
data/test/test_taxonifi_name_collection.rb +158 -0
data/test/test_taxonifi_ref.rb +90 -0
data/test/test_taxonifi_ref_collection.rb +69 -0
data/test/test_taxonifi_species_name.rb +95 -0
metadata +167 -0

data/test/test_splitter_tokens.rb ADDED Viewed

@@ -0,0 +1,403 @@
+require File.expand_path(File.join(File.dirname(__FILE__), 'helper'))
+require File.expand_path(File.join(File.dirname(__FILE__), '../lib/splitter/splitter'))
+class Test_TaxonifiSplitterLexer < Test::Unit::TestCase
+  def test_lexer_raises_when_not_hit
+    lexer = Taxonifi::Splitter::Lexer.new("123a")
+    assert_raises Taxonifi::Splitter::SplitterError do
+      lexer.pop(Taxonifi::Splitter::Tokens::Year)
+    end
+  end
+end
+class Test_TaxonifiSplitterTokens < Test::Unit::TestCase
+  def test_year
+    lexer = Taxonifi::Splitter::Lexer.new("1235")
+    assert lexer.pop(Taxonifi::Splitter::Tokens::Year)
+    lexer = Taxonifi::Splitter::Lexer.new(" 1235")
+    assert lexer.pop(Taxonifi::Splitter::Tokens::Year)
+    lexer = Taxonifi::Splitter::Lexer.new(" 1235  ")
+    assert lexer.pop(Taxonifi::Splitter::Tokens::Year)
+    lexer = Taxonifi::Splitter::Lexer.new("1235  ")
+    assert lexer.pop(Taxonifi::Splitter::Tokens::Year)
+    lexer = Taxonifi::Splitter::Lexer.new("1235\n  ")
+    assert lexer.pop(Taxonifi::Splitter::Tokens::Year)
+  end
+  def test_left_paren
+    lexer = Taxonifi::Splitter::Lexer.new("(")
+    assert lexer.pop(Taxonifi::Splitter::Tokens::LeftParen)
+    lexer = Taxonifi::Splitter::Lexer.new(" (")
+    assert lexer.pop(Taxonifi::Splitter::Tokens::LeftParen)
+    lexer = Taxonifi::Splitter::Lexer.new(" ( ")
+    assert lexer.pop(Taxonifi::Splitter::Tokens::LeftParen)
+  end
+  def test_right_paren
+    lexer = Taxonifi::Splitter::Lexer.new(")")
+    assert lexer.pop(Taxonifi::Splitter::Tokens::RightParen)
+    lexer = Taxonifi::Splitter::Lexer.new(" )")
+    assert lexer.pop(Taxonifi::Splitter::Tokens::RightParen)
+    lexer = Taxonifi::Splitter::Lexer.new(" ) ")
+    assert lexer.pop(Taxonifi::Splitter::Tokens::RightParen)
+  end
+  def test_right_paren
+    lexer = Taxonifi::Splitter::Lexer.new(",")
+    assert lexer.pop(Taxonifi::Splitter::Tokens::Comma)
+  end
+  def test_author_year
+    # let's try some combinations
+    authors = ["Foo", "Foo ", "Kukalova-Peck", "Grimaldi, Michalski & Schmidt", "Smith and Adams", "Smith, J.H.", "Smith, J.H. and Jones, Y.K.", "Lin."]
+    comma = [true, false]
+    years = ["", " 1993" ]
+    parens = [true, false]
+    authors.each do |a|
+      years.each do |y|
+        comma.each do |c|
+          parens.each do |p|
+            s = a.to_s + (comma ? "," : "") + y.to_s
+            s = "(#{s})" if p
+            lexer = Taxonifi::Splitter::Lexer.new(s)
+            assert t = lexer.pop(Taxonifi::Splitter::Tokens::AuthorYear)
+            assert_equal a.strip, t.authors
+            assert_equal (y.size > 0 ? y.strip.to_i : nil), t.year
+            assert_equal p, t.parens
+            s = nil
+          end
+        end
+      end
+    end
+  end
+  def test_quadrinomial
+    ["Foo"].each do |genus|
+      ["(Bar)", nil].each do |subgenus|
+        sg = nil
+        sg = $1
+        ["stuff"].each do |species|
+          ["things", nil].each do |subspecies|
+            str = [genus, subgenus, species, subspecies].compact.join(" ")
+            if subgenus
+              sg = subgenus[-(subgenus.size-1)..-2]
+            else
+              sg = nil
+            end
+            lexer = Taxonifi::Splitter::Lexer.new(str)
+            t = lexer.pop(Taxonifi::Splitter::Tokens::Quadrinomial)
+            assert_equal genus,      t.genus
+            assert_equal sg,         t.subgenus
+            assert_equal species,    t.species
+            assert_equal subspecies, t.subspecies
+          end
+        end
+      end
+    end
+    lexer = Taxonifi::Splitter::Lexer.new("Foo")
+    t = lexer.pop(Taxonifi::Splitter::Tokens::Quadrinomial)
+    assert_equal "Foo",      t.genus
+    lexer = Taxonifi::Splitter::Lexer.new("Foo stuff")
+    t = lexer.pop(Taxonifi::Splitter::Tokens::Quadrinomial)
+    assert_equal "Foo",      t.genus
+    assert_equal "stuff",      t.species
+    lexer = Taxonifi::Splitter::Lexer.new('Foo (Bar) stuff things (Smith, 1912) and some other...')
+    t = lexer.pop(Taxonifi::Splitter::Tokens::Quadrinomial)
+    assert_equal "Foo",      t.genus
+    assert_equal "Bar",      t.subgenus
+    assert_equal "stuff",    t.species
+    assert_equal "things",   t.subspecies
+  end
+  # Token is very flexible.
+  def test_authors
+    auths = [
+        "Jepson, J.E.,Makarkin, V.N., & Jarzembowski, E.A.",    # 0
+        "Ren, D & Meng, X-m.",                                  # 1
+        "Ren, D and Meng, X-m.",                                # 2
+        "Smith, J.H. and Jones, Y.K.",                          # 3
+        "Thomas jr. D.B.",                                      # 4
+        "Wighton, D.C., & Wilson, M.V.H.",                      # 5
+        "Heyden, C.H.G. von & Heyden, L.F.J.D. von",            # 6
+        "Zhang, B., et al.",                                    # 7
+        " Zhang, J.F. ",                                        # 8
+        "Hong, Y-C.",                                           # 9
+        "Yan, E.V.",                                            # 10
+        "Foo A, Bar ZA, Smith-Blorf A",                         # 11
+        "Smith and Barnes",                                     # 12
+        "Smith & Barnes",                                       # 13
+        "Smith",                                                # 14
+        "Smith, Jones and Simon",                               # 15
+        "Van Duzee",                                            # 16
+        "Walker, F.",                                           # 17
+        "Watson, T. F., D. Langston, D. Fullerton, R. Rakickas, B. Engroff, R. Rokey, and L. Bricker",  # 18
+        "Wheeler, A. G., Jr. and T. J. Henry.",                 # 19
+        "Wheeler, A. G., Jr., B. R. Stinner, and T. J. Henry",  # 20
+        "Wilson, L. T. and A. P. Gutierrez",                    # 21
+        "Torre-Bueno, J. R. de la",                             # 22
+        "Vollenhoven, S. C. S.",                                # 23
+        "Usinger, R. L. and P. D. Ashlock",                     # 24
+        "van den Bosch, R. and K. Hagen",                       # 25
+        "Slater, J. A. and J. E. O'Donnell",                    # 26
+        "O'Donnell, J.E. and Slater, J. A.",                    # 27
+        "Van Steenwyk, R. A., N. C. Toscano, G. R. Ballmer, K. Kido, and H. T. Reynolds",                             # 28
+        "Ward, C. R., C. W. O'Brien, L. B. O'Brien, D. E. Foster, and E. W. Huddleston",                              # 29
+        "McPherson, R. M., J. C. Smith, and W. A. Allen",                                                             # 30
+        "Oatman, E. R., J. A. McMurty, H. H. Shorey, and V. Voth",                                                    # 31
+        "Ferrari, E. von ",                                                                                           # 32
+        "Whitaker J. O., Jr., D. Rubin and J. R. Munsee",                                                             # 33
+        "Palisot de Beauvois, A. M. F. J.",                                                                           # 34
+        "Maa, T.-C. and K.-S. Lin",                                                                                   # 35
+        "Costa Lima, A. M. da, C. A. Campos Seabra, and C. R. Hathaway",                                              # 36
+        "Falcon, L. A., R. van den Bosch, C. A. Ferris, L. K. Stromberg, L. K. Etzel, R. E. Stinner, and T. F. Leigh",  # 37
+        "Kinzer, R. E., J. W. Davis, Jr., J. R. Coppedge, and S. L. Jones",                                           # 38
+        "Doesburg, P. H. van, Jr. "                                                                                   # 39
+    ]
+    lexer = Taxonifi::Splitter::Lexer.new(auths[39])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal ['Doesburg'], t.names.collect{|n| n[:last_name] }
+    assert_equal "van Jr.", t.names[0][:suffix]
+    lexer = Taxonifi::Splitter::Lexer.new(auths[38])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal ['Kinzer', 'Davis', 'Coppedge', 'Jones'], t.names.collect{|n| n[:last_name] }
+    assert_equal "Jr.", t.names[1][:suffix]
+    lexer = Taxonifi::Splitter::Lexer.new(auths[37])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal ['Falcon', 'van den Bosch', 'Ferris', 'Stromberg', 'Etzel', 'Stinner', 'Leigh'], t.names.collect{|n| n[:last_name] }
+    assert_equal [%w{L A}, %w{R}, %w{C A}] , t.names[0..2].collect{|n| n[:initials] }
+    lexer = Taxonifi::Splitter::Lexer.new(auths[36])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal ['Costa Lima', 'Campos Seabra', 'Hathaway'], t.names.collect{|n| n[:last_name] }
+    assert_equal [%w{A M}, %w{C A}, %w{C R}] , t.names.collect{|n| n[:initials] }
+    assert_equal "da" , t.names.first[:suffix]
+    lexer = Taxonifi::Splitter::Lexer.new(auths[35])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal ['Maa', 'Lin'], t.names.collect{|n| n[:last_name] }
+    assert_equal [%w{T -C}, %w{K -S}] , t.names.collect{|n| n[:initials] }
+    lexer = Taxonifi::Splitter::Lexer.new(auths[32])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal ['Ferrari'], t.names.collect{|n| n[:last_name] }
+    assert_equal [%w{E}] , t.names.collect{|n| n[:initials] }
+    assert_equal ['von'] , t.names.collect{|n| n[:suffix] }
+    lexer = Taxonifi::Splitter::Lexer.new(auths[31])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal ['Oatman', 'McMurty', 'Shorey', 'Voth'], t.names.collect{|n| n[:last_name] }
+    assert_equal [%w{E R}, %w{J A}, %w{H H}, %w{V}] , t.names.collect{|n| n[:initials] }
+    lexer = Taxonifi::Splitter::Lexer.new(auths[30])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal ["McPherson", "Smith", "Allen"], t.names.collect{|n| n[:last_name] }
+    assert_equal [%w{R M}, %w{J C}, %w{W A}] , t.names.collect{|n| n[:initials] }
+    lexer = Taxonifi::Splitter::Lexer.new(auths[29])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal ["Ward", "O'Brien", "O'Brien", "Foster", "Huddleston" ], t.names.collect{|n| n[:last_name] }
+    assert_equal [%w{C R}, %w{C W}, %w{L B}, %w{D E}, %w{E W}] , t.names.collect{|n| n[:initials] }
+    lexer = Taxonifi::Splitter::Lexer.new(auths[28])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal ["Van Steenwyk", "Toscano", "Ballmer", "Kido", "Reynolds" ], t.names.collect{|n| n[:last_name] }
+    assert_equal [%w{R A}, %w{N C}, %w{G R}, %w{K}, %w{H T}] , t.names.collect{|n| n[:initials] }
+    lexer = Taxonifi::Splitter::Lexer.new(auths[27])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal ["O'Donnell", "Slater" ], t.names.collect{|n| n[:last_name] }
+    assert_equal [["J", "E"],["J", "A"]] , t.names.collect{|n| n[:initials] }
+    lexer = Taxonifi::Splitter::Lexer.new(auths[26])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal ["Slater", "O'Donnell"], t.names.collect{|n| n[:last_name] }
+    assert_equal [["J", "A"],["J", "E"]] , t.names.collect{|n| n[:initials] }
+    lexer = Taxonifi::Splitter::Lexer.new(auths[25])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal ["van den Bosch", "Hagen"], t.names.collect{|n| n[:last_name] }
+    assert_equal [["R"],["K"]] , t.names.collect{|n| n[:initials] }
+    lexer = Taxonifi::Splitter::Lexer.new(auths[24])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal ["Usinger", "Ashlock"], t.names.collect{|n| n[:last_name] }
+    assert_equal [["R", "L"],["P", "D"]] , t.names.collect{|n| n[:initials] }
+    lexer = Taxonifi::Splitter::Lexer.new(auths[23])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal ["Vollenhoven"], t.names.collect{|n| n[:last_name] }
+    assert_equal [["S", "C", "S"]] , t.names.collect{|n| n[:initials] }
+    lexer = Taxonifi::Splitter::Lexer.new(auths[22])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal ["Torre-Bueno"], t.names.collect{|n| n[:last_name] }
+    assert_equal [["J", "R"]] , t.names.collect{|n| n[:initials] }
+    assert_equal "de la", t.names.first[:suffix]
+    lexer = Taxonifi::Splitter::Lexer.new(auths[21])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal ["Wilson", "Gutierrez"], t.names.collect{|n| n[:last_name] }
+    assert_equal [["L", "T"], ["A", "P"]] , t.names.collect{|n| n[:initials] }
+    lexer = Taxonifi::Splitter::Lexer.new(auths[20])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal ["Wheeler", "Stinner", "Henry"], t.names.collect{|n| n[:last_name] }
+    assert_equal [["A", "G"], ["B", "R"], ["T", "J"]] , t.names.collect{|n| n[:initials] }
+    assert_equal "Jr.", t.names.first[:suffix]
+    lexer = Taxonifi::Splitter::Lexer.new(auths[19])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal ["Wheeler", "Henry"], t.names.collect{|n| n[:last_name] }
+    assert_equal [["A", "G"], ["T", "J"]] , [t.names.first[:initials], t.names.last[:initials]]
+    assert_equal "Jr.", t.names.first[:suffix]
+    lexer = Taxonifi::Splitter::Lexer.new(auths[18])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal ["Watson", "Langston", "Fullerton", "Rakickas", "Engroff", "Rokey", "Bricker"], t.names.collect{|n| n[:last_name] }
+    assert_equal [["T", "F"], ["L"]] , [t.names.first[:initials], t.names.last[:initials]]
+    lexer = Taxonifi::Splitter::Lexer.new(auths[17])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal 1, t.names.size
+    assert_equal "Walker", t.names[0][:last_name]
+    assert_equal ["F"], t.names[0][:initials]
+    lexer = Taxonifi::Splitter::Lexer.new(auths[16])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal 1, t.names.size
+    assert_equal "Van Duzee", t.names[0][:last_name]
+    lexer = Taxonifi::Splitter::Lexer.new(auths[15])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal 3, t.names.size
+    assert_equal "Smith", t.names[0][:last_name]
+    assert_equal "Jones", t.names[1][:last_name]
+    assert_equal "Simon", t.names[2][:last_name]
+    lexer = Taxonifi::Splitter::Lexer.new(auths[14])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal 1, t.names.size
+    assert_equal "Smith", t.names[0][:last_name]
+    lexer = Taxonifi::Splitter::Lexer.new(auths[12])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal 2, t.names.size
+    assert_equal "Smith", t.names[0][:last_name]
+    assert_equal "Barnes", t.names[1][:last_name]
+    lexer = Taxonifi::Splitter::Lexer.new(auths[13])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal 2, t.names.size
+    assert_equal "Smith", t.names[0][:last_name]
+    assert_equal "Barnes", t.names[1][:last_name]
+    lexer = Taxonifi::Splitter::Lexer.new(auths[0])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal 3, t.names.size
+    assert_equal "Jepson", t.names[0][:last_name]
+    assert_equal "JE", t.names[0][:initials].join
+    assert_equal "Jarzembowski", t.names[2][:last_name]
+    assert_equal "EA", t.names[2][:initials].join
+    lexer = Taxonifi::Splitter::Lexer.new(auths[1])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal 2, t.names.size
+    assert_equal "Ren", t.names[0][:last_name]
+    assert_equal "D", t.names[0][:initials].join
+    assert_equal "Meng", t.names[1][:last_name]
+    assert_equal "X-m", t.names[1][:initials].join
+    lexer = Taxonifi::Splitter::Lexer.new(auths[9])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal 1, t.names.size
+    assert_equal "Hong", t.names[0][:last_name]
+    assert_equal "Y-C", t.names[0][:initials].join
+    lexer = Taxonifi::Splitter::Lexer.new(auths[11])
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::Authors)
+    assert_equal 3, t.names.size
+    assert_equal "Foo", t.names[0][:last_name]
+    assert_equal "A", t.names[0][:initials].join
+    assert_equal "Bar", t.names[1][:last_name]
+    assert_equal "ZA", t.names[1][:initials].join
+    assert_equal "Smith-Blorf", t.names[2][:last_name]
+    assert_equal "A", t.names[2][:initials].join
+  end
+  def test_volume_number
+    lexer = Taxonifi::Splitter::Lexer.new("42(123)", :volume_number)
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::VolumeNumber)
+    assert_equal "42", t.volume
+    assert_equal "123", t.number
+    lexer = Taxonifi::Splitter::Lexer.new("42:123", :volume_number)
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::VolumeNumber)
+    assert_equal "42", t.volume
+    assert_equal "123", t.number
+    lexer = Taxonifi::Splitter::Lexer.new("42", :volume_number)
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::VolumeNumber)
+    assert_equal "42", t.volume
+    assert_equal nil, t.number
+    lexer = Taxonifi::Splitter::Lexer.new("II(5)", :volume_number)
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::VolumeNumber)
+    assert_equal "II", t.volume
+    assert_equal "5", t.number
+    lexer = Taxonifi::Splitter::Lexer.new("99A", :volume_number)
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::VolumeNumber)
+    assert_equal "99A", t.volume
+    assert_equal nil, t.number
+    lexer = Taxonifi::Splitter::Lexer.new("99(2-3)", :volume_number)
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::VolumeNumber)
+    assert_equal "99", t.volume
+    assert_equal "2-3", t.number
+    lexer = Taxonifi::Splitter::Lexer.new("8(c4)", :volume_number)
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::VolumeNumber)
+    assert_equal "8", t.volume
+    assert_equal "c4", t.number
+    lexer = Taxonifi::Splitter::Lexer.new("74 (1/2)", :volume_number)
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::VolumeNumber)
+    assert_equal "74", t.volume
+    assert_equal "1/2", t.number
+    lexer = Taxonifi::Splitter::Lexer.new("74(1/2)", :volume_number)
+    assert t = lexer.pop(Taxonifi::Splitter::Tokens::VolumeNumber)
+    assert_equal "74", t.volume
+    assert_equal "1/2", t.number
+  end
+  def test_pages
+    ["1-10", "1-10.", "1-10, something", "1-10. something"].each do |p|
+      lexer = Taxonifi::Splitter::Lexer.new(p, :pages)
+      assert t = lexer.pop(Taxonifi::Splitter::Tokens::Pages)
+      assert_equal "1", t.pg_start
+      assert_equal "10", t.pg_end
+    end
+  end
+end

data/test/test_taxonifi.rb ADDED Viewed

@@ -0,0 +1,11 @@
+require File.expand_path(File.join(File.dirname(__FILE__), 'helper'))
+require File.expand_path(File.join(File.dirname(__FILE__), '../lib/taxonifi'))
+class TestTaxonifi < Test::Unit::TestCase
+  def test_constants
+    assert Taxonifi::RANKS
+  end
+end

data/test/test_taxonifi_accessor.rb ADDED Viewed

@@ -0,0 +1,61 @@
+require File.expand_path(File.join(File.dirname(__FILE__), 'helper'))
+require File.expand_path(File.join(File.dirname(__FILE__), '../lib/assessor/assessor'))
+class Test_TaxonifiAccessor < Test::Unit::TestCase
+  def setup
+    @headers = ["family", "genus", "species", "author", "year"]
+    @csv_string = CSV.generate() do |csv|
+      csv <<  @headers
+      csv << ["Fooidae", "Foo", "bar", "Smith", "1854"]
+    end
+    @csv = CSV.parse(@csv_string, {headers: true})
+  end
+  def test_first_available
+    assert_equal [:family, 'Fooidae'], Taxonifi::Assessor::RowAssessor.first_available(@csv.first, [:family, :genus])
+  end
+  def test_last_available
+    assert_equal [:genus, 'Foo'], Taxonifi::Assessor::RowAssessor.last_available(@csv.first, [:family, :genus])
+  end
+  def test_lump_name_rank
+    assert_equal :species, Taxonifi::Assessor::RowAssessor.lump_name_rank(@csv.first)
+    @csv << ["Fooidae"]
+    assert_equal :family, Taxonifi::Assessor::RowAssessor.lump_name_rank(@csv[1])
+    @csv << ["Fooidae", "Blorf"]
+    assert_equal :genus, Taxonifi::Assessor::RowAssessor.lump_name_rank(@csv[2])
+  end
+  def test_lump_rank_parent
+    assert_equal ["genus", "Foo"], Taxonifi::Assessor::RowAssessor.parent_taxon_column(@csv.first)
+  end
+  def test_intersecting_lumps_with_data
+      headers = ["authors"]
+      csv_string = CSV.generate() do |csv|
+        csv <<  headers
+        csv << ["Smith J. and Barnes S."]
+      end
+     csv = CSV.parse(csv_string, {headers: true})
+     assert_equal [:citation_basic, :citation_small],  Taxonifi::Assessor::RowAssessor.intersecting_lumps_with_data(csv.first)
+  end
+  def test_lumps_with_data
+      headers = Taxonifi::Lumper::LUMPS[:citation_small]
+      csv_string = CSV.generate() do |csv|
+        csv <<  headers
+        csv << ["Smith J. and Barnes S.", 1912, "Foo", "Bar", "3(4)", "1-2"]
+      end
+     csv = CSV.parse(csv_string, {headers: true})
+     assert_equal [:citation_small],  Taxonifi::Assessor::RowAssessor.lumps_with_data(csv.first)
+  end
+end

data/test/test_taxonifi_geog.rb ADDED Viewed

@@ -0,0 +1,51 @@
+require File.expand_path(File.join(File.dirname(__FILE__), 'helper'))
+require File.expand_path(File.join(File.dirname(__FILE__), '../lib/models/name'))
+class TestTaxonifiGeog < Test::Unit::TestCase
+  def test_new_name
+    assert n = Taxonifi::Model::Geog.new()
+  end
+  def test_that_geog_has_a_name
+    n = Taxonifi::Model::Geog.new()
+    assert n.respond_to?(:name)
+  end
+  def test_that_geog_has_a_rank
+    n = Taxonifi::Model::Geog.new()
+    assert n.respond_to?(:rank)
+  end
+  def test_that_geog_rank_is_checked
+    n = Taxonifi::Model::Geog.new()
+    assert_raise Taxonifi::GeogError do
+      n.rank = 'Foo'
+    end
+    assert n.rank = 'country'
+  end
+  def test_that_setting_a_parent_checks_for_nil
+    p = Taxonifi::Model::Geog.new()
+    c = Taxonifi::Model::Geog.new()
+    c.rank = 'state'
+    assert_raise Taxonifi::GeogError do
+      c.parent = nil
+    end
+  end
+  def test_that_geog_rank_for_parents_is_checked
+    p = Taxonifi::Model::Geog.new()
+    c = Taxonifi::Model::Geog.new()
+    c.rank = 'state'
+    p.rank = 'country'
+    assert_raise Taxonifi::GeogError do
+      p.parent = c
+    end
+    assert c.parent = p
+  end
+end