RubyGems - treat - Versions diffs - 0.2.5 → 1.0.0 - Mend

treat 0.2.5 → 1.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

data/LICENSE +3 -3
data/README.md +33 -0
data/files/INFO +1 -0
data/lib/treat.rb +40 -105
data/lib/treat/ai.rb +12 -0
data/lib/treat/ai/classifiers/id3.rb +27 -0
data/lib/treat/categories.rb +82 -35
data/lib/treat/categorizable.rb +44 -0
data/lib/treat/classification.rb +61 -0
data/lib/treat/configurable.rb +115 -0
data/lib/treat/data_set.rb +42 -0
data/lib/treat/dependencies.rb +24 -0
data/lib/treat/downloader.rb +87 -0
data/lib/treat/entities.rb +68 -66
data/lib/treat/entities/abilities.rb +10 -0
data/lib/treat/entities/abilities/buildable.rb +327 -0
data/lib/treat/entities/abilities/checkable.rb +31 -0
data/lib/treat/entities/abilities/copyable.rb +45 -0
data/lib/treat/entities/abilities/countable.rb +51 -0
data/lib/treat/entities/abilities/debuggable.rb +83 -0
data/lib/treat/entities/abilities/delegatable.rb +123 -0
data/lib/treat/entities/abilities/doable.rb +62 -0
data/lib/treat/entities/abilities/exportable.rb +11 -0
data/lib/treat/entities/abilities/iterable.rb +115 -0
data/lib/treat/entities/abilities/magical.rb +83 -0
data/lib/treat/entities/abilities/registrable.rb +74 -0
data/lib/treat/entities/abilities/stringable.rb +91 -0
data/lib/treat/entities/entities.rb +104 -0
data/lib/treat/entities/entity.rb +122 -245
data/lib/treat/exception.rb +4 -4
data/lib/treat/extractors.rb +77 -80
data/lib/treat/extractors/keywords/tf_idf.rb +56 -22
data/lib/treat/extractors/language/what_language.rb +50 -45
data/lib/treat/extractors/name_tag/stanford.rb +55 -0
data/lib/treat/extractors/tf_idf/native.rb +87 -0
data/lib/treat/extractors/time/chronic.rb +55 -0
data/lib/treat/extractors/time/nickel.rb +86 -62
data/lib/treat/extractors/time/ruby.rb +53 -0
data/lib/treat/extractors/topic_words/lda.rb +67 -58
data/lib/treat/extractors/topics/reuters.rb +100 -87
data/lib/treat/formatters.rb +39 -35
data/lib/treat/formatters/readers/abw.rb +49 -29
data/lib/treat/formatters/readers/autoselect.rb +37 -33
data/lib/treat/formatters/readers/doc.rb +19 -13
data/lib/treat/formatters/readers/html.rb +52 -30
data/lib/treat/formatters/readers/image.rb +41 -40
data/lib/treat/formatters/readers/odt.rb +59 -45
data/lib/treat/formatters/readers/pdf.rb +28 -25
data/lib/treat/formatters/readers/txt.rb +12 -15
data/lib/treat/formatters/readers/xml.rb +73 -36
data/lib/treat/formatters/serializers/xml.rb +80 -79
data/lib/treat/formatters/serializers/yaml.rb +19 -18
data/lib/treat/formatters/unserializers/autoselect.rb +12 -22
data/lib/treat/formatters/unserializers/xml.rb +94 -99
data/lib/treat/formatters/unserializers/yaml.rb +20 -19
data/lib/treat/formatters/visualizers/dot.rb +132 -132
data/lib/treat/formatters/visualizers/standoff.rb +52 -44
data/lib/treat/formatters/visualizers/tree.rb +26 -29
data/lib/treat/groupable.rb +153 -0
data/lib/treat/helpers/decimal_point_escaper.rb +22 -0
data/lib/treat/inflectors.rb +50 -45
data/lib/treat/inflectors/cardinalizers/linguistics.rb +40 -0
data/lib/treat/inflectors/conjugators/linguistics.rb +55 -0
data/lib/treat/inflectors/declensors/active_support.rb +31 -0
data/lib/treat/inflectors/declensors/english.rb +38 -0
data/lib/treat/inflectors/declensors/english/inflect.rb +288 -0
data/lib/treat/inflectors/declensors/linguistics.rb +49 -0
data/lib/treat/inflectors/ordinalizers/linguistics.rb +17 -0
data/lib/treat/inflectors/stemmers/porter.rb +160 -0
data/lib/treat/inflectors/stemmers/porter_c.rb +24 -0
data/lib/treat/inflectors/stemmers/uea.rb +28 -0
data/lib/treat/installer.rb +308 -0
data/lib/treat/kernel.rb +105 -27
data/lib/treat/languages.rb +122 -88
data/lib/treat/languages/arabic.rb +15 -15
data/lib/treat/languages/chinese.rb +15 -15
data/lib/treat/languages/dutch.rb +15 -15
data/lib/treat/languages/english.rb +61 -62
data/lib/treat/languages/french.rb +19 -19
data/lib/treat/languages/german.rb +20 -20
data/lib/treat/languages/greek.rb +15 -15
data/lib/treat/languages/italian.rb +16 -16
data/lib/treat/languages/polish.rb +15 -15
data/lib/treat/languages/portuguese.rb +15 -15
data/lib/treat/languages/russian.rb +15 -15
data/lib/treat/languages/spanish.rb +16 -16
data/lib/treat/languages/swedish.rb +16 -16
data/lib/treat/lexicalizers.rb +34 -55
data/lib/treat/lexicalizers/categorizers/from_tag.rb +54 -0
data/lib/treat/lexicalizers/sensers/wordnet.rb +57 -0
data/lib/treat/lexicalizers/sensers/wordnet/synset.rb +71 -0
data/lib/treat/lexicalizers/taggers/brill.rb +70 -0
data/lib/treat/lexicalizers/taggers/brill/patch.rb +61 -0
data/lib/treat/lexicalizers/taggers/lingua.rb +90 -0
data/lib/treat/lexicalizers/taggers/stanford.rb +97 -0
data/lib/treat/linguistics.rb +9 -0
data/lib/treat/linguistics/categories.rb +11 -0
data/lib/treat/linguistics/tags.rb +422 -0
data/lib/treat/loaders/linguistics.rb +30 -0
data/lib/treat/loaders/stanford.rb +27 -0
data/lib/treat/object.rb +1 -0
data/lib/treat/processors.rb +37 -44
data/lib/treat/processors/chunkers/autoselect.rb +16 -0
data/lib/treat/processors/chunkers/html.rb +71 -0
data/lib/treat/processors/chunkers/txt.rb +18 -24
data/lib/treat/processors/parsers/enju.rb +253 -208
data/lib/treat/processors/parsers/stanford.rb +130 -131
data/lib/treat/processors/segmenters/punkt.rb +79 -45
data/lib/treat/processors/segmenters/stanford.rb +46 -48
data/lib/treat/processors/segmenters/tactful.rb +43 -36
data/lib/treat/processors/tokenizers/perl.rb +124 -92
data/lib/treat/processors/tokenizers/ptb.rb +81 -0
data/lib/treat/processors/tokenizers/punkt.rb +48 -42
data/lib/treat/processors/tokenizers/stanford.rb +39 -38
data/lib/treat/processors/tokenizers/tactful.rb +64 -55
data/lib/treat/proxies.rb +52 -35
data/lib/treat/retrievers.rb +26 -16
data/lib/treat/retrievers/indexers/ferret.rb +47 -26
data/lib/treat/retrievers/searchers/ferret.rb +69 -50
data/lib/treat/tree.rb +241 -183
data/spec/collection.rb +123 -0
data/spec/document.rb +93 -0
data/spec/entity.rb +408 -0
data/spec/languages.rb +25 -0
data/spec/phrase.rb +146 -0
data/spec/samples/mathematicians/archimedes.abw +34 -0
data/spec/samples/mathematicians/euler.html +21 -0
data/spec/samples/mathematicians/gauss.pdf +0 -0
data/spec/samples/mathematicians/leibniz.txt +13 -0
data/spec/samples/mathematicians/newton.doc +0 -0
data/spec/sandbox.rb +5 -0
data/spec/token.rb +109 -0
data/spec/treat.rb +52 -0
data/spec/tree.rb +117 -0
data/spec/word.rb +110 -0
data/spec/zone.rb +66 -0
data/tmp/INFO +1 -1
metadata +100 -201
data/INSTALL +0 -1
data/README +0 -3
data/TODO +0 -28
data/lib/economist/half_cocked_basel.txt +0 -16
data/lib/economist/hungarys_troubles.txt +0 -46
data/lib/economist/indias_slowdown.txt +0 -15
data/lib/economist/merkozy_rides_again.txt +0 -24
data/lib/economist/prada_is_not_walmart.txt +0 -9
data/lib/economist/to_infinity_and_beyond.txt +0 -15
data/lib/ferret/_11.cfs +0 -0
data/lib/ferret/_14.cfs +0 -0
data/lib/ferret/_p.cfs +0 -0
data/lib/ferret/_s.cfs +0 -0
data/lib/ferret/_v.cfs +0 -0
data/lib/ferret/_y.cfs +0 -0
data/lib/ferret/segments +0 -0
data/lib/ferret/segments_15 +0 -0
data/lib/treat/buildable.rb +0 -157
data/lib/treat/category.rb +0 -33
data/lib/treat/delegatable.rb +0 -116
data/lib/treat/doable.rb +0 -45
data/lib/treat/entities/collection.rb +0 -14
data/lib/treat/entities/document.rb +0 -12
data/lib/treat/entities/phrases.rb +0 -17
data/lib/treat/entities/tokens.rb +0 -61
data/lib/treat/entities/zones.rb +0 -41
data/lib/treat/extractors/coreferences/stanford.rb +0 -69
data/lib/treat/extractors/date/chronic.rb +0 -32
data/lib/treat/extractors/date/ruby.rb +0 -25
data/lib/treat/extractors/keywords/topics_tf_idf.rb +0 -48
data/lib/treat/extractors/language/language_extractor.rb +0 -27
data/lib/treat/extractors/named_entity_tag/stanford.rb +0 -53
data/lib/treat/extractors/roles/naive.rb +0 -73
data/lib/treat/extractors/statistics/frequency_in.rb +0 -16
data/lib/treat/extractors/statistics/position_in.rb +0 -14
data/lib/treat/extractors/statistics/tf_idf.rb +0 -104
data/lib/treat/extractors/statistics/transition_matrix.rb +0 -105
data/lib/treat/extractors/statistics/transition_probability.rb +0 -57
data/lib/treat/extractors/topic_words/lda/data.dat +0 -46
data/lib/treat/extractors/topic_words/lda/wiki.yml +0 -121
data/lib/treat/extractors/topics/reuters/industry.xml +0 -2717
data/lib/treat/extractors/topics/reuters/region.xml +0 -13586
data/lib/treat/extractors/topics/reuters/topics.xml +0 -17977
data/lib/treat/feature.rb +0 -58
data/lib/treat/features.rb +0 -7
data/lib/treat/formatters/visualizers/short_value.rb +0 -29
data/lib/treat/formatters/visualizers/txt.rb +0 -45
data/lib/treat/group.rb +0 -106
data/lib/treat/helpers/linguistics_loader.rb +0 -18
data/lib/treat/inflectors/cardinal_words/linguistics.rb +0 -42
data/lib/treat/inflectors/conjugations/linguistics.rb +0 -36
data/lib/treat/inflectors/declensions/english.rb +0 -319
data/lib/treat/inflectors/declensions/linguistics.rb +0 -42
data/lib/treat/inflectors/ordinal_words/linguistics.rb +0 -20
data/lib/treat/inflectors/stem/porter.rb +0 -162
data/lib/treat/inflectors/stem/porter_c.rb +0 -26
data/lib/treat/inflectors/stem/uea.rb +0 -30
data/lib/treat/install.rb +0 -59
data/lib/treat/languages/tags.rb +0 -377
data/lib/treat/lexicalizers/category/from_tag.rb +0 -49
data/lib/treat/lexicalizers/linkages/naive.rb +0 -63
data/lib/treat/lexicalizers/synsets/wordnet.rb +0 -76
data/lib/treat/lexicalizers/tag/brill.rb +0 -91
data/lib/treat/lexicalizers/tag/lingua.rb +0 -123
data/lib/treat/lexicalizers/tag/stanford.rb +0 -70
data/lib/treat/processors/segmenters/punkt/dutch.yaml +0 -9716
data/lib/treat/processors/segmenters/punkt/english.yaml +0 -10340
data/lib/treat/processors/segmenters/punkt/french.yaml +0 -43159
data/lib/treat/processors/segmenters/punkt/german.yaml +0 -9572
data/lib/treat/processors/segmenters/punkt/greek.yaml +0 -6050
data/lib/treat/processors/segmenters/punkt/italian.yaml +0 -14748
data/lib/treat/processors/segmenters/punkt/polish.yaml +0 -9751
data/lib/treat/processors/segmenters/punkt/portuguese.yaml +0 -13662
data/lib/treat/processors/segmenters/punkt/russian.yaml +0 -4237
data/lib/treat/processors/segmenters/punkt/spanish.yaml +0 -24034
data/lib/treat/processors/segmenters/punkt/swedish.yaml +0 -10001
data/lib/treat/processors/tokenizers/macintyre.rb +0 -77
data/lib/treat/processors/tokenizers/multilingual.rb +0 -30
data/lib/treat/registrable.rb +0 -28
data/lib/treat/sugar.rb +0 -50
data/lib/treat/viewable.rb +0 -29
data/lib/treat/visitable.rb +0 -28
data/test/profile.rb +0 -2
data/test/tc_entity.rb +0 -117
data/test/tc_extractors.rb +0 -73
data/test/tc_formatters.rb +0 -41
data/test/tc_inflectors.rb +0 -34
data/test/tc_lexicalizers.rb +0 -32
data/test/tc_processors.rb +0 -50
data/test/tc_resources.rb +0 -22
data/test/tc_treat.rb +0 -60
data/test/tc_tree.rb +0 -60
data/test/tests.rb +0 -20
data/test/texts.rb +0 -19
data/test/texts/english/half_cocked_basel.txt +0 -16
data/test/texts/english/hose_and_dry.doc +0 -0
data/test/texts/english/hungarys_troubles.abw +0 -70
data/test/texts/english/long.html +0 -24
data/test/texts/english/long.txt +0 -22
data/test/texts/english/medium.txt +0 -5
data/test/texts/english/republican_nomination.pdf +0 -0
data/test/texts/english/saving_the_euro.odt +0 -0
data/test/texts/english/short.txt +0 -3
data/test/texts/english/zero_sum.html +0 -111

data/lib/treat/inflectors/conjugators/linguistics.rb ADDED Viewed

@@ -0,0 +1,55 @@
+# This class is a wrapper for the functions included
+# in the 'linguistics' gem that allow to conjugate verbs.
+#
+# Project website: http://deveiate.org/projects/Linguistics/
+module Treat::Inflectors::Conjugators::Linguistics
+  require 'treat/loaders/linguistics'
+  DefaultOptions = {
+    :strict => false
+  }
+  Forms = {
+    :present_participle =>
+    {:mode => :participle, :tense => :present},
+    :infinitive => {:mode => :infinitive},
+    :plural_verb => {:count => :plural},
+    :singular_verb => {:count => :singular}
+  }
+  # Conjugate a verb using ruby linguistics with the specified
+  # mode, tense, count and person.
+  #
+  # Options:
+  #
+  # - (Boolean) :strict => whether to tag all words or only verbs.
+  # - (Symbol) :mode => :infinitive, :indicative, :subjunctive, :participle
+  # - (Symbol) :tense => :past, :present, :future
+  # - (Symbol) :count => :singular, :plural
+  # - (Symbol) :person => :first, :second, :third
+  #
+  def self.conjugate(entity, options = {})
+    options = DefaultOptions.merge(options)
+    cat = entity.check_has(:category)
+    return if cat != :verb && options[:strict]
+    options = Forms[options[:form]] if options[:form]
+    klass = Treat::Loaders::Linguistics.load(entity.language)
+    if options[:mode] == :infinitive
+      silence_warnings { klass.infinitive(entity.to_s) }
+    elsif options[:mode] == :participle && options[:tense] == :present
+      silence_warnings { klass.present_participle(entity.to_s) }
+    elsif options[:count] == :plural && options.size == 1
+      silence_warnings { klass.plural_verb(entity.to_s) }
+    else
+      raise Treat::Exception,
+      'This combination of modes, tenses, persons ' +
+      'and/or counts is not presently supported.'
+    end
+  end
+end

data/lib/treat/inflectors/declensors/active_support.rb ADDED Viewed

@@ -0,0 +1,31 @@
+# This class is a wrapper for the ActiveSupport
+# declension tools.
+class Treat::Inflectors::Declensors::English
+  require 'active_support/inflector/inflections'
+  # Declense a word using ActiveSupport::Inflector::Inflections
+  def self.declense(entity, options)
+    cat = entity.check_has(:category)
+    unless [:noun, :adjective, :determiner].
+      include?(cat)
+        return
+    end
+    unless options[:count]
+      raise Treat::Exception,
+      "Must supply option count (:singular or :plural)."
+    end
+    string = entity.to_s
+    if options[:count] == :plural
+      ActiveSupport::Inflector::Inflections.pluralize(string)
+    elsif options[:count] == :singular
+      ActiveSupport::Inflector::Inflections.singularize(string)
+    end
+  end
+end

data/lib/treat/inflectors/declensors/english.rb ADDED Viewed

@@ -0,0 +1,38 @@
+# This class is a wrapper for the Inflect module,
+# copied from the unmaintained 'english' ruby gem,
+# created by Thomas Sawyer.
+#
+# Released under the MIT License.
+#
+#  http://english.rubyforge.org
+class Treat::Inflectors::Declensors::English
+  require 'treat/inflectors/declensors/english/inflect'
+  # Retrieve the declensions (singular, plural)
+  # of an english word using a class lifted from
+  # the 'english' ruby gem.
+  def self.declense(entity, options)
+    cat = entity.check_has(:category)
+    unless [:noun, :adjective, :determiner].
+      include?(cat)
+        return
+    end
+    unless options[:count]
+      raise Treat::Exception,
+      "Must supply option count (:singular or :plural)."
+    end
+    string = entity.to_s
+    if options[:count] == :plural
+      Inflect.plural(string)
+    elsif options[:count] == :singular
+      Inflect.singular(string)
+    end
+  end
+end

data/lib/treat/inflectors/declensors/english/inflect.rb ADDED Viewed

@@ -0,0 +1,288 @@
+# This class comes from the Inflect module; it has been
+# copied from the unmaintained 'english' ruby gem,
+# created by Thomas Sawyer.
+#
+# Released under the MIT License.
+#
+#  http://english.rubyforge.org
+module Treat::Inflectors::Declensors::English::Inflect
+  @singular_of = {}
+  @plural_of = {}
+  @singular_rules = []
+  @plural_rules = []
+  # This class provides the DSL for creating inflections, you can add additional rules.
+  # Examples:
+  #
+  #   word "ox", "oxen"
+  #   word "octopus", "octopi"
+  #   word "man", "men"
+  #
+  #   rule "lf", "lves"
+  #
+  #   word "equipment"
+  #
+  # Rules are evaluated by size, so rules you add to override specific cases should be longer than the rule
+  # it overrides. For instance, if you want "pta" to pluralize to "ptas", even though a general purpose rule
+  # for "ta" => "tum" already exists, simply add a new rule for "pta" => "ptas", and it will automatically win
+  # since it is longer than the old rule.
+  #
+  # Also, single-word exceptions win over general words ("ox" pluralizes to "oxen", because it's a single word
+  # exception, even though "fox" pluralizes to "foxes")
+  class << self
+    # Define a general two-way exception.
+    #
+    # This also defines a general rule, so foo_child will correctly become
+    # foo_children.
+    #
+    # Whole words also work if they are capitalized (Goose => Geese).
+    def word(singular, plural=nil)
+      plural = singular unless plural
+      singular_word(singular, plural)
+      plural_word(singular, plural)
+      rule(singular, plural)
+    end
+    # Define a singularization exception.
+    def singular_word(singular, plural)
+      @singular_of[plural] = singular
+      @singular_of[plural.capitalize] = singular.capitalize
+    end
+    # Define a pluralization exception.
+    def plural_word(singular, plural)
+      @plural_of[singular] = plural
+      @plural_of[singular.capitalize] = plural.capitalize
+    end
+    # Define a general rule.
+    def rule(singular, plural)
+      singular_rule(singular, plural)
+      plural_rule(singular, plural)
+    end
+    # Define a singularization rule.
+    def singular_rule(singular, plural)
+      @singular_rules << [singular, plural]
+    end
+    # Define a plurualization rule.
+    def plural_rule(singular, plural)
+      @plural_rules << [singular, plural]
+    end
+    # Read prepared singularization rules.
+    def singularization_rules
+      if defined?(@singularization_regex) && @singularization_regex
+        return [@singularization_regex, @singularization_hash]
+      end
+      # No sorting needed: Regexen match on longest string
+      @singularization_regex = Regexp.new("(" + @singular_rules.map {|s,p| p}.join("|") + ")$", "i")
+      @singularization_hash  = Hash[*@singular_rules.flatten].invert
+      [@singularization_regex, @singularization_hash]
+    end
+    # Read prepared singularization rules.
+    #def singularization_rules
+    #  return @singularization_rules if @singularization_rules
+    #  sorted = @singular_rules.sort_by{ |s, p| "#{p}".size }.reverse
+    #  @singularization_rules = sorted.collect do |s, p|
+    #    [ /#{p}$/, "#{s}" ]
+    #  end
+    #end
+    # Read prepared pluralization rules.
+    def pluralization_rules
+      if defined?(@pluralization_regex) && @pluralization_regex
+        return [@pluralization_regex, @pluralization_hash]
+      end
+      @pluralization_regex = Regexp.new("(" + @plural_rules.map {|s,p| s}.join("|") + ")$", "i")
+      @pluralization_hash = Hash[*@plural_rules.flatten]
+      [@pluralization_regex, @pluralization_hash]
+    end
+    # Read prepared pluralization rules.
+    #def pluralization_rules
+    #  return @pluralization_rules if @pluralization_rules
+    #  sorted = @plural_rules.sort_by{ |s, p| "#{s}".size }.reverse
+    #  @pluralization_rules = sorted.collect do |s, p|
+    #    [ /#{s}$/, "#{p}" ]
+    #  end
+    #end
+    #
+    def singular_of ; @singular_of ; end
+    #
+    def plural_of   ; @plural_of   ; end
+    # Convert an English word from plurel to singular.
+    #
+    #   "boys".singular      #=> boy
+    #   "tomatoes".singular  #=> tomato
+    #
+    def singular(word)
+      return "" if word == ""
+      if result = singular_of[word]
+        return result.dup
+      end
+      result = word.dup
+      regex, hash = singularization_rules
+      result.sub!(regex) {|m| hash[m]}
+      singular_of[word] = result
+      return result
+      #singularization_rules.each do |(match, replacement)|
+      #  break if result.gsub!(match, replacement)
+      #end
+      #return result
+    end
+    # Alias for #singular (a Railism).
+    #
+    alias_method(:singularize, :singular)
+    # Convert an English word from singular to plurel.
+    #
+    #   "boy".plural     #=> boys
+    #   "tomato".plural  #=> tomatoes
+    #
+    def plural(word)
+      return "" if word == ""
+      if result = plural_of[word]
+        return result.dup
+      end
+      #return self.dup if /s$/ =~ self # ???
+      result = word.dup
+      regex, hash = pluralization_rules
+      result.sub!(regex) {|m| hash[m]}
+      plural_of[word] = result
+      return result
+      #pluralization_rules.each do |(match, replacement)|
+      #  break if result.gsub!(match, replacement)
+      #end
+      #return result
+    end
+    # Alias for #plural (a Railism).
+    alias_method(:pluralize, :plural)
+    # Clear all rules.
+    def clear(type = :all)
+      if type == :singular || type == :all
+        @singular_of = {}
+        @singular_rules = []
+        @singularization_rules, @singularization_regex = nil, nil
+      end
+      if type == :plural || type == :all
+        @singular_of = {}
+        @singular_rules = []
+        @singularization_rules, @singularization_regex = nil, nil
+      end
+    end
+  end
+  # One argument means singular and plural are the same.
+  word 'equipment'
+  word 'information'
+  word 'money'
+  word 'species'
+  word 'series'
+  word 'fish'
+  word 'sheep'
+  word 'moose'
+  word 'hovercraft'
+  word 'news'
+  word 'rice'
+  word 'plurals'
+  # Two arguments defines a singular and plural exception.
+  word 'Swiss'     , 'Swiss'
+  word 'alias'     , 'aliases'
+  word 'analysis'  , 'analyses'
+  #word 'axis'      , 'axes'
+  word 'basis'     , 'bases'
+  word 'buffalo'   , 'buffaloes'
+  word 'child'     , 'children'
+  #word 'cow'       , 'kine'
+  word 'crisis'    , 'crises'
+  word 'criterion' , 'criteria'
+  word 'datum'     , 'data'
+  word 'goose'     , 'geese'
+  word 'hive'      , 'hives'
+  word 'index'     , 'indices'
+  word 'life'      , 'lives'
+  word 'louse'     , 'lice'
+  word 'man'       , 'men'
+  word 'matrix'    , 'matrices'
+  word 'medium'    , 'media'
+  word 'mouse'     , 'mice'
+  word 'movie'     , 'movies'
+  word 'octopus'   , 'octopi'
+  word 'ox'        , 'oxen'
+  word 'person'    , 'people'
+  word 'potato'    , 'potatoes'
+  word 'quiz'      , 'quizzes'
+  word 'shoe'      , 'shoes'
+  word 'status'    , 'statuses'
+  word 'testis'    , 'testes'
+  word 'thesis'    , 'theses'
+  word 'thief'     , 'thieves'
+  word 'tomato'    , 'tomatoes'
+  word 'torpedo'   , 'torpedoes'
+  word 'vertex'    , 'vertices'
+  word 'virus'     , 'viri'
+  word 'wife'      , 'wives'
+  # One-way singularization exception (convert plural to singular).
+  singular_word 'cactus', 'cacti'
+  # One-way pluralizaton exception (convert singular to plural).
+  plural_word 'axis', 'axes'
+  # General rules.
+  rule 'rf'     , 'rves'
+  rule 'ero'    , 'eroes'
+  rule 'ch'     , 'ches'
+  rule 'sh'     , 'shes'
+  rule 'ss'     , 'sses'
+  #rule 'ess'  , 'esses'
+  rule 'ta'     , 'tum'
+  rule 'ia'     , 'ium'
+  rule 'ra'     , 'rum'
+  rule 'ay'     , 'ays'
+  rule 'ey'     , 'eys'
+  rule 'oy'     , 'oys'
+  rule 'uy'     , 'uys'
+  rule 'y'      , 'ies'
+  rule 'x'      , 'xes'
+  rule 'lf'     , 'lves'
+  rule 'ffe'    , 'ffes'
+  rule 'af'     , 'aves'
+  rule 'us'     , 'uses'
+  rule 'ouse'   , 'ouses'
+  rule 'osis'   , 'oses'
+  rule 'ox'     , 'oxes'
+  rule ''       , 's'
+  # One-way singular rules.
+  singular_rule 'of' , 'ofs' # proof
+  singular_rule 'o'  , 'oes' # hero, heroes
+  #singular_rule 'f'  , 'ves'
+  # One-way plural rules.
+  plural_rule 's'   , 'ses'
+  plural_rule 'ive' , 'ives' # don't want to snag wife
+  plural_rule 'fe'  , 'ves'  # don't want to snag perspectives
+end

data/lib/treat/inflectors/declensors/linguistics.rb ADDED Viewed

@@ -0,0 +1,49 @@
+# This class is a wrapper for the functions included
+# in the 'linguistics' gem that allow to obtain the
+# declensions of a word.
+#
+# Project website: http://deveiate.org/projects/Linguistics/
+class Treat::Inflectors::Declensors::Linguistics
+  require 'treat/loaders/linguistics'
+  # Retrieve a declension of a word using the 'linguistics' gem.
+  #
+  # Options:
+  #
+  # - (Identifier) :count => :singular, :plural
+  def self.declense(entity, options = {})
+    cat = entity.check_has(:category)
+    unless [:noun, :adjective, :determiner].
+      include?(cat)
+        return
+    end
+    unless options[:count]
+      raise Treat::Exception,
+      "Must supply option count (:singular or :plural)."
+    end
+    klass = Treat::Loaders::Linguistics.load(entity.language)
+    string = entity.to_s
+    if options[:count] == :plural
+      if entity.has?(:category) &&
+        [:noun, :adjective, :verb].
+        include?(entity.category)
+        silence_warnings do
+          klass.send(
+          :"plural_#{entity.category}",
+          string)
+        end
+      else
+        klass.plural(string)
+      end
+    end
+  end
+end