RubyGems - treat - Versions diffs - 0.2.5 → 1.0.0 - Mend

treat 0.2.5 → 1.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

data/LICENSE +3 -3
data/README.md +33 -0
data/files/INFO +1 -0
data/lib/treat.rb +40 -105
data/lib/treat/ai.rb +12 -0
data/lib/treat/ai/classifiers/id3.rb +27 -0
data/lib/treat/categories.rb +82 -35
data/lib/treat/categorizable.rb +44 -0
data/lib/treat/classification.rb +61 -0
data/lib/treat/configurable.rb +115 -0
data/lib/treat/data_set.rb +42 -0
data/lib/treat/dependencies.rb +24 -0
data/lib/treat/downloader.rb +87 -0
data/lib/treat/entities.rb +68 -66
data/lib/treat/entities/abilities.rb +10 -0
data/lib/treat/entities/abilities/buildable.rb +327 -0
data/lib/treat/entities/abilities/checkable.rb +31 -0
data/lib/treat/entities/abilities/copyable.rb +45 -0
data/lib/treat/entities/abilities/countable.rb +51 -0
data/lib/treat/entities/abilities/debuggable.rb +83 -0
data/lib/treat/entities/abilities/delegatable.rb +123 -0
data/lib/treat/entities/abilities/doable.rb +62 -0
data/lib/treat/entities/abilities/exportable.rb +11 -0
data/lib/treat/entities/abilities/iterable.rb +115 -0
data/lib/treat/entities/abilities/magical.rb +83 -0
data/lib/treat/entities/abilities/registrable.rb +74 -0
data/lib/treat/entities/abilities/stringable.rb +91 -0
data/lib/treat/entities/entities.rb +104 -0
data/lib/treat/entities/entity.rb +122 -245
data/lib/treat/exception.rb +4 -4
data/lib/treat/extractors.rb +77 -80
data/lib/treat/extractors/keywords/tf_idf.rb +56 -22
data/lib/treat/extractors/language/what_language.rb +50 -45
data/lib/treat/extractors/name_tag/stanford.rb +55 -0
data/lib/treat/extractors/tf_idf/native.rb +87 -0
data/lib/treat/extractors/time/chronic.rb +55 -0
data/lib/treat/extractors/time/nickel.rb +86 -62
data/lib/treat/extractors/time/ruby.rb +53 -0
data/lib/treat/extractors/topic_words/lda.rb +67 -58
data/lib/treat/extractors/topics/reuters.rb +100 -87
data/lib/treat/formatters.rb +39 -35
data/lib/treat/formatters/readers/abw.rb +49 -29
data/lib/treat/formatters/readers/autoselect.rb +37 -33
data/lib/treat/formatters/readers/doc.rb +19 -13
data/lib/treat/formatters/readers/html.rb +52 -30
data/lib/treat/formatters/readers/image.rb +41 -40
data/lib/treat/formatters/readers/odt.rb +59 -45
data/lib/treat/formatters/readers/pdf.rb +28 -25
data/lib/treat/formatters/readers/txt.rb +12 -15
data/lib/treat/formatters/readers/xml.rb +73 -36
data/lib/treat/formatters/serializers/xml.rb +80 -79
data/lib/treat/formatters/serializers/yaml.rb +19 -18
data/lib/treat/formatters/unserializers/autoselect.rb +12 -22
data/lib/treat/formatters/unserializers/xml.rb +94 -99
data/lib/treat/formatters/unserializers/yaml.rb +20 -19
data/lib/treat/formatters/visualizers/dot.rb +132 -132
data/lib/treat/formatters/visualizers/standoff.rb +52 -44
data/lib/treat/formatters/visualizers/tree.rb +26 -29
data/lib/treat/groupable.rb +153 -0
data/lib/treat/helpers/decimal_point_escaper.rb +22 -0
data/lib/treat/inflectors.rb +50 -45
data/lib/treat/inflectors/cardinalizers/linguistics.rb +40 -0
data/lib/treat/inflectors/conjugators/linguistics.rb +55 -0
data/lib/treat/inflectors/declensors/active_support.rb +31 -0
data/lib/treat/inflectors/declensors/english.rb +38 -0
data/lib/treat/inflectors/declensors/english/inflect.rb +288 -0
data/lib/treat/inflectors/declensors/linguistics.rb +49 -0
data/lib/treat/inflectors/ordinalizers/linguistics.rb +17 -0
data/lib/treat/inflectors/stemmers/porter.rb +160 -0
data/lib/treat/inflectors/stemmers/porter_c.rb +24 -0
data/lib/treat/inflectors/stemmers/uea.rb +28 -0
data/lib/treat/installer.rb +308 -0
data/lib/treat/kernel.rb +105 -27
data/lib/treat/languages.rb +122 -88
data/lib/treat/languages/arabic.rb +15 -15
data/lib/treat/languages/chinese.rb +15 -15
data/lib/treat/languages/dutch.rb +15 -15
data/lib/treat/languages/english.rb +61 -62
data/lib/treat/languages/french.rb +19 -19
data/lib/treat/languages/german.rb +20 -20
data/lib/treat/languages/greek.rb +15 -15
data/lib/treat/languages/italian.rb +16 -16
data/lib/treat/languages/polish.rb +15 -15
data/lib/treat/languages/portuguese.rb +15 -15
data/lib/treat/languages/russian.rb +15 -15
data/lib/treat/languages/spanish.rb +16 -16
data/lib/treat/languages/swedish.rb +16 -16
data/lib/treat/lexicalizers.rb +34 -55
data/lib/treat/lexicalizers/categorizers/from_tag.rb +54 -0
data/lib/treat/lexicalizers/sensers/wordnet.rb +57 -0
data/lib/treat/lexicalizers/sensers/wordnet/synset.rb +71 -0
data/lib/treat/lexicalizers/taggers/brill.rb +70 -0
data/lib/treat/lexicalizers/taggers/brill/patch.rb +61 -0
data/lib/treat/lexicalizers/taggers/lingua.rb +90 -0
data/lib/treat/lexicalizers/taggers/stanford.rb +97 -0
data/lib/treat/linguistics.rb +9 -0
data/lib/treat/linguistics/categories.rb +11 -0
data/lib/treat/linguistics/tags.rb +422 -0
data/lib/treat/loaders/linguistics.rb +30 -0
data/lib/treat/loaders/stanford.rb +27 -0
data/lib/treat/object.rb +1 -0
data/lib/treat/processors.rb +37 -44
data/lib/treat/processors/chunkers/autoselect.rb +16 -0
data/lib/treat/processors/chunkers/html.rb +71 -0
data/lib/treat/processors/chunkers/txt.rb +18 -24
data/lib/treat/processors/parsers/enju.rb +253 -208
data/lib/treat/processors/parsers/stanford.rb +130 -131
data/lib/treat/processors/segmenters/punkt.rb +79 -45
data/lib/treat/processors/segmenters/stanford.rb +46 -48
data/lib/treat/processors/segmenters/tactful.rb +43 -36
data/lib/treat/processors/tokenizers/perl.rb +124 -92
data/lib/treat/processors/tokenizers/ptb.rb +81 -0
data/lib/treat/processors/tokenizers/punkt.rb +48 -42
data/lib/treat/processors/tokenizers/stanford.rb +39 -38
data/lib/treat/processors/tokenizers/tactful.rb +64 -55
data/lib/treat/proxies.rb +52 -35
data/lib/treat/retrievers.rb +26 -16
data/lib/treat/retrievers/indexers/ferret.rb +47 -26
data/lib/treat/retrievers/searchers/ferret.rb +69 -50
data/lib/treat/tree.rb +241 -183
data/spec/collection.rb +123 -0
data/spec/document.rb +93 -0
data/spec/entity.rb +408 -0
data/spec/languages.rb +25 -0
data/spec/phrase.rb +146 -0
data/spec/samples/mathematicians/archimedes.abw +34 -0
data/spec/samples/mathematicians/euler.html +21 -0
data/spec/samples/mathematicians/gauss.pdf +0 -0
data/spec/samples/mathematicians/leibniz.txt +13 -0
data/spec/samples/mathematicians/newton.doc +0 -0
data/spec/sandbox.rb +5 -0
data/spec/token.rb +109 -0
data/spec/treat.rb +52 -0
data/spec/tree.rb +117 -0
data/spec/word.rb +110 -0
data/spec/zone.rb +66 -0
data/tmp/INFO +1 -1
metadata +100 -201
data/INSTALL +0 -1
data/README +0 -3
data/TODO +0 -28
data/lib/economist/half_cocked_basel.txt +0 -16
data/lib/economist/hungarys_troubles.txt +0 -46
data/lib/economist/indias_slowdown.txt +0 -15
data/lib/economist/merkozy_rides_again.txt +0 -24
data/lib/economist/prada_is_not_walmart.txt +0 -9
data/lib/economist/to_infinity_and_beyond.txt +0 -15
data/lib/ferret/_11.cfs +0 -0
data/lib/ferret/_14.cfs +0 -0
data/lib/ferret/_p.cfs +0 -0
data/lib/ferret/_s.cfs +0 -0
data/lib/ferret/_v.cfs +0 -0
data/lib/ferret/_y.cfs +0 -0
data/lib/ferret/segments +0 -0
data/lib/ferret/segments_15 +0 -0
data/lib/treat/buildable.rb +0 -157
data/lib/treat/category.rb +0 -33
data/lib/treat/delegatable.rb +0 -116
data/lib/treat/doable.rb +0 -45
data/lib/treat/entities/collection.rb +0 -14
data/lib/treat/entities/document.rb +0 -12
data/lib/treat/entities/phrases.rb +0 -17
data/lib/treat/entities/tokens.rb +0 -61
data/lib/treat/entities/zones.rb +0 -41
data/lib/treat/extractors/coreferences/stanford.rb +0 -69
data/lib/treat/extractors/date/chronic.rb +0 -32
data/lib/treat/extractors/date/ruby.rb +0 -25
data/lib/treat/extractors/keywords/topics_tf_idf.rb +0 -48
data/lib/treat/extractors/language/language_extractor.rb +0 -27
data/lib/treat/extractors/named_entity_tag/stanford.rb +0 -53
data/lib/treat/extractors/roles/naive.rb +0 -73
data/lib/treat/extractors/statistics/frequency_in.rb +0 -16
data/lib/treat/extractors/statistics/position_in.rb +0 -14
data/lib/treat/extractors/statistics/tf_idf.rb +0 -104
data/lib/treat/extractors/statistics/transition_matrix.rb +0 -105
data/lib/treat/extractors/statistics/transition_probability.rb +0 -57
data/lib/treat/extractors/topic_words/lda/data.dat +0 -46
data/lib/treat/extractors/topic_words/lda/wiki.yml +0 -121
data/lib/treat/extractors/topics/reuters/industry.xml +0 -2717
data/lib/treat/extractors/topics/reuters/region.xml +0 -13586
data/lib/treat/extractors/topics/reuters/topics.xml +0 -17977
data/lib/treat/feature.rb +0 -58
data/lib/treat/features.rb +0 -7
data/lib/treat/formatters/visualizers/short_value.rb +0 -29
data/lib/treat/formatters/visualizers/txt.rb +0 -45
data/lib/treat/group.rb +0 -106
data/lib/treat/helpers/linguistics_loader.rb +0 -18
data/lib/treat/inflectors/cardinal_words/linguistics.rb +0 -42
data/lib/treat/inflectors/conjugations/linguistics.rb +0 -36
data/lib/treat/inflectors/declensions/english.rb +0 -319
data/lib/treat/inflectors/declensions/linguistics.rb +0 -42
data/lib/treat/inflectors/ordinal_words/linguistics.rb +0 -20
data/lib/treat/inflectors/stem/porter.rb +0 -162
data/lib/treat/inflectors/stem/porter_c.rb +0 -26
data/lib/treat/inflectors/stem/uea.rb +0 -30
data/lib/treat/install.rb +0 -59
data/lib/treat/languages/tags.rb +0 -377
data/lib/treat/lexicalizers/category/from_tag.rb +0 -49
data/lib/treat/lexicalizers/linkages/naive.rb +0 -63
data/lib/treat/lexicalizers/synsets/wordnet.rb +0 -76
data/lib/treat/lexicalizers/tag/brill.rb +0 -91
data/lib/treat/lexicalizers/tag/lingua.rb +0 -123
data/lib/treat/lexicalizers/tag/stanford.rb +0 -70
data/lib/treat/processors/segmenters/punkt/dutch.yaml +0 -9716
data/lib/treat/processors/segmenters/punkt/english.yaml +0 -10340
data/lib/treat/processors/segmenters/punkt/french.yaml +0 -43159
data/lib/treat/processors/segmenters/punkt/german.yaml +0 -9572
data/lib/treat/processors/segmenters/punkt/greek.yaml +0 -6050
data/lib/treat/processors/segmenters/punkt/italian.yaml +0 -14748
data/lib/treat/processors/segmenters/punkt/polish.yaml +0 -9751
data/lib/treat/processors/segmenters/punkt/portuguese.yaml +0 -13662
data/lib/treat/processors/segmenters/punkt/russian.yaml +0 -4237
data/lib/treat/processors/segmenters/punkt/spanish.yaml +0 -24034
data/lib/treat/processors/segmenters/punkt/swedish.yaml +0 -10001
data/lib/treat/processors/tokenizers/macintyre.rb +0 -77
data/lib/treat/processors/tokenizers/multilingual.rb +0 -30
data/lib/treat/registrable.rb +0 -28
data/lib/treat/sugar.rb +0 -50
data/lib/treat/viewable.rb +0 -29
data/lib/treat/visitable.rb +0 -28
data/test/profile.rb +0 -2
data/test/tc_entity.rb +0 -117
data/test/tc_extractors.rb +0 -73
data/test/tc_formatters.rb +0 -41
data/test/tc_inflectors.rb +0 -34
data/test/tc_lexicalizers.rb +0 -32
data/test/tc_processors.rb +0 -50
data/test/tc_resources.rb +0 -22
data/test/tc_treat.rb +0 -60
data/test/tc_tree.rb +0 -60
data/test/tests.rb +0 -20
data/test/texts.rb +0 -19
data/test/texts/english/half_cocked_basel.txt +0 -16
data/test/texts/english/hose_and_dry.doc +0 -0
data/test/texts/english/hungarys_troubles.abw +0 -70
data/test/texts/english/long.html +0 -24
data/test/texts/english/long.txt +0 -22
data/test/texts/english/medium.txt +0 -5
data/test/texts/english/republican_nomination.pdf +0 -0
data/test/texts/english/saving_the_euro.odt +0 -0
data/test/texts/english/short.txt +0 -3
data/test/texts/english/zero_sum.html +0 -111

data/lib/treat/inflectors/ordinalizers/linguistics.rb ADDED Viewed

@@ -0,0 +1,17 @@
+# This class is a wrapper for the functions included
+# in the 'linguistics' gem that allow to describe a
+# number in words in ordinal form.
+#
+# Project website: http://deveiate.org/projects/Linguistics/
+class Treat::Inflectors::Ordinalizers::Linguistics
+  require 'treat/loaders/linguistics'
+  # Desribe a number in words in ordinal form, using the
+  # 'linguistics' gem.
+  def self.ordinal(number, options = {})
+    klass = Treat::Loaders::Linguistics.load(number.language)
+    klass.ordinate(number.to_s)
+  end
+end

data/lib/treat/inflectors/stemmers/porter.rb ADDED Viewed

@@ -0,0 +1,160 @@
+# Stem a word using a native Ruby implementation of the
+# Porter stemming algorithm, ported to Ruby from a
+# version coded up in Perl. This is a simplified
+# implementation; for a true and fast Porter stemmer,
+# see Treat::Inflectors::Stemmers::PorterC.
+#
+# Authored by Ray Pereda (raypereda@hotmail.com).
+# Unknown license.
+#
+# Original paper: Porter, 1980. An algorithm for suffix stripping,
+# Program, Vol. 14, no. 3, pp 130-137,
+# Original C implementation: http://www.tartarus.org/~martin/PorterStemmer.
+class Treat::Inflectors::Stemmers::Porter
+  # Returns the stem of a word using a native Porter stemmer.
+  #
+  # Options: none.
+  def self.stem(word, options = {})
+    # Copy the word and convert it to a string.
+    w = word.to_s
+    return w if w.length < 3
+    # Map initial y to Y so that the patterns
+    # never treat it as vowel.
+    w[0] = 'Y' if w[0] == ?y
+    # Step 1a
+    if w =~ /(ss|i)es$/
+      w = $` + $1
+    elsif w =~ /([^s])s$/
+      w = $` + $1
+    end
+    # Step 1b
+    if w =~ /eed$/
+      w.chop! if $` =~ MGR0
+    elsif w =~ /(ed|ing)$/
+      stem = $`
+      if stem =~ VOWEL_IN_STEM
+        w = stem
+        case w
+        when /(at|bl|iz)$/             then w << "e"
+        when /([^aeiouylsz])\1$/       then w.chop!
+        when /^#{CC}#{V}[^aeiouwxy]$/o then w << "e"
+        end
+      end
+    end
+    if w =~ /y$/
+      stem = $`
+      w = stem + "i" if stem =~ VOWEL_IN_STEM
+    end
+    # Step 2
+    if w =~ SUFFIX_1_REGEXP
+      stem = $`
+      suffix = $1
+      if stem =~ MGR0
+        w = stem + STEP_2_LIST[suffix]
+      end
+    end
+    # Step 3
+    if w =~
+      /(icate|ative|alize|iciti|ical|ful|ness)$/
+      stem = $`
+      suffix = $1
+      if stem =~ MGR0
+        w = stem + STEP_3_LIST[suffix]
+      end
+    end
+    # Step 4
+    if w =~ SUFFIX_2_REGEXP
+      stem = $`
+      if stem =~ MGR1
+        w = stem
+      end
+    elsif w =~ /(s|t)(ion)$/
+      stem = $` + $1
+      if stem =~ MGR1
+        w = stem
+      end
+    end
+    #  Step 5
+    if w =~ /e$/
+      stem = $`
+      if (stem =~ MGR1) ||
+        (stem =~ MEQ1 && stem !~
+        /^#{CC}#{V}[^aeiouwxy]$/o)
+        w = stem
+      end
+    end
+    if w =~ /ll$/ && w =~ MGR1
+      w.chop!
+    end
+    # and turn initial Y back to y
+    w[0] = 'y' if w[0] == ?Y
+    w
+  end
+  STEP_2_LIST = {
+    'ational'=>'ate', 'tional'=>'tion', 'enci'=>'ence', 'anci'=>'ance',
+    'izer'=>'ize', 'bli'=>'ble',
+    'alli'=>'al', 'entli'=>'ent', 'eli'=>'e', 'ousli'=>'ous',
+    'ization'=>'ize', 'ation'=>'ate',
+    'ator'=>'ate', 'alism'=>'al', 'iveness'=>'ive', 'fulness'=>'ful',
+    'ousness'=>'ous', 'anati'=>'al',
+    'iviti'=>'ive', 'binati'=>'ble', 'logi'=>'log'
+  }
+  STEP_3_LIST = {
+    'icate'=>'ic', 'ative'=>'', 'alize'=>'al', 'iciti'=>'ic',
+    'ical'=>'ic', 'ful'=>'', 'ness'=>''
+  }
+  SUFFIX_1_REGEXP = /(
+  ational  |
+  tional   |
+  enci     |
+  anci     |
+  izer     |
+  bli      |
+  alli     |
+  entli    |
+  eli      |
+  ousli    |
+  ization  |
+  ation    |
+  ator     |
+  alism    |
+  iveness  |
+  fulness  |
+  ousness  |
+  anati    |
+  iviti    |
+  binati   |
+  logi)$/x
+  SUFFIX_2_REGEXP = /(
+  al       |
+  ance     |
+  ence     |
+  er       |
+  ic       |
+  able     |
+  ible     |
+  ant      |
+  ement    |
+  ment     |
+  ent      |
+  ou       |
+  ism      |
+  ate      |
+  iti      |
+  ous      |
+  ive      |
+  ize)$/x
+  C = "[^aeiou]"         # consonant
+  V = "[aeiouy]"         # vowel
+  CC = "#{C}(?>[^aeiouy]*)"  # consonant sequence
+  VV = "#{V}(?>[aeiou]*)"    # vowel sequence
+  MGR0 = /^(#{CC})?#{VV}#{CC}/o                # [cc]vvcc... is m>0
+  MEQ1 = /^(#{CC})?#{VV}#{CC}(#{VV})?$/o       # [cc]vvcc[vv] is m=1
+  MGR1 = /^(#{CC})?#{VV}#{CC}#{VV}#{CC}/o      # [cc]vvccvvcc... is m>1
+  VOWEL_IN_STEM   = /^(#{CC})?#{V}/o                      # vowel in stem
+end

data/lib/treat/inflectors/stemmers/porter_c.rb ADDED Viewed

@@ -0,0 +1,24 @@
+# Stems words using the 'ruby-stemmer' gem, which
+# wraps a C version of the Porter stemming algorithm.
+#
+# Project website: https://github.com/aurelian/ruby-stemmer
+# Original paper: Porter, 1980. An algorithm for suffix stripping,
+# Program, Vol. 14, no. 3, pp 130-137,
+# Original C implementation: http://www.tartarus.org/~martin/PorterStemmer.
+module Treat::Inflectors::Stemmers::PorterC
+  # Require the 'ruby-stemmer' gem.
+  silence_warnings { require 'lingua/stemmer' }
+  # Remove a conflict between this gem and the 'engtagger' gem.
+  ::LinguaStemmer = ::Lingua
+  Object.instance_eval { remove_const :Lingua }
+  # Stem the word using a full-blown Porter stemmer in C.
+  #
+  # Options: none.
+  def self.stem(word, options = {})
+    ::LinguaStemmer.stemmer(word.to_s)
+  end
+end

data/lib/treat/inflectors/stemmers/uea.rb ADDED Viewed

@@ -0,0 +1,28 @@
+# Stems a word using the UEA algorithm, implemented
+# by the 'uea-stemmer' gem.
+#
+# "Similar to other stemmers, UEA-Lite operates on a
+# set of rules which are used as steps. There are two
+# groups of rules: the first to clean the tokens, and
+# the second to alter suffixes."
+#
+# Project website: https://github.com/ealdent/uea-stemmer
+# Original paper: Jenkins, Marie-Claire, Smith, Dan,
+# Conservative stemming for search and indexing, 2005.
+# http://www.uea.ac.uk/polopoly_fs/1.85493!stemmer25feb.pdf
+class Treat::Inflectors::Stemmers::UEA
+  # Require the 'uea-stemmer' gem.
+  silence_warnings { require 'uea-stemmer' }
+  # Keep only one copy of the stemmer.
+  @@stemmer = nil
+  # Stems a word using the UEA algorithm, implemented
+  # by the 'uea-stemmer' gem.
+  def self.stem(entity, options = {})
+    @@stemmer ||= ::UEAStemmer.new
+    @@stemmer.stem(entity.to_s).strip
+  end
+end

data/lib/treat/installer.rb ADDED Viewed

@@ -0,0 +1,308 @@
+# Installer is a dependency manager for languages.
+#
+# It can be called by using Treat.install(language).
+module Treat::Installer
+  # Require the Rubygem dependency installer.
+  silence_warnings do
+    require 'rubygems/dependency_installer'
+  end
+  require 'treat/downloader'
+  require 'treat/dependencies'
+  # Package managers for each platforms.
+  PackageManagers = {
+    :mac => 'port',
+    :linux => 'apt-get',
+    :windows => 'win-get'
+  }
+  # Address of the server with the files.
+  Server = 'www.louismullie.com'
+  # Filenames for the Stanford packages.
+  StanfordPackages = {
+    :minimal => "stanford-core-nlp-minimal.zip",
+    :english => "stanford-core-nlp-english.zip",
+    :all => "stanford-core-nlp-all.zip"
+  }
+  # Absolute paths required for cp and mkdir.
+  Paths = {
+    :tmp => File.absolute_path(Treat.tmp),
+    :bin => File.absolute_path(Treat.bin),
+    :models => File.absolute_path(Treat.models)
+  }
+  # Install required dependencies and optional
+  # dependencies for a specific language.
+  def self.install(language = :english)
+    @@installer = Gem::DependencyInstaller.new
+    if language == :travis
+      install_travis; return
+    end
+    lang_class = Treat::Languages.get(language.to_s)
+    l = "#{language.to_s.capitalize} language"
+    puts
+    puts "Treat Installer, v. #{Treat::VERSION.to_s}\n"
+    puts
+    begin
+      title "Install language-independent gem dependencies."
+      case prompt(
+        "1 - Install all default language-independent dependencies\n" +
+        "2 - Select dependencies to install manually\n" +
+        "3 - Skip this step", ['1', '2', '3'])
+      when '1' then install_dependencies(false)
+      when '2' then install_dependencies(true)
+      when '3' then puts 'Skipping this step.'
+      end
+      title "Install gem dependencies for the #{l}.\n"
+      dflt = lang_class::RequiredDependencies
+      all = dflt + lang_class::OptionalDependencies
+      case prompt("1 - Install default dependencies.\n" +
+        "2 - Select dependencies to install manually.\n" +
+        "3 - Skip this step.", ['1', '2', '3'])
+      when '1' then install_language_dependencies(dflt, false)
+      when '2' then install_language_dependencies(all, true)
+      when '3' then puts 'Skipping this step.'
+      end
+      Treat::Downloader.show_progress = true
+      # If gem is installed only, download models.
+      begin
+        Gem::Specification.find_by_name('punkt-segmenter')
+        title "Downloading model for the Punkt segmenter for the #{l}."
+        download_punkt_models(language)
+      rescue Gem::LoadError; end
+      # If stanford is installed, download models.
+      begin
+        Gem::Specification.find_by_name('stanford-core-nlp')
+        title "Download Stanford Core NLP JARs and " +
+        "model files for the the #{l}.\n\n"
+        package = (language == :english) ? :english : :all
+        download_stanford(package)
+      rescue Gem::LoadError; end
+      title "Install external binary libraries " +
+            "(requires port, apt-get or win-get).\n"
+      puts "Warning: this may take a long amount of time."
+      case prompt("1 - Select binaries to install manually.\n" +
+        "2 - Skip this step.", ['1', '2'])
+      when '1' then install_binaries
+      when '2' then puts 'Skipping this step.'
+      end
+      puts
+      puts "-----\nDone!"
+    rescue Errno::EACCES => e
+      raise Treat::Exception,
+      "Couldn't write to file - permission denied (#{e.message}). " +
+      "You may need to run Ruby or Rake on sudo."
+    end
+  end
+  # Automated install for Travis CI.
+  def self.install_travis
+    dep = (Treat::Languages::English::RequiredDependencies +
+          Treat::Languages::English::OptionalDependencies)
+    install_dependencies(false)
+    install_language_dependencies(dep, false)
+    download_stanford(:minimal)
+    download_punkt_models(:english)
+  end
+  def self.install_dependencies(optionally)
+    Treat::Dependencies::Gem.each do |d|
+      dep, ver, pur = *d
+      install_gem(dep, ver, pur, optionally)
+    end
+  end
+  def self.install_language_dependencies(dependencies, optionally)
+    puts "No dependencies to install.\n" if dependencies.empty?
+    dependencies.each do |dependency|
+      install_gem(dependency, nil, nil, optionally)
+    end
+  end
+  def self.install_binaries
+    puts "Warning: this will require authentification."
+    p = detect_platform
+    man = PackageManagers[p]
+    if !man
+      puts "Cannot find a download manager "+
+      "for the #{p} platform.\n\n"
+    else
+      unless `hash #{man} 2>&1` == ''
+        puts "The '#{man}' command is required "+
+        "to install binaries on #{p}.\n\n"
+        man = nil
+      end
+    end
+    unless man
+      puts "Skipping installation of the "+
+      "following binaries:\n\n"
+      Binaries.each do |binary, purpose|
+        puts "- #{binary} to #{purpose}"
+      end
+      return
+    end
+    Treat::Dependencies::Binary.each do |binary, purpose|
+      if prompt("install #{binary} to " +
+        "#{purpose} (y/n)", ['y', 'n']) == 'y'
+        `sudo #{man} install #{binary}`
+      end
+    end
+  end
+  def self.download_stanford(package = :minimal)
+    f = StanfordPackages[package]
+    loc = Treat::Downloader.download(
+    'http', Server, 'treat', f, Treat.tmp)
+    puts "- Unzipping package ..."
+    dest = File.join(Treat.tmp, 'stanford')
+    unzip_stanford(loc, dest)
+    model_dir = File.join(Paths[:models], 'stanford')
+    bin_dir = File.join(Paths[:bin], 'stanford')
+    origin = File.join(Paths[:tmp], 'stanford')
+    # Mac hidden files fix.
+    mac_remove = File.join(dest, '__MACOSX')
+    if File.readable?(mac_remove)
+      FileUtils.rm_rf(mac_remove)
+    end
+    unless File.readable?(bin_dir)
+      puts "- Creating directory bin/stanford ..."
+      FileUtils.mkdir_p(bin_dir)
+    end
+    unless File.readable?(model_dir)
+      puts "- Creating directory models/stanford ..."
+      FileUtils.mkdir_p(model_dir)
+    end
+    puts "- Copying JAR files to bin/stanford " +
+         "and model files to models/stanford ..."
+    Dir.glob(File.join(origin, '*')) do |f|
+      next if ['.', '..'].include?(f)
+      if f.index('jar')
+        FileUtils.cp(f, File.join(Paths[:bin],
+        'stanford', File.basename(f)))
+      elsif FileTest.directory?(f)
+        FileUtils.cp_r(f, model_dir)
+      end
+    end
+    puts "- Cleaning up..."
+    FileUtils.rm_rf(origin)
+  end
+  def self.download_punkt_models(language)
+    f = "#{language}.yaml"
+    dest = "#{Treat.models}punkt/"
+    loc = Treat::Downloader.download(
+    'http', Server, 'treat/punkt', f, Treat.tmp)
+    unless File.readable?(dest)
+      puts "- Creating directory models/punkt ..."
+      FileUtils.mkdir_p(File.absolute_path(dest))
+    end
+    puts "- Copying model file to models/punkt ..."
+    FileUtils.cp(loc, File.join(Paths[:models], 'punkt', f))
+    puts "- Cleaning up..."
+    FileUtils.rm_rf(Paths[:tmp] + Server)
+  end
+  private
+  @@n = 1
+  # Print out a numbered title.
+  def self.title(string)
+    puts
+    puts "#{@@n}. #{string}"
+    puts
+    @@n += 1
+  end
+  # Install a dependency with a supplied purpose
+  # but ask the user if she wishes to do so first.
+  def self.install_gem(dependency, version = nil,
+                       purpose = nil, optionally = false)
+    install = false
+    begin
+      purpose = purpose ? " to #{purpose}" : ''
+      if optionally
+        if prompt("install #{dependency}#{purpose}",
+          ['y', 'n']) == 'y'
+          install = true
+        end
+      else
+        puts "\n- Installing #{dependency}#{purpose}."
+        install = true
+      end
+      silence_warnings do
+        @@installer.install(dependency, version)
+      end if install
+    rescue Exception => error
+      raise
+      puts "Couldn't install gem '#{dependency}' " +
+           "(#{error.message})."
+    end
+  end
+  # Unzip a file to the destination path.
+  def self.unzip_stanford(file, destination)
+    require 'zip/zip'
+    f_path = ''
+    Zip::ZipFile.open(file) do |zip_file|
+      zip_file.each do |f|
+        f_path = File.join(destination, f.name)
+        FileUtils.mkdir_p(File.absolute_path(File.dirname(f_path)))
+        zip_file.extract(f, f_path) unless File.exist?(f_path)
+      end
+    end
+  end
+end