RubyGems - lingo - Versions diffs - 1.8.1 → 1.8.2 - Mend

lingo 1.8.1 → 1.8.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (99) hide show

data/ChangeLog +23 -5
data/README +1 -1
data/Rakefile +5 -7
data/TODO +2 -0
data/bin/lingo +5 -1
data/de.lang +1 -1
data/en/lingo-syn.txt +0 -0
data/en.lang +2 -1
data/lib/lingo/attendee/abbreviator.rb +8 -9
data/lib/lingo/attendee/debugger.rb +5 -4
data/lib/lingo/attendee/decomposer.rb +8 -3
data/lib/lingo/attendee/dehyphenizer.rb +19 -63
data/lib/lingo/attendee/formatter.rb +1 -1
data/lib/lingo/attendee/multi_worder.rb +67 -155
data/lib/lingo/attendee/noneword_filter.rb +16 -9
data/lib/lingo/attendee/object_filter.rb +1 -1
data/lib/lingo/attendee/sequencer.rb +32 -63
data/lib/lingo/attendee/stemmer/porter.rb +343 -0
data/{info/gpl-hdr.txt → lib/lingo/attendee/stemmer.rb} +33 -0
data/lib/lingo/attendee/synonymer.rb +10 -9
data/lib/lingo/attendee/text_reader.rb +102 -76
data/lib/lingo/attendee/text_writer.rb +23 -26
data/lib/lingo/attendee/tokenizer.rb +13 -27
data/lib/lingo/attendee/variator.rb +26 -66
data/lib/lingo/attendee/vector_filter.rb +42 -43
data/lib/lingo/attendee/word_searcher.rb +6 -7
data/lib/lingo/attendee.rb +25 -7
data/lib/lingo/buffered_attendee.rb +36 -10
data/lib/lingo/cachable.rb +8 -8
data/lib/lingo/config.rb +5 -6
data/lib/lingo/ctl.rb +2 -3
data/lib/lingo/database/crypter.rb +9 -26
data/lib/lingo/database/gdbm_store.rb +3 -5
data/lib/lingo/database/libcdb_store.rb +4 -6
data/lib/lingo/database/sdbm_store.rb +11 -6
data/lib/lingo/database/show_progress.rb +3 -43
data/lib/lingo/database/source/key_value.rb +2 -6
data/lib/lingo/database/source/multi_key.rb +3 -5
data/lib/lingo/database/source/multi_value.rb +2 -6
data/lib/lingo/database/source/single_word.rb +4 -6
data/lib/lingo/database/source/word_class.rb +4 -10
data/lib/lingo/database/source.rb +20 -18
data/lib/lingo/database.rb +84 -59
data/lib/lingo/error.rb +57 -1
data/lib/lingo/language/dictionary.rb +21 -18
data/lib/lingo/language/grammar.rb +40 -49
data/lib/lingo/language/lexical.rb +6 -6
data/lib/lingo/language/lexical_hash.rb +6 -0
data/lib/lingo/language/word.rb +32 -15
data/lib/lingo/language/word_form.rb +1 -1
data/lib/lingo/language.rb +14 -25
data/lib/lingo/reportable.rb +12 -10
data/lib/lingo/show_progress.rb +81 -0
data/lib/lingo/version.rb +1 -1
data/lib/lingo.rb +63 -24
data/lingo-call.cfg +6 -10
data/lingo.cfg +60 -44
data/lir.cfg +42 -41
data/test/attendee/ts_abbreviator.rb +3 -5
data/test/attendee/ts_decomposer.rb +3 -5
data/test/attendee/ts_multi_worder.rb +87 -145
data/test/attendee/ts_noneword_filter.rb +5 -3
data/test/attendee/ts_object_filter.rb +5 -3
data/test/attendee/ts_sequencer.rb +3 -5
data/test/attendee/ts_stemmer.rb +309 -0
data/test/attendee/ts_synonymer.rb +15 -11
data/test/attendee/ts_text_reader.rb +12 -15
data/test/attendee/ts_text_writer.rb +24 -29
data/test/attendee/ts_tokenizer.rb +9 -7
data/test/attendee/ts_variator.rb +4 -4
data/test/attendee/ts_vector_filter.rb +24 -16
data/test/attendee/ts_word_searcher.rb +20 -36
data/test/{lir.csv → lir.vec} +0 -0
data/test/ref/artikel.vec +943 -943
data/test/ref/artikel.ven +943 -943
data/test/ref/lir.non +201 -201
data/test/ref/lir.seq +178 -178
data/test/ref/lir.syn +49 -49
data/test/ref/lir.vec +329 -0
data/test/test_helper.rb +20 -36
data/test/ts_database.rb +10 -10
data/test/ts_language.rb +279 -319
metadata +93 -104
data/info/Objekte.png +0 -0
data/info/Typen.png +0 -0
data/info/database.png +0 -0
data/info/db_small.png +0 -0
data/info/download.png +0 -0
data/info/kerze.png +0 -0
data/info/language.png +0 -0
data/info/lingo.png +0 -0
data/info/logo.png +0 -0
data/info/meeting.png +0 -0
data/info/types.png +0 -0
data/lingo-all.cfg +0 -89
data/porter/stem.cfg +0 -311
data/porter/stem.rb +0 -150
data/test/ref/lir.csv +0 -329
data/test.cfg +0 -79

metadata CHANGED Viewed

@@ -1,7 +1,7 @@
 --- !ruby/object:Gem::Specification
 name: lingo
 version: !ruby/object:Gem::Version
-  version: 1.8.1
+  version: 1.8.2
   prerelease:
 platform: ruby
 authors:
@@ -10,11 +10,11 @@ authors:
 autorequire:
 bindir: bin
 cert_chain: []
-date: 2012-02-19 00:00:00.000000000 Z
+date: 2012-04-19 00:00:00.000000000 Z
 dependencies:
 - !ruby/object:Gem::Dependency
   name: ruby-nuggets
-  requirement: &10045620 !ruby/object:Gem::Requirement
+  requirement: &12303700 !ruby/object:Gem::Requirement
     none: false
     requirements:
     - - ! '>='
@@ -22,10 +22,10 @@ dependencies:
         version: 0.8.5
   type: :runtime
   prerelease: false
-  version_requirements: *10045620
+  version_requirements: *12303700
 - !ruby/object:Gem::Dependency
   name: unicode
-  requirement: &10045140 !ruby/object:Gem::Requirement
+  requirement: &12302600 !ruby/object:Gem::Requirement
     none: false
     requirements:
     - - ! '>='
@@ -33,10 +33,10 @@ dependencies:
         version: '0'
   type: :runtime
   prerelease: false
-  version_requirements: *10045140
+  version_requirements: *12302600
 - !ruby/object:Gem::Dependency
   name: highline
-  requirement: &10044660 !ruby/object:Gem::Requirement
+  requirement: &12317680 !ruby/object:Gem::Requirement
     none: false
     requirements:
     - - ! '>='
@@ -44,10 +44,10 @@ dependencies:
         version: '0'
   type: :runtime
   prerelease: false
-  version_requirements: *10044660
+  version_requirements: *12317680
 - !ruby/object:Gem::Dependency
   name: diff-lcs
-  requirement: &10044140 !ruby/object:Gem::Requirement
+  requirement: &12315360 !ruby/object:Gem::Requirement
     none: false
     requirements:
     - - ! '>='
@@ -55,10 +55,10 @@ dependencies:
         version: 1.1.3
   type: :development
   prerelease: false
-  version_requirements: *10044140
+  version_requirements: *12315360
 - !ruby/object:Gem::Dependency
   name: open4
-  requirement: &10043720 !ruby/object:Gem::Requirement
+  requirement: &12314340 !ruby/object:Gem::Requirement
     none: false
     requirements:
     - - ! '>='
@@ -66,7 +66,7 @@ dependencies:
         version: '0'
   type: :development
   prerelease: false
-  version_requirements: *10043720
+  version_requirements: *12314340
 description: ! "Lingo is an open source indexing system for research and teachings.\nThe
   main functions of Lingo are:\n\n* identification of (i.e. reduction to) basic word
   form by means of\n  dictionaries and suffix lists\n* algorithmic decomposition\n*
@@ -76,144 +76,133 @@ email:
 - lingo@vorhauer.de
 - jens.wille@uni-koeln.de
 executables:
-- lingo
 - lingoctl
+- lingo
 extensions: []
 extra_rdoc_files:
 - README
 - COPYING
 - ChangeLog
 files:
-- lib/lingo/ctl.rb
+- lib/lingo.rb
+- lib/lingo/show_progress.rb
+- lib/lingo/config.rb
 - lib/lingo/database.rb
-- lib/lingo/error.rb
-- lib/lingo/version.rb
-- lib/lingo/database/source.rb
-- lib/lingo/database/libcdb_store.rb
-- lib/lingo/database/sdbm_store.rb
-- lib/lingo/database/show_progress.rb
-- lib/lingo/database/crypter.rb
-- lib/lingo/database/source/multi_key.rb
-- lib/lingo/database/source/key_value.rb
-- lib/lingo/database/source/single_word.rb
-- lib/lingo/database/source/word_class.rb
-- lib/lingo/database/source/multi_value.rb
-- lib/lingo/database/gdbm_store.rb
-- lib/lingo/database/hash_store.rb
-- lib/lingo/cli.rb
-- lib/lingo/cachable.rb
-- lib/lingo/attendee/variator.rb
-- lib/lingo/attendee/debugger.rb
+- lib/lingo/language/dictionary.rb
+- lib/lingo/language/word_form.rb
+- lib/lingo/language/lexical.rb
+- lib/lingo/language/grammar.rb
+- lib/lingo/language/lexical_hash.rb
+- lib/lingo/language/token.rb
+- lib/lingo/language/word.rb
+- lib/lingo/attendee/stemmer/porter.rb
+- lib/lingo/attendee/vector_filter.rb
+- lib/lingo/attendee/noneword_filter.rb
 - lib/lingo/attendee/object_filter.rb
-- lib/lingo/attendee/synonymer.rb
-- lib/lingo/attendee/text_writer.rb
+- lib/lingo/attendee/variator.rb
 - lib/lingo/attendee/multi_worder.rb
 - lib/lingo/attendee/text_reader.rb
+- lib/lingo/attendee/synonymer.rb
+- lib/lingo/attendee/word_searcher.rb
 - lib/lingo/attendee/dehyphenizer.rb
+- lib/lingo/attendee/sequencer.rb
+- lib/lingo/attendee/debugger.rb
+- lib/lingo/attendee/text_writer.rb
+- lib/lingo/attendee/stemmer.rb
 - lib/lingo/attendee/tokenizer.rb
 - lib/lingo/attendee/abbreviator.rb
-- lib/lingo/attendee/formatter.rb
-- lib/lingo/attendee/noneword_filter.rb
-- lib/lingo/attendee/sequencer.rb
 - lib/lingo/attendee/decomposer.rb
-- lib/lingo/attendee/word_searcher.rb
-- lib/lingo/attendee/vector_filter.rb
-- lib/lingo/config.rb
+- lib/lingo/attendee/formatter.rb
+- lib/lingo/database/hash_store.rb
+- lib/lingo/database/show_progress.rb
+- lib/lingo/database/sdbm_store.rb
+- lib/lingo/database/source.rb
+- lib/lingo/database/crypter.rb
+- lib/lingo/database/source/multi_value.rb
+- lib/lingo/database/source/word_class.rb
+- lib/lingo/database/source/key_value.rb
+- lib/lingo/database/source/multi_key.rb
+- lib/lingo/database/source/single_word.rb
+- lib/lingo/database/gdbm_store.rb
+- lib/lingo/database/libcdb_store.rb
+- lib/lingo/call.rb
+- lib/lingo/attendee.rb
+- lib/lingo/version.rb
+- lib/lingo/ctl.rb
+- lib/lingo/cli.rb
 - lib/lingo/core_ext.rb
-- lib/lingo/agenda_item.rb
 - lib/lingo/buffered_attendee.rb
-- lib/lingo/reportable.rb
+- lib/lingo/agenda_item.rb
+- lib/lingo/cachable.rb
 - lib/lingo/language.rb
-- lib/lingo/language/dictionary.rb
-- lib/lingo/language/word.rb
-- lib/lingo/language/lexical.rb
-- lib/lingo/language/word_form.rb
-- lib/lingo/language/token.rb
-- lib/lingo/language/grammar.rb
-- lib/lingo/language/lexical_hash.rb
-- lib/lingo/attendee.rb
-- lib/lingo/call.rb
-- lib/lingo.rb
-- bin/lingo
+- lib/lingo/error.rb
+- lib/lingo/reportable.rb
 - bin/lingoctl
+- bin/lingo
 - lingo.rb
 - lingo.cfg
-- lingo-all.cfg
 - lingo-call.cfg
+- lir.cfg
 - de.lang
 - en.lang
-- de/lingo-syn.txt
-- de/lingo-abk.txt
 - de/lingo-dic.txt
+- de/lingo-abk.txt
+- de/lingo-syn.txt
 - de/lingo-mul.txt
 - de/user-dic.txt
+- de/test_syn.txt
+- de/test_dic.txt
+- de/test_syn2.txt
+- de/test_singleword.txt
+- de/test_mul.txt
+- de/test_mul2.txt
 - en/lingo-dic.txt
+- en/lingo-syn.txt
 - en/lingo-mul.txt
 - en/user-dic.txt
 - txt/artikel.txt
 - txt/artikel-en.txt
-- info/gpl-hdr.txt
-- info/kerze.png
-- info/meeting.png
-- info/lingo.png
-- info/types.png
-- info/logo.png
-- info/language.png
-- info/Typen.png
-- info/Objekte.png
-- info/download.png
-- info/database.png
-- info/db_small.png
-- lir.cfg
 - txt/lir.txt
-- porter/stem.rb
-- porter/stem.cfg
-- test.cfg
-- de/test_mul.txt
-- de/test_singleword.txt
-- de/test_mul2.txt
-- de/test_syn.txt
-- de/test_dic.txt
-- de/test_syn2.txt
-- TODO
-- README
 - ChangeLog
 - COPYING
+- README
 - Rakefile
+- TODO
 - spec/spec_helper.rb
 - .rspec
-- test/lir.csv
-- test/attendee/ts_abbreviator.rb
-- test/attendee/ts_noneword_filter.rb
-- test/attendee/ts_word_searcher.rb
-- test/attendee/ts_object_filter.rb
-- test/attendee/ts_vector_filter.rb
-- test/attendee/ts_text_writer.rb
-- test/attendee/ts_decomposer.rb
-- test/attendee/ts_sequencer.rb
-- test/attendee/ts_synonymer.rb
-- test/attendee/ts_tokenizer.rb
-- test/attendee/ts_variator.rb
-- test/attendee/ts_text_reader.rb
-- test/attendee/ts_multi_worder.rb
-- test/mul.txt
-- test/test_helper.rb
 - test/ref/artikel.ven
-- test/ref/lir.csv
-- test/ref/artikel.vec
 - test/ref/lir.mul
-- test/ref/artikel.syn
+- test/ref/lir.vec
+- test/ref/artikel.vec
 - test/ref/lir.syn
 - test/ref/artikel.mul
+- test/ref/artikel.syn
 - test/ref/artikel.seq
-- test/ref/lir.seq
 - test/ref/artikel.non
-- test/ref/artikel.ver
 - test/ref/lir.non
+- test/ref/lir.seq
+- test/ref/artikel.ver
+- test/ts_language.rb
 - test/lir2.txt
-- test/ts_database.rb
+- test/attendee/ts_noneword_filter.rb
+- test/attendee/ts_text_writer.rb
+- test/attendee/ts_sequencer.rb
+- test/attendee/ts_object_filter.rb
+- test/attendee/ts_text_reader.rb
+- test/attendee/ts_multi_worder.rb
+- test/attendee/ts_variator.rb
+- test/attendee/ts_decomposer.rb
+- test/attendee/ts_abbreviator.rb
+- test/attendee/ts_stemmer.rb
+- test/attendee/ts_tokenizer.rb
+- test/attendee/ts_vector_filter.rb
+- test/attendee/ts_word_searcher.rb
+- test/attendee/ts_synonymer.rb
+- test/lir.vec
+- test/test_helper.rb
 - test/lir.txt
-- test/ts_language.rb
+- test/mul.txt
+- test/ts_database.rb
 homepage: http://lex-lingo.de
 licenses: []
 post_install_message:
@@ -223,7 +212,7 @@ rdoc_options:
 - --line-numbers
 - --all
 - --title
-- lingo Application documentation (v1.8.1)
+- lingo Application documentation (v1.8.2)
 - --main
 - README
 require_paths:

data/info/Objekte.png DELETED Viewed

Binary file

data/info/Typen.png DELETED Viewed

Binary file

data/info/database.png DELETED Viewed

Binary file

data/info/db_small.png DELETED Viewed

Binary file

data/info/download.png DELETED Viewed

Binary file

data/info/kerze.png DELETED Viewed

Binary file

data/info/language.png DELETED Viewed

Binary file

data/info/lingo.png DELETED Viewed

Binary file

data/info/logo.png DELETED Viewed

Binary file

data/info/meeting.png DELETED Viewed

Binary file

data/info/types.png DELETED Viewed

Binary file

data/lingo-all.cfg DELETED Viewed

@@ -1,89 +0,0 @@
-#
-#  Lingo-Konfiguration
-#
----
-meeting:
-  attendees:
-    ########################################
-    #  Text bereitstellen
-    #
-    #  Angegebene Datei zeilenweise einlesen und verarbeitet
-    -  text_reader:     { files: '$(files)' }
-    ########################################
-    #  Inhalte verarbeiten
-    #
-    #  Zeile in einzelnen Sinnbestandteile (Token) zerlegen
-    -  tokenizer:       { }
-    #  Abkürzungen erkennen und auflösen
-#   -  abbreviator:     { source: 'sys-abk' }
-    #  Verbleibende Token im Wörterbuch suchen
-    -  word_searcher:   { source: 'sys-dic', mode: 'first' }
-    #  Schreibweisen variieren und erneut suchen
-#   -  variator:        { source: 'sys-dic' }
-    #  Bindestrichergänzungen rekonstruieren
-#   -  dehyphenizer:    { source: 'sys-dic' }
-    #  Nicht erkannte Wörter auf Kompositum testen
-#   -  decomposer:      { source: 'sys-dic' }
-    #  Mehrwortgruppen im Strom erkennen
-#   -  multi_worder:    { stopper: 'PUNC,OTHR', source: 'sys-mul' }
-    #  Wortsequenzen anhand von Regeln identifizieren
-#   -  sequencer:       { stopper: 'PUNC,OTHR' }
-    #  Relationierungen einfügen
-#   -  synonymer:       { skip: '?,t', source: 'sys-syn', out: syn }
-    ########################################
-    #  Datenstrom anzeigen
-    #
-    -  debugger:        { eval: 'true', ceval: 'cmd!="EOL"', prompt: 'lex:) ' }
-    ########################################
-    #  Ergebnisse ausgeben
-    #
-    #  Erstelle Datei mit Endung .log für Datenstrom
-#   -  vector_filter:   { in: syn, debug: 'true', prompt: 'lex:) ' }
-#   -  text_writer:     { ext: log, sep: "\n" }
-    #  Erstelle Datei mit Endung .non für nicht erkannte Wörter
-#   -  noneword_filter: { in: syn }
-#   -  text_writer:     { ext: non, sep: "\n" }
-    #  Erstelle Datei mit Endung .vec für erkannte Indexterme
-#   -  vector_filter:   { in: syn, lexicals: '^[ksavem]$' }
-#   -  text_writer:     { ext: vec, sep: "\n" }
-    #  Erstelle Datei mit Endung .ven für erkannte Indexterme mit absoluter Häufigkeit
-#   -  vector_filter:   { in: syn, lexicals: '^[ksavem]$', sort: 'term_abs' }
-#   -  text_writer:     { ext: ven, sep: "\n" }
-    #  Erstelle Datei mit Endung .ver für erkannte Indexterme mit relativer Häufigkeit
-#   -  vector_filter:   { in: syn, lexicals: '^[ksavem]$', sort: 'term_rel' }
-#   -  text_writer:     { ext: ver, sep: "\n" }
-    #  Erstelle Datei mit Endung .mul für erkannte Mehrwortgruppen
-#   -  vector_filter:   { in: syn, lexicals: m }
-#   -  text_writer:     { ext: mul, sep: "\n" }
-    #  Erstelle Datei mit Endung .seq für erkannte Wortsequenzen
-#   -  vector_filter:   { in: syn, lexicals: q, sort: 'term_abs' }
-#   -  text_writer:     { ext: seq, sep: "\n" }
-    #  Erstelle Datei mit Endung .syn für erkannte Synonyme
-#   -  vector_filter:   { in: syn, lexicals: y, sort: 'term_abs' }
-#   -  text_writer:     { ext: syn, sep: "\n" }