RubyGems - lingo - Versions diffs - 1.8.1 → 1.8.2 - Mend

lingo 1.8.1 → 1.8.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (99) hide show

data/ChangeLog +23 -5
data/README +1 -1
data/Rakefile +5 -7
data/TODO +2 -0
data/bin/lingo +5 -1
data/de.lang +1 -1
data/en/lingo-syn.txt +0 -0
data/en.lang +2 -1
data/lib/lingo/attendee/abbreviator.rb +8 -9
data/lib/lingo/attendee/debugger.rb +5 -4
data/lib/lingo/attendee/decomposer.rb +8 -3
data/lib/lingo/attendee/dehyphenizer.rb +19 -63
data/lib/lingo/attendee/formatter.rb +1 -1
data/lib/lingo/attendee/multi_worder.rb +67 -155
data/lib/lingo/attendee/noneword_filter.rb +16 -9
data/lib/lingo/attendee/object_filter.rb +1 -1
data/lib/lingo/attendee/sequencer.rb +32 -63
data/lib/lingo/attendee/stemmer/porter.rb +343 -0
data/{info/gpl-hdr.txt → lib/lingo/attendee/stemmer.rb} +33 -0
data/lib/lingo/attendee/synonymer.rb +10 -9
data/lib/lingo/attendee/text_reader.rb +102 -76
data/lib/lingo/attendee/text_writer.rb +23 -26
data/lib/lingo/attendee/tokenizer.rb +13 -27
data/lib/lingo/attendee/variator.rb +26 -66
data/lib/lingo/attendee/vector_filter.rb +42 -43
data/lib/lingo/attendee/word_searcher.rb +6 -7
data/lib/lingo/attendee.rb +25 -7
data/lib/lingo/buffered_attendee.rb +36 -10
data/lib/lingo/cachable.rb +8 -8
data/lib/lingo/config.rb +5 -6
data/lib/lingo/ctl.rb +2 -3
data/lib/lingo/database/crypter.rb +9 -26
data/lib/lingo/database/gdbm_store.rb +3 -5
data/lib/lingo/database/libcdb_store.rb +4 -6
data/lib/lingo/database/sdbm_store.rb +11 -6
data/lib/lingo/database/show_progress.rb +3 -43
data/lib/lingo/database/source/key_value.rb +2 -6
data/lib/lingo/database/source/multi_key.rb +3 -5
data/lib/lingo/database/source/multi_value.rb +2 -6
data/lib/lingo/database/source/single_word.rb +4 -6
data/lib/lingo/database/source/word_class.rb +4 -10
data/lib/lingo/database/source.rb +20 -18
data/lib/lingo/database.rb +84 -59
data/lib/lingo/error.rb +57 -1
data/lib/lingo/language/dictionary.rb +21 -18
data/lib/lingo/language/grammar.rb +40 -49
data/lib/lingo/language/lexical.rb +6 -6
data/lib/lingo/language/lexical_hash.rb +6 -0
data/lib/lingo/language/word.rb +32 -15
data/lib/lingo/language/word_form.rb +1 -1
data/lib/lingo/language.rb +14 -25
data/lib/lingo/reportable.rb +12 -10
data/lib/lingo/show_progress.rb +81 -0
data/lib/lingo/version.rb +1 -1
data/lib/lingo.rb +63 -24
data/lingo-call.cfg +6 -10
data/lingo.cfg +60 -44
data/lir.cfg +42 -41
data/test/attendee/ts_abbreviator.rb +3 -5
data/test/attendee/ts_decomposer.rb +3 -5
data/test/attendee/ts_multi_worder.rb +87 -145
data/test/attendee/ts_noneword_filter.rb +5 -3
data/test/attendee/ts_object_filter.rb +5 -3
data/test/attendee/ts_sequencer.rb +3 -5
data/test/attendee/ts_stemmer.rb +309 -0
data/test/attendee/ts_synonymer.rb +15 -11
data/test/attendee/ts_text_reader.rb +12 -15
data/test/attendee/ts_text_writer.rb +24 -29
data/test/attendee/ts_tokenizer.rb +9 -7
data/test/attendee/ts_variator.rb +4 -4
data/test/attendee/ts_vector_filter.rb +24 -16
data/test/attendee/ts_word_searcher.rb +20 -36
data/test/{lir.csv → lir.vec} +0 -0
data/test/ref/artikel.vec +943 -943
data/test/ref/artikel.ven +943 -943
data/test/ref/lir.non +201 -201
data/test/ref/lir.seq +178 -178
data/test/ref/lir.syn +49 -49
data/test/ref/lir.vec +329 -0
data/test/test_helper.rb +20 -36
data/test/ts_database.rb +10 -10
data/test/ts_language.rb +279 -319
metadata +93 -104
data/info/Objekte.png +0 -0
data/info/Typen.png +0 -0
data/info/database.png +0 -0
data/info/db_small.png +0 -0
data/info/download.png +0 -0
data/info/kerze.png +0 -0
data/info/language.png +0 -0
data/info/lingo.png +0 -0
data/info/logo.png +0 -0
data/info/meeting.png +0 -0
data/info/types.png +0 -0
data/lingo-all.cfg +0 -89
data/porter/stem.cfg +0 -311
data/porter/stem.rb +0 -150
data/test/ref/lir.csv +0 -329
data/test.cfg +0 -79

data/test/attendee/ts_stemmer.rb ADDED Viewed

@@ -0,0 +1,309 @@
+# encoding: utf-8
+require_relative '../test_helper'
+class TestAttendeeStemmer < AttendeeTestCase
+  def test_type
+    assert_raise(Lingo::NameNotFoundError) { meet({ 'type' => 'bla' }, []) }
+  end
+  def test_basic
+    meet({}, [
+      wd('bla|IDF'),
+      wd('blub|?'),
+      wd('blubs|?'),
+      ai('EOF|')
+    ], [
+      wd('bla|IDF'),
+      wd('blub|?'),
+      wd('blubs|?', 'blub|z'),
+      ai('EOF|')
+    ])
+  end
+  def test_wc
+    meet({ 'wordclass' => 'w' }, [
+      wd('bla|IDF'),
+      wd('blub|?'),
+      wd('blubs|?'),
+      ai('EOF|')
+    ], [
+      wd('bla|IDF'),
+      wd('blub|?'),
+      wd('blubs|?', 'blub|w'),
+      ai('EOF|')
+    ])
+  end
+  def test_mode
+    meet({ 'mode' => '' }, [
+      wd('bla|IDF'),
+      wd('a|?'),
+      wd('yet|?'),
+      wd('blubs|?'),
+      ai('EOF|')
+    ], [
+      wd('bla|IDF'),
+      wd('a|?'),
+      wd('yet|?'),
+      wd('blubs|?', 'blub|z'),
+      ai('EOF|')
+    ])
+    meet({ 'mode' => 'all' }, [
+      wd('bla|IDF'),
+      wd('a|?'),
+      wd('yet|?'),
+      wd('blubs|?'),
+      ai('EOF|')
+    ], [
+      wd('bla|IDF'),
+      wd('a|?',     'a|z'),
+      wd('yet|?',   'yet|z'),
+      wd('blubs|?', 'blub|z'),
+      ai('EOF|')
+    ])
+  end
+  def test_examples_100
+    meet({}, [
+      wd('S100|IDF'),
+      wd('caresses|?'),
+      wd('ponies|?'),
+      wd('ties|?'),
+      wd('caress|?'),
+      wd('cats|?'),
+      ai('EOF|')
+    ], [
+      wd('S100|IDF'),
+      wd('caresses|?', 'caress|z'),
+      wd('ponies|?',   'poni|z'),
+      wd('ties|?',     'ti|z'),      # snowball: tie
+      wd('caress|?',   'caress|z'),
+      wd('cats|?',     'cat|z'),
+      ai('EOF|')
+    ])
+  end
+  def test_examples_110
+    meet({ 'mode' => 'all' }, [
+      wd('S110|IDF'),
+      wd('agreed|?'),
+      wd('feed|?'),
+      wd('plastered|?'),
+      wd('bled|?'),
+      wd('motoring|?'),
+      wd('sing|?'),
+      ai('EOF|')
+    ], [
+      wd('S110|IDF'),
+      wd('agreed|?',    'agre|z'),
+      wd('feed|?',      'fe|z'),       # snowball: feed
+      wd('plastered|?', 'plaster|z'),
+      wd('bled|?',      'bled|z'),
+      wd('motoring|?',  'motor|z'),
+      wd('sing|?',      'sing|z'),
+      ai('EOF|')
+    ])
+  end
+  def test_examples_111
+    meet({}, [
+      wd('S111|IDF'),
+      wd('conflated|?'),
+      wd('troubled|?'),
+      wd('sized|?'),
+      wd('hopping|?'),
+      wd('tanned|?'),
+      wd('falling|?'),
+      wd('hissing|?'),
+      wd('fizzed|?'),
+      wd('failing|?'),
+      wd('filing|?'),
+      ai('EOF|')
+    ], [
+      wd('S111|IDF'),
+      wd('conflated|?', 'conflat|z'),
+      wd('troubled|?',  'troubl|z'),
+      wd('sized|?',     'size|z'),
+      wd('hopping|?',   'hop|z'),
+      wd('tanned|?',    'tan|z'),
+      wd('falling|?',   'fall|z'),
+      wd('hissing|?',   'hiss|z'),
+      wd('fizzed|?',    'fizz|z'),
+      wd('failing|?',   'fail|z'),
+      wd('filing|?',    'file|z'),
+      ai('EOF|')
+    ])
+  end
+  def test_examples_120
+    meet({ 'mode' => 'all' }, [
+      wd('S120|IDF'),
+      wd('happy|?'),
+      wd('sky|?'),
+      ai('EOF|')
+    ], [
+      wd('S120|IDF'),
+      wd('happy|?', 'happi|z'),
+      wd('sky|?',   'sky|z'),
+      ai('EOF|')
+    ])
+  end
+  def test_examples_200
+    meet({}, [
+      wd('S200|IDF'),
+      wd('relational|?'),
+      wd('conditional|?'),
+      wd('rational|?'),
+      wd('valency|?'),
+      wd('hesitancy|?'),
+      wd('digitizer|?'),
+      wd('conformably|?'),
+      wd('radically|?'),
+      wd('differently|?'),
+      wd('vilely|?'),
+      wd('analogously|?'),
+      wd('vietnamization|?'),
+      wd('predication|?'),
+      wd('operator|?'),
+      wd('feudalism|?'),
+      wd('decisiveness|?'),
+      wd('hopefulness|?'),
+      wd('callousness|?'),
+      wd('formality|?'),
+      wd('sensitivity|?'),
+      wd('sensibility|?'),
+      ai('EOF|')
+    ], [
+      wd('S200|IDF'),
+      wd('relational|?',     'relat|z'),
+      wd('conditional|?',    'condit|z'),
+      wd('rational|?',       'ration|z'),
+      wd('valency|?',        'valenc|z'),
+      wd('hesitancy|?',      'hesit|z'),
+      wd('digitizer|?',      'digit|z'),
+      wd('conformably|?',    'conform|z'),
+      wd('radically|?',      'radic|z'),
+      wd('differently|?',    'differ|z'),
+      wd('vilely|?',         'vile|z'),
+      wd('analogously|?',    'analog|z'),
+      wd('vietnamization|?', 'vietnam|z'),
+      wd('predication|?',    'predic|z'),
+      wd('operator|?',       'oper|z'),
+      wd('feudalism|?',      'feudal|z'),
+      wd('decisiveness|?',   'decis|z'),
+      wd('hopefulness|?',    'hope|z'),
+      wd('callousness|?',    'callous|z'),
+      wd('formality|?',      'formal|z'),
+      wd('sensitivity|?',    'sensit|z'),
+      wd('sensibility|?',    'sensibl|z'),
+      ai('EOF|')
+    ])
+  end
+  def test_examples_300
+    meet({}, [
+      wd('S300|IDF'),
+      wd('triplicate|?'),
+      wd('formative|?'),
+      wd('formalize|?'),
+      wd('electricity|?'),
+      wd('electrical|?'),
+      wd('hopeful|?'),
+      wd('goodness|?'),
+      ai('EOF|')
+    ], [
+      wd('S300|IDF'),
+      wd('triplicate|?',  'triplic|z'),
+      wd('formative|?',   'form|z'),    # snowball: format
+      wd('formalize|?',   'formal|z'),
+      wd('electricity|?', 'electr|z'),
+      wd('electrical|?',  'electr|z'),
+      wd('hopeful|?',     'hope|z'),
+      wd('goodness|?',    'good|z'),
+      ai('EOF|')
+    ])
+  end
+  def test_examples_400
+    meet({}, [
+      wd('S400|IDF'),
+      wd('revival|?'),
+      wd('allowance|?'),
+      wd('inference|?'),
+      wd('airliner|?'),
+      wd('gyroscopic|?'),
+      wd('adjustable|?'),
+      wd('defensible|?'),
+      wd('irritant|?'),
+      wd('replacement|?'),
+      wd('adjustment|?'),
+      wd('dependent|?'),
+      wd('adoption|?'),
+      wd('homologou|?'),
+      wd('communism|?'),
+      wd('activate|?'),
+      wd('angularity|?'),
+      wd('homologous|?'),
+      wd('effective|?'),
+      wd('bowdlerize|?'),
+      ai('EOF|')
+    ], [
+      wd('S400|IDF'),
+      wd('revival|?',     'reviv|z'),
+      wd('allowance|?',   'allow|z'),
+      wd('inference|?',   'infer|z'),
+      wd('airliner|?',    'airlin|z'),
+      wd('gyroscopic|?',  'gyroscop|z'),
+      wd('adjustable|?',  'adjust|z'),
+      wd('defensible|?',  'defens|z'),
+      wd('irritant|?',    'irrit|z'),
+      wd('replacement|?', 'replac|z'),
+      wd('adjustment|?',  'adjust|z'),
+      wd('dependent|?',   'depend|z'),
+      wd('adoption|?',    'adopt|z'),
+      wd('homologou|?',   'homolog|z'),   # snowball: homologou
+      wd('communism|?',   'commun|z'),    # snowball: communism
+      wd('activate|?',    'activ|z'),
+      wd('angularity|?',  'angular|z'),
+      wd('homologous|?',  'homolog|z'),
+      wd('effective|?',   'effect|z'),
+      wd('bowdlerize|?',  'bowdler|z'),
+      ai('EOF|')
+    ])
+  end
+  def test_examples_500
+    meet({ 'mode' => 'all' }, [
+      wd('S500|IDF'),
+      wd('probate|?'),
+      wd('rate|?'),
+      wd('cease|?'),
+      ai('EOF|')
+    ], [
+      wd('S500|IDF'),
+      wd('probate|?', 'probat|z'),
+      wd('rate|?',    'rate|z'),
+      wd('cease|?',   'ceas|z'),
+      ai('EOF|')
+    ])
+  end
+  def test_examples_510
+    meet({ 'mode' => 'all' }, [
+      wd('S510|IDF'),
+      wd('controll|?'),
+      wd('roll|?'),
+      ai('EOF|')
+    ], [
+      wd('S510|IDF'),
+      wd('controll|?', 'control|z'),
+      wd('roll|?',     'roll|z'),
+      ai('EOF|')
+    ])
+  end
+end

data/test/attendee/ts_synonymer.rb CHANGED Viewed

@@ -5,23 +5,27 @@ require_relative '../test_helper'
 class TestAttendeeSynonymer < AttendeeTestCase
   def test_basic
-    @input = [wd('abtastzeiten|IDF', 'abtastzeit|s')]
-    @expect = [wd('abtastzeiten|IDF', 'abtastzeit|s', 'abtastfrequenz|y', 'abtastperiode|y')]
-    meet({'source'=>'sys-syn', 'check'=>'-,MUL'})
-# @expect.each_index {|i| assert_equal(@expect[i], @output[i]) }
+    meet({ 'source' => 'sys-syn', 'check' => '-,MUL' }, [
+      wd('abtastzeiten|IDF', 'abtastzeit|s')
+    ], [
+      wd('abtastzeiten|IDF', 'abtastzeit|s', 'abtastfrequenz|y', 'abtastperiode|y')
+    ])
   end
   def test_first
-    @input = [wd('Aktienanleihe|IDF', 'aktienanleihe|s')]
-    @expect = [wd('Aktienanleihe|IDF', 'aktienanleihe|s', 'aktien-anleihe|y',
-      'reverse convertible bond|y', 'reverse convertibles|y')]
-    meet({'source'=>'sys-syn,tst-syn', 'check'=>'-,MUL', 'mode'=>'first'})
+    meet({ 'source' => 'sys-syn,tst-syn', 'check' => '-,MUL', 'mode' => 'first' }, [
+      wd('Aktienanleihe|IDF', 'aktienanleihe|s')
+    ], [
+      wd('Aktienanleihe|IDF', 'aktienanleihe|s', 'aktien-anleihe|y', 'reverse convertible bond|y', 'reverse convertibles|y')
+    ])
   end
   def test_all
-    @input = [wd('Kerlchen|IDF', 'kerlchen|s')]
-    @expect = [wd('Kerlchen|IDF', 'kerlchen|s', 'kerlchen|y', 'zwerg-nase|y')]
-    meet({'source'=>'sys-syn,tst-syn', 'check'=>'-,MUL', 'mode'=>'all'})
+    meet({ 'source' => 'sys-syn,tst-syn', 'check' => '-,MUL', 'mode' => 'all' }, [
+      wd('Kerlchen|IDF', 'kerlchen|s')
+    ], [
+      wd('Kerlchen|IDF', 'kerlchen|s', 'kerlchen|y', 'zwerg-nase|y')
+    ])
   end
 end

data/test/attendee/ts_text_reader.rb CHANGED Viewed

@@ -5,8 +5,8 @@ require_relative '../test_helper'
 class TestAttendeeTextReader < AttendeeTestCase
   def test_lir_file
-    @expect = [
-      ai('LIR-FORMAT|'), ai('FILE|test/lir.txt'),
+    meet({ 'files' => 'test/lir.txt', 'records' => true }, nil, [
+      ai('LIR-FORMAT|'), ai("FILE|#{path = File.expand_path('test/lir.txt')}"),
       ai('RECORD|00237'),
       '020: GERHARD.',
       '025: Automatisches Sammeln, Klassifizieren und Indexieren von wissenschaftlich relevanten Informationsressourcen.',
@@ -17,14 +17,13 @@ class TestAttendeeTextReader < AttendeeTestCase
       ai('RECORD|00239'),
       '020: Information Retrieval und Dokumentmanagement im Multimedia-Zeitalter.',
       '056: "Das Buch ist ein praxisbezogenes VADEMECUM für alle, die in einer Welt der Datennetze Wissen/Informationen sammeln.',
-      ai('EOF|test/lir.txt')
-    ]
-    meet({'files'=>'test/lir.txt', 'lir-record-pattern'=>'^\[(\d+)\.\]'})
+      ai("EOF|#{path}")
+    ])
   end
   def test_lir_file_another_pattern
-    @expect = [
-      ai('LIR-FORMAT|'), ai('FILE|test/lir2.txt'),
+    meet({ 'files' => 'test/lir2.txt', 'records' => '^\021(\d+)\022' }, nil, [
+      ai('LIR-FORMAT|'), ai("FILE|#{path = File.expand_path('test/lir2.txt')}"),
       ai('RECORD|00237'),
       '020: GERHARD.',
       '025: Automatisches Sammeln, Klassifizieren und Indexieren von wissenschaftlich relevanten Informationsressourcen.',
@@ -35,18 +34,16 @@ class TestAttendeeTextReader < AttendeeTestCase
       ai('RECORD|00239'),
       '020: Information Retrieval und Dokumentmanagement im Multimedia-Zeitalter.',
       '056: "Das Buch ist ein praxisbezogenes VADEMECUM für alle, die in einer Welt der Datennetze Wissen/Informationen sammeln.',
-      ai('EOF|test/lir2.txt')
-    ]
-    meet({'files'=>'test/lir2.txt', 'lir-record-pattern'=>'^\021(\d+)\022'})
+      ai("EOF|#{path}")
+    ])
   end
   def test_normal_file
-    @expect = [
-      ai('FILE|test/mul.txt'),
+    meet({ 'files' => 'test/mul.txt' }, nil, [
+      ai("FILE|#{path = File.expand_path('test/mul.txt')}"),
       'Die abstrakte Kunst ist schön.',
-      ai('EOF|test/mul.txt')
-    ]
-    meet({'files'=>'test/mul.txt'})
+      ai("EOF|#{path}")
+    ])
   end
 end

data/test/attendee/ts_text_writer.rb CHANGED Viewed

@@ -5,7 +5,7 @@ require_relative '../test_helper'
 class TestAttendeeTextWriter < AttendeeTestCase
   def setup
-    @data = [
+    @input = [
       ai('FILE|test/test.txt'),
       wd('Dies|IDF'),
       wd('ist|IDF'),
@@ -25,34 +25,31 @@ class TestAttendeeTextWriter < AttendeeTestCase
   end
   def test_basic
-    @input = @data
-    @expect = [ "Dies,ist,eine,Zeile,.\n", "Dies,ist,eine,zweite,Zeile,.\n" ]
-    meet({'ext'=>'tst',  'sep'=>','}, false)
+    meet({ 'ext' => 'tst', 'sep' => ',' }, @input)
-    @output = File.readlines('test/test.tst', encoding: Lingo::ENC)
-    assert_equal(@expect, @output)
+    assert_equal([
+      "Dies,ist,eine,Zeile,.\n", "Dies,ist,eine,zweite,Zeile,.\n"
+    ], File.readlines('test/test.tst', encoding: Lingo::ENC))
   end
   def test_complex
-    @input = @data
-    @expect = [ "Dies-ist-eine-Zeile-.\n", "Dies-ist-eine-zweite-Zeile-.\n" ]
-    meet({'ext'=>'yip',  'sep'=>'-'}, false)
+    meet({ 'ext' => 'yip', 'sep' => '-' }, @input)
-    @output = File.readlines('test/test.yip', encoding: Lingo::ENC)
-    assert_equal(@expect, @output)
+    assert_equal([
+      "Dies-ist-eine-Zeile-.\n", "Dies-ist-eine-zweite-Zeile-.\n"
+    ], File.readlines('test/test.yip', encoding: Lingo::ENC))
   end
   def test_crlf
-    @input = @data
-    @expect = [ "Dies\n", "ist\n", "eine\n", "Zeile\n", ".\n", "Dies\n", "ist\n", "eine\n", "zweite\n", "Zeile\n", ".\n" ]
-    meet({'sep'=>"\n"}, false)
+    meet({ 'sep' => "\n" }, @input)
-    @output = File.readlines('test/test.txt2', encoding: Lingo::ENC)
-    assert_equal(@expect, @output)
+    assert_equal([
+      "Dies\n", "ist\n", "eine\n", "Zeile\n", ".\n", "Dies\n", "ist\n", "eine\n", "zweite\n", "Zeile\n", ".\n"
+    ], File.readlines('test/test.txt2', encoding: Lingo::ENC))
   end
   def test_lir_file
-    @input = [
+    meet({ 'ext' => 'vec', 'lir-format' => nil }, [
       ai('LIR-FORMAT|'), ai('FILE|test/lir.txt'),
       ai('RECORD|00237'),
       '020: GERHARD.',
@@ -65,28 +62,26 @@ class TestAttendeeTextWriter < AttendeeTestCase
       '020: Information Retrieval und Dokumentmanagement im Multimedia-Zeitalter.',
       "056: \"Das Buch ist ein praxisbezogenes VADEMECUM für alle, die in einer Welt der Datennetze Wissen/Informationen sammeln.\r",
       ai('EOF|test/lir.txt')
-    ]
-    @expect = [
+    ])
+    assert_equal([
       "00237*020: GERHARD. 025: Automatisches Sammeln, Klassifizieren und Indexieren von wissenschaftlich relevanten Informationsressour\
 cen. 056: Die intellektuelle Erschließung des Internet befindet sich in einer Krise. GERHARD ist derzeit weltweit der einzige.\r\n",
       "00238*020: Automatisches Sammeln, Klassifizieren und Indexieren von wissenschaftlich relevanten Informationsressourcen. 025: das D\
 FG-Projekt GERHARD.\r\n",
       "00239*020: Information Retrieval und Dokumentmanagement im Multimedia-Zeitalter. 056: \"Das Buch ist ein praxisbezogenes VADEMECUM\
  für alle, die in einer Welt der Datennetze Wissen/Informationen sammeln.\r\n"
-    ]
-    meet({'ext'=>'csv', 'lir-format'=>nil}, false)
-    @output = File.readlines('test/lir.csv', encoding: Lingo::ENC)
-    assert_equal(@expect, @output)
+    ], File.readlines('test/lir.vec', encoding: Lingo::ENC))
   end
   def test_nonewords
-    @input = [ai('FILE|test/text.txt'), 'Nonwörter', 'Nonsense', ai('EOF|test/text.txt')]
-    @expect = [ "Nonwörter\n", "Nonsense" ]
-    meet({'ext'=>'non', 'sep'=>"\n"}, false)
+    meet({ 'ext' => 'non', 'sep' => "\n" }, [
+      ai('FILE|test/text.txt'), 'Nonwörter', 'Nonsense', ai('EOF|test/text.txt')
+    ])
-    @output = File.readlines('test/text.non', encoding: Lingo::ENC)
-    assert_equal(@expect, @output)
+    assert_equal([
+      "Nonwörter\n", "Nonsense"
+    ], File.readlines('test/text.non', encoding: Lingo::ENC))
   end
 end

data/test/attendee/ts_tokenizer.rb CHANGED Viewed

@@ -3,14 +3,17 @@
 class TestAttendeeTokenizer < AttendeeTestCase
   def test_basic
-    @input = ["Dies ist ein Test."]
-    @expect = [tk('Dies|WORD'), tk('ist|WORD'), tk('ein|WORD'), tk('Test|WORD'), tk('.|PUNC')]
-    meet({})
+    meet({}, [
+      "Dies ist ein Test."
+    ], [
+      tk('Dies|WORD'), tk('ist|WORD'), tk('ein|WORD'), tk('Test|WORD'), tk('.|PUNC')
+    ])
   end
   def test_complex
-    @input = ["1964 www.vorhauer.de bzw. nasenbär, ()"]
-    @expect = [
+    meet({}, [
+      "1964 www.vorhauer.de bzw. nasenbär, ()"
+    ], [
       tk('1964|NUMS'),
       tk('www.vorhauer.de|URLS'),
       tk('bzw|WORD'),
@@ -19,8 +22,7 @@ class TestAttendeeTokenizer < AttendeeTestCase
       tk(',|PUNC'),
       tk('(|OTHR'),
       tk(')|OTHR')
-    ]
-    meet({})
+    ])
   end
 end

data/test/attendee/ts_variator.rb CHANGED Viewed

@@ -5,14 +5,14 @@ require_relative '../test_helper'
 class TestAttendeeVariator < AttendeeTestCase
   def test_basic
-    @input = [wd('fchwarz|?'), wd('fchilling|?'), wd('iehwarzfchilling|?'), wd('fchiiiirg|?')]
-    @expect = [
+    meet({ 'source' => 'sys-dic' }, [
+      wd('fchwarz|?'), wd('fchilling|?'), wd('iehwarzfchilling|?'), wd('fchiiiirg|?')
+    ], [
       wd('*schwarz|IDF', 'schwarz|s', 'schwarz|a'),
       wd('*schilling|IDF', 'schilling|s'),
       wd('*schwarzschilling|KOM', 'schwarzschilling|k', 'schwarz|a+', 'schilling|s+', 'schwarz|s+'),
       wd('fchiiiirg|?')
-    ]
-    meet({'source'=>'sys-dic'})
+    ])
   end
 end

data/test/attendee/ts_vector_filter.rb CHANGED Viewed

@@ -14,43 +14,51 @@ class TestAttendeeVectorFilter < AttendeeTestCase
   end
   def test_basic
-    @expect = [ai('FILE|test'), 'substantiv', ai('EOF|test')]
-    meet({})
+    meet({}, @input, [
+      ai('FILE|test'), 'substantiv', ai('EOF|test')
+    ])
   end
   def test_lexicals
-    @expect = [ai('FILE|test'), 'adjektiv', 'eigenname', 'substantiv', 'verb', ai('EOF|test')]
-    meet({'lexicals'=>'[save]'})
+    meet({ 'lexicals' => '[save]' }, @input, [
+      ai('FILE|test'), 'adjektiv', 'eigenname', 'substantiv', 'verb', ai('EOF|test')
+    ])
   end
   def test_sort_term_abs
-    @expect = [ai('FILE|test'), '1 adjektiv', '1 eigenname', '1 substantiv', '1 verb', ai('EOF|test')]
-    meet({'lexicals'=>'[save]', 'sort'=>'term_abs'})
+    meet({ 'lexicals' => '[save]', 'sort' => 'term_abs' }, @input, [
+      ai('FILE|test'), '1 adjektiv', '1 eigenname', '1 substantiv', '1 verb', ai('EOF|test')
+    ])
   end
   def test_sort_term_rel
-    @expect = [ai('FILE|test'), '0.50000 adjektiv', '0.50000 eigenname', '0.50000 substantiv', '0.50000 verb', ai('EOF|test')]
-    meet({'lexicals'=>'[save]', 'sort'=>'term_rel'})
+    meet({ 'lexicals' => '[save]', 'sort' => 'term_rel' }, @input, [
+      ai('FILE|test'), '0.50000 adjektiv', '0.50000 eigenname', '0.50000 substantiv', '0.50000 verb', ai('EOF|test')
+    ])
   end
   def test_sort_sto_abs
-    @expect = [ai('FILE|test'), 'adjektiv {1}', 'eigenname {1}', 'substantiv {1}', 'verb {1}', ai('EOF|test')]
-    meet({'lexicals'=>'[save]', 'sort'=>'sto_abs'})
+    meet({ 'lexicals' => '[save]', 'sort' => 'sto_abs' }, @input, [
+      ai('FILE|test'), 'adjektiv {1}', 'eigenname {1}', 'substantiv {1}', 'verb {1}', ai('EOF|test')
+    ])
   end
   def test_sort_sto_rel
-    @expect = [ai('FILE|test'), 'adjektiv {0.50000}', 'eigenname {0.50000}', 'substantiv {0.50000}', 'verb {0.50000}', ai('EOF|test')]
-    meet({'lexicals'=>'[save]', 'sort'=>'sto_rel'})
+    meet({ 'lexicals' => '[save]', 'sort' => 'sto_rel' }, @input, [
+      ai('FILE|test'), 'adjektiv {0.50000}', 'eigenname {0.50000}', 'substantiv {0.50000}', 'verb {0.50000}', ai('EOF|test')
+    ])
   end
   def test_nonword
-    @expect = [ai('FILE|test'), 'unknown', ai('EOF|test')]
-    meet({'lexicals'=>'\?'})
+    meet({ 'lexicals' => '\?' }, @input, [
+      ai('FILE|test'), 'unknown', ai('EOF|test')
+    ])
   end
   def test_nonword_sort_term_abs
-    @expect = [ai('FILE|test'), '1 unknown', ai('EOF|test')]
-    meet({'lexicals'=>'\?', 'sort'=>'term_abs'})
+    meet({ 'lexicals' => '\?', 'sort' => 'term_abs' }, @input, [
+      ai('FILE|test'), '1 unknown', ai('EOF|test')
+    ])
   end
 end