lingo 1.8.4.2 → 1.8.5
Sign up to get free protection for your applications and to get access to all the features.
- checksums.yaml +4 -4
- data/ChangeLog +413 -325
- data/README +380 -131
- data/Rakefile +19 -21
- data/de/lingo-abk.txt +15 -17
- data/de/lingo-dic.txt +20210 -20659
- data/de/lingo-mul.txt +5 -13
- data/de/lingo-syn.txt +5 -8
- data/de/test_dic.txt +2 -0
- data/de/test_gen.txt +8 -0
- data/de/{test_mul2.txt → test_mu2.txt} +0 -0
- data/de/{test_singleword.txt → test_sgw.txt} +0 -0
- data/de/user-dic.txt +5 -7
- data/de.lang +64 -49
- data/en/lingo-dic.txt +6398 -6404
- data/en/lingo-irr.txt +2 -3
- data/en/lingo-mul.txt +6 -7
- data/en/lingo-wdn.txt +881 -1762
- data/en/user-dic.txt +2 -5
- data/en.lang +39 -39
- data/lib/lingo/app.rb +10 -6
- data/lib/lingo/attendee/abbreviator.rb +1 -0
- data/lib/lingo/attendee/decomposer.rb +2 -1
- data/lib/lingo/attendee/multi_worder.rb +5 -6
- data/lib/lingo/attendee/stemmer.rb +1 -1
- data/lib/lingo/attendee/synonymer.rb +4 -2
- data/lib/lingo/attendee/text_reader.rb +77 -57
- data/lib/lingo/attendee/text_writer.rb +1 -1
- data/lib/lingo/attendee/tokenizer.rb +101 -50
- data/lib/lingo/attendee/variator.rb +2 -1
- data/lib/lingo/attendee/vector_filter.rb +28 -6
- data/lib/lingo/attendee/word_searcher.rb +2 -1
- data/lib/lingo/attendee.rb +8 -4
- data/lib/lingo/call.rb +7 -3
- data/lib/lingo/cli.rb +8 -16
- data/lib/lingo/config.rb +11 -6
- data/lib/lingo/ctl.rb +54 -3
- data/lib/lingo/database/crypter.rb +8 -14
- data/lib/lingo/database/hash_store.rb +1 -1
- data/lib/lingo/database/{show_progress.rb → progress.rb} +7 -8
- data/lib/lingo/database/source/key_value.rb +6 -5
- data/lib/lingo/database/source/multi_key.rb +5 -2
- data/lib/lingo/database/source/multi_value.rb +6 -4
- data/lib/lingo/database/source/single_word.rb +2 -3
- data/lib/lingo/database/source/word_class.rb +24 -5
- data/lib/lingo/database/source.rb +5 -3
- data/lib/lingo/database.rb +102 -41
- data/lib/lingo/error.rb +24 -2
- data/lib/lingo/language/dictionary.rb +26 -54
- data/lib/lingo/language/grammar.rb +19 -23
- data/lib/lingo/language/lexical.rb +5 -1
- data/lib/lingo/language/lexical_hash.rb +7 -12
- data/lib/lingo/language/token.rb +10 -1
- data/lib/lingo/language/word.rb +35 -23
- data/lib/lingo/language/word_form.rb +5 -4
- data/lib/lingo/{show_progress.rb → progress.rb} +43 -30
- data/lib/lingo/srv/lingosrv.cfg +1 -1
- data/lib/lingo/srv/public/.gitkeep +0 -0
- data/lib/lingo/srv.rb +11 -6
- data/lib/lingo/version.rb +2 -2
- data/lib/lingo/web/lingoweb.cfg +1 -1
- data/lib/lingo/web/views/index.erb +4 -4
- data/lib/lingo/web.rb +4 -6
- data/lib/lingo.rb +4 -12
- data/lingo.cfg +1 -1
- data/lir.cfg +1 -1
- data/ru/lingo-dic.txt +33473 -2113
- data/ru/lingo-mul.txt +8430 -1913
- data/ru/lingo-syn.txt +1634 -0
- data/ru/user-dic.txt +6 -0
- data/ru.lang +49 -47
- data/spec/spec_helper.rb +4 -0
- data/test/attendee/ts_decomposer.rb +2 -2
- data/test/attendee/ts_synonymer.rb +3 -3
- data/test/attendee/ts_tokenizer.rb +215 -2
- data/test/attendee/ts_variator.rb +2 -2
- data/test/attendee/ts_word_searcher.rb +10 -6
- data/test/ref/artikel.seq +2 -2
- data/test/ref/artikel.vec +5 -5
- data/test/ref/artikel.ven +11 -11
- data/test/ref/artikel.ver +11 -11
- data/test/ref/lir.seq +13 -13
- data/test/ref/lir.vec +31 -31
- data/test/test_helper.rb +19 -5
- data/test/ts_database.rb +206 -77
- data/test/ts_language.rb +86 -26
- metadata +93 -49
- data/.rspec +0 -1
- data/de/test_syn2.txt +0 -1
data/ru/user-dic.txt
ADDED
data/ru.lang
CHANGED
@@ -1,8 +1,8 @@
|
|
1
|
-
|
1
|
+
#------------------------------------------------------------------------------------------------------------------------------------
|
2
2
|
#
|
3
3
|
# database-Section - Definitionen für Wörterbücher
|
4
4
|
#
|
5
|
-
# In der database-Section können alle benötigten Wörterbücher angegeben werden.
|
5
|
+
# In der database-Section können alle benötigten Wörterbücher angegeben werden.
|
6
6
|
# Dabei werden folgende Attribute interpretiert:
|
7
7
|
#
|
8
8
|
# Attribut Default Bedeutung
|
@@ -12,7 +12,7 @@
|
|
12
12
|
#
|
13
13
|
# name Gibt den Ort der Quelldaten an.
|
14
14
|
#
|
15
|
-
# def-wc ? Gibt eine Wortklasse vor die verwendet wird, wenn die Datenquelle über keine adäquate Information zur
|
15
|
+
# def-wc ? Gibt eine Wortklasse vor die verwendet wird, wenn die Datenquelle über keine adäquate Information zur
|
16
16
|
# Wortklasse eines Eintrags verfügt.
|
17
17
|
#
|
18
18
|
# txt-format KeyValue Gibt an, in welchem Format die Quelldaten je Zeile vorliegen. Dabei wird unterschieden zwischen
|
@@ -27,73 +27,75 @@
|
|
27
27
|
# "Fax;Faxkopie;Telefax\n"
|
28
28
|
# MultiKey
|
29
29
|
#
|
30
|
-
# separator (s.Text) Gibt an, durch welches Zeichen eine Textzeile die Grundform von der Projektion trennt. Der Defaultwert ist
|
30
|
+
# separator (s.Text) Gibt an, durch welches Zeichen eine Textzeile die Grundform von der Projektion trennt. Der Defaultwert ist
|
31
31
|
# abhängig vom Text-Format: KeyValue='*', WordClass=',' und MultiValue=';'.
|
32
32
|
#
|
33
33
|
# use-lex Gibt an, dass bei Mehrwort-Schlüsseln eine Vorab-Lexikalisierung vorgenommen wird durch Zuhilfenahme der
|
34
|
-
# Wörterbücher, die mit diesem Attribut angegeben werden, z.B. use-lex='sys-dic'.
|
35
|
-
# Die Vorab-Lexikalisierung von Mehrwortgruppen ermöglicht die leichte Erkennung von allen möglichen
|
34
|
+
# Wörterbücher, die mit diesem Attribut angegeben werden, z.B. use-lex='sys-dic'.
|
35
|
+
# Die Vorab-Lexikalisierung von Mehrwortgruppen ermöglicht die leichte Erkennung von allen möglichen
|
36
36
|
# Dehnungsvarianten. Bei Mehrwort-Wörterbüchern, die ausschließlich Personennamen enthalten, kann dieser Wert
|
37
37
|
# entfallen, da er nur die Verarbeitungsgeschwindigkeit vermindert ohne die Erkennungsquote zu erhöhen.
|
38
38
|
#
|
39
|
-
# ACHTUNG: Wird mit dem Attribut use-lex ein anderes Wörterbuch referenziert, so sollte dieses VOR der ersten Referenzierung
|
39
|
+
# ACHTUNG: Wird mit dem Attribut use-lex ein anderes Wörterbuch referenziert, so sollte dieses VOR der ersten Referenzierung
|
40
40
|
# definiert sein, da es sonst noch nicht existiert!
|
41
41
|
#
|
42
42
|
|
43
|
-
|
44
|
-
---
|
43
|
+
---
|
45
44
|
language:
|
46
45
|
name: 'Russisch'
|
47
46
|
|
48
47
|
dictionary:
|
49
48
|
databases:
|
50
|
-
#
|
49
|
+
# System dictionaries
|
51
50
|
sys-dic: { name: ru/lingo-dic.txt, txt-format: WordClass, separator: '=' }
|
52
|
-
sys-syn: { name: ru/lingo-syn.txt, txt-format: KeyValue,
|
53
|
-
sys-mul: { name: ru/lingo-mul.txt, txt-format: SingleWord, use-lex:
|
54
|
-
|
55
|
-
|
51
|
+
sys-syn: { name: ru/lingo-syn.txt, txt-format: KeyValue, separator: '=', def-wc: y }
|
52
|
+
sys-mul: { name: ru/lingo-mul.txt, txt-format: SingleWord, use-lex: sys-dic, def-wc: m }
|
53
|
+
|
54
|
+
# User dictionaries
|
55
|
+
usr-dic: { name: ru/user-dic.txt, txt-format: WordClass, separator: '=' }
|
56
56
|
|
57
57
|
compound:
|
58
|
-
min-word-size:
|
59
|
-
min-part-size:
|
60
|
-
max-parts:
|
61
|
-
min-avg-part-size:
|
62
|
-
append-wordclass:
|
58
|
+
min-word-size: '7'
|
59
|
+
min-part-size: '3'
|
60
|
+
max-parts: '5'
|
61
|
+
min-avg-part-size: '4'
|
62
|
+
append-wordclass: '+'
|
63
63
|
skip-sequences: [ xx ]
|
64
64
|
|
65
65
|
suffix:
|
66
|
-
#
|
67
|
-
#
|
68
|
-
#
|
69
|
-
- [s,
|
70
|
-
- [a,
|
71
|
-
- [v, "у/ть ю/ть ешь/ть ет/ть ем/ть ете/ть ют/ть л/ть ла/ть ло/ть ли/ть й/ть йте/ть я/ть в/ть ут/ти у/ти ю/ти ешь/ти ет/ти ем/ти ете/ти ют/ти л/ти ла/ти ло/ти ли/ти й/ти йте/ти я/ти в/ти ут/ти усь/ться юсь/ться ешься/ться ется/ться емся/ться етесь/ться ются/ться лся/ться лась/ться лось/ться лись/ться йся/ться йтесь/ться усь/тись юсь/тись ешься/тись ется/тись емся/тись етесь/тись утся/тись ются/тись лся/тись лась/тись лось/тись лись/тись ись/тись итесь/тись ю/ить ишь/ить ит/ить им/ить ите/ить ят/ить ил/ить ила/ить ило/ить или/ить й/ить йте/ить ью/ить ьешь/ить ьет/ить ьем/ить ьете/ить ьют/ить ей/ить ейте/ить я/ить ив/ить юсь/иться ишься/иться ится/иться имся/иться итесь/иться ятся/иться ился/иться илась/иться илось/иться ились/иться йся/иться йтесь/иться ьюсь/иться ьешься/иться ьется/иться ьемся/иться ьетесь/иться ьются/иться ейся/иться ейтесь/иться ю/оть ешь/оть ет/оть ем/оть ете/оть ют/оть л/оть ла/оть ло/оть ли/оть й/оть йте/оть я/оть ов/оть юсь/оться ешься/оться ется/оться емся/оться етесь/оться ются/оться лся/оться лась/оться лось/оться лись/оться ись/оться итесь/оться ую/овать уешь/овать ует/овать уем/овать уете/овать уют/овать овал/овать овала/овать овало/овать овали/овать уй/овать уйте/овать уя/овать овав/овать уюсь/оваться уешься/оваться уется/оваться уемся/оваться уетесь/оваться уются/оваться овался/оваться овалась/оваться овалось/оваться овались/оваться уйся/оваться уйтесь/оваться юю/евать юешь/евать юет/евать юем/евать юете/евать юют/евать евал/евать евала/евать евало/евать евали/евать юй/евать юйте/евать юя/евать евав/евать ююсь/еваться юешься/еваться юется/еваться юемся/еваться юетесь/еваться ются/еваться евался/еваться евалась/еваться евалось/еваться евались/еваться юйся/еваться юйтесь/еваться ну/нуть нешь/нуть нет/нуть нем/нуть нете/нуть нут/нуть нул/нуть нула/нуть нуло/нуть нули/нуть ни/нуть ните/нуть нув/нуть нусь/нуться нешься/нуться нется/нуться немся/нуться нетесь/нуться нутся/нуться нулся/нуться нулась/нуться нулось/нуться нулись/нуться нись/нуться нитесь/нуться гу/чь жешь/чь жет/чь жем/чь жете/чь гут/чь г/чь гла/чь гло/чь гли/чь ги/чь гите/чь ку/чь чешь/чь чет/чь чем/чь чете/чь кут/чь к/чь кла/чь кло/чь кли/чь ки/чь ките/чь гусь/чься жешься/чься жется/чься жемся/чься жетесь/чься гутся/чься гся/чься глась/чься глось/чься глись/чься гись/чься гитесь/чься кусь/чься чешься/чься чется/чься чемся/чься четесь/чься кутся/чься кся/чься клась/чься клось/чься клись/чься кись/чься китесь/чься ююсь/еваться юешься/еваться юется/еваться юемся/еваться юетесь/еваться юются/еваться"]
|
72
|
-
|
73
|
-
|
66
|
+
# Suffixliste, Stand: 29-07-2013
|
67
|
+
# Suffixklasse: s = Substantiv, a = Adjektiv, v = Verb, e = Eigenwort, g = Geographika, u = Vornamen/Vatersnamen, i = TheSoz
|
68
|
+
# Suffixe je Klasse: "<suffix>['/'<ersetzung>][ <suffix>['/'<ersetzung>]]"
|
69
|
+
- [s, 'а у ом е ы ов ам ами ах и енка/енок енку/енок енком/енок енке/енок ята/енок ят/енок ятам/енок ятами/енок ятах/енок я/й ю/й е/й ем/й и/й ев/й ям/й ями/й ях/й я/ь ю/ь ем/ь e/ь и/ь ей/ь ям/ь ями/ь ях/ь ью/ь ы/а е/а у/а ой/а ам/а ами/а ах/а и/а /а и/я е/я ю/я ей/я ь/я ям/я ями/я ях/я й/я ени/я енем/я ена/я ен/я енам/я енами/я енах/я а/о у/о ом/о е/о ам/о ами/о ах/о и/о /о я/е ю/е ем/е и/е й/е ей/е ям/е ями/е ях/е а/е у/е ам/е ами/е ах/е /е /ы ам/ы ами/ы ах/ы /и ов/и ам/и ами/и ах/и ей/и ям/и ями/и ях/и ка/ок ку/ок ком/ок ке/ок ки/ок ков/ок кам/ок ками/ок ках/ок ца/ец цу/ец цем/ец це/ец цы/ец цев/ец цам/ец цами/ец цах/ец ек/ка ок/ка']
|
70
|
+
- [a, 'а/ий а/ой а/ый ая/ий ая/ой ая/ый его/ий ее/ий ее/ой ее/ый ей/ий ейшего/ий ейшего/ой ейшего/ый ейшем/ий ейшем/ой ейшем/ый ейшему/ий ейшему/ой ейшему/ый ейшие/ий ейшие/ой ейшие/ый ейший/ий ейший/ой ейший/ый ейшим/ий ейшим/ой ейшим/ый ейшими/ий ейшими/ой ейшими/ый ейших/ий ейших/ой ейших/ый ем/ий ему/ий ие/ий ие/ой ие/ый им/ий им/ой им/ый ими/ий ими/ой ими/ый их/ий их/ой их/ый о/ий о/ой о/ый ого/ий ого/ой ого/ый ое/ий ое/ой ое/ый ой/ий ой/ой ой/ый ом/ий ом/ой ом/ый ому/ий ому/ой ому/ый ую/ий ую/ой ую/ый ы/ий ы/ой ы/ый ые/ий ые/ой ые/ый ым/ий ым/ий ым/ой ым/ый ыми/ий ыми/ой ыми/ый ых/ий ых/ой ых/ый юю/ий яя/ий ья/ий ьей/ий ью/ий ьи/ий ьих/ий ьим/ий ьими/ий ейшая/ый ейшей/ый ейшую/ый ейшее/ый /ый а/ый о/ый ы/ый ейшая/ой ейшей/ой ейшую/ой ейшее/ой /ой а/ой о/ой ы/ой ейшая/ий ейшей/ий ейшую/ий ейшее/ий ий а/ий о/ий и/ий ен/ный']
|
71
|
+
- [v, 'у/ть ю/ть ешь/ть ет/ть ем/ть ете/ть ют/ть л/ть ла/ть ло/ть ли/ть й/ть йте/ть ут/ть я/ть в/ть у/ти ю/ти ешь/ти ет/ти ем/ти ете/ти ют/ти л/ти ла/ти ло/ти ли/ти й/ти йте/ти ут/ти я/ти в/ти усь/ться юсь/ться ешься/ться ется/ться емся/ться етесь/ться ются/ться лся/ться лась/ться лось/ться лись/ться йся/ться йтесь/ться усь/тись юсь/тись ешься/тись ется/тись емся/тись етесь/тись ются/тись лся/тись лась/тись лось/тись лись/тись йся/тись йтесь/тись ю/ить ишь/ить ит/ить им/ить ите/ить ят/ить ил/ить ила/ить ило/ить или/ить й/ить йте/ить ью/ить ьешь/ить ьет/ить ьем/ить ьете/ить ьют/ить ей/ить ейте/ить я/ить ив/ить юсь/иться ишься/иться ится/иться имся/иться итесь/иться ятся/иться ился/иться илась/иться илось/иться ились/иться йся/иться йтесь/иться ьюсь/иться ьешься/иться ьется/иться ьемся/иться ьетесь/иться ьются/иться ейся/иться ейтесь/иться ю/оть ешь/оть ет/оть ем/оть ете/оть ют/оть л/оть ла/оть ло/оть ли/оть й/оть йте/оть я/оть ов/оть юсь/оться ешься/оться ется/оться емся/оться етесь/оться ются/оться лся/оться лась/оться лось/оться лись/оться ись/оться итесь/оться ую/овать уешь/овать ует/овать уем/овать уете/овать уют/овать овал/овать овала/овать овало/овать овали/овать уй/овать уйте/овать уя/овать овав/овать уюсь/оваться уешься/оваться уется/оваться уемся/оваться уетесь/оваться уются/оваться овался/оваться овалась/оваться овалось/оваться овались/оваться уйся/оваться уйтесь/оваться ую/евать юю/евать юешь/евать юет/евать юем/евать юете/евать юют/евать евал/евать евала/евать евало/евать евали/евать юй/евать юйте/евать юя/евать евав/евать уюсь/еваться ююсь/еваться юешься/еваться юется/еваться юемся/еваться юетесь/еваться юются/еваться евался/еваться евалась/еваться евалось/еваться евались/еваться юйся/еваться юйтесь/еваться ну/нуть нешь/нуть нет/нуть нем/нуть нете/нуть нут/нуть нул/нуть нула/нуть нуло/нуть нули/нуть ни/нуть ните/нуть нув/нуть нусь/нуться нешься/нуться нется/нуться немся/нуться нетесь/нуться нутся/нуться нулся/нуться нулась/нуться нулось/нуться нулись/нуться нись/нуться нитесь/нуться гу/чь жешь/чь жет/чь жем/чь жете/чь гут/чь г/чь гла/чь гло/чь гли/чь ги/чь гите/чь ку/чь чешь/чь чет/чь чем/чь чете/чь кут/чь к/чь кла/чь кло/чь кли/чь ки/чь ките/чь гусь/чься жешься/чься жется/чься жемся/чься жетесь/чься гутся/чься гся/чься глась/чься глось/чься глись/чься гись/чься гитесь/чься кусь/чься чешься/чься чется/чься чемся/чься четесь/чься кутся/чься кся/чься клась/чься клось/чься клись/чься кись/чься китесь/чься вшая/ти вшая/ть вшаяся/тись вшаяся/ться вшего/ти вшего/ть вшегося/тись вшегося/ться вшее/ти вшее/ть вшееся/тись вшееся/ться вшей/ти вшей/ть вшейся/тись вшейся/ться вшем/ти вшем/ть вшемся/тись вшемся/ться вшему/ти вшему/ть вшемуся/тись вшемуся/ться вшие/ти вшие/ть вшиеся/тись вшиеся/ться вший/ти вший/ть вшийся/тись вшийся/ться вшим/ти вшим/ть вшими/ти вшими/ть вшимися/тись вшимися/ться вшимся/тись вшимся/ться вших/ти вших/ть вшихся/тись вшихся/ться вшую/ти вшую/ть вшуюся/тись вшуюся/ться гущая/чь гущаяся/чься гущего/чь гущегося/чься гущее/чь гущееся/чься гущей/чь гущейся/чься гущем/чь гущемся/чься гущему/чь гущемуся/чься гущие/чь гущиеся/чься гущий/чь гущийся/чься гущим/чь гущими/чь гущимися/чься гущимся/чься гущих/чь гущихся/чься гущую/чь гущуюся/чься евавшая/евать евавшаяся/еваться евавшего/евать евавшегося/еваться евавшее/евать евавшееся/еваться евавшей/евать евавшейся/еваться евавшем/евать евавшемся/еваться евавшему/евать евавшемуся/еваться евавшие/евать евавшиеся/еваться евавший/евать евавшийся/еваться евавшим/евать евавшими/евать евавшимися/еваться евавшимся/еваться евавших/евать евавшихся/еваться евавшую/евать евавшуюся/еваться еванная/евать еванного/евать еванное/евать еванной/евать еванном/евать еванному/евать еванную/евать еванные/евать еванный/евать еванным/евать еванными/евать еванных/евать емая/ти емая/ть емого/ти емого/ть емое/ти емое/ть емой/ти емой/ть емом/ти емом/ть емому/ти емому/ть емую/ти емую/ть емые/ти емые/ть емый/ти емый/ть емым/ти емым/ть емыми/ти емыми/ть емых/ти емых/ть енная/ить енного/ить енное/ить енной/ить енном/ить енному/ить енную/ить енные/ить енный/ить енным/ить енными/ить енных/ить женная/чь женного/чь женное/чь женной/чь женном/чь женному/чь женную/чь женные/чь женный/чь женным/чь женными/чь женных/чь ившая/ить ившаяся/иться ившего/ить ившегося/иться ившее/ить ившееся/иться ившей/ить ившейся/иться ившем/ить ившемся/иться ившему/ить ившемуся/иться ившие/ить ившиеся/иться ивший/ить ившийся/иться ившим/ить ившими/ить ившимися/иться ившимся/иться ивших/ить ившихся/иться ившую/ить ившуюся/иться имая/ить имого/ить имое/ить имой/ить имом/ить имому/ить имую/ить имые/ить имый/ить имым/ить имыми/ить имых/ить кущая/чь кущаяся/чься кущего/чь кущегося/чься кущее/чь кущееся/чься кущей/чь кущейся/чься кущем/чь кущемся/чься кущему/чь кущемуся/чься кущие/чь кущиеся/чься кущий/чь кущийся/чься кущим/чь кущими/чь кущимися/чься кущимся/чься кущих/чь кущихся/чься кущую/чь кущуюся/чься нная/ти нная/ть нного/ти нного/ть нное/ти нное/ть нной/ти нной/ть нном/ти нном/ть нному/ти нному/ть нную/ти нную/ть нные/ти нные/ть нный/ти нный/ть нным/ти нным/ть нными/ти нными/ть нных/ти нных/ть нувшая/нуть нувшаяся/нуться нувшего/нуть нувшегося/нуться нувшее/нуть нувшееся/нуться нувшей/нуть нувшейся/нуться нувшем/нуть нувшемся/нуться нувшему/нуть нувшемуся/нуться нувшие/нуть нувшиеся/нуться нувший/нуть нувшийся/нуться нувшим/нуть нувшими/нуть нувшимися/нуться нувшимся/нуться нувших/нуть нувшихся/нуться нувшую/нуть нувшуюся/нуться нущая/нуть нущаяся/нуться нущего/нуть нущегося/нуться нущее/нуть нущееся/нуться нущей/нуть нущейся/нуться нущем/нуть нущемся/нуться нущему/нуть нущемуся/нуться нущие/нуть нущиеся/нуться нущий/нуть нущийся/нуться нущим/нуть нущими/нуть нущимися/нуться нущимся/нуться нущих/нуть нущихся/нуться нущую/нуть нущуюся/нуться овавшая/овать овавшаяся/оваться овавшего/овать овавшегося/оваться овавшее/овать овавшееся/оваться овавшей/овать овавшейся/оваться овавшем/овать овавшемся/оваться овавшему/овать овавшемуся/оваться овавшие/овать овавшиеся/оваться овавший/овать овавшийся/оваться овавшим/овать овавшими/овать овавшимися/оваться овавшимся/оваться овавших/овать овавшихся/оваться овавшую/овать овавшуюся/оваться ованная/овать ованного/овать ованное/овать ованной/овать ованном/овать ованному/овать ованную/овать ованные/овать ованный/овать ованным/овать ованными/овать ованных/овать овшая/оть овшаяся/оться овшего/оть овшегося/оться овшее/оть овшееся/оться овшей/оть овшейся/оться овшем/оть овшемся/оться овшему/оть овшемуся/оться овшие/оть овшиеся/оться овший/оть овшийся/оться овшим/оть овшими/оть овшимися/оться овшимся/оться овших/оть овшихся/оться овшую/оть овшуюся/оться отая/оть отого/оть отое/оть отой/оть отом/оть отому/оть отую/оть отые/оть отый/оть отым/оть отыми/оть отых/оть уемая/овать уемого/овать уемое/овать уемой/овать уемом/овать уемому/овать уемую/овать уемые/овать уемый/овать уемым/овать уемыми/овать уемых/овать ущая/ти ущая/ть ущаяся/тись ущаяся/ться ущего/ти ущего/ть ущегося/тись ущегося/ться ущее/ти ущее/ть ущееся/тись ущееся/ться ущей/ти ущей/ть ущейся/тись ущейся/ться ущем/ти ущем/ть ущемся/тись ущемся/ться ущему/ти ущему/ть ущемуся/тись ущемуся/ться ущие/ти ущие/ть ущиеся/тись ущиеся/ться ущий/ти ущий/ть ущийся/тись ущийся/ться ущим/ти ущим/ть ущими/ти ущими/ть ущимися/тись ущимися/ться ущимся/тись ущимся/ться ущих/ти ущих/ть ущихся/тись ущихся/ться ущую/ти ущую/ть ущуюся/тись ущуюся/ться ующая/овать ующаяся/оваться ующего/овать ующегося/оваться ующее/овать ующееся/оваться ующей/овать ующейся/оваться ующем/овать ующемся/оваться ующему/овать ующемуся/оваться ующие/овать ующиеся/оваться ующий/овать ующийся/оваться ующим/овать ующими/овать ующимися/оваться ующимся/оваться ующих/овать ующихся/оваться ующую/овать ующуюся/оваться ченная/чь ченного/чь ченное/чь ченной/чь ченном/чь ченному/чь ченную/чь ченные/чь ченный/чь ченным/чь ченными/чь ченных/чь шая/ти шая/ть шаяся/тись шаяся/ться шего/ти шего/ть шегося/тись шегося/ться шее/ти шее/ть шееся/тись шееся/ться шей/ти шей/ть шейся/тись шейся/ться шем/ти шем/ть шемся/тись шемся/ться шему/ти шему/ть шемуся/тись шемуся/ться шие/ти шие/ть шиеся/тись шиеся/ться ший/ти ший/ть шийся/тись шийся/ться шим/ти шим/ть шими/ти шими/ть шимися/тись шимися/ться шимся/тись шимся/ться ших/ти ших/ть шихся/тись шихся/ться шую/ти шую/ть шуюся/тись шуюся/ться ьющая/ить ьющаяся/иться ьющего/ить ьющегося/иться ьющее/ить ьющееся/иться ьющей/ить ьющейся/иться ьющем/ить ьющемся/иться ьющему/ить ьющемуся/иться ьющие/ить ьющиеся/иться ьющий/ить ьющийся/иться ьющим/ить ьющими/ить ьющимися/иться ьющимся/иться ьющих/ить ьющихся/иться ьющую/ить ьющуюся/иться ющая/оть ющая/ти ющая/ть ющаяся/оться ющаяся/тись ющаяся/ться ющего/оть ющего/ти ющего/ть ющегося/оться ющегося/тись ющегося/ться ющее/оть ющее/ти ющее/ть ющееся/оться ющееся/тись ющееся/ться ющей/оть ющей/ти ющей/ть ющейся/оться ющейся/тись ющейся/ться ющем/оть ющем/ти ющем/ть ющемся/оться ющемся/тись ющемся/ться ющему/оть ющему/ти ющему/ть ющемуся/оться ющемуся/тись ющемуся/ться ющие/оть ющие/ти ющие/ть ющиеся/оться ющиеся/тись ющиеся/ться ющий/оть ющий/ти ющий/ть ющийся/оться ющийся/тись ющийся/ться ющим/оть ющим/ти ющим/ть ющими/оть ющими/ти ющими/тись ющими/ть ющимися/оться ющимися/ться ющимся/оться ющимся/тись ющимся/ться ющих/оть ющих/ти ющих/ть ющихся/оться ющихся/тись ющихся/ться ющую/оть ющую/ти ющую/ть ющуюся/оться ющуюся/тись ющуюся/ться юющая/евать юющаяся/еваться юющего/евать юющегося/еваться юющее/евать юющееся/еваться юющей/евать юющейся/еваться юющем/евать юющемся/еваться юющему/евать юющемуся/еваться юющие/евать юющиеся/еваться юющий/евать юющийся/еваться юющим/евать юющими/евать юющими/еваться юющимся/еваться юющих/евать юющихся/еваться юющую/евать юющуюся/еваться ящая/ить ящаяся/иться ящего/ить ящегося/иться ящее/ить ящееся/иться ящей/ить ящейся/иться ящем/ить ящемся/иться ящему/ить ящемуся/иться ящие/ить ящиеся/иться ящий/ить ящийся/иться ящим/ить ящими/ить ящимися/иться ящимся/иться ящих/ить ящихся/иться ящую/ить ящуюся/иться ат/ить ясь/ться ясь/тись ясь/иться вшись/иться ясь/оться овшись/оться уясь/оваться овавшись/оваться юясь/еваться евашись/еваться но/ть на/ть н/ть но/ти на/ти н/ти ны/ть ны/ти ен/ить ено/ить ена/ить ены/ить от/оть ота/оть ото/оть оты/оть ован/овать ована/овать овано/овать ованы/овать еван/евать евана/евать евано/евать еваны/евать нутый/нуть нута/нуть нуто/нуть нуты/нуть нут/нуть нутого/нуть нутому/нуть нутым/нуть нутом/нуть нутое/нуть нутая/нуть нутой/нуть нутую/нуть нутые/нуть нутых/нуть нутыми/нуть чен/чь чена/чь чено/чь чены/чь жен/чь жена/чь жено/чь жены/чь']
|
72
|
+
- [g, '/а а а/о ам ам/а ам/е ам/и ам/о ам/ы ам/ь ами ами/а ами/е ами/и ами/о ами/ы ами/ь ах ах/а ах/е ах/и ах/о ах/ы ах/ь е е/а е/е е/о е/ь е/я ей/а ей/е ей/и ей/ь ей/я ем/е ем/й ем/ь и и/ и/а и/е и/й и/о и/ь и/я й/е й/ь й/я ов ов/и ов/о ой/а ом ом/о у у/а у/о ы ы/а ы/о ь/я ью/е ью/ь ю/е ю/й ю/ь ю/я я/е я/й я/ь ям/е ям/и ям/ь ям/я ями/е ями/и ями/ь ями/я ях/е ях/и ях/ь ях/я']
|
73
|
+
- [e, 'а у ым е ой/а у/а ой/ая ую/ая ей/яя юю/яя ого/ий ому/ий им/ий ом/ий ого/ый ому/ый ым/ый ом/ый ого/ой ому/ой ым/ой ом/ой']
|
74
|
+
- [u, 'а у ом ем е я/й ю/й ем/й и/й и/я ю/я ей/я ы/а е/а у/а ой/а']
|
75
|
+
- [i, 'а у ом е ы ов ам ами ах и енка/енок енку/енок енком/енок енке/енок ята/енок ят/енок ятам/енок ятами/енок ятах/енок я/й ю/й е/й ем/й и/й ев/й ям/й ями/й ях/й я/ь ю/ь ем/ь e/ь и/ь ей/ь ям/ь ями/ь ях/ь ью/ь ы/а е/а у/а ой/а ам/а ами/а ах/а и/а /а и/я е/я ю/я ей/я ь/я ям/я ями/я ях/я й/я ени/я енем/я ена/я ен/я енам/я енами/я енах/я а/о у/о ом/о е/о ам/о ами/о ах/о и/о /о я/е ю/е ем/е и/е й/е ей/е ям/е ями/е ях/е а/е у/е ам/е ами/е ах/е /е /ы ам/ы ами/ы ах/ы /и ов/и ам/и ами/и ах/и ей/и ям/и ями/и ях/и']
|
74
76
|
|
75
77
|
attendees:
|
76
78
|
variator:
|
77
79
|
variations:
|
78
|
-
- [
|
79
|
-
- [
|
80
|
-
- [
|
81
|
-
- [
|
82
|
-
- [
|
83
|
-
- [
|
84
|
-
- [
|
85
|
-
- [
|
86
|
-
- [
|
87
|
-
- [
|
88
|
-
- [
|
89
|
-
- [
|
90
|
-
- [
|
91
|
-
- [
|
92
|
-
- [
|
93
|
-
- [
|
94
|
-
- [
|
95
|
-
- [
|
96
|
-
- [
|
80
|
+
- [ieh, sch]
|
81
|
+
- [fec, see]
|
82
|
+
- [it, st ]
|
83
|
+
- [fch, sch]
|
84
|
+
- [fp, sp ]
|
85
|
+
- [f, s ]
|
86
|
+
- [c, e ]
|
87
|
+
- [ffc, sse]
|
88
|
+
- [ff, ss ]
|
89
|
+
- [e, c ]
|
90
|
+
- [ni, m ]
|
91
|
+
- [feh, sch]
|
92
|
+
- [lt, st ]
|
93
|
+
- [il, st ]
|
94
|
+
- [ftc, ste]
|
95
|
+
- [ft, st ]
|
96
|
+
- [fl, st ]
|
97
|
+
- [li, h ]
|
98
|
+
- [i, s ]
|
97
99
|
|
98
100
|
sequencer:
|
99
|
-
sequences: [ [AS,
|
101
|
+
sequences: [ [SS, '1 2'], [AS, '2, 1'], [AI, '2, 1'], [ASS, '2 3, 1'], [AAS, '3, 1 2'], [AAI, '3, 1 2'] ]
|
data/spec/spec_helper.rb
CHANGED
@@ -13,8 +13,8 @@ class TestAttendeeDecomposer < AttendeeTestCase
|
|
13
13
|
wd('Kompositumzerlegung|?')
|
14
14
|
], [
|
15
15
|
wd('Kleinseite|KOM', 'kleinseite|k', 'klein|a+', 'seite|s+'),
|
16
|
-
wd('Arrafat-Nachfolger|KOM', 'arrafat-nachfolger|k', '
|
17
|
-
wd('Afganistan-Reisen|KOM', 'afganistan-
|
16
|
+
wd('Arrafat-Nachfolger|KOM', 'arrafat-nachfolger|k', 'arrafat|x+', 'nachfolger|s+'),
|
17
|
+
wd('Afganistan-Reisen|KOM', 'afganistan-reisen|k', 'afganistan|x+', 'reisen|v+', 'reise|s+'),
|
18
18
|
wd('Kompositumzerlegung|KOM', 'kompositumzerlegung|k', 'kompositum|s+', 'zerlegung|s+'),
|
19
19
|
wd('Kompositumzerlegung|KOM', 'kompositumzerlegung|k', 'kompositum|s+', 'zerlegung|s+')
|
20
20
|
])
|
@@ -5,7 +5,7 @@ require_relative '../test_helper'
|
|
5
5
|
class TestAttendeeSynonymer < AttendeeTestCase
|
6
6
|
|
7
7
|
def test_basic
|
8
|
-
meet({ 'source' => 'sys-syn'
|
8
|
+
meet({ 'source' => 'sys-syn' }, [
|
9
9
|
wd('abtastzeiten|IDF', 'abtastzeit|s')
|
10
10
|
], [
|
11
11
|
wd('abtastzeiten|IDF', 'abtastzeit|s', 'abtastfrequenz|y', 'abtastperiode|y')
|
@@ -13,7 +13,7 @@ class TestAttendeeSynonymer < AttendeeTestCase
|
|
13
13
|
end
|
14
14
|
|
15
15
|
def test_first
|
16
|
-
meet({ 'source' => 'sys-syn,tst-syn', '
|
16
|
+
meet({ 'source' => 'sys-syn,tst-syn', 'mode' => 'first' }, [
|
17
17
|
wd('Aktienanleihe|IDF', 'aktienanleihe|s')
|
18
18
|
], [
|
19
19
|
wd('Aktienanleihe|IDF', 'aktienanleihe|s', 'aktien-anleihe|y', 'reverse convertible bond|y', 'reverse convertibles|y')
|
@@ -21,7 +21,7 @@ class TestAttendeeSynonymer < AttendeeTestCase
|
|
21
21
|
end
|
22
22
|
|
23
23
|
def test_all
|
24
|
-
meet({ 'source' => 'sys-syn,tst-syn', '
|
24
|
+
meet({ 'source' => 'sys-syn,tst-syn', 'mode' => 'all' }, [
|
25
25
|
wd('Kerlchen|IDF', 'kerlchen|s')
|
26
26
|
], [
|
27
27
|
wd('Kerlchen|IDF', 'kerlchen|s', 'kerlchen|y', 'zwerg-nase|y')
|
@@ -2,9 +2,28 @@
|
|
2
2
|
|
3
3
|
class TestAttendeeTokenizer < AttendeeTestCase
|
4
4
|
|
5
|
+
def setup
|
6
|
+
@wiki = [
|
7
|
+
'Test [[Link|internal link]] and [http://example.com external link].',
|
8
|
+
'Try __MAGIC__ with [[Multiline',
|
9
|
+
'link (because we can)]].',
|
10
|
+
'[[Category:cat1]]',
|
11
|
+
'Link to [[:Category:cat2]].',
|
12
|
+
'== Heading ==',
|
13
|
+
'{{Template}}',
|
14
|
+
'Function with {{#func|param|{{{var}}}}} and <nowiki>{{{var}}}</nowiki>!',
|
15
|
+
'{{Multi',
|
16
|
+
' | line=1',
|
17
|
+
' | [[link]]',
|
18
|
+
' | {{{var}}}',
|
19
|
+
'',
|
20
|
+
'}}'
|
21
|
+
]
|
22
|
+
end
|
23
|
+
|
5
24
|
def test_basic
|
6
25
|
meet({}, [
|
7
|
-
|
26
|
+
'Dies ist ein Test.'
|
8
27
|
], [
|
9
28
|
tk('Dies|WORD'), tk('ist|WORD'), tk('ein|WORD'), tk('Test|WORD'), tk('.|PUNC')
|
10
29
|
])
|
@@ -12,7 +31,7 @@ class TestAttendeeTokenizer < AttendeeTestCase
|
|
12
31
|
|
13
32
|
def test_complex
|
14
33
|
meet({}, [
|
15
|
-
|
34
|
+
'1964 www.vorhauer.de bzw. nasenbär, ()'
|
16
35
|
], [
|
17
36
|
tk('1964|NUMS'),
|
18
37
|
tk('www.vorhauer.de|URLS'),
|
@@ -25,4 +44,198 @@ class TestAttendeeTokenizer < AttendeeTestCase
|
|
25
44
|
])
|
26
45
|
end
|
27
46
|
|
47
|
+
def test_wiki1
|
48
|
+
meet({}, @wiki, [
|
49
|
+
tk('Test|WORD'),
|
50
|
+
tk('[|OTHR'),
|
51
|
+
tk('[|OTHR'),
|
52
|
+
tk('Link|WORD'),
|
53
|
+
tk('||OTHR'),
|
54
|
+
tk('internal|WORD'),
|
55
|
+
tk('link|WORD'),
|
56
|
+
tk(']|OTHR'),
|
57
|
+
tk(']|OTHR'),
|
58
|
+
tk('and|WORD'),
|
59
|
+
tk('[|OTHR'),
|
60
|
+
tk('http://example.com|URLS'),
|
61
|
+
tk('external|WORD'),
|
62
|
+
tk('link|WORD'),
|
63
|
+
tk(']|OTHR'),
|
64
|
+
tk('.|PUNC'),
|
65
|
+
tk('Try|WORD'),
|
66
|
+
tk('_|OTHR'),
|
67
|
+
tk('_|OTHR'),
|
68
|
+
tk('MAGIC|WORD'),
|
69
|
+
tk('_|OTHR'),
|
70
|
+
tk('_|OTHR'),
|
71
|
+
tk('with|WORD'),
|
72
|
+
tk('[|OTHR'),
|
73
|
+
tk('[|OTHR'),
|
74
|
+
tk('Multiline|WORD'),
|
75
|
+
tk('link|WORD'),
|
76
|
+
tk('(|OTHR'),
|
77
|
+
tk('because|WORD'),
|
78
|
+
tk('we|WORD'),
|
79
|
+
tk('can|WORD'),
|
80
|
+
tk(')|OTHR'),
|
81
|
+
tk(']|OTHR'),
|
82
|
+
tk(']|OTHR'),
|
83
|
+
tk('.|PUNC'),
|
84
|
+
tk('[|OTHR'),
|
85
|
+
tk('[|OTHR'),
|
86
|
+
tk('Category|WORD'),
|
87
|
+
tk(':|PUNC'),
|
88
|
+
tk('cat1|WORD'),
|
89
|
+
tk(']|OTHR'),
|
90
|
+
tk(']|OTHR'),
|
91
|
+
tk('Link|WORD'),
|
92
|
+
tk('to|WORD'),
|
93
|
+
tk('[|OTHR'),
|
94
|
+
tk('[|OTHR'),
|
95
|
+
tk(':|PUNC'),
|
96
|
+
tk('Category|WORD'),
|
97
|
+
tk(':|PUNC'),
|
98
|
+
tk('cat2|WORD'),
|
99
|
+
tk(']|OTHR'),
|
100
|
+
tk(']|OTHR'),
|
101
|
+
tk('.|PUNC'),
|
102
|
+
tk('=|OTHR'),
|
103
|
+
tk('=|OTHR'),
|
104
|
+
tk('Heading|WORD'),
|
105
|
+
tk('=|OTHR'),
|
106
|
+
tk('=|OTHR'),
|
107
|
+
tk('{|OTHR'),
|
108
|
+
tk('{|OTHR'),
|
109
|
+
tk('Template|WORD'),
|
110
|
+
tk('}|OTHR'),
|
111
|
+
tk('}|OTHR'),
|
112
|
+
tk('Function|WORD'),
|
113
|
+
tk('with|WORD'),
|
114
|
+
tk('{|OTHR'),
|
115
|
+
tk('{|OTHR'),
|
116
|
+
tk('#|OTHR'),
|
117
|
+
tk('func|WORD'),
|
118
|
+
tk('||OTHR'),
|
119
|
+
tk('param|WORD'),
|
120
|
+
tk('||OTHR'),
|
121
|
+
tk('{|OTHR'),
|
122
|
+
tk('{|OTHR'),
|
123
|
+
tk('{|OTHR'),
|
124
|
+
tk('var|WORD'),
|
125
|
+
tk('}|OTHR'),
|
126
|
+
tk('}|OTHR'),
|
127
|
+
tk('}|OTHR'),
|
128
|
+
tk('}|OTHR'),
|
129
|
+
tk('}|OTHR'),
|
130
|
+
tk('and|WORD'),
|
131
|
+
tk('<|OTHR'),
|
132
|
+
tk('nowiki|WORD'),
|
133
|
+
tk('>|OTHR'),
|
134
|
+
tk('{|OTHR'),
|
135
|
+
tk('{|OTHR'),
|
136
|
+
tk('{|OTHR'),
|
137
|
+
tk('var|WORD'),
|
138
|
+
tk('}|OTHR'),
|
139
|
+
tk('}|OTHR'),
|
140
|
+
tk('}|OTHR'),
|
141
|
+
tk('<|OTHR'),
|
142
|
+
tk('/|OTHR'),
|
143
|
+
tk('nowiki|WORD'),
|
144
|
+
tk('>|OTHR'),
|
145
|
+
tk('!|PUNC'),
|
146
|
+
tk('{|OTHR'),
|
147
|
+
tk('{|OTHR'),
|
148
|
+
tk('Multi|WORD'),
|
149
|
+
tk('||OTHR'),
|
150
|
+
tk('line|WORD'),
|
151
|
+
tk('=|OTHR'),
|
152
|
+
tk('1|NUMS'),
|
153
|
+
tk('||OTHR'),
|
154
|
+
tk('[|OTHR'),
|
155
|
+
tk('[|OTHR'),
|
156
|
+
tk('link|WORD'),
|
157
|
+
tk(']|OTHR'),
|
158
|
+
tk(']|OTHR'),
|
159
|
+
tk('||OTHR'),
|
160
|
+
tk('{|OTHR'),
|
161
|
+
tk('{|OTHR'),
|
162
|
+
tk('{|OTHR'),
|
163
|
+
tk('var|WORD'),
|
164
|
+
tk('}|OTHR'),
|
165
|
+
tk('}|OTHR'),
|
166
|
+
tk('}|OTHR'),
|
167
|
+
tk('}|OTHR'),
|
168
|
+
tk('}|OTHR')
|
169
|
+
])
|
170
|
+
end
|
171
|
+
|
172
|
+
def test_wiki2
|
173
|
+
meet({ 'space' => true, 'tags' => true, 'wiki' => true }, @wiki, [
|
174
|
+
tk('Test|WORD'),
|
175
|
+
tk(' |SPAC'),
|
176
|
+
tk('[[|WIKI'),
|
177
|
+
tk('Link|internal link]]|WIKI'),
|
178
|
+
tk(' |SPAC'),
|
179
|
+
tk('and|WORD'),
|
180
|
+
tk(' |SPAC'),
|
181
|
+
tk('[http://|WIKI'),
|
182
|
+
tk('example.com external link]|WIKI'),
|
183
|
+
tk('.|PUNC'),
|
184
|
+
tk('Try|WORD'),
|
185
|
+
tk(' |SPAC'),
|
186
|
+
tk('__MAGIC__|WIKI'),
|
187
|
+
tk(' |SPAC'),
|
188
|
+
tk('with|WORD'),
|
189
|
+
tk(' |SPAC'),
|
190
|
+
tk('[[|WIKI'),
|
191
|
+
tk('Multiline|WIKI'),
|
192
|
+
tk('link (because we can)]]|WIKI'),
|
193
|
+
tk('.|PUNC'),
|
194
|
+
tk('[[|WIKI'),
|
195
|
+
tk('Category:cat1]]|WIKI'),
|
196
|
+
tk('Link|WORD'),
|
197
|
+
tk(' |SPAC'),
|
198
|
+
tk('to|WORD'),
|
199
|
+
tk(' |SPAC'),
|
200
|
+
tk('[[|WIKI'),
|
201
|
+
tk(':Category:cat2]]|WIKI'),
|
202
|
+
tk('.|PUNC'),
|
203
|
+
tk('== Heading ==|WIKI'),
|
204
|
+
tk('{{|WIKI'),
|
205
|
+
tk('Template}}|WIKI'),
|
206
|
+
tk('Function|WORD'),
|
207
|
+
tk(' |SPAC'),
|
208
|
+
tk('with|WORD'),
|
209
|
+
tk(' |SPAC'),
|
210
|
+
tk('{{|WIKI'),
|
211
|
+
tk('#func|param||WIKI'),
|
212
|
+
tk('{{{|WIKI'),
|
213
|
+
tk('var}}}|WIKI'),
|
214
|
+
tk('}}|WIKI'),
|
215
|
+
tk(' |SPAC'),
|
216
|
+
tk('and|WORD'),
|
217
|
+
tk(' |SPAC'),
|
218
|
+
tk('<|HTML'),
|
219
|
+
tk('nowiki>|HTML'),
|
220
|
+
tk('{{{|WIKI'),
|
221
|
+
tk('var}}}|WIKI'),
|
222
|
+
tk('<|HTML'),
|
223
|
+
tk('/nowiki>|HTML'),
|
224
|
+
tk('!|PUNC'),
|
225
|
+
tk('{{|WIKI'),
|
226
|
+
tk('Multi|WIKI'),
|
227
|
+
tk(' | line=1|WIKI'),
|
228
|
+
tk(' | |WIKI'),
|
229
|
+
tk('[[|WIKI'),
|
230
|
+
tk('link]]|WIKI'),
|
231
|
+
tk('|WIKI'),
|
232
|
+
tk(' | |WIKI'),
|
233
|
+
tk('{{{|WIKI'),
|
234
|
+
tk('var}}}|WIKI'),
|
235
|
+
tk('|WIKI'),
|
236
|
+
tk('|WIKI'),
|
237
|
+
tk('}}|WIKI')
|
238
|
+
])
|
239
|
+
end
|
240
|
+
|
28
241
|
end
|
@@ -8,9 +8,9 @@ class TestAttendeeVariator < AttendeeTestCase
|
|
8
8
|
meet({ 'source' => 'sys-dic' }, [
|
9
9
|
wd('fchwarz|?'), wd('fchilling|?'), wd('iehwarzfchilling|?'), wd('fchiiiirg|?')
|
10
10
|
], [
|
11
|
-
wd('*schwarz|IDF', 'schwarz|
|
11
|
+
wd('*schwarz|IDF', 'schwarz|a', 'schwarz|s'),
|
12
12
|
wd('*schilling|IDF', 'schilling|s'),
|
13
|
-
wd('*schwarzschilling|KOM', 'schwarzschilling|k', 'schwarz|a+', '
|
13
|
+
wd('*schwarzschilling|KOM', 'schwarzschilling|k', 'schwarz|a+', 'schwarz|s+', 'schilling|s+'),
|
14
14
|
wd('fchiiiirg|?')
|
15
15
|
])
|
16
16
|
end
|
@@ -10,7 +10,7 @@ class TestAttendeeWordSearcher < AttendeeTestCase
|
|
10
10
|
], [
|
11
11
|
wd('Dies|IDF', 'dies|w'),
|
12
12
|
wd('ist|IDF', 'sein|v'),
|
13
|
-
wd('ein|IDF', '
|
13
|
+
wd('ein|IDF', 'ein|w', 'einen|v'),
|
14
14
|
wd('Test|IDF', 'test|s', 'testen|v'),
|
15
15
|
tk('.|PUNC'),
|
16
16
|
ai('EOL|')
|
@@ -23,7 +23,7 @@ class TestAttendeeWordSearcher < AttendeeTestCase
|
|
23
23
|
], [
|
24
24
|
wd('Dies|IDF', 'dies|w'),
|
25
25
|
wd('ist|IDF', 'sein|v'),
|
26
|
-
wd('ein|IDF', '
|
26
|
+
wd('ein|IDF', 'ein|w', 'einen|v'),
|
27
27
|
wd('Test|IDF', 'test|s', 'testen|v'),
|
28
28
|
tk('.|PUNC'),
|
29
29
|
ai('EOL|')
|
@@ -41,7 +41,7 @@ class TestAttendeeWordSearcher < AttendeeTestCase
|
|
41
41
|
wd('Hasennasen|?'),
|
42
42
|
wd('Knaller|IDF', 'knaller|s'),
|
43
43
|
wd('Lex-Lingo|IDF', 'super indexierungssystem|m'),
|
44
|
-
wd('A-Dur|IDF', 'a-dur|s'),
|
44
|
+
wd('A-Dur|IDF', 'a-dur|s|m', 'a-dur|s|n'),
|
45
45
|
ai('EOL|')
|
46
46
|
])
|
47
47
|
end
|
@@ -73,23 +73,27 @@ class TestAttendeeWordSearcher < AttendeeTestCase
|
|
73
73
|
wd('Hasennasen|?'),
|
74
74
|
wd('Knaller|IDF', 'knaller|s'),
|
75
75
|
wd('Lex-Lingo|IDF', 'super indexierungssystem|m'),
|
76
|
-
wd('A-Dur|IDF', 'a-dur|s', 'b-dur|s'),
|
76
|
+
wd('A-Dur|IDF', 'a-dur|s|m', 'a-dur|s|n', 'b-dur|s'),
|
77
77
|
ai('EOL|')
|
78
78
|
])
|
79
79
|
end
|
80
80
|
|
81
|
-
def
|
81
|
+
def test_select_two_sources_mode_default
|
82
82
|
meet({ 'source' => 'sys-dic,tst-dic' }, [
|
83
83
|
tk('Hasennasen|WORD'),
|
84
84
|
tk('Knaller|WORD'),
|
85
85
|
tk('Lex-Lingo|WORD'),
|
86
86
|
tk('A-Dur|WORD'),
|
87
|
+
tk('Wirkungsort|WORD'),
|
88
|
+
tk('Zettelkatalog|WORD'),
|
87
89
|
ai('EOL|')
|
88
90
|
], [
|
89
91
|
wd('Hasennasen|?'),
|
90
92
|
wd('Knaller|IDF', 'knaller|s'),
|
91
93
|
wd('Lex-Lingo|IDF', 'super indexierungssystem|m'),
|
92
|
-
wd('A-Dur|IDF', 'a-dur|s', 'b-dur|s'),
|
94
|
+
wd('A-Dur|IDF', 'a-dur|s|m', 'a-dur|s|n', 'b-dur|s'),
|
95
|
+
wd('Wirkungsort|IDF', 'wirkungsort|s', 'wirkung|s+', 'ort|s+'),
|
96
|
+
wd('Zettelkatalog|KOM', 'zettelkatalog|k', 'zettel|s+', 'katalog|s+'),
|
93
97
|
ai('EOL|')
|
94
98
|
])
|
95
99
|
end
|
data/test/ref/artikel.seq
CHANGED
@@ -139,7 +139,7 @@
|
|
139
139
|
1 instrument, nützlich
|
140
140
|
1 instrument, zentral gepflegt
|
141
141
|
1 katalogmerkmal, typisch
|
142
|
-
1
|
142
|
+
1 katalogorientiert, allen
|
143
143
|
1 kategorie, allen
|
144
144
|
1 klassifikation, existierend
|
145
145
|
1 kollektion, charakterisiert
|
@@ -272,4 +272,4 @@
|
|
272
272
|
1 zuteilung, lexikalisch
|
273
273
|
1 zuweisung, getrennt
|
274
274
|
1 zuweisungsverfahren, basiert
|
275
|
-
1 zuweisungsverfahren, statistisch basiert
|
275
|
+
1 zuweisungsverfahren, statistisch basiert
|
data/test/ref/artikel.vec
CHANGED
@@ -48,7 +48,7 @@ anwachsen
|
|
48
48
|
anwendung
|
49
49
|
anwendungsbereich
|
50
50
|
arbeitend
|
51
|
-
|
51
|
+
arbeitsaufwändig
|
52
52
|
arbeitspapier
|
53
53
|
artist
|
54
54
|
aspekt
|
@@ -446,7 +446,7 @@ katalogbrüche
|
|
446
446
|
katalogfunktion
|
447
447
|
katalogmerkmal
|
448
448
|
katalogmodell
|
449
|
-
|
449
|
+
katalogorientiert
|
450
450
|
katalogumgebung
|
451
451
|
kategorie
|
452
452
|
kenntnis
|
@@ -647,7 +647,7 @@ retrievalfähigkeit
|
|
647
647
|
retrievalgründen
|
648
648
|
retrievalinstrument
|
649
649
|
retrievalmöglichkeit
|
650
|
-
|
650
|
+
retrievalorientiert
|
651
651
|
retrievalsituation
|
652
652
|
retrievalsystem
|
653
653
|
retrievaltauglich
|
@@ -736,7 +736,7 @@ suchindex
|
|
736
736
|
suchkonstellation
|
737
737
|
suchmaschine
|
738
738
|
suchmöglichkeit
|
739
|
-
|
739
|
+
suchszenarium
|
740
740
|
synonym
|
741
741
|
synonymbeziehung
|
742
742
|
system
|
@@ -940,4 +940,4 @@ zweitausendeins
|
|
940
940
|
öl
|
941
941
|
überblick
|
942
942
|
überspitzen
|
943
|
-
überspitzt
|
943
|
+
überspitzt
|