lingo 1.8.4.2 → 1.8.5

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (89) hide show
  1. checksums.yaml +4 -4
  2. data/ChangeLog +413 -325
  3. data/README +380 -131
  4. data/Rakefile +19 -21
  5. data/de/lingo-abk.txt +15 -17
  6. data/de/lingo-dic.txt +20210 -20659
  7. data/de/lingo-mul.txt +5 -13
  8. data/de/lingo-syn.txt +5 -8
  9. data/de/test_dic.txt +2 -0
  10. data/de/test_gen.txt +8 -0
  11. data/de/{test_mul2.txt → test_mu2.txt} +0 -0
  12. data/de/{test_singleword.txt → test_sgw.txt} +0 -0
  13. data/de/user-dic.txt +5 -7
  14. data/de.lang +64 -49
  15. data/en/lingo-dic.txt +6398 -6404
  16. data/en/lingo-irr.txt +2 -3
  17. data/en/lingo-mul.txt +6 -7
  18. data/en/lingo-wdn.txt +881 -1762
  19. data/en/user-dic.txt +2 -5
  20. data/en.lang +39 -39
  21. data/lib/lingo/app.rb +10 -6
  22. data/lib/lingo/attendee/abbreviator.rb +1 -0
  23. data/lib/lingo/attendee/decomposer.rb +2 -1
  24. data/lib/lingo/attendee/multi_worder.rb +5 -6
  25. data/lib/lingo/attendee/stemmer.rb +1 -1
  26. data/lib/lingo/attendee/synonymer.rb +4 -2
  27. data/lib/lingo/attendee/text_reader.rb +77 -57
  28. data/lib/lingo/attendee/text_writer.rb +1 -1
  29. data/lib/lingo/attendee/tokenizer.rb +101 -50
  30. data/lib/lingo/attendee/variator.rb +2 -1
  31. data/lib/lingo/attendee/vector_filter.rb +28 -6
  32. data/lib/lingo/attendee/word_searcher.rb +2 -1
  33. data/lib/lingo/attendee.rb +8 -4
  34. data/lib/lingo/call.rb +7 -3
  35. data/lib/lingo/cli.rb +8 -16
  36. data/lib/lingo/config.rb +11 -6
  37. data/lib/lingo/ctl.rb +54 -3
  38. data/lib/lingo/database/crypter.rb +8 -14
  39. data/lib/lingo/database/hash_store.rb +1 -1
  40. data/lib/lingo/database/{show_progress.rb → progress.rb} +7 -8
  41. data/lib/lingo/database/source/key_value.rb +6 -5
  42. data/lib/lingo/database/source/multi_key.rb +5 -2
  43. data/lib/lingo/database/source/multi_value.rb +6 -4
  44. data/lib/lingo/database/source/single_word.rb +2 -3
  45. data/lib/lingo/database/source/word_class.rb +24 -5
  46. data/lib/lingo/database/source.rb +5 -3
  47. data/lib/lingo/database.rb +102 -41
  48. data/lib/lingo/error.rb +24 -2
  49. data/lib/lingo/language/dictionary.rb +26 -54
  50. data/lib/lingo/language/grammar.rb +19 -23
  51. data/lib/lingo/language/lexical.rb +5 -1
  52. data/lib/lingo/language/lexical_hash.rb +7 -12
  53. data/lib/lingo/language/token.rb +10 -1
  54. data/lib/lingo/language/word.rb +35 -23
  55. data/lib/lingo/language/word_form.rb +5 -4
  56. data/lib/lingo/{show_progress.rb → progress.rb} +43 -30
  57. data/lib/lingo/srv/lingosrv.cfg +1 -1
  58. data/lib/lingo/srv/public/.gitkeep +0 -0
  59. data/lib/lingo/srv.rb +11 -6
  60. data/lib/lingo/version.rb +2 -2
  61. data/lib/lingo/web/lingoweb.cfg +1 -1
  62. data/lib/lingo/web/views/index.erb +4 -4
  63. data/lib/lingo/web.rb +4 -6
  64. data/lib/lingo.rb +4 -12
  65. data/lingo.cfg +1 -1
  66. data/lir.cfg +1 -1
  67. data/ru/lingo-dic.txt +33473 -2113
  68. data/ru/lingo-mul.txt +8430 -1913
  69. data/ru/lingo-syn.txt +1634 -0
  70. data/ru/user-dic.txt +6 -0
  71. data/ru.lang +49 -47
  72. data/spec/spec_helper.rb +4 -0
  73. data/test/attendee/ts_decomposer.rb +2 -2
  74. data/test/attendee/ts_synonymer.rb +3 -3
  75. data/test/attendee/ts_tokenizer.rb +215 -2
  76. data/test/attendee/ts_variator.rb +2 -2
  77. data/test/attendee/ts_word_searcher.rb +10 -6
  78. data/test/ref/artikel.seq +2 -2
  79. data/test/ref/artikel.vec +5 -5
  80. data/test/ref/artikel.ven +11 -11
  81. data/test/ref/artikel.ver +11 -11
  82. data/test/ref/lir.seq +13 -13
  83. data/test/ref/lir.vec +31 -31
  84. data/test/test_helper.rb +19 -5
  85. data/test/ts_database.rb +206 -77
  86. data/test/ts_language.rb +86 -26
  87. metadata +93 -49
  88. data/.rspec +0 -1
  89. data/de/test_syn2.txt +0 -1
data/ru/user-dic.txt ADDED
@@ -0,0 +1,6 @@
1
+ # Musterwörterbuch user-dic.txt als Vorlage
2
+ # für eigene Benutzerwörterbücher
3
+
4
+ хлеб=хлеб #s
5
+ сыр=сыр #s
6
+ спать=спать #v
data/ru.lang CHANGED
@@ -1,8 +1,8 @@
1
- #------------------------------------------------------------------------------------------------------------------------------------
1
+ #------------------------------------------------------------------------------------------------------------------------------------
2
2
  #
3
3
  # database-Section - Definitionen für Wörterbücher
4
4
  #
5
- # In der database-Section können alle benötigten Wörterbücher angegeben werden.
5
+ # In der database-Section können alle benötigten Wörterbücher angegeben werden.
6
6
  # Dabei werden folgende Attribute interpretiert:
7
7
  #
8
8
  # Attribut Default Bedeutung
@@ -12,7 +12,7 @@
12
12
  #
13
13
  # name Gibt den Ort der Quelldaten an.
14
14
  #
15
- # def-wc ? Gibt eine Wortklasse vor die verwendet wird, wenn die Datenquelle über keine adäquate Information zur
15
+ # def-wc ? Gibt eine Wortklasse vor die verwendet wird, wenn die Datenquelle über keine adäquate Information zur
16
16
  # Wortklasse eines Eintrags verfügt.
17
17
  #
18
18
  # txt-format KeyValue Gibt an, in welchem Format die Quelldaten je Zeile vorliegen. Dabei wird unterschieden zwischen
@@ -27,73 +27,75 @@
27
27
  # "Fax;Faxkopie;Telefax\n"
28
28
  # MultiKey
29
29
  #
30
- # separator (s.Text) Gibt an, durch welches Zeichen eine Textzeile die Grundform von der Projektion trennt. Der Defaultwert ist
30
+ # separator (s.Text) Gibt an, durch welches Zeichen eine Textzeile die Grundform von der Projektion trennt. Der Defaultwert ist
31
31
  # abhängig vom Text-Format: KeyValue='*', WordClass=',' und MultiValue=';'.
32
32
  #
33
33
  # use-lex Gibt an, dass bei Mehrwort-Schlüsseln eine Vorab-Lexikalisierung vorgenommen wird durch Zuhilfenahme der
34
- # Wörterbücher, die mit diesem Attribut angegeben werden, z.B. use-lex='sys-dic'.
35
- # Die Vorab-Lexikalisierung von Mehrwortgruppen ermöglicht die leichte Erkennung von allen möglichen
34
+ # Wörterbücher, die mit diesem Attribut angegeben werden, z.B. use-lex='sys-dic'.
35
+ # Die Vorab-Lexikalisierung von Mehrwortgruppen ermöglicht die leichte Erkennung von allen möglichen
36
36
  # Dehnungsvarianten. Bei Mehrwort-Wörterbüchern, die ausschließlich Personennamen enthalten, kann dieser Wert
37
37
  # entfallen, da er nur die Verarbeitungsgeschwindigkeit vermindert ohne die Erkennungsquote zu erhöhen.
38
38
  #
39
- # ACHTUNG: Wird mit dem Attribut use-lex ein anderes Wörterbuch referenziert, so sollte dieses VOR der ersten Referenzierung
39
+ # ACHTUNG: Wird mit dem Attribut use-lex ein anderes Wörterbuch referenziert, so sollte dieses VOR der ersten Referenzierung
40
40
  # definiert sein, da es sonst noch nicht existiert!
41
41
  #
42
42
 
43
- # lingo language definition
44
- ---
43
+ ---
45
44
  language:
46
45
  name: 'Russisch'
47
46
 
48
47
  dictionary:
49
48
  databases:
50
- # Systemwörterbücher
49
+ # System dictionaries
51
50
  sys-dic: { name: ru/lingo-dic.txt, txt-format: WordClass, separator: '=' }
52
- sys-syn: { name: ru/lingo-syn.txt, txt-format: KeyValue, separator: '=', def-wc: y }
53
- sys-mul: { name: ru/lingo-mul.txt, txt-format: SingleWord, use-lex: 'sys-dic', def-wc: m }
54
- # Benutzerwörterbücher
55
- usr-dic: { name: ru/user-dic.txt, txt-format: WordClass, separator: '=' }
51
+ sys-syn: { name: ru/lingo-syn.txt, txt-format: KeyValue, separator: '=', def-wc: y }
52
+ sys-mul: { name: ru/lingo-mul.txt, txt-format: SingleWord, use-lex: sys-dic, def-wc: m }
53
+
54
+ # User dictionaries
55
+ usr-dic: { name: ru/user-dic.txt, txt-format: WordClass, separator: '=' }
56
56
 
57
57
  compound:
58
- min-word-size: "7"
59
- min-part-size: "3"
60
- max-parts: "5"
61
- min-avg-part-size: "4"
62
- append-wordclass: "+"
58
+ min-word-size: '7'
59
+ min-part-size: '3'
60
+ max-parts: '5'
61
+ min-avg-part-size: '4'
62
+ append-wordclass: '+'
63
63
  skip-sequences: [ xx ]
64
64
 
65
65
  suffix:
66
- # Suffixliste, Stand: 07-09-2012
67
- # Suffixklasse: s = Substantiv, a = Adjektiv, v = Verb, e = Eigenwort, f = Fugung
68
- # Suffixe je Klasse: "<suffix>['/'<ersetzung>][ <suffix>['/'<ersetzung>]]"
69
- - [s, "а у ом е ы ов ам ами ах и енка/енок енку/енок енком/енок енке/енок ята/енок ят/енок ятам/енок ятами/енок ятах/енок я/й ю/й е/й ем/й и/й ев/й ям/й ями/й ях/й я/ь ю/ь ем/ь е/ь и/ь ей/ь ям/ь ями/ь ях/ь ью/ь ы/а е/а у/а ой/а ам/а ами/а ах/а и/а /а и/я е/я ю/я ей/я ь/я ям/я ями/я ях/я й/я ени/я енем/я ена/я ен/я енам/я енами/я енах/я а/о у/о ом/о е/о ам/о ами/о ах/о и/о /о я/е ю/е ем/е и/е й/е ей/е ям/е ями/е ях/е а/е у/е ам/е ами/е ах/е /е"]
70
- - [a, "ого/ый ому/ый ым/ый ом/ый ая/ый ой/ый ую/ый ое/ый ые/ый ых/ый ыми/ый а/ый о/ый ы/ый ее/ый им/ый ие/ый их/ый ими/ый ейший/ый ейшего/ый ейшему/ый ейшим/ый ейшем/ый ейшие/ый ейших/ый ейшими/ый ого/ой ому/ой ым/ой ом/ой ая/ой ую/ой ое/ой ые/ой ых/ой ыми/ой а/ой о/ой ы/ой ее/ой им/ой ие/ой их/ой ими/ой ейший/ой ейшего/ой ейшему/ой ейшим/ой ейшем/ой ейшие/ой ейших/ой ейшими/ой его/ий ему/ий им/ий ем/ий ее/ий яя/ий ей/ий юю/ий ие/ий их/ий им/ий ими/ий ого/ий ому/ий ым/ий ом/ий ая/ий ой/ий ую/ий ое/ий ые/ий ых/ий ым/ий ыми/ий а/ий о/ий ы/ий ейший/ий ейшего/ий ейшему/ий ейшим/ий ейшем/ий ейшие/ий ейших/ий ейшими/ий"]
71
- - [v, "у/ть ю/ть ешь/ть ет/ть ем/ть ете/ть ют/ть л/ть ла/ть ло/ть ли/ть й/ть йте/ть я/ть в/ть ут/ти у/ти ю/ти ешь/ти ет/ти ем/ти ете/ти ют/ти л/ти ла/ти ло/ти ли/ти й/ти йте/ти я/ти в/ти ут/ти усь/ться юсь/ться ешься/ться ется/ться емся/ться етесь/ться ются/ться лся/ться лась/ться лось/ться лись/ться йся/ться йтесь/ться усь/тись юсь/тись ешься/тись ется/тись емся/тись етесь/тись утся/тись ются/тись лся/тись лась/тись лось/тись лись/тись ись/тись итесь/тись ю/ить ишь/ить ит/ить им/ить ите/ить ят/ить ил/ить ила/ить ило/ить или/ить й/ить йте/ить ью/ить ьешь/ить ьет/ить ьем/ить ьете/ить ьют/ить ей/ить ейте/ить я/ить ив/ить юсь/иться ишься/иться ится/иться имся/иться итесь/иться ятся/иться ился/иться илась/иться илось/иться ились/иться йся/иться йтесь/иться ьюсь/иться ьешься/иться ьется/иться ьемся/иться ьетесь/иться ьются/иться ейся/иться ейтесь/иться ю/оть ешь/оть ет/оть ем/оть ете/оть ют/оть л/оть ла/оть ло/оть ли/оть й/оть йте/оть я/оть ов/оть юсь/оться ешься/оться ется/оться емся/оться етесь/оться ются/оться лся/оться лась/оться лось/оться лись/оться ись/оться итесь/оться ую/овать уешь/овать ует/овать уем/овать уете/овать уют/овать овал/овать овала/овать овало/овать овали/овать уй/овать уйте/овать уя/овать овав/овать уюсь/оваться уешься/оваться уется/оваться уемся/оваться уетесь/оваться уются/оваться овался/оваться овалась/оваться овалось/оваться овались/оваться уйся/оваться уйтесь/оваться юю/евать юешь/евать юет/евать юем/евать юете/евать юют/евать евал/евать евала/евать евало/евать евали/евать юй/евать юйте/евать юя/евать евав/евать ююсь/еваться юешься/еваться юется/еваться юемся/еваться юетесь/еваться ются/еваться евался/еваться евалась/еваться евалось/еваться евались/еваться юйся/еваться юйтесь/еваться ну/нуть нешь/нуть нет/нуть нем/нуть нете/нуть нут/нуть нул/нуть нула/нуть нуло/нуть нули/нуть ни/нуть ните/нуть нув/нуть нусь/нуться нешься/нуться нется/нуться немся/нуться нетесь/нуться нутся/нуться нулся/нуться нулась/нуться нулось/нуться нулись/нуться нись/нуться нитесь/нуться гу/чь жешь/чь жет/чь жем/чь жете/чь гут/чь г/чь гла/чь гло/чь гли/чь ги/чь гите/чь ку/чь чешь/чь чет/чь чем/чь чете/чь кут/чь к/чь кла/чь кло/чь кли/чь ки/чь ките/чь гусь/чься жешься/чься жется/чься жемся/чься жетесь/чься гутся/чься гся/чься глась/чься глось/чься глись/чься гись/чься гитесь/чься кусь/чься чешься/чься чется/чься чемся/чься четесь/чься кутся/чься кся/чься клась/чься клось/чься клись/чься кись/чься китесь/чься ююсь/еваться юешься/еваться юется/еваться юемся/еваться юетесь/еваться юются/еваться"]
72
- # - [e, "s"]
73
- # - [f, "s n e en es er ch/che /en"]
66
+ # Suffixliste, Stand: 29-07-2013
67
+ # Suffixklasse: s = Substantiv, a = Adjektiv, v = Verb, e = Eigenwort, g = Geographika, u = Vornamen/Vatersnamen, i = TheSoz
68
+ # Suffixe je Klasse: "<suffix>['/'<ersetzung>][ <suffix>['/'<ersetzung>]]"
69
+ - [s, 'а у ом е ы ов ам ами ах и енка/енок енку/енок енком/енок енке/енок ята/енок ят/енок ятам/енок ятами/енок ятах/енок я/й ю/й е/й ем/й и/й ев/й ям/й ями/й ях/й я/ь ю/ь ем/ь e/ь и/ь ей/ь ям/ь ями/ь ях/ь ью/ь ы/а е/а у/а ой/а ам/а ами/а ах/а и/а /а и/я е/я ю/я ей/я ь/я ям/я ями/я ях/я й/я ени/я енем/я ена/я ен/я енам/я енами/я енах/я а/о у/о ом/о е/о ам/о ами/о ах/о и/о /о я/е ю/е ем/е и/е й/е ей/е ям/е ями/е ях/е а/е у/е ам/е ами/е ах/е /е /ы ам/ы ами/ы ах/ы /и ов/и ам/и ами/и ах/и ей/и ям/и ями/и ях/и ка/ок ку/ок ком/ок ке/ок ки/ок ков/ок кам/ок ками/ок ках/ок ца/ец цу/ец цем/ец це/ец цы/ец цев/ец цам/ец цами/ец цах/ец ек/ка ок/ка']
70
+ - [a, 'а/ий а/ой а/ый ая/ий ая/ой ая/ый его/ий ее/ий ее/ой ее/ый ей/ий ейшего/ий ейшего/ой ейшего/ый ейшем/ий ейшем/ой ейшем/ый ейшему/ий ейшему/ой ейшему/ый ейшие/ий ейшие/ой ейшие/ый ейший/ий ейший/ой ейший/ый ейшим/ий ейшим/ой ейшим/ый ейшими/ий ейшими/ой ейшими/ый ейших/ий ейших/ой ейших/ый ем/ий ему/ий ие/ий ие/ой ие/ый им/ий им/ой им/ый ими/ий ими/ой ими/ый их/ий их/ой их/ый о/ий о/ой о/ый ого/ий ого/ой ого/ый ое/ий ое/ой ое/ый ой/ий ой/ой ой/ый ом/ий ом/ой ом/ый ому/ий ому/ой ому/ый ую/ий ую/ой ую/ый ы/ий ы/ой ы/ый ые/ий ые/ой ые/ый ым/ий ым/ий ым/ой ым/ый ыми/ий ыми/ой ыми/ый ых/ий ых/ой ых/ый юю/ий яя/ий ья/ий ьей/ий ью/ий ьи/ий ьих/ий ьим/ий ьими/ий ейшая/ый ейшей/ый ейшую/ый ейшее/ый /ый а/ый о/ый ы/ый ейшая/ой ейшей/ой ейшую/ой ейшее/ой /ой а/ой о/ой ы/ой ейшая/ий ейшей/ий ейшую/ий ейшее/ий ий а/ий о/ий и/ий ен/ный']
71
+ - [v, 'у/ть ю/ть ешь/ть ет/ть ем/ть ете/ть ют/ть л/ть ла/ть ло/ть ли/ть й/ть йте/ть ут/ть я/ть в/ть у/ти ю/ти ешь/ти ет/ти ем/ти ете/ти ют/ти л/ти ла/ти ло/ти ли/ти й/ти йте/ти ут/ти я/ти в/ти усь/ться юсь/ться ешься/ться ется/ться емся/ться етесь/ться ются/ться лся/ться лась/ться лось/ться лись/ться йся/ться йтесь/ться усь/тись юсь/тись ешься/тись ется/тись емся/тись етесь/тись ются/тись лся/тись лась/тись лось/тись лись/тись йся/тись йтесь/тись ю/ить ишь/ить ит/ить им/ить ите/ить ят/ить ил/ить ила/ить ило/ить или/ить й/ить йте/ить ью/ить ьешь/ить ьет/ить ьем/ить ьете/ить ьют/ить ей/ить ейте/ить я/ить ив/ить юсь/иться ишься/иться ится/иться имся/иться итесь/иться ятся/иться ился/иться илась/иться илось/иться ились/иться йся/иться йтесь/иться ьюсь/иться ьешься/иться ьется/иться ьемся/иться ьетесь/иться ьются/иться ейся/иться ейтесь/иться ю/оть ешь/оть ет/оть ем/оть ете/оть ют/оть л/оть ла/оть ло/оть ли/оть й/оть йте/оть я/оть ов/оть юсь/оться ешься/оться ется/оться емся/оться етесь/оться ются/оться лся/оться лась/оться лось/оться лись/оться ись/оться итесь/оться ую/овать уешь/овать ует/овать уем/овать уете/овать уют/овать овал/овать овала/овать овало/овать овали/овать уй/овать уйте/овать уя/овать овав/овать уюсь/оваться уешься/оваться уется/оваться уемся/оваться уетесь/оваться уются/оваться овался/оваться овалась/оваться овалось/оваться овались/оваться уйся/оваться уйтесь/оваться ую/евать юю/евать юешь/евать юет/евать юем/евать юете/евать юют/евать евал/евать евала/евать евало/евать евали/евать юй/евать юйте/евать юя/евать евав/евать уюсь/еваться ююсь/еваться юешься/еваться юется/еваться юемся/еваться юетесь/еваться юются/еваться евался/еваться евалась/еваться евалось/еваться евались/еваться юйся/еваться юйтесь/еваться ну/нуть нешь/нуть нет/нуть нем/нуть нете/нуть нут/нуть нул/нуть нула/нуть нуло/нуть нули/нуть ни/нуть ните/нуть нув/нуть нусь/нуться нешься/нуться нется/нуться немся/нуться нетесь/нуться нутся/нуться нулся/нуться нулась/нуться нулось/нуться нулись/нуться нись/нуться нитесь/нуться гу/чь жешь/чь жет/чь жем/чь жете/чь гут/чь г/чь гла/чь гло/чь гли/чь ги/чь гите/чь ку/чь чешь/чь чет/чь чем/чь чете/чь кут/чь к/чь кла/чь кло/чь кли/чь ки/чь ките/чь гусь/чься жешься/чься жется/чься жемся/чься жетесь/чься гутся/чься гся/чься глась/чься глось/чься глись/чься гись/чься гитесь/чься кусь/чься чешься/чься чется/чься чемся/чься четесь/чься кутся/чься кся/чься клась/чься клось/чься клись/чься кись/чься китесь/чься вшая/ти вшая/ть вшаяся/тись вшаяся/ться вшего/ти вшего/ть вшегося/тись вшегося/ться вшее/ти вшее/ть вшееся/тись вшееся/ться вшей/ти вшей/ть вшейся/тись вшейся/ться вшем/ти вшем/ть вшемся/тись вшемся/ться вшему/ти вшему/ть вшемуся/тись вшемуся/ться вшие/ти вшие/ть вшиеся/тись вшиеся/ться вший/ти вший/ть вшийся/тись вшийся/ться вшим/ти вшим/ть вшими/ти вшими/ть вшимися/тись вшимися/ться вшимся/тись вшимся/ться вших/ти вших/ть вшихся/тись вшихся/ться вшую/ти вшую/ть вшуюся/тись вшуюся/ться гущая/чь гущаяся/чься гущего/чь гущегося/чься гущее/чь гущееся/чься гущей/чь гущейся/чься гущем/чь гущемся/чься гущему/чь гущемуся/чься гущие/чь гущиеся/чься гущий/чь гущийся/чься гущим/чь гущими/чь гущимися/чься гущимся/чься гущих/чь гущихся/чься гущую/чь гущуюся/чься евавшая/евать евавшаяся/еваться евавшего/евать евавшегося/еваться евавшее/евать евавшееся/еваться евавшей/евать евавшейся/еваться евавшем/евать евавшемся/еваться евавшему/евать евавшемуся/еваться евавшие/евать евавшиеся/еваться евавший/евать евавшийся/еваться евавшим/евать евавшими/евать евавшимися/еваться евавшимся/еваться евавших/евать евавшихся/еваться евавшую/евать евавшуюся/еваться еванная/евать еванного/евать еванное/евать еванной/евать еванном/евать еванному/евать еванную/евать еванные/евать еванный/евать еванным/евать еванными/евать еванных/евать емая/ти емая/ть емого/ти емого/ть емое/ти емое/ть емой/ти емой/ть емом/ти емом/ть емому/ти емому/ть емую/ти емую/ть емые/ти емые/ть емый/ти емый/ть емым/ти емым/ть емыми/ти емыми/ть емых/ти емых/ть енная/ить енного/ить енное/ить енной/ить енном/ить енному/ить енную/ить енные/ить енный/ить енным/ить енными/ить енных/ить женная/чь женного/чь женное/чь женной/чь женном/чь женному/чь женную/чь женные/чь женный/чь женным/чь женными/чь женных/чь ившая/ить ившаяся/иться ившего/ить ившегося/иться ившее/ить ившееся/иться ившей/ить ившейся/иться ившем/ить ившемся/иться ившему/ить ившемуся/иться ившие/ить ившиеся/иться ивший/ить ившийся/иться ившим/ить ившими/ить ившимися/иться ившимся/иться ивших/ить ившихся/иться ившую/ить ившуюся/иться имая/ить имого/ить имое/ить имой/ить имом/ить имому/ить имую/ить имые/ить имый/ить имым/ить имыми/ить имых/ить кущая/чь кущаяся/чься кущего/чь кущегося/чься кущее/чь кущееся/чься кущей/чь кущейся/чься кущем/чь кущемся/чься кущему/чь кущемуся/чься кущие/чь кущиеся/чься кущий/чь кущийся/чься кущим/чь кущими/чь кущимися/чься кущимся/чься кущих/чь кущихся/чься кущую/чь кущуюся/чься нная/ти нная/ть нного/ти нного/ть нное/ти нное/ть нной/ти нной/ть нном/ти нном/ть нному/ти нному/ть нную/ти нную/ть нные/ти нные/ть нный/ти нный/ть нным/ти нным/ть нными/ти нными/ть нных/ти нных/ть нувшая/нуть нувшаяся/нуться нувшего/нуть нувшегося/нуться нувшее/нуть нувшееся/нуться нувшей/нуть нувшейся/нуться нувшем/нуть нувшемся/нуться нувшему/нуть нувшемуся/нуться нувшие/нуть нувшиеся/нуться нувший/нуть нувшийся/нуться нувшим/нуть нувшими/нуть нувшимися/нуться нувшимся/нуться нувших/нуть нувшихся/нуться нувшую/нуть нувшуюся/нуться нущая/нуть нущаяся/нуться нущего/нуть нущегося/нуться нущее/нуть нущееся/нуться нущей/нуть нущейся/нуться нущем/нуть нущемся/нуться нущему/нуть нущемуся/нуться нущие/нуть нущиеся/нуться нущий/нуть нущийся/нуться нущим/нуть нущими/нуть нущимися/нуться нущимся/нуться нущих/нуть нущихся/нуться нущую/нуть нущуюся/нуться овавшая/овать овавшаяся/оваться овавшего/овать овавшегося/оваться овавшее/овать овавшееся/оваться овавшей/овать овавшейся/оваться овавшем/овать овавшемся/оваться овавшему/овать овавшемуся/оваться овавшие/овать овавшиеся/оваться овавший/овать овавшийся/оваться овавшим/овать овавшими/овать овавшимися/оваться овавшимся/оваться овавших/овать овавшихся/оваться овавшую/овать овавшуюся/оваться ованная/овать ованного/овать ованное/овать ованной/овать ованном/овать ованному/овать ованную/овать ованные/овать ованный/овать ованным/овать ованными/овать ованных/овать овшая/оть овшаяся/оться овшего/оть овшегося/оться овшее/оть овшееся/оться овшей/оть овшейся/оться овшем/оть овшемся/оться овшему/оть овшемуся/оться овшие/оть овшиеся/оться овший/оть овшийся/оться овшим/оть овшими/оть овшимися/оться овшимся/оться овших/оть овшихся/оться овшую/оть овшуюся/оться отая/оть отого/оть отое/оть отой/оть отом/оть отому/оть отую/оть отые/оть отый/оть отым/оть отыми/оть отых/оть уемая/овать уемого/овать уемое/овать уемой/овать уемом/овать уемому/овать уемую/овать уемые/овать уемый/овать уемым/овать уемыми/овать уемых/овать ущая/ти ущая/ть ущаяся/тись ущаяся/ться ущего/ти ущего/ть ущегося/тись ущегося/ться ущее/ти ущее/ть ущееся/тись ущееся/ться ущей/ти ущей/ть ущейся/тись ущейся/ться ущем/ти ущем/ть ущемся/тись ущемся/ться ущему/ти ущему/ть ущемуся/тись ущемуся/ться ущие/ти ущие/ть ущиеся/тись ущиеся/ться ущий/ти ущий/ть ущийся/тись ущийся/ться ущим/ти ущим/ть ущими/ти ущими/ть ущимися/тись ущимися/ться ущимся/тись ущимся/ться ущих/ти ущих/ть ущихся/тись ущихся/ться ущую/ти ущую/ть ущуюся/тись ущуюся/ться ующая/овать ующаяся/оваться ующего/овать ующегося/оваться ующее/овать ующееся/оваться ующей/овать ующейся/оваться ующем/овать ующемся/оваться ующему/овать ующемуся/оваться ующие/овать ующиеся/оваться ующий/овать ующийся/оваться ующим/овать ующими/овать ующимися/оваться ующимся/оваться ующих/овать ующихся/оваться ующую/овать ующуюся/оваться ченная/чь ченного/чь ченное/чь ченной/чь ченном/чь ченному/чь ченную/чь ченные/чь ченный/чь ченным/чь ченными/чь ченных/чь шая/ти шая/ть шаяся/тись шаяся/ться шего/ти шего/ть шегося/тись шегося/ться шее/ти шее/ть шееся/тись шееся/ться шей/ти шей/ть шейся/тись шейся/ться шем/ти шем/ть шемся/тись шемся/ться шему/ти шему/ть шемуся/тись шемуся/ться шие/ти шие/ть шиеся/тись шиеся/ться ший/ти ший/ть шийся/тись шийся/ться шим/ти шим/ть шими/ти шими/ть шимися/тись шимися/ться шимся/тись шимся/ться ших/ти ших/ть шихся/тись шихся/ться шую/ти шую/ть шуюся/тись шуюся/ться ьющая/ить ьющаяся/иться ьющего/ить ьющегося/иться ьющее/ить ьющееся/иться ьющей/ить ьющейся/иться ьющем/ить ьющемся/иться ьющему/ить ьющемуся/иться ьющие/ить ьющиеся/иться ьющий/ить ьющийся/иться ьющим/ить ьющими/ить ьющимися/иться ьющимся/иться ьющих/ить ьющихся/иться ьющую/ить ьющуюся/иться ющая/оть ющая/ти ющая/ть ющаяся/оться ющаяся/тись ющаяся/ться ющего/оть ющего/ти ющего/ть ющегося/оться ющегося/тись ющегося/ться ющее/оть ющее/ти ющее/ть ющееся/оться ющееся/тись ющееся/ться ющей/оть ющей/ти ющей/ть ющейся/оться ющейся/тись ющейся/ться ющем/оть ющем/ти ющем/ть ющемся/оться ющемся/тись ющемся/ться ющему/оть ющему/ти ющему/ть ющемуся/оться ющемуся/тись ющемуся/ться ющие/оть ющие/ти ющие/ть ющиеся/оться ющиеся/тись ющиеся/ться ющий/оть ющий/ти ющий/ть ющийся/оться ющийся/тись ющийся/ться ющим/оть ющим/ти ющим/ть ющими/оть ющими/ти ющими/тись ющими/ть ющимися/оться ющимися/ться ющимся/оться ющимся/тись ющимся/ться ющих/оть ющих/ти ющих/ть ющихся/оться ющихся/тись ющихся/ться ющую/оть ющую/ти ющую/ть ющуюся/оться ющуюся/тись ющуюся/ться юющая/евать юющаяся/еваться юющего/евать юющегося/еваться юющее/евать юющееся/еваться юющей/евать юющейся/еваться юющем/евать юющемся/еваться юющему/евать юющемуся/еваться юющие/евать юющиеся/еваться юющий/евать юющийся/еваться юющим/евать юющими/евать юющими/еваться юющимся/еваться юющих/евать юющихся/еваться юющую/евать юющуюся/еваться ящая/ить ящаяся/иться ящего/ить ящегося/иться ящее/ить ящееся/иться ящей/ить ящейся/иться ящем/ить ящемся/иться ящему/ить ящемуся/иться ящие/ить ящиеся/иться ящий/ить ящийся/иться ящим/ить ящими/ить ящимися/иться ящимся/иться ящих/ить ящихся/иться ящую/ить ящуюся/иться ат/ить ясь/ться ясь/тись ясь/иться вшись/иться ясь/оться овшись/оться уясь/оваться овавшись/оваться юясь/еваться евашись/еваться но/ть на/ть н/ть но/ти на/ти н/ти ны/ть ны/ти ен/ить ено/ить ена/ить ены/ить от/оть ота/оть ото/оть оты/оть ован/овать ована/овать овано/овать ованы/овать еван/евать евана/евать евано/евать еваны/евать нутый/нуть нута/нуть нуто/нуть нуты/нуть нут/нуть нутого/нуть нутому/нуть нутым/нуть нутом/нуть нутое/нуть нутая/нуть нутой/нуть нутую/нуть нутые/нуть нутых/нуть нутыми/нуть чен/чь чена/чь чено/чь чены/чь жен/чь жена/чь жено/чь жены/чь']
72
+ - [g, '/а а а/о ам ам/а ам/е ам/и ам/о ам/ы ам/ь ами ами/а ами/е ами/и ами/о ами/ы ами/ь ах ах/а ах/е ах/и ах/о ах/ы ах/ь е е/а е/е е/о е/ь е/я ей/а ей/е ей/и ей/ь ей/я ем/е ем/й ем/ь и и/ и/а и/е и/й и/о и/ь и/я й/е й/ь й/я ов ов/и ов/о ой/а ом ом/о у у/а у/о ы ы/а ы/о ь/я ью/е ью/ь ю/е ю/й ю/ь ю/я я/е я/й я/ь ям/е ям/и ям/ь ям/я ями/е ями/и ями/ь ями/я ях/е ях/и ях/ь ях/я']
73
+ - [e, у ым е ой/а у/а ой/ая ую/ая ей/яя юю/яя ого/ий ому/ий им/ий ом/ий ого/ый ому/ый ым/ый ом/ый ого/ой ому/ой ым/ой ом/ой']
74
+ - [u, 'а у ом ем е я/й ю/й ем/й и/й и/я ю/я ей/я ы/а е/а у/а ой/а']
75
+ - [i, 'а у ом е ы ов ам ами ах и енка/енок енку/енок енком/енок енке/енок ята/енок ят/енок ятам/енок ятами/енок ятах/енок я/й ю/й е/й ем/й и/й ев/й ям/й ями/й ях/й я/ь ю/ь ем/ь e/ь и/ь ей/ь ям/ь ями/ь ях/ь ью/ь ы/а е/а у/а ой/а ам/а ами/а ах/а и/а /а и/я е/я ю/я ей/я ь/я ям/я ями/я ях/я й/я ени/я енем/я ена/я ен/я енам/я енами/я енах/я а/о у/о ом/о е/о ам/о ами/о ах/о и/о /о я/е ю/е ем/е и/е й/е ей/е ям/е ями/е ях/е а/е у/е ам/е ами/е ах/е /е /ы ам/ы ами/ы ах/ы /и ов/и ам/и ами/и ах/и ей/и ям/и ями/и ях/и']
74
76
 
75
77
  attendees:
76
78
  variator:
77
79
  variations:
78
- - [ ieh, sch ]
79
- - [ fec, see ]
80
- - [ it, st ]
81
- - [ fch, sch ]
82
- - [ fp, sp ]
83
- - [ f, s ]
84
- - [ c, e ]
85
- - [ ffc, sse ]
86
- - [ ff, ss ]
87
- - [ e, c ]
88
- - [ ni, m ]
89
- - [ feh, sch ]
90
- - [ lt, st ]
91
- - [ il, st ]
92
- - [ ftc, ste ]
93
- - [ ft, st ]
94
- - [ fl, st ]
95
- - [ li, h ]
96
- - [ i, s ]
80
+ - [ieh, sch]
81
+ - [fec, see]
82
+ - [it, st ]
83
+ - [fch, sch]
84
+ - [fp, sp ]
85
+ - [f, s ]
86
+ - [c, e ]
87
+ - [ffc, sse]
88
+ - [ff, ss ]
89
+ - [e, c ]
90
+ - [ni, m ]
91
+ - [feh, sch]
92
+ - [lt, st ]
93
+ - [il, st ]
94
+ - [ftc, ste]
95
+ - [ft, st ]
96
+ - [fl, st ]
97
+ - [li, h ]
98
+ - [i, s ]
97
99
 
98
100
  sequencer:
99
- sequences: [ [AS, "2, 1"] ]
101
+ sequences: [ [SS, '1 2'], [AS, '2, 1'], [AI, '2, 1'], [ASS, '2 3, 1'], [AAS, '3, 1 2'], [AAI, '3, 1 2'] ]
data/spec/spec_helper.rb CHANGED
@@ -1 +1,5 @@
1
1
  # encoding: utf-8
2
+
3
+ RSpec.configure { |config|
4
+ config.expect_with(:rspec) { |c| c.syntax = [:should, :expect] }
5
+ }
@@ -13,8 +13,8 @@ class TestAttendeeDecomposer < AttendeeTestCase
13
13
  wd('Kompositumzerlegung|?')
14
14
  ], [
15
15
  wd('Kleinseite|KOM', 'kleinseite|k', 'klein|a+', 'seite|s+'),
16
- wd('Arrafat-Nachfolger|KOM', 'arrafat-nachfolger|k', 'nachfolger|s+', 'arrafat|x+'),
17
- wd('Afganistan-Reisen|KOM', 'afganistan-reise|k', 'reise|s+', 'reisen|v+', 'afganistan|x+'),
16
+ wd('Arrafat-Nachfolger|KOM', 'arrafat-nachfolger|k', 'arrafat|x+', 'nachfolger|s+'),
17
+ wd('Afganistan-Reisen|KOM', 'afganistan-reisen|k', 'afganistan|x+', 'reisen|v+', 'reise|s+'),
18
18
  wd('Kompositumzerlegung|KOM', 'kompositumzerlegung|k', 'kompositum|s+', 'zerlegung|s+'),
19
19
  wd('Kompositumzerlegung|KOM', 'kompositumzerlegung|k', 'kompositum|s+', 'zerlegung|s+')
20
20
  ])
@@ -5,7 +5,7 @@ require_relative '../test_helper'
5
5
  class TestAttendeeSynonymer < AttendeeTestCase
6
6
 
7
7
  def test_basic
8
- meet({ 'source' => 'sys-syn', 'check' => '-,MUL' }, [
8
+ meet({ 'source' => 'sys-syn' }, [
9
9
  wd('abtastzeiten|IDF', 'abtastzeit|s')
10
10
  ], [
11
11
  wd('abtastzeiten|IDF', 'abtastzeit|s', 'abtastfrequenz|y', 'abtastperiode|y')
@@ -13,7 +13,7 @@ class TestAttendeeSynonymer < AttendeeTestCase
13
13
  end
14
14
 
15
15
  def test_first
16
- meet({ 'source' => 'sys-syn,tst-syn', 'check' => '-,MUL', 'mode' => 'first' }, [
16
+ meet({ 'source' => 'sys-syn,tst-syn', 'mode' => 'first' }, [
17
17
  wd('Aktienanleihe|IDF', 'aktienanleihe|s')
18
18
  ], [
19
19
  wd('Aktienanleihe|IDF', 'aktienanleihe|s', 'aktien-anleihe|y', 'reverse convertible bond|y', 'reverse convertibles|y')
@@ -21,7 +21,7 @@ class TestAttendeeSynonymer < AttendeeTestCase
21
21
  end
22
22
 
23
23
  def test_all
24
- meet({ 'source' => 'sys-syn,tst-syn', 'check' => '-,MUL', 'mode' => 'all' }, [
24
+ meet({ 'source' => 'sys-syn,tst-syn', 'mode' => 'all' }, [
25
25
  wd('Kerlchen|IDF', 'kerlchen|s')
26
26
  ], [
27
27
  wd('Kerlchen|IDF', 'kerlchen|s', 'kerlchen|y', 'zwerg-nase|y')
@@ -2,9 +2,28 @@
2
2
 
3
3
  class TestAttendeeTokenizer < AttendeeTestCase
4
4
 
5
+ def setup
6
+ @wiki = [
7
+ 'Test [[Link|internal link]] and [http://example.com external link].',
8
+ 'Try __MAGIC__ with [[Multiline',
9
+ 'link (because we can)]].',
10
+ '[[Category:cat1]]',
11
+ 'Link to [[:Category:cat2]].',
12
+ '== Heading ==',
13
+ '{{Template}}',
14
+ 'Function with {{#func|param|{{{var}}}}} and <nowiki>{{{var}}}</nowiki>!',
15
+ '{{Multi',
16
+ ' | line=1',
17
+ ' | [[link]]',
18
+ ' | {{{var}}}',
19
+ '',
20
+ '}}'
21
+ ]
22
+ end
23
+
5
24
  def test_basic
6
25
  meet({}, [
7
- "Dies ist ein Test."
26
+ 'Dies ist ein Test.'
8
27
  ], [
9
28
  tk('Dies|WORD'), tk('ist|WORD'), tk('ein|WORD'), tk('Test|WORD'), tk('.|PUNC')
10
29
  ])
@@ -12,7 +31,7 @@ class TestAttendeeTokenizer < AttendeeTestCase
12
31
 
13
32
  def test_complex
14
33
  meet({}, [
15
- "1964 www.vorhauer.de bzw. nasenbär, ()"
34
+ '1964 www.vorhauer.de bzw. nasenbär, ()'
16
35
  ], [
17
36
  tk('1964|NUMS'),
18
37
  tk('www.vorhauer.de|URLS'),
@@ -25,4 +44,198 @@ class TestAttendeeTokenizer < AttendeeTestCase
25
44
  ])
26
45
  end
27
46
 
47
+ def test_wiki1
48
+ meet({}, @wiki, [
49
+ tk('Test|WORD'),
50
+ tk('[|OTHR'),
51
+ tk('[|OTHR'),
52
+ tk('Link|WORD'),
53
+ tk('||OTHR'),
54
+ tk('internal|WORD'),
55
+ tk('link|WORD'),
56
+ tk(']|OTHR'),
57
+ tk(']|OTHR'),
58
+ tk('and|WORD'),
59
+ tk('[|OTHR'),
60
+ tk('http://example.com|URLS'),
61
+ tk('external|WORD'),
62
+ tk('link|WORD'),
63
+ tk(']|OTHR'),
64
+ tk('.|PUNC'),
65
+ tk('Try|WORD'),
66
+ tk('_|OTHR'),
67
+ tk('_|OTHR'),
68
+ tk('MAGIC|WORD'),
69
+ tk('_|OTHR'),
70
+ tk('_|OTHR'),
71
+ tk('with|WORD'),
72
+ tk('[|OTHR'),
73
+ tk('[|OTHR'),
74
+ tk('Multiline|WORD'),
75
+ tk('link|WORD'),
76
+ tk('(|OTHR'),
77
+ tk('because|WORD'),
78
+ tk('we|WORD'),
79
+ tk('can|WORD'),
80
+ tk(')|OTHR'),
81
+ tk(']|OTHR'),
82
+ tk(']|OTHR'),
83
+ tk('.|PUNC'),
84
+ tk('[|OTHR'),
85
+ tk('[|OTHR'),
86
+ tk('Category|WORD'),
87
+ tk(':|PUNC'),
88
+ tk('cat1|WORD'),
89
+ tk(']|OTHR'),
90
+ tk(']|OTHR'),
91
+ tk('Link|WORD'),
92
+ tk('to|WORD'),
93
+ tk('[|OTHR'),
94
+ tk('[|OTHR'),
95
+ tk(':|PUNC'),
96
+ tk('Category|WORD'),
97
+ tk(':|PUNC'),
98
+ tk('cat2|WORD'),
99
+ tk(']|OTHR'),
100
+ tk(']|OTHR'),
101
+ tk('.|PUNC'),
102
+ tk('=|OTHR'),
103
+ tk('=|OTHR'),
104
+ tk('Heading|WORD'),
105
+ tk('=|OTHR'),
106
+ tk('=|OTHR'),
107
+ tk('{|OTHR'),
108
+ tk('{|OTHR'),
109
+ tk('Template|WORD'),
110
+ tk('}|OTHR'),
111
+ tk('}|OTHR'),
112
+ tk('Function|WORD'),
113
+ tk('with|WORD'),
114
+ tk('{|OTHR'),
115
+ tk('{|OTHR'),
116
+ tk('#|OTHR'),
117
+ tk('func|WORD'),
118
+ tk('||OTHR'),
119
+ tk('param|WORD'),
120
+ tk('||OTHR'),
121
+ tk('{|OTHR'),
122
+ tk('{|OTHR'),
123
+ tk('{|OTHR'),
124
+ tk('var|WORD'),
125
+ tk('}|OTHR'),
126
+ tk('}|OTHR'),
127
+ tk('}|OTHR'),
128
+ tk('}|OTHR'),
129
+ tk('}|OTHR'),
130
+ tk('and|WORD'),
131
+ tk('<|OTHR'),
132
+ tk('nowiki|WORD'),
133
+ tk('>|OTHR'),
134
+ tk('{|OTHR'),
135
+ tk('{|OTHR'),
136
+ tk('{|OTHR'),
137
+ tk('var|WORD'),
138
+ tk('}|OTHR'),
139
+ tk('}|OTHR'),
140
+ tk('}|OTHR'),
141
+ tk('<|OTHR'),
142
+ tk('/|OTHR'),
143
+ tk('nowiki|WORD'),
144
+ tk('>|OTHR'),
145
+ tk('!|PUNC'),
146
+ tk('{|OTHR'),
147
+ tk('{|OTHR'),
148
+ tk('Multi|WORD'),
149
+ tk('||OTHR'),
150
+ tk('line|WORD'),
151
+ tk('=|OTHR'),
152
+ tk('1|NUMS'),
153
+ tk('||OTHR'),
154
+ tk('[|OTHR'),
155
+ tk('[|OTHR'),
156
+ tk('link|WORD'),
157
+ tk(']|OTHR'),
158
+ tk(']|OTHR'),
159
+ tk('||OTHR'),
160
+ tk('{|OTHR'),
161
+ tk('{|OTHR'),
162
+ tk('{|OTHR'),
163
+ tk('var|WORD'),
164
+ tk('}|OTHR'),
165
+ tk('}|OTHR'),
166
+ tk('}|OTHR'),
167
+ tk('}|OTHR'),
168
+ tk('}|OTHR')
169
+ ])
170
+ end
171
+
172
+ def test_wiki2
173
+ meet({ 'space' => true, 'tags' => true, 'wiki' => true }, @wiki, [
174
+ tk('Test|WORD'),
175
+ tk(' |SPAC'),
176
+ tk('[[|WIKI'),
177
+ tk('Link|internal link]]|WIKI'),
178
+ tk(' |SPAC'),
179
+ tk('and|WORD'),
180
+ tk(' |SPAC'),
181
+ tk('[http://|WIKI'),
182
+ tk('example.com external link]|WIKI'),
183
+ tk('.|PUNC'),
184
+ tk('Try|WORD'),
185
+ tk(' |SPAC'),
186
+ tk('__MAGIC__|WIKI'),
187
+ tk(' |SPAC'),
188
+ tk('with|WORD'),
189
+ tk(' |SPAC'),
190
+ tk('[[|WIKI'),
191
+ tk('Multiline|WIKI'),
192
+ tk('link (because we can)]]|WIKI'),
193
+ tk('.|PUNC'),
194
+ tk('[[|WIKI'),
195
+ tk('Category:cat1]]|WIKI'),
196
+ tk('Link|WORD'),
197
+ tk(' |SPAC'),
198
+ tk('to|WORD'),
199
+ tk(' |SPAC'),
200
+ tk('[[|WIKI'),
201
+ tk(':Category:cat2]]|WIKI'),
202
+ tk('.|PUNC'),
203
+ tk('== Heading ==|WIKI'),
204
+ tk('{{|WIKI'),
205
+ tk('Template}}|WIKI'),
206
+ tk('Function|WORD'),
207
+ tk(' |SPAC'),
208
+ tk('with|WORD'),
209
+ tk(' |SPAC'),
210
+ tk('{{|WIKI'),
211
+ tk('#func|param||WIKI'),
212
+ tk('{{{|WIKI'),
213
+ tk('var}}}|WIKI'),
214
+ tk('}}|WIKI'),
215
+ tk(' |SPAC'),
216
+ tk('and|WORD'),
217
+ tk(' |SPAC'),
218
+ tk('<|HTML'),
219
+ tk('nowiki>|HTML'),
220
+ tk('{{{|WIKI'),
221
+ tk('var}}}|WIKI'),
222
+ tk('<|HTML'),
223
+ tk('/nowiki>|HTML'),
224
+ tk('!|PUNC'),
225
+ tk('{{|WIKI'),
226
+ tk('Multi|WIKI'),
227
+ tk(' | line=1|WIKI'),
228
+ tk(' | |WIKI'),
229
+ tk('[[|WIKI'),
230
+ tk('link]]|WIKI'),
231
+ tk('|WIKI'),
232
+ tk(' | |WIKI'),
233
+ tk('{{{|WIKI'),
234
+ tk('var}}}|WIKI'),
235
+ tk('|WIKI'),
236
+ tk('|WIKI'),
237
+ tk('}}|WIKI')
238
+ ])
239
+ end
240
+
28
241
  end
@@ -8,9 +8,9 @@ class TestAttendeeVariator < AttendeeTestCase
8
8
  meet({ 'source' => 'sys-dic' }, [
9
9
  wd('fchwarz|?'), wd('fchilling|?'), wd('iehwarzfchilling|?'), wd('fchiiiirg|?')
10
10
  ], [
11
- wd('*schwarz|IDF', 'schwarz|s', 'schwarz|a'),
11
+ wd('*schwarz|IDF', 'schwarz|a', 'schwarz|s'),
12
12
  wd('*schilling|IDF', 'schilling|s'),
13
- wd('*schwarzschilling|KOM', 'schwarzschilling|k', 'schwarz|a+', 'schilling|s+', 'schwarz|s+'),
13
+ wd('*schwarzschilling|KOM', 'schwarzschilling|k', 'schwarz|a+', 'schwarz|s+', 'schilling|s+'),
14
14
  wd('fchiiiirg|?')
15
15
  ])
16
16
  end
@@ -10,7 +10,7 @@ class TestAttendeeWordSearcher < AttendeeTestCase
10
10
  ], [
11
11
  wd('Dies|IDF', 'dies|w'),
12
12
  wd('ist|IDF', 'sein|v'),
13
- wd('ein|IDF', 'einen|v', 'ein|w'),
13
+ wd('ein|IDF', 'ein|w', 'einen|v'),
14
14
  wd('Test|IDF', 'test|s', 'testen|v'),
15
15
  tk('.|PUNC'),
16
16
  ai('EOL|')
@@ -23,7 +23,7 @@ class TestAttendeeWordSearcher < AttendeeTestCase
23
23
  ], [
24
24
  wd('Dies|IDF', 'dies|w'),
25
25
  wd('ist|IDF', 'sein|v'),
26
- wd('ein|IDF', 'einen|v', 'ein|w'),
26
+ wd('ein|IDF', 'ein|w', 'einen|v'),
27
27
  wd('Test|IDF', 'test|s', 'testen|v'),
28
28
  tk('.|PUNC'),
29
29
  ai('EOL|')
@@ -41,7 +41,7 @@ class TestAttendeeWordSearcher < AttendeeTestCase
41
41
  wd('Hasennasen|?'),
42
42
  wd('Knaller|IDF', 'knaller|s'),
43
43
  wd('Lex-Lingo|IDF', 'super indexierungssystem|m'),
44
- wd('A-Dur|IDF', 'a-dur|s'),
44
+ wd('A-Dur|IDF', 'a-dur|s|m', 'a-dur|s|n'),
45
45
  ai('EOL|')
46
46
  ])
47
47
  end
@@ -73,23 +73,27 @@ class TestAttendeeWordSearcher < AttendeeTestCase
73
73
  wd('Hasennasen|?'),
74
74
  wd('Knaller|IDF', 'knaller|s'),
75
75
  wd('Lex-Lingo|IDF', 'super indexierungssystem|m'),
76
- wd('A-Dur|IDF', 'a-dur|s', 'b-dur|s'),
76
+ wd('A-Dur|IDF', 'a-dur|s|m', 'a-dur|s|n', 'b-dur|s'),
77
77
  ai('EOL|')
78
78
  ])
79
79
  end
80
80
 
81
- def test_select_two_sources_mode_def
81
+ def test_select_two_sources_mode_default
82
82
  meet({ 'source' => 'sys-dic,tst-dic' }, [
83
83
  tk('Hasennasen|WORD'),
84
84
  tk('Knaller|WORD'),
85
85
  tk('Lex-Lingo|WORD'),
86
86
  tk('A-Dur|WORD'),
87
+ tk('Wirkungsort|WORD'),
88
+ tk('Zettelkatalog|WORD'),
87
89
  ai('EOL|')
88
90
  ], [
89
91
  wd('Hasennasen|?'),
90
92
  wd('Knaller|IDF', 'knaller|s'),
91
93
  wd('Lex-Lingo|IDF', 'super indexierungssystem|m'),
92
- wd('A-Dur|IDF', 'a-dur|s', 'b-dur|s'),
94
+ wd('A-Dur|IDF', 'a-dur|s|m', 'a-dur|s|n', 'b-dur|s'),
95
+ wd('Wirkungsort|IDF', 'wirkungsort|s', 'wirkung|s+', 'ort|s+'),
96
+ wd('Zettelkatalog|KOM', 'zettelkatalog|k', 'zettel|s+', 'katalog|s+'),
93
97
  ai('EOL|')
94
98
  ])
95
99
  end
data/test/ref/artikel.seq CHANGED
@@ -139,7 +139,7 @@
139
139
  1 instrument, nützlich
140
140
  1 instrument, zentral gepflegt
141
141
  1 katalogmerkmal, typisch
142
- 1 katalogorientieren, allen
142
+ 1 katalogorientiert, allen
143
143
  1 kategorie, allen
144
144
  1 klassifikation, existierend
145
145
  1 kollektion, charakterisiert
@@ -272,4 +272,4 @@
272
272
  1 zuteilung, lexikalisch
273
273
  1 zuweisung, getrennt
274
274
  1 zuweisungsverfahren, basiert
275
- 1 zuweisungsverfahren, statistisch basiert
275
+ 1 zuweisungsverfahren, statistisch basiert
data/test/ref/artikel.vec CHANGED
@@ -48,7 +48,7 @@ anwachsen
48
48
  anwendung
49
49
  anwendungsbereich
50
50
  arbeitend
51
- arbeitsaufwendig
51
+ arbeitsaufwändig
52
52
  arbeitspapier
53
53
  artist
54
54
  aspekt
@@ -446,7 +446,7 @@ katalogbrüche
446
446
  katalogfunktion
447
447
  katalogmerkmal
448
448
  katalogmodell
449
- katalogorientieren
449
+ katalogorientiert
450
450
  katalogumgebung
451
451
  kategorie
452
452
  kenntnis
@@ -647,7 +647,7 @@ retrievalfähigkeit
647
647
  retrievalgründen
648
648
  retrievalinstrument
649
649
  retrievalmöglichkeit
650
- retrievalorientieren
650
+ retrievalorientiert
651
651
  retrievalsituation
652
652
  retrievalsystem
653
653
  retrievaltauglich
@@ -736,7 +736,7 @@ suchindex
736
736
  suchkonstellation
737
737
  suchmaschine
738
738
  suchmöglichkeit
739
- suchszenario
739
+ suchszenarium
740
740
  synonym
741
741
  synonymbeziehung
742
742
  system
@@ -940,4 +940,4 @@ zweitausendeins
940
940
  öl
941
941
  überblick
942
942
  überspitzen
943
- überspitzt
943
+ überspitzt