lingo 1.8.0 → 1.8.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (100) hide show
  1. data/ChangeLog +13 -0
  2. data/README +49 -29
  3. data/Rakefile +28 -4
  4. data/TODO +2 -9
  5. data/bin/lingo +24 -0
  6. data/bin/lingoctl +24 -0
  7. data/de/lingo-dic.txt +559 -74
  8. data/info/gpl-hdr.txt +21 -24
  9. data/lib/lingo.rb +83 -112
  10. data/lib/lingo/agenda_item.rb +53 -0
  11. data/lib/lingo/attendee.rb +261 -0
  12. data/lib/lingo/attendee/abbreviator.rb +95 -97
  13. data/lib/lingo/attendee/debugger.rb +94 -93
  14. data/lib/lingo/attendee/decomposer.rb +76 -83
  15. data/lib/lingo/attendee/dehyphenizer.rb +141 -144
  16. data/lib/lingo/attendee/formatter.rb +65 -0
  17. data/lib/lingo/attendee/multi_worder.rb +302 -0
  18. data/lib/lingo/attendee/noneword_filter.rb +89 -84
  19. data/lib/lingo/attendee/object_filter.rb +91 -0
  20. data/lib/lingo/attendee/sequencer.rb +159 -158
  21. data/lib/lingo/attendee/synonymer.rb +81 -84
  22. data/lib/lingo/attendee/text_reader.rb +242 -0
  23. data/lib/lingo/attendee/text_writer.rb +169 -0
  24. data/lib/lingo/attendee/tokenizer.rb +192 -191
  25. data/lib/lingo/attendee/variator.rb +152 -156
  26. data/lib/lingo/attendee/vector_filter.rb +140 -135
  27. data/lib/lingo/attendee/word_searcher.rb +98 -0
  28. data/lib/lingo/buffered_attendee.rb +69 -0
  29. data/lib/lingo/cachable.rb +58 -0
  30. data/lib/lingo/call.rb +72 -0
  31. data/lib/lingo/cli.rb +26 -0
  32. data/lib/lingo/config.rb +23 -26
  33. data/lib/lingo/core_ext.rb +42 -0
  34. data/lib/lingo/ctl.rb +239 -173
  35. data/lib/lingo/database.rb +148 -496
  36. data/lib/lingo/database/crypter.rb +85 -0
  37. data/lib/lingo/database/gdbm_store.rb +49 -0
  38. data/lib/lingo/database/hash_store.rb +67 -0
  39. data/lib/lingo/database/libcdb_store.rb +58 -0
  40. data/lib/lingo/database/sdbm_store.rb +64 -0
  41. data/lib/lingo/database/show_progress.rb +81 -0
  42. data/lib/lingo/database/source.rb +134 -0
  43. data/lib/lingo/database/source/key_value.rb +62 -0
  44. data/lib/lingo/database/source/multi_key.rb +65 -0
  45. data/lib/lingo/database/source/multi_value.rb +65 -0
  46. data/lib/lingo/database/source/single_word.rb +60 -0
  47. data/lib/lingo/database/source/word_class.rb +64 -0
  48. data/lib/lingo/error.rb +122 -0
  49. data/lib/lingo/language.rb +78 -518
  50. data/lib/lingo/language/dictionary.rb +173 -0
  51. data/lib/lingo/language/grammar.rb +211 -0
  52. data/lib/lingo/language/lexical.rb +66 -0
  53. data/lib/lingo/language/lexical_hash.rb +88 -0
  54. data/lib/lingo/language/token.rb +48 -0
  55. data/lib/lingo/language/word.rb +130 -0
  56. data/lib/lingo/language/word_form.rb +83 -0
  57. data/lib/lingo/reportable.rb +59 -0
  58. data/lib/lingo/version.rb +1 -1
  59. data/lingo-all.cfg +14 -10
  60. data/lingo-call.cfg +5 -5
  61. data/lingo.cfg +14 -12
  62. data/lingo.rb +26 -0
  63. data/lir.cfg +13 -9
  64. data/spec/spec_helper.rb +1 -0
  65. data/test.cfg +11 -11
  66. data/test/attendee/ts_abbreviator.rb +0 -6
  67. data/test/attendee/ts_decomposer.rb +0 -6
  68. data/test/attendee/{ts_multiworder.rb → ts_multi_worder.rb} +1 -7
  69. data/test/attendee/ts_noneword_filter.rb +1 -7
  70. data/test/attendee/{ts_objectfilter.rb → ts_object_filter.rb} +1 -7
  71. data/test/attendee/ts_sequencer.rb +0 -6
  72. data/test/attendee/ts_synonymer.rb +0 -6
  73. data/test/attendee/{ts_textreader.rb → ts_text_reader.rb} +1 -7
  74. data/test/attendee/{ts_textwriter.rb → ts_text_writer.rb} +1 -7
  75. data/test/attendee/ts_tokenizer.rb +0 -6
  76. data/test/attendee/ts_variator.rb +0 -6
  77. data/test/attendee/ts_vector_filter.rb +1 -7
  78. data/test/attendee/{ts_wordsearcher.rb → ts_word_searcher.rb} +1 -7
  79. data/test/ref/artikel.non +2 -29
  80. data/test/ref/artikel.seq +13 -8
  81. data/test/ref/artikel.vec +30 -15
  82. data/test/ref/artikel.ven +29 -14
  83. data/test/ref/artikel.ver +58 -43
  84. data/test/ref/lir.csv +146 -145
  85. data/test/ref/lir.non +186 -210
  86. data/test/ref/lir.seq +54 -50
  87. data/test/test_helper.rb +41 -36
  88. data/test/ts_database.rb +12 -11
  89. data/test/ts_language.rb +118 -68
  90. metadata +67 -29
  91. data/lib/lingo/attendee/multiworder.rb +0 -301
  92. data/lib/lingo/attendee/objectfilter.rb +0 -86
  93. data/lib/lingo/attendee/textreader.rb +0 -237
  94. data/lib/lingo/attendee/textwriter.rb +0 -196
  95. data/lib/lingo/attendee/wordsearcher.rb +0 -96
  96. data/lib/lingo/attendees.rb +0 -289
  97. data/lib/lingo/const.rb +0 -131
  98. data/lib/lingo/modules.rb +0 -98
  99. data/lib/lingo/types.rb +0 -285
  100. data/lib/lingo/utilities.rb +0 -40
@@ -12,7 +12,7 @@
12
12
  00019*1 erschließung, inhaltlich 1 indexierung, syntaktisch
13
13
  00021*1 selektion, automatisch
14
14
  00022*1 indexiermuster, sachbezogen 1 rahmenregelung, methodisch
15
- 00024*1 darstellung, ausführlich 1 sektion, verschieden 1 wiedergebrauch, effektiv
15
+ 00024*1 darstellung, ausführlich 1 rolle, besonders 1 sektion, verschieden 1 wiedergebrauch, effektiv
16
16
  00025*1 indexierungssystem, alphabetisch
17
17
  00028*1 indexierungsdaten, verbal 1 verarbeitung, maschinell
18
18
  00029*1 basis, abstrakt linguistisch 1 basis, linguistisch 1 grundlage, allgemein 1 sachregister, alphabetisch
@@ -21,21 +21,21 @@
21
21
  00033*1 religion, christlich
22
22
  00034*1 beschreibung, kurz 1 indexierungssystem, verbal 1 sprache, skandinavisch
23
23
  00036*1 ansatz, wichtig 1 indexierungsmodell, statistisch 1 termgewicht, vorgeschlagen
24
- 00038*1 arbeit, intellektuell 1 arbeit, überholt intellektuell 1 bibliothek, einig 1 buch, ganz 1 diskussion, merkwürdig 1 indexierung, breit 1 informationstechnologie, modern 1 informationstechnologie, wirklich modern 1 intellektuelle, überholt 1 katalog, gedruckt 1 mangel, zunehmend 1 moderne, wirklich 1 sacherschließung, bibliothekarisch 1 schlagwort, eng 1 schlagwort, hilfreich 1 thema, indiziert 1 zeit, langsam
24
+ 00038*1 arbeit, intellektuell 1 arbeit, überholt intellektuell 1 bibliothek, einig 1 buch, ganz 1 diskussion, merkwürdig 1 indexierung, breit 1 informationstechnologie, modern 1 informationstechnologie, wirklich modern 1 katalog, gedruckt 1 mangel, zunehmend 1 moderne, wirklich 1 sacherschließung, bibliothekarisch 1 schlagwort, eng 1 schlagwort, hilfreich 1 thema, indiziert 1 zeit, langsam
25
25
  00039*2 thesaurus, allgemein 1 bibliografie, deutsch 1 bibliothek, deutsch 1 schlagwort, verwendet 1 verzeichnis, wöchentlich
26
26
  00040*1 anmerkung, kritisch 1 erörterung, abschließend 1 indexierung, frei 1 indexierung, maschinell 1 indexierung, verbindlich 1 textsuche, frei
27
27
  00041*1 indexierung, automatisch
28
28
  00042*1 objekt, abstrakt
29
29
  00043*1 bereich, international 1 bibliografie, laufend 1 möglichkeit, realisierbar 1 schwerpunkt, inhaltlich 1 thema, vernachlässigt
30
- 00044*2 kategorie, semantisch 1 gut, genügend 1 kategorie, wichtig semantisch 1 text, machend 1 voraussagbar, genügend gut 1 voraussagbar, gut 1 wiedergabetreue, ausreichend 1 zahl, klein
31
- 00045*2 sachregister, alphabetisch 1 zugriff, besseren
30
+ 00044*2 kategorie, semantisch 1 beachtung, besonders 1 beachtung, unter besonders 1 form, gut voraussagbar 1 form, voraussagbar 1 gut, genügend 1 kategorie, wichtig semantisch 1 prozess, zweistufig 1 text, machend 1 wiedergabetreue, ausreichend 1 zahl, klein
31
+ 00045*2 sachregister, alphabetisch 1 begriff, hierarchisch hoch 1 begriff, hoch 1 begriff, spezifisch 1 zugriff, besseren
32
32
  00046*1 grundlage, linguistisch 1 sacherschließungsmethode, verbal
33
- 00047*1 aktuell-synchronischen, unter weitgehend 1 aktuell-synchronischen, weitgehend 1 beschäftigung, praktisch 1 entwicklung, bisherig 1 entwicklung, historisch 1 identität, absolut 1 lösung, praktisch 1 platonismus, dreifach 1 textinhaltsgegebenheit, absolut 1 universalität, absolut identisch 1 universalität, identisch
33
+ 00047*1 aktuell-synchronischen, unter weitgehend 1 aktuell-synchronischen, weitgehend 1 beschäftigung, praktisch 1 entwicklung, bisherig 1 entwicklung, historisch 1 identität, absolut 1 lösung, praktisch 1 platonismus, dreifach 1 statisch-strukturell, sehr 1 textinhaltsgegebenheit, absolut 1 universalität, absolut identisch 1 universalität, identisch
34
34
  00048*1 beispiel, einig 1 fachgebiet, untersucht 1 kategorie, verschieden 1 schema, dargestellt 1 typ, verschieden 1 untersuchung, statistisch
35
35
  00049*1 informationsprofil, individuell 1 informationssystem, betriebseigen
36
36
  00052*2 indexierung, automatisch 1 anpassung, erheblich 1 berücksichtigung, unter 1 system, einfach 1 system, äußerst einfach 1 systemstrategie, jeweilig
37
37
  00053*2 indexierungssystem, automatisch 1 arbeit, vorliegend 1 indexierungswörterbuch, groß 1 vokabular, vorgeschrieben
38
- 00054*1 folge, logisch 1 folge, natürlich logisch 1 indexierung, automatisch 1 indexierungsansatz, theoretisch 1 vektorraum-modell, klassisch
38
+ 00054*1 anwendung, sinnvoll 1 folge, logisch 1 folge, natürlich logisch 1 indexierung, automatisch 1 indexierungsansatz, theoretisch 1 vektorraum-modell, klassisch
39
39
  00055*2 indexierung, automatisch 1 beispiel, trivial 1 forschungsrichtung, weit 1 information-retrieval-system, ideal 1 richtung, aufgezeigt
40
40
  00056*1 bedeutung, unerträglich
41
41
  00057*1 grundlagenforschung, universitär 1 klassifikationssystem, existent 1 vorteil, weit
@@ -50,14 +50,15 @@
50
50
  00071*1 dokumentationsverfahren, maschinell 1 dokumentationsverfahren, orientiert maschinell 1 grundlage, systematisch
51
51
  00074*1 indexierung, automatisch
52
52
  00075*1 indexierung, automatisch
53
- 00078*1 documentalist, blind 1 rundfunk, saarländisch
53
+ 00078*1 rundfunk, saarländisch
54
54
  00079*1 analyse, vergleichend 1 bezugseinheit, dokumentarisch 1 indexierung, intellektuell 1 literaturdatenbank, biomedizinisch 1 online-datenbank, biomedizinisch 1 zuteilung, maschinell 1 zuteilung, verfügbar maschinell
55
55
  00080*1 klassifikation, automatisch thematisch 1 klassifikation, thematisch
56
56
  00081*1 analyse, vergleichend 1 indexierung, automatisch
57
57
  00082*2 register, gedruckt 1 kwoc-verfahren, modifiziert 1 steuerung, genau
58
58
  00083*2 daten, unstrukturiert 1 automatich, weitgehend 1 bedienung, einfach 1 bedienung, möglich einfach 1 benutzer, einzeln 1 benutzerkreis, breit 1 dialogform, verschieden 1 nutzungsflexibilität, hoch 1 oberflächengestaltung, systematisch
59
- 00086*1 beziehung, international 1 database, cooperativ online 1 database, online 1 überlegung, ökonomisch
60
- 00088*1 ergebnis, brauchbar 1 fortsetzung, konsequent 1 indexierung, automatisch 1 indexierung, syntaktisch 1 satzanalyse, vollständig
59
+ 00084*1 berücksichtigung, besonders 1 berücksichtigung, unter besonders
60
+ 00086*1 beziehung, international 1 database, cooperativ online 1 database, online 1 retrieval, online 1 überlegung, ökonomisch
61
+ 00088*1 begriff, komplex 1 ergebnis, brauchbar 1 fortsetzung, konsequent 1 indexierung, automatisch 1 indexierung, syntaktisch 1 satzanalyse, vollständig
61
62
  00089*1 patentinformationssystem, deutsch
62
63
  00090*1 sacherschließung, verbal 1 tagung, international
63
64
  00092*1 erschließung, sachlich 1 indexierung, maschinell
@@ -86,16 +87,17 @@
86
87
  00126*1 informationssystem, biografisch 1 informationssystem, international biografisch
87
88
  00127*1 ausführung, folgend 1 software, betrachtet
88
89
  00128*1 begriffssystem, verwendet 1 fachgebiet, dominierend 1 genauigkeitsrate, hoch 1 indexierung, maschinell 1 nummerierung, fortlaufend 1 variante, verschieden
89
- 00129*1 anregung, interessant 1 beziehung, syntaktisch 1 fachinformationssystem, modern 1 indexierung, syntaktisch 1 kennzeichnung, eindeutig 1 methode, entwickelt 1 ordnungselement, alphabetisch 1 verknüpfungsmittel, syntaktisch
90
+ 00129*1 anregung, interessant 1 begriff, ordnend 1 beziehung, syntaktisch 1 fachinformationssystem, modern 1 indexierung, syntaktisch 1 kennzeichnung, eindeutig 1 methode, entwickelt 1 ordnungselement, alphabetisch 1 verknüpfungsmittel, syntaktisch
91
+ 00132*1 erfordernis, berufsbedingt
90
92
  00133*1 debatte, international 1 horizont, national 1 sacherschließung, verbal 1 verbreitung, zunehmend 1 übersetzung, gekürzt 1 übersetzung, leicht gekürzt
91
93
  00134*1 analyse, semantisch 1 inhaltserschließung, maschinell 1 wort, komplex 1 wort, morphologisch komplex
92
94
  00135*1 ausführung, vorliegend 1 bedeutung, zentral 1 einblick, kurz 1 maß, zunehmend 1 reputation, wissenschaftlich 1 tätigkeit, wissenschaftlich 1 zeitschriftentitel, jeweilig
93
- 00136*1 post, elektronisch
95
+ 00136*1 post, elektronisch 1 post, weltweit elektronisch
94
96
  00137*2 inhalt, neu 1 anpassung, gegenseitig 1 datenbank, vorhanden 1 datenformat, verwendet 1 patentklassifikation, strukturiert 1 änderung, aktuell
95
- 00138*1 abbild, zutreffend 1 einrichtung, wissenschaftlich 1 einwandfreien, methodisch 1 fachdatenbank, elektronisch 1 information, gespeichert 1 ranglisten, erstellt
97
+ 00138*1 abbild, zutreffend 1 einrichtung, wissenschaftlich 1 einwandfrei, methodisch 1 fachdatenbank, elektronisch 1 information, gespeichert 1 rangliste, erstellt
96
98
  00140*1 bibliothek, deutsch 1 bibliotheksinstitut, deutsch 1 form, operational
97
99
  00141*1 bibliothek, öffentlich 1 erschließungstechnik, neu
98
- 00142*1 arbeit, folgend 1 information, ausreichend 1 vergleichsuntersuchung, entsprechend 1 wissenschaftlergruppe, bestimmt
100
+ 00142*1 arbeit, folgend 1 forschungspolitisch, sinnvoll 1 information, ausreichend 1 vergleichsuntersuchung, entsprechend 1 wissenschaftlergruppe, bestimmt
99
101
  00143*1 untersuchung, vergleichend
100
102
  00144*1 inhaltserschließung, automatisch
101
103
  00145*1 indexierung, automatisch
@@ -104,8 +106,9 @@
104
106
  00148*1 information, human
105
107
  00149*1 indexierung, automatisch
106
108
  00150*1 datei, elektronisch 1 post, rheinisch
109
+ 00153*1 expertensystem, groß
107
110
  00154*1 dokumentation, inhaltlich 1 indexierung, kontrolliert 1 komfort, erreicht 1 schnittgenau, gar
108
- 00155*1 ausgabe, gedruckt 1 information, gewünscht 1 inhaltserschließung, gut 1 prüfung, kritisch 1 speicherkapazität, groß 1 zürcher, neu
111
+ 00155*1 ausgabe, gedruckt 1 information, gewünscht 1 inhaltserschließung, gut 1 maß, besonders 1 prüfung, kritisch 1 speicherkapazität, groß 1 zugriff, zielgenau 1 zürcher, neu
109
112
  00156*1 grundlage, linguistisch
110
113
  00158*1 indexierung, automatisch
111
114
  00159*1 indexierung, automatisch 1 inhaltserschließung, bibliothekarisch
@@ -113,25 +116,26 @@
113
116
  00162*1 bibliothekskatalog, groß
114
117
  00163*1 aspekt, qualitativ 1 sacherschließung, verbal
115
118
  00164*1 dokument, relevant 1 informationsmenge, riesig 1 internet, chaotisch organisiert 1 internet, organisiert 1 monat, vergangen 1 nutzung, effektiv 1 online-medium, populär 1 problem, schwerwiegend 1 suchwerkzeug, genannt
116
- 00165*1 analyse, statistisch 1 analyse, umfangreich 1 faszination, stark 1 forschungsgeld, fließend 1 forschungsgeld, knapp fließend 1 gutachter-system, überfordert 1 interpretation, sorgfältig 1 selektionskriterium, geeignet 1 spezialist, wenig
117
- 00166*1 aussage, wichtig 1 indexsprache, kategorisiert 1 mangel, bedingt 1 ordnung, hoch 1 regel, einfach 1 satz, letzte 1 struktur, linear 1 überblick, besseren
118
- 00171*1 marketingstratege, kreativ 1 marketingstratege, unermüdlich kreativ
119
+ 00165*1 analyse, statistisch 1 analyse, umfangreich 1 anwendung, sinnvoll 1 faszination, stark 1 forschungsgeld, fließend 1 forschungsgeld, knapp fließend 1 gutachter-system, überfordert 1 interpretation, sorgfältig 1 selektionskriterium, geeignet 1 spezialist, wenig
120
+ 00166*1 aussage, wichtig 1 begriff, gesucht 1 begriff, syntaktisch verknüpft 1 begriff, verknüpft 1 begriff, zusammengehörend 1 indexsprache, kategorisiert 1 mangel, bedingt 1 ordnung, hoch 1 regel, einfach 1 satz, letzte 1 struktur, linear 1 überblick, besseren
121
+ 00170*1 informationsvermittlung, sinnvoll
122
+ 00171*1 begriff, neu 1 marketingstratege, kreativ 1 marketingstratege, unermüdlich kreativ
119
123
  00173*1 bildschirmschoner, global 1 toilette, öffentlich 1 webpage, seltsam
120
- 00174*3 datenbank, bibliografisch 3 oberfläche, visuell 1 soll, folgend 1 studie, früh
121
- 00176*1 bibliothek, wissenschaftlich 1 form, kurz 1 information, technisch 1 maßnahmen, wesentlich 1 maßnahmen, zugeordnet wesentlich 1 nutzung, verstärkt 1 selbstverwaltung, wissenschaftlich 1 struktur, wesentlich 1 ziel, langfristig 1 ziel, wesentlich 1 zugang, effizient
124
+ 00174*3 datenbank, bibliografisch 3 oberfläche, visuell 1 retrieval, traditionell 1 soll, folgend 1 studie, früh
125
+ 00176*1 bibliothek, wissenschaftlich 1 form, kurz 1 information, technisch 1 maßnahme, wesentlich 1 maßnahme, zugeordnet wesentlich 1 nutzung, verstärkt 1 selbstverwaltung, wissenschaftlich 1 struktur, wesentlich 1 ziel, langfristig 1 ziel, wesentlich 1 zugang, effizient
122
126
  00177*1 arbeitsgang, sonstig 1 datenbank, verbunden 1 datenbanksystem, gesamt 1 datenbanksystem, umfassend 1 dokumenttyp, alle verschieden 1 dokumenttyp, verschieden 1 mediendatenbank, umfassend 1 textdokument, alle 1 zusammenstellung, elektronisch
123
127
  00178*1 bild, digital
124
128
  00181*1 eitelkeit, gelehrt
125
129
  00182*1 kinderbibliothek, gerade 1 medienerlebnis, kreativ 1 medium, neu 1 technologie, neu 1 welt, real 1 zugang, neu
126
130
  00183*1 enzyklopädie, interaktiv 1 kulturfahrplan, groß
127
- 00185*1 indexierung, automatisch 1 indexierung, intellektuell 1 indexierungsverfahren, automatisch 1 klassifikation, automatisch 1 klärung, terminologisch 1 kooperation, eng
131
+ 00185*1 begriff, weit 1 indexierung, automatisch 1 indexierung, intellektuell 1 indexierungsverfahren, automatisch 1 klassifikation, automatisch 1 klärung, terminologisch 1 kooperation, eng
128
132
  00186*2 indexierung, automatisch 2 klassifikation, automatisch 1 dokument, klassifiziert 1 dokumentklassifikation, automatisch 1 einführung, kurz 1 relation, statistisch 1 thema, folgend
129
133
  00187*1 arbeitsgruppe, bibliothekarisch
130
134
  00191*1 erschließung, automatisch 1 klassifikation, hierarchisch 1 klassifikation, thematisch hierarchisch 1 ordnungsstruktur, gewonnen 1 text, wiedergewonnen 1 textklassifikation, automatisch thematisch 1 textklassifikation, thematisch 1 wichtigkeitsstufe, entstanden
131
135
  00192*2 indexierung, automatisch 1 datenbank, groß 1 facettenklassifikation, universal 1 fachwort, wichtig 1 indexierung, unter automatisch 1 klassifikationssystem, vorgegeben 1 sprache, deutsch 1 titel, beliebig 1 veröffentlichung, wissenschaftlich
132
136
  00193*1 abfragbar, online 1 indexierung, numerisch 1 zugang, schnell
133
- 00194*1 indexierung, intellektuell 1 methode, neu 1 system, britisch
134
- 00195*1 indexierung, intellektuell 1 methode, neu 1 system, britisch
137
+ 00194*1 berücksichtigung, besonders 1 berücksichtigung, unter besonders 1 indexierung, intellektuell 1 methode, neu 1 system, britisch
138
+ 00195*1 berücksichtigung, besonders 1 berücksichtigung, unter besonders 1 indexierung, intellektuell 1 methode, neu 1 system, britisch
135
139
  00197*1 arbeit, beruflich 1 beziehung, bestimmt 1 einheit, thematisch 1 inhalt, kommuniziert 1 kern, eigen 1 kerngebiet, komplex 1 potential, technisch 1 veränderung, technisch
136
140
  00198*1 inhaltserschließung, automatisch
137
141
  00199*1 anwendung, unter 1 moderne, befindlich 1 standardsystem, herkömmlich
@@ -139,13 +143,13 @@
139
143
  00201*1 bibliothek, wissenschaftlich 1 bibliothekskongress, deutsch
140
144
  00204*1 konferenz, international
141
145
  00205*1 bibliothek, deutsch
142
- 00206*1 forschungsgemeinschaft, deutsch 1 indexierung, automatisch 1 inhaltserschließung, automatisch 1 projekt, durchgeführt 1 sacherschließung, bibliothekarisch 1 sacherschließung, konventionell bibliothekarisch
143
- 00207*2 stellung, systematisch 1 bezeichnung, taxonomisch 1 eingabe, unter 1 erreger, dazugehörig 1 hilfe, unterstützt 1 indexdatei, vorgegeben 1 nachschlagewerk, verschieden 1 name, wissenschaftlich 1 objekt, biologisch 1 rationalisierung, weit 1 weise, gleich
146
+ 00206*1 forschungsgemeinschaft, deutsch 1 indexierung, automatisch 1 inhaltserschließung, automatisch 1 projekt, durchgeführt 1 sacherschließung, bibliothekarisch 1 sacherschließung, konventionell bibliothekarisch 1 verbindung, sinnvoll
147
+ 00207*2 stellung, systematisch 1 begriff, verändert 1 bezeichnung, taxonomisch 1 eingabe, unter 1 erreger, dazugehörig 1 hilfe, unterstützt 1 indexdatei, vorgegeben 1 nachschlagewerk, verschieden 1 name, wissenschaftlich 1 objekt, biologisch 1 rationalisierung, weit 1 weise, gleich
144
148
  00208*1 anpassung, strukturell 1 bereich, folgend 1 katalog, elektronisch 1 problem, allgemein 1 umfang, erreicht 1 vokabular, universal 1 überarbeitung, grundsätzlich
145
149
  00209*2 umfeldsuche, semantisch 1 ergebnis, unbefriedigend 1 indexierung, maschinell 1 katalog, konventionell 1 online-katalog, bibliothekarisch 1 suche, sachlich 1 umfeld, semantisch 1 vokabular, strukturiert
146
150
  00210*1 bild, entsprechend 1 möglichkeit, technisch 1 speicher, effektiv 1 suchanfragen, formuliert 1 system, verschieden 1 voraussetzung, alle
147
151
  00211*1 fachinformation, sozialwissenschaftlich
148
- 00212*2 informationssuche, effizient 1 kostenfaktor, verschieden 1 multimedia-dokumentkollektion, verteilt 1 multimedial, verteilt 1 ranglist, final 1 ranglisten, individuell 1 skalierbar, beliebig 1 typ, beliebig
152
+ 00212*2 informationssuche, effizient 1 kostenfaktor, verschieden 1 multimedia-dokumentkollektion, verteilt 1 multimedial, verteilt 1 rangliste, final 1 rangliste, individuell 1 skalierbar, beliebig 1 typ, beliebig
149
153
  00213*1 beitrag, vorliegend 1 beziehung, derartig 1 indexierung, automatisch 1 indexierungssystem, automatisch 1 interesse, groß 1 relation, erfasst 1 schätzverfahren, verschieden 1 schätzverfahren, vorgeschlagen
150
154
  00214*1 indexierung, automatisch
151
155
  00215*1 indexierungsfunktion, logistisch
@@ -155,7 +159,7 @@
155
159
  00219*1 praxis, neu
156
160
  00221*1 bibliotheksindex, allgemein 1 system, national
157
161
  00222*1 indexierung, syntaktisch
158
- 00223*1 nachricht, aktuell
162
+ 00223*1 informationsquelle, groß 1 nachricht, aktuell
159
163
  00225*1 deutsche, professionell 1 seite, deutsch 1 seite, professionell deutsch 1 spur, grün 1 umwelt-angebot, unzählig
160
164
  00227*1 datenbank, verschieden 1 datenmenge, gespeichert 1 erkenntnis, allgemein
161
165
  00228*1 studie, neu
@@ -165,7 +169,7 @@
165
169
  00232*2 bibliothek, deutsch 1 dienst, zentral 1 dokumentationssprache, adäquat 1 gleichordnend, augenblicklich 1 indexierungsverfahren, britisch 1 jahr, einig 1 linguistik, modern 1 sacherschließung, verbal 1 sprache, natürlich 1 stande, alternativ 1 version, britisch 1 version, verkürzt
166
170
  00233*1 einsatz, praktisch 1 halbautomatisch, arbeitet 1 heuristik, linguistisch 1 information, gewonnen 1 verantwortung, gesellschaftlich
167
171
  00234*2 patentklassifikation, international 1 auflage, letzte 1 einteilungssystem, ganz 1 information, erfasst 1 klassifikationssymbol, obligatorisch 1 neuerung, gravierend 1 sachgebieten, bestimmt 1 sachverhalt, technisch 1 stelle, passend
168
- 00236*2 patentinformationssystem, deutsch 1 ansatz, allgemein 1 informationswissenschaft, linguistisch 1 patentamt, deutsch
172
+ 00236*2 patentinformationssystem, deutsch 1 ansatz, allgemein 1 informationswissenschaft, linguistisch 1 patentamt, deutsch 1 retrievaltest, extensiv
169
173
  00237*1 dezimalklassifikation, dreisprachig universal 1 dezimalklassifikation, universal 1 erschließung, intellektuell 1 informationsressource, relevant 1 informationsressource, wissenschaftlich relevant 1 internetressource, gesammelt 1 server, relevant 1 server, wissenschaftlich relevant
170
174
  00238*1 informationsressource, relevant 1 informationsressource, wissenschaftlich relevant
171
175
  00239*1 archivsystem, optisch 1 bedingung, alle 1 datenbank, international 1 informationsflut, anwachsend 1 informationsflut, stetig anwachsend 1 umfeld, technisch
@@ -176,7 +180,7 @@
176
180
  00244*1 indexierung, automatisch
177
181
  00246*1 indexierung, manuell
178
182
  00247*1 artikel, zitierend 1 datenbank, einzig 1 einrichtung, allem 1 entwicklungsstand, derzeitig 1 forschungseinrichtung, groß 1 fußnote, gemeinsam 1 information, wissenschaftlich 1 literatur, zitiert 1 produkt, parallel 1 wissenschaftsfächer, mehrere 1 zitationsdatenbank, groß
179
- 00248*1 arbeit, praktisch 1 einsatz, praktisch 1 erfahrung, intensiv praktisch 1 erfahrung, praktisch 1 erschließung, inhaltlich 1 form, rührend 1 gleichermaß, informiert 1 grundlage, theoretisch 1 problem, auftretend 1 register, ausführlich 1 register, ungewöhnlich ausführlich 1 überlegung, gründlich
183
+ 00248*1 arbeit, praktisch 1 einsatz, praktisch 1 erfahrung, intensiv praktisch 1 erfahrung, praktisch 1 erschließung, inhaltlich 1 form, rührend 1 gleichermaß, informiert 1 grundlage, theoretisch 1 problem, auftretend 1 register, ausführlich 1 register, ungewöhnlich ausführlich 1 retrievalmöglichkeit, spät 1 überlegung, gründlich
180
184
  00249*1 bibliothek, deutsch
181
185
  00250*1 abhilfe, automatisch 1 analyseverfahren, neu 1 datenmenge, verfügbar 1 information, relevant 1 pfad, neu
182
186
  00251*1 suchfunktion, ausgereift 1 suchfunktion, eigen 1 webserver, eigen
@@ -186,16 +190,16 @@
186
190
  00255*2 wahrheit, unterdrückt 1 bildbearbeitung, digital 1 fotografie, politisch 1 höhepunkt, vorläufig
187
191
  00258*1 darstellung, besseren 1 fachgesellschaft, wissenschaftlich 1 jahr, einig 1 material, spezifisch 1 methode, technisch 1 methode, verwendet technisch 1 verfügbarkeit, besseren
188
192
  00259*1 lotus, unter 1 version, neu
189
- 00260*1 aktualität, mangelnd 1 anbieter, kommerziell 1 beitrag, folgend 1 erschließung, automatisch 1 internetquell, gefunden 1 link-sammlung, thematisch 1 maß, erheblich stark 1 maß, stark 1 mehr, wohl 1 netz, gesamt 1 quell, erschlossen 1 quell, intellektuell erschlossen 1 suchmaschine, divers
193
+ 00260*1 aktualität, mangelnd 1 anbieter, kommerziell 1 beitrag, folgend 1 erschließung, automatisch 1 internetquelle, gefunden 1 link-sammlung, thematisch 1 maß, erheblich stark 1 maß, stark 1 mehr, wohl 1 netz, gesamt 1 quelle, erschlossen 1 quelle, intellektuell erschlossen 1 suchmaschine, divers
190
194
  00261*2 indexierung, automatisch 1 forschungsgemeinschaft, deutsch 1 projekt, durchgeführt 1 sacherschließung, bibliothekarisch
191
195
  00264*2 indexierung, automatisch 1 mischform, realisiert 1 relevanz, statistisch 1 suchergebnis, sortiert
192
196
  00265*1 datenverarbeitung, elektronisch 1 dokumentationsmethode, wenig 1 fachsprache, starr 1 fachterminologie, akzeptiert 1 philosophie-dokumentation, elektronisch
193
- 00267*1 dokumenterschließung, automatisch 1 indexierung, automatisch 1 milos-verfahren, erweitert 1 projekt, gefördert 1 titeldaten, angereichert
197
+ 00267*1 dokumenterschließung, automatisch 1 indexierung, automatisch 1 milos-verfahren, erweitert 1 projekt, gefördert 1 retrievaltest, umfangreich 1 titeldaten, angereichert
194
198
  00268*1 publikation, elektronisch 1 sicht, bibliothekarisch 1 trend, aktuell
195
199
  00269*1 visualisierungstechnik, innovativ
196
200
  00270*1 inhaltserschließung, verbal 1 literaturbericht, kommentiert
197
201
  00271*1 sacherschließung, verbal
198
- 00273*1 indexierung, syntaktisch
202
+ 00273*2 retrieval, online 1 indexierung, syntaktisch
199
203
  00274*1 database, online 1 dokumenterschließung, inhaltlich
200
204
  00275*1 indexierung, maschinell
201
205
  00276*2 information, relevant 1 information, lokal 1 konsens, breiten 1 suchmaschine, universal 1 teil, relevant 1 web-server, eigen 1 weise, einheitlich 1 zugang, effizient
@@ -204,29 +208,29 @@
204
208
  00280*1 erkenntnis, methodisch
205
209
  00281*1 leistung, wissenschaftlich
206
210
  00283*1 bibliotheksverbund, kooperativ 1 konzept, lokal 1 schnittstelle, technisch
207
- 00284*1 darstellung, begrifflich 1 darstellung, einfach begrifflich 1 suchsystem, basiert 1 suchsystem, semantisch basiert 1 wörterbuch, umfassend 1 zusammenhang, systematisch
211
+ 00284*1 begriff, einfach 1 darstellung, begrifflich 1 darstellung, einfach begrifflich 1 retrieval, semantisch 1 retrievaltechnik, heutig 1 suchsystem, basiert 1 suchsystem, semantisch basiert 1 wörterbuch, umfassend 1 zusammenhang, systematisch
208
212
  00285*1 kriterium, verschieden 1 verteilung, zeitlich 1 verwendung, unter 1 wissenschaftskommunikation, formal
209
213
  00286*2 datenbank, bibliothekarisch 1 ergebnis, konsistent 1 indexierung, einheitlich 1 indexsystem, angegangen 1 konstruktion, unterschiedlich 1 oberfläche, einheitlich 1 problem, einig 1 schnittmenge, gemeinsam 1 schnittmenge, klein gemeinsam 1 suchergebnis, inkonsistent 1 suchschlüssel, gleich 1 suchschlüssel, scheinbar gleich 1 suchschlüssel, unterschiedlich 1 verbreitung, zunehmend
210
- 00287*2 information, smart 1 datei, groß 1 ergebnismenge, groß 1 gruppierung, automatisch 1 internetquell, verschieden 1 nachricht, aktuell 1 nachricht, einzeln 1 nachricht, zusammengestellt 1 sprache, deutsch 1 version, angepasst
214
+ 00287*2 information, smart 1 begriff, frei gewählt 1 begriff, gewählt 1 datei, groß 1 ergebnismenge, groß 1 gruppierung, automatisch 1 internetquelle, verschieden 1 nachricht, aktuell 1 nachricht, einzeln 1 nachricht, zusammengestellt 1 sprache, deutsch 1 version, angepasst
211
215
  00288*1 austausch, allen kommunikativ 1 austausch, kommunikativ 1 datenspeicher, elektronisch 1 erde, ganz 1 informationsverlust, ungewollt 1 objekt, intern 1 patent, international 1 schatz, gigantisch 1 schlüssel, entscheidend 1 speicher, auffindbar 1 sprache, zahlreich 1 suchoption, weit 1 technologie, alle 1 technologie, erfasst alle 1 teil, groß 1 terminologie, gemeinsam 1 terminologie, professionell 1 unternehmen, global 1 weg, benötigt 1 weltwissen, gesamt technisch 1 weltwissen, technisch 1 wirkung, integrativ 1 wirkung, stark integrativ
212
- 00289*1 informationswissenschaftlich, unser 1 known-item-retrievaltest, unser 1 suchwerkzeug, jeweilig
216
+ 00289*1 informationswissenschaftlich, unser 1 known-item-retrievaltest, unser 1 retrievaloberfläche, kund 1 suchwerkzeug, jeweilig
213
217
  00290*1 antwort, konkret 1 aufwand, hoch technologisch 1 aufwand, technologisch 1 auskunft, genau 1 bewertung, intern 1 bewertungsverfahren, kompliziert 1 dateiformat, kryptisch 1 datenbankservermelden, mächtig 1 dokument, ständig verfügbar 1 dokument, verfügbar 1 entscheidung, intuitiv 1 hyperlink, richtig 1 information, bessere 1 intelligenz, human 1 katalog, inhaltlich sortierend 1 katalog, sortierend 1 konzept, gut 1 kriterium, inhaltlich 1 liege, entfernt 1 linkverbindung, gut 1 maschine, automatisch 1 projekt, kalifornisch 1 recherche, automatisch 1 relevanz, inhaltlich 1 roboter, chic unentwegt 1 roboter, unentwegt 1 seite, alle 1 seite, aller 1 seite, zentral 1 sportergebnis, neu 1 studie, früh 1 suchroboter, chic 1 suchsystem, alle 1 suchtechnologie, konventionell 1 surfer, unzählig 1 thema, einig 1 verarbeitung, maschinell 1 verarbeitung, rein maschinell 1 viertel, weit 1 webadresse, beliebig 1 webseite, alle 1 webseite, aller 1 webseite, indiziert 1 webseite, katalogisiert 1 welt, heterogen 1 wort, alle 1 wort, erfasst alle
214
- 00291*3 handschrift, mittelalterlich 2 erschließung, bibliothekarisch 1 anforderung, neu 1 anforderung, völlig neu 1 belastung, stark 1 bereich, automatisiert 1 bereich, partiell automatisiert 1 bibliothek, wenig 1 bibliothekskatalog, allgemein 1 bibliotheksmaterial, herkömmlich 1 darstellung, ausführlich 1 dokument, elektronisch 1 dokument, neu elektronisch 1 festlegung, inhaltlich 1 festlegung, vielfach inhaltlich 1 gesamtindex, früh 1 handschriftenkatalog, gedruckt 1 handschriftenkatalog, gefördert 1 informationsgewinn, erheblich 1 jahr, einig 1 katalog, erstellt 1 katalog, gedruckt 1 katalogsystem, jeweilig 1 kreis, eng 1 material, verschieden 1 problem, entstehend technisch 1 problem, technisch 1 regelwerk, bibliothekarisch 1 richtlinie, gültig 1 suche, vereinheitlicht 1 system, verwendet 1 wirkung, tiefgreifend
215
- 00292*4 inhaltserschließung, automatisch 1 akzeptanz, merklich 1 ansatz, verschieden 1 anstrengung, verstärkt 1 anwenderkreisen, breiten 1 automatisierung, zunehmend 1 informationsflut, steigend 1 interesse, wachsend 1 komponente, bestimmt 1 produkt, neu 1 softwarewerkzeug, kommerziell vertrieben 1 softwarewerkzeug, vertrieben 1 vertrieb, kommerziell 1 zugriffsverfahren, effizient
216
- 00293*1 datenvolumen, groß 1 indexierung, maschinell 1 prozess, iterativ 1 sicht, technisch
217
- 00294*1 ansprüche, verändert 1 benutzer, unser 1 bibliotheksbenutzer, extern 1 form, allgemein 1 form, recht allgemein 1 jahr, letzte 1 problem, häufig 1 recherchemöglichkeit, hervorragend 1 rückgang, stark 1 umfeld, universitär
218
- 00295*1 einstieg, optimal 1 erhebung, ausgearbeitet empirisch 1 erhebung, empirisch 1 indexierung, automatisch 1 informationswissenschaftlich, seriös 1 speerspitze, technologisch 1 suchsystem, unterschiedlich 1 vokabular, geordnet kontrolliert 1 vokabular, kontrolliert
219
- 00296*1 befehlsorientieren, ausschließlich 1 befehlsorientieren, elaboriert 1 benutzerschnittstelle, ergonomisch 1 checklist, unser 1 datensätzen, singulär 1 indexierung, automatisch 1 informationsproduzent, isoliert 1 leistungsindikator, weit 1 methode, automatisch 1 methode, suboptimal 1 online-archiv, kommerziell 1 realisierungsmöglichkeit, technisch 1 suche, gut 1 system, irgendwelch 1 umgebung, experimentell 1 wirdjedoch, vorausgesetzt
218
+ 00291*3 handschrift, mittelalterlich 2 erschließung, bibliothekarisch 1 anforderung, neu 1 anforderung, völlig neu 1 belastung, stark 1 bereich, automatisiert 1 bereich, partiell automatisiert 1 bibliothek, wenig 1 bibliothekskatalog, allgemein 1 bibliotheksmaterial, besonders 1 bibliotheksmaterial, herkömmlich 1 darstellung, ausführlich 1 dokument, elektronisch 1 dokument, neu elektronisch 1 festlegung, inhaltlich 1 festlegung, vielfach inhaltlich 1 gesamtindex, früh 1 handschriftenkatalog, gedruckt 1 handschriftenkatalog, gefördert 1 informationsgewinn, erheblich 1 jahr, einig 1 katalog, erstellt 1 katalog, gedruckt 1 katalogsystem, jeweilig 1 kreis, eng 1 material, verschieden 1 problem, entstehend technisch 1 problem, technisch 1 regelwerk, bibliothekarisch 1 richtlinie, gültig 1 suche, vereinheitlicht 1 system, verwendet 1 wirkung, tiefgreifend
219
+ 00292*4 inhaltserschließung, automatisch 1 akzeptanz, merklich 1 ansatz, verschieden 1 anstrengung, verstärkt 1 anwenderkreisen, breiten 1 automatisierung, zunehmend 1 informationsflut, steigend 1 interesse, wachsend 1 komponente, bestimmt 1 produkt, neu 1 softwarewerkzeug, kommerziell vertrieben 1 softwarewerkzeug, vertrieben 1 vertrieb, kommerziell 1 zugriffsverfahren, effizient 1 zukunft, nah
220
+ 00293*1 begriff, alphabetisch 1 datenvolumen, groß 1 indexierung, maschinell 1 prozess, iterativ 1 sicht, technisch
221
+ 00294*1 ansprüche, verändert 1 benutzer, unser 1 bibliotheksbenutzer, extern 1 form, allgemein 1 form, recht allgemein 1 jahr, letzte 1 maß, besonders 1 problem, häufig 1 recherchemöglichkeit, hervorragend 1 rückgang, stark 1 umfeld, universitär
222
+ 00295*1 einstieg, optimal 1 erhebung, ausgearbeitet empirisch 1 erhebung, empirisch 1 indexierung, automatisch 1 informationswissenschaftlich, seriös 1 speerspitze, technologisch 1 suchsystem, unterschiedlich 1 vokabular, geordnet kontrolliert 1 vokabular, kontrolliert 1 zugriff, zielgenau
223
+ 00296*1 befehlsorientieren, ausschließlich 1 befehlsorientieren, elaboriert 1 benutzerschnittstelle, ergonomisch 1 checkliste, unser 1 datensätzen, singulär 1 indexierung, automatisch 1 informationsproduzent, isoliert 1 leistungsindikator, weit 1 methode, automatisch 1 methode, suboptimal 1 online-archiv, kommerziell 1 realisierungsmöglichkeit, technisch 1 retrievalsystem, gut 1 suche, gut 1 system, irgendwelch 1 umgebung, experimentell 1 wirdjedoch, vorausgesetzt
220
224
  00297*2 problem, methodisch 2 wissenschaftsforschung, empirisch 1 arbeit, vorliegend 1 basis, problematisch 1 bereich, semantisch 1 bereich, syntaktisch 1 charakter, dynamisch 1 faktor, beachtenswert 1 informationstheorie, semantisch 1 leistung, wissenschaftlich 1 problem, alle methodisch 1 problem, auftretend methodisch 1 problem, grundlegend 1 problem, offen 1 problem, spezifisch 1 publikation, elektronisch 1 publikation, zitiert 1 wirkung, wissenschaftlich
221
- 00298*3 text, elektronisch 2 erschließung, inhaltlich 1 aspekt-klassifikation, universal 1 erschließung, automatisch inhaltlich 1 erschließung, syntaktisch inhaltlich 1 klassifikationselement, bezogen 1 klassifikationselement, inhaltlich bezogen 1 recherche, zahlreich 1 suchalgorithmen, bekannt 1 suchgegenstand, jeweilig 1 textdokument, unbekannt
225
+ 00298*3 text, elektronisch 2 erschließung, inhaltlich 1 aspekt-klassifikation, universal 1 erschließung, automatisch inhaltlich 1 erschließung, syntaktisch inhaltlich 1 klassifikationselement, bezogen 1 klassifikationselement, inhaltlich bezogen 1 recherche, zahlreich 1 retrieval, syntaktisch 1 suchalgorithmen, bekannt 1 suchgegenstand, jeweilig 1 textdokument, unbekannt
222
226
  00299*1 angebot, nutzend 1 veröffentlichung, alle 1 übersetzungssystem, automatisch
223
- 00300*1 anwendung, experimentell 1 anwendungsfall, fruchtbar 1 erschließung, inhaltlich 1 migration, sozialwissenschaftlich 1 relation, komplex 1 suche, semantisch
227
+ 00300*1 anwendung, experimentell 1 anwendungsfall, fruchtbar 1 erschließung, inhaltlich 1 interesse, besonders 1 migration, sozialwissenschaftlich 1 relation, komplex 1 suche, semantisch
224
228
  00301*4 daten, inhaltlich 1 daten, formatiert 1 datenarten, inhaltlich 1 form, strukturiert 1 management, integriert 1 text, vorwiegend
225
229
  00302*1 anforderung, speziell 1 anwendungskontext, real 1 erschließung, automatisch inhaltlich 1 erschließung, inhaltlich 1 gesichtspunkt, qualitativ 1 indexierung, automatisch 1 inhaltserschließung, intellektuell 1 mangel, einig 1 methode, anerkannt 1 system, grundsätzlich unterschiedlich 1 system, lernend 1 system, unterschiedlich 1 trainingsvorlage, erstellt 1 trainingsvorlage, intellektuell erstellt
226
230
  00303*1 annotationssystem, verteilt 1 ansatz, konzeptuell 1 anwendungsbereich, exemplarisch 1 artikel, einschlägig 1 aufgabe, komplex 1 aufgabe, verbunden komplex 1 aufgabenbasieren, entsprechend 1 beitrag, vorliegend 1 benutzergruppe, verteilt 1 benutzertyp, verschieden 1 bestand, wachsend 1 datenbestand, gespeichert 1 dokumentenverarbeitung, intelligent 1 filmarchiv, europäisch 1 filmarchiv, groß europäisch 1 filmforschung, historisch 1 jahrhundert, vorig 1 korpus, groß 1 quellenmaterial, historisch 1 technik, dediziert 1 xml-basiert, modern
227
231
  00304*1 indexierung, automatisch
228
232
  00305*2 generierung, maschinell 1 abteilung, verantwortlich 1 auftraggeber, öffentlich 1 beratungsdienstleistung, international 1 beratungsschwerpunkt, weit 1 beratungsunternehmen, führend 1 externe, dokumentiert 1 material, dokumentiert extern 1 material, extern 1 netz, intern 1 projektbericht, aller intern 1 projektbericht, intern 1 stand, derzeitig 1 unternehmen, jung
229
- 00306*5 indexierung, automatisch 1 ansatz, behandelt 1 ansatz, grundsätzlich 1 ansatz, verschieden 1 berg, ständig wachsend 1 berg, wachsend 1 buch, vorliegend 1 charakter, beispielhaft 1 darstellung, einführend 1 information, unstrukturiert 1 informationsbedarf, grundsätzlich 1 informationswirtschaft, betrieblich 1 lehrveranstaltung, entsprechend 1 mittel, manuell 1 praktiker, konfrontiert 1 seite, technisch 1 sprache, verständlich 1 tag, heutig 1 tiefendarstellung, detailliert 1 verarbeitung, schnell 1 verwaltung, öffentlich 1 voraussetzung, jeweilig 1 wirtschaft, abhängig
233
+ 00306*5 indexierung, automatisch 1 ansatz, behandelt 1 ansatz, grundsätzlich 1 ansatz, verschieden 1 bedeutung, groß 1 berg, ständig wachsend 1 berg, wachsend 1 buch, vorliegend 1 charakter, beispielhaft 1 darstellung, einführend 1 information, unstrukturiert 1 informationsbedarf, grundsätzlich 1 informationswirtschaft, betrieblich 1 lehrveranstaltung, entsprechend 1 mittel, manuell 1 praktiker, konfrontiert 1 seite, technisch 1 sprache, verständlich 1 tag, heutig 1 tiefendarstellung, detailliert 1 verarbeitung, schnell 1 verwaltung, öffentlich 1 voraussetzung, jeweilig 1 wirtschaft, abhängig
230
234
  00308*2 zeitschrift, wissenschaftlich 1 anwendungsbereich, fokussiert 1 autor, wissenschaftlich 1 hilfsmittel, notwendig 1 jahrgang, aktuell 1 kriterium, objektiv 1 verbesserungsvorschlag, einig 1 zeitschrift, weich 1 zeitschriftenkommunikation, wissenschaftlich
231
235
  00309*1 datenbank, relational 1 forschungsgemeinschaft, deutsch 1 projekt, gefördert
232
236
  00310*1 aktionsmuster, gewonnen sequentiell 1 aktionsmuster, sequentiell 1 angabe, betreffend 1 aufgabe, allgemein 1 auswertung, rechnerisch 1 forschungsfragen, allgemein 1 informationsraum, inhaltlich komplex 1 informationsraum, komplex 1 interpretation, zusammenfassend 1 phasenmodell, dynamisch 1 schritt, folgend 1 suchmaschinennutzer, unerfahren 1 thema, anschließend 1 untergruppe, unerfahren 1 web-rechercheaufgabe, offen 1 wissensarten, unterschiedlich
@@ -236,14 +240,14 @@
236
240
  00315*1 aspekt, neu 1 gesellschaft, international 1 sektion, deutsch
237
241
  00317*1 anforderung, speziell 1 anwendungskontext, real 1 erschließung, automatisch inhaltlich 1 erschließung, inhaltlich 1 gesichtspunkt, qualitativ 1 indexierung, automatisch 1 inhaltserschließung, intellektuell 1 mangel, einig 1 methode, anerkannt 1 system, grundsätzlich unterschiedlich 1 system, lernend 1 system, unterschiedlich 1 trainingsvorlage, erstellt 1 trainingsvorlage, intellektuell erstellt
238
242
  00318*1 belästigung, sexuell
239
- 00319*2 sprache, natürlich 2 thesaurus, semantisch 1 bedeutung, rasant zunehmend 1 bedeutung, zunehmend 1 beitrag, vorliegend 1 instrument, möglich 1 mach, deutlich 1 programmiersprache, objektorientiert 1 publikationsform, verändernd 1 sprache, unser natürlich 1 text, wissensbasiert
240
- 00320*1 analyse, semantisch 1 bedienbar, leicht 1 begriffsgut, abgebildet 1 begriffssammlung, beliebig geordnet 1 begriffssammlung, geordnet 1 bibliografie, soziologisch 1 datenbank, ursprünglich 1 dokument, relevant 1 dokument, wenig relevant 1 ordnungssystem, bestehend 1 ordnungssystem, speziell 1 schritt, nachfolgend 1 suche, ausschließlich 1 systematik, formal 1 thesaurus, beispielsweise 1 zeichenkettenabgleich, exakt
243
+ 00319*2 sprache, natürlich 2 thesaurus, semantisch 1 bedeutung, rasant zunehmend 1 bedeutung, zunehmend 1 begriff, definierbar 1 beitrag, vorliegend 1 instrument, möglich 1 mach, deutlich 1 programmiersprache, objektorientiert 1 publikationsform, verändernd 1 sprache, unser natürlich 1 text, wissensbasiert
244
+ 00320*1 analyse, semantisch 1 bedienbar, leicht 1 begriffsgut, abgebildet 1 begriffssammlung, beliebig geordnet 1 begriffssammlung, geordnet 1 berücksichtigung, besonders 1 bibliografie, soziologisch 1 datenbank, ursprünglich 1 dokument, relevant 1 dokument, wenig relevant 1 ordnungssystem, bestehend 1 ordnungssystem, speziell 1 retrievalverfahren, nachgeordnet semantisch 1 retrievalverfahren, semantisch 1 schritt, nachfolgend 1 suche, ausschließlich 1 systematik, formal 1 thesaurus, beispielsweise 1 zeichenkettenabgleich, exakt
241
245
  00321*1 basis, theoretisch 1 fixierbar, schriftlich 1 form, alle 1 netz, generalisiert neuronal 1 netz, neuronal 1 notation, formal 1 struktursystem, vorgestellt
242
246
  00322*1 ausgabe, aufgelegt gedruckt 1 ausgabe, gedruckt 1 darstellung, systematisch 1 version, elektronisch
243
- 00323*2 aspekt, pragmatisch 1 bezugnahmen, unter 1 dimension, neu 1 ergebnis, wissenschaftlich 1 information, möglich 1 informationssystem, wissenschaftlich 1 position, philosophisch 1 repräsentationsstruktur, entwickelt 1 standpunkt, unser
247
+ 00323*2 aspekt, pragmatisch 1 bezugnahmen, unter 1 dimension, neu 1 ergebnis, wissenschaftlich 1 information, möglich 1 informationssystem, wissenschaftlich 1 position, philosophisch 1 repräsentationsstruktur, entwickelt 1 retrievalverfahren, effizient 1 standpunkt, unser
244
248
  00324*2 funktion, enzyklopädisch 1 anschauung, herrschend 1 bibliothek, modern 1 disziplin, aller 1 epochenübergreifend, gezielt 1 erscheinungsform, verschieden 1 forschung, künftig 1 forschungsdialog, deutsch 1 forschungsförderung, orientiert 1 gleichbleiben, prinzipiell 1 identitätsfindung, national 1 informationsaustausch, umfassend 1 informationsverarbeitung, enzyklopädisch 1 institut, rührig 1 kulturgeschichte, europäisch 1 kunstsprache, barock 1 masse, wachsend 1 medientechnik, spezifisch 1 modell, europäisch 1 neuzeit, früh 1 person, einzeln 1 philosoph, französisch 1 standard, existierend technisch 1 standard, technisch 1 thema, bestimmt 1 umschau, thematisch 1 werk, enzyklopädisch 1 wirkung, ähnlich 1 wissenssammlung, enzyklopädisch 1 zivilisation, wissenschaftlich 1 überblick, enzyklopädisch 1 überblicksbeiträge, historisch
245
- 00325*2 soziologe, deutsch 1 deutsche, unter 1 forschungsleistung, sozialwissenschaftlich 1 schwachpunkt, bekannte 1 schwachpunkt, bestätigt bekannte 1 soziologe, antwortend 1 soziologe, unter deutsch 1 umfragergebnis, weit 1 untersuchung, durchgeführt
246
- 00326*1 ausbildungseinrichtung, bibliothekarisch 1 ausbildungseinrichtung, deutsch bibliothekarisch 1 beschreibungsebene, strukturiert 1 indexierung, automatisch 1 information, intelligent 1 katalog, lokal 1 netz, heterogen 1 sicht, integrativ 1 thema, folgend 1 trend, folgend
247
- 00329*2 indexierung, adaptiv 1 fragestellung, komplex 1 indexierung, mehrfach 1 indexierungsmethode, konzeptuell 1 konzeptrahm, gebunden 1 tiefenanalyse, selektiv 1 wissensstruktur, relevant 1 zielgruppe, unterschiedlich
248
- 00330*2 maschine, weit 2 seite, weit 1 adresse, alt 1 automat, groß 1 beiträge, neu 1 beiträge, ruppig 1 betrachter, mobil 1 bildersuchen, eigen 1 browserfenster, neu 1 darstellung, einheitlich 1 datei, deutsch 1 datei, verlinkt 1 datenbanksuche, eigen 1 dokument, aufgesucht 1 dokument, elektronisch 1 dokument, findend 1 dokument, frisch aufgesucht 1 durchforschen, alles 1 einblick, klein 1 ergebnis, erstaunlich 1 ergebnis, fremd 1 forum, jeweilig 1 frage, deutsch gestellt 1 frage, gestellt 1 frage, wirklich 1 fünfhundertmal, schätzungsweise 1 google-besuch, letzte 1 hilfe, groß 1 hilfe, praktisch 1 idee, olympisch 1 index, neu 1 inhalt, häufig wechselnd 1 inhalt, klassisch 1 inhalt, wechselnd 1 insel, riesig 1 intelligenz, künstlich 1 intelligenz, maschinell 1 internet-anbieter, groß 1 kind, vermisst 1 kollegialität, unermüdlich 1 kopierbar, vorteilhaft 1 link, sogenannt 1 linux-pc-server, billigen 1 mach, lustig 1 maschinenlesbar, oft 1 mitarbeit, frei 1 monat, einig 1 multimedia-inhalt, kommend 1 nachlese, stündlich 1 netz, ganz 1 netz, unsichtbar 1 netzfreund, aller 1 nichtkommerziell, uralt 1 rahmenlos, möglich 1 rolle, untergeordnet 1 röhre, kommunizierend 1 schleuse, lieb 1 seite, angemeldet 1 seite, durchsucht 1 seite, einfach 1 seite, gefunden 1 seite, gespeichert 1 seite, jeweilig 1 server, kooperierend 1 speicher, eigen 1 speicher, weit 1 suchmaschine, beliebte 1 suchmaschine, deutsch 1 suchseite, englisch 1 suchseite, sehenswert englisch 1 telefonbuchsuche, deutsch 1 text, gefunden 1 thema, bestimmt 1 verweis, einheitlich 1 webformat, neu 1 wettstreit, international 1 wille, gut 1 wort, aller vorkommend 1 wort, paar 1 wort, vorkommend 1 wortgruppe, geschlossen 1 wortgruppe, spät geschlossen 1 wortlaut, genau 1 wunderwelt, offen 1 wunderwerk, technisch 1 übersetzung, maschinell
249
+ 00325*2 soziologe, deutsch 1 deutsche, unter 1 forschungsleistung, sozialwissenschaftlich 1 informationelle, sinnvoll 1 schwachpunkt, bekannte 1 schwachpunkt, bestätigt bekannte 1 soziologe, antwortend 1 soziologe, unter deutsch 1 umfragergebnis, weit 1 untersuchung, durchgeführt
250
+ 00326*1 ausbildungseinrichtung, bibliothekarisch 1 ausbildungseinrichtung, deutsch bibliothekarisch 1 beschreibungsebene, strukturiert 1 indexierung, automatisch 1 information, intelligent 1 interaktionsschnittstelle, benutzerfreundlich 1 katalog, lokal 1 netz, heterogen 1 sicht, integrativ 1 thema, folgend 1 trend, folgend
251
+ 00329*2 indexierung, adaptiv 1 fragestellung, komplex 1 indexierung, mehrfach 1 indexierungsmethode, konzeptuell 1 konzeptrahmen, gebunden 1 tiefenanalyse, selektiv 1 wissensstruktur, relevant 1 zielgruppe, unterschiedlich
252
+ 00330*2 maschine, weit 2 seite, weit 1 adresse, alt 1 automat, groß 1 begriff, eingegeben 1 begriff, selten 1 beiträge, neu 1 beiträge, ruppig 1 betrachter, mobil 1 bildersuchen, eigen 1 browserfenster, neu 1 darstellung, einheitlich 1 datei, deutsch 1 datei, verlinkt 1 datenbanksuche, eigen 1 dokument, aufgesucht 1 dokument, elektronisch 1 dokument, findend 1 dokument, frisch aufgesucht 1 durchforschen, alles 1 einblick, klein 1 ergebnis, erstaunlich 1 ergebnis, fremd 1 forum, jeweilig 1 frage, deutsch gestellt 1 frage, gestellt 1 frage, wirklich 1 fünfhundertmal, schätzungsweise 1 google-besuch, letzte 1 hilfe, groß 1 hilfe, praktisch 1 idee, olympisch 1 index, neu 1 inhalt, häufig wechselnd 1 inhalt, klassisch 1 inhalt, wechselnd 1 insel, riesig 1 intelligenz, künstlich 1 intelligenz, maschinell 1 internet-anbieter, groß 1 kind, vermisst 1 kollegialität, unermüdlich 1 kopierbar, vorteilhaft 1 link, sogenannt 1 linux-pc-server, billigen 1 mach, lustig 1 maschinenlesbar, oft 1 mitarbeit, frei 1 monat, einig 1 multimedia-inhalt, kommend 1 nachlese, stündlich 1 netz, ganz 1 netz, unsichtbar 1 netzfreund, aller 1 nichtkommerziell, uralt 1 rahmenlos, möglich 1 rolle, untergeordnet 1 röhre, kommunizierend 1 schleuse, lieb 1 seite, angemeldet 1 seite, durchsucht 1 seite, einfach 1 seite, gefunden 1 seite, gespeichert 1 seite, jeweilig 1 server, kooperierend 1 sorge, groß 1 speicher, eigen 1 speicher, weit 1 suchmaschine, beliebte 1 suchmaschine, deutsch 1 suchmaschine, groß 1 suchmaschine, sehr beliebte 1 suchseite, englisch 1 suchseite, sehenswert englisch 1 telefonbuchsuche, deutsch 1 text, gefunden 1 thema, bestimmt 1 verweis, einheitlich 1 webformat, neu 1 wettstreit, international 1 wille, gut 1 wort, aller vorkommend 1 wort, paar 1 wort, vorkommend 1 wortgruppe, geschlossen 1 wortgruppe, spät geschlossen 1 wortlaut, genau 1 wunderwelt, offen 1 wunderwerk, technisch 1 übersetzung, maschinell
249
253
  00331*2 bibliothek, öffentlich 1 ekz-daten, indexiert 1 erschließungsmethode, herkömmlich 1 indexierung, maschinell 1 methode, verschieden 1 sachbuchbestand, typisch 1 titel, relevant
@@ -1,3 +1,5 @@
1
+ # encoding: utf-8
2
+
1
3
  require 'test/unit'
2
4
  require 'lingo'
3
5
 
@@ -27,22 +29,22 @@ class LingoTestCase < Test::Unit::TestCase
27
29
  # Erzeugt ein Token-Objekt
28
30
  def tk( text )
29
31
  f, a = split( text )
30
- Lingo::Token.new( f, a )
32
+ Lingo::Language::Token.new( f, a )
31
33
  end
32
34
 
33
35
  # Erzeugt ein Lexical-Objekt
34
36
  def lx( text )
35
37
  f, a = split( text )
36
- Lingo::Lexical.new( f, a )
38
+ Lingo::Language::Lexical.new( f, a )
37
39
  end
38
40
 
39
41
  # Erzeugt ein Word-Objekt
40
42
  def wd( text, *lexis )
41
43
  f, a = split( text )
42
- w = Lingo::Word.new( f, a )
44
+ w = Lingo::Language::Word.new( f, a )
43
45
  lexis.each do |text|
44
46
  f, a = split( text )
45
- w << Lingo::Lexical.new( f, a )
47
+ w << Lingo::Language::Lexical.new( f, a )
46
48
  end
47
49
  w
48
50
  end
@@ -54,22 +56,24 @@ class AttendeeTestCase < LingoTestCase
54
56
  def initialize(fname)
55
57
  super
56
58
 
57
- @attendee = $1.downcase if self.class.to_s =~ /TestAttendee(.*)/
59
+ @attendee = $1 if self.class.to_s =~ /TestAttendee(.*)/
58
60
  @lingo, @output = Lingo.new, []
59
61
  end
60
62
 
61
- def meet(att_cfg, check=true)
62
- std_cfg = {'name'=>@attendee.capitalize}
63
- std_cfg.update({'in'=>'lines'}) unless @input.nil?
64
- std_cfg.update({'out'=>'output'}) unless @output.nil?
63
+ def meet(att_cfg, check = true)
64
+ cfg = { 'name' => @attendee.camelcase }
65
+ cfg.update('in' => 'input') if @input
66
+ cfg.update('out' => 'output') if @output
67
+ cfg.update(att_cfg)
65
68
 
66
69
  @output.clear
67
70
  @lingo.reset
68
- inv_list = []
69
- inv_list << {'helper'=>{'name'=>'Helper', 'out'=>'lines', 'spool_from'=>@input}} unless @input.nil?
70
- inv_list << {@attendee=>std_cfg.update( att_cfg )}
71
- inv_list << {'helper'=>{'name'=>'Helper', 'in'=>'output', 'dump_to'=>@output}} unless @output.nil?
72
- @lingo.invite(inv_list)
71
+
72
+ list = [{ @attendee => cfg }]
73
+ list.unshift 'TestSpooler' => { 'out' => 'input', 'input' => @input } if @input
74
+ list.push 'TestDumper' => { 'in' => 'output', 'output' => @output } if @output
75
+
76
+ @lingo.invite(list)
73
77
  @lingo.start
74
78
 
75
79
  assert_equal(@expect, @output) if check
@@ -78,36 +82,37 @@ class AttendeeTestCase < LingoTestCase
78
82
  end
79
83
 
80
84
  class Lingo
85
+ class Attendee
86
+ class TestSpooler < self
81
87
 
82
- class Attendee::Helper < Attendee
88
+ protected
83
89
 
84
- protected
90
+ def init
91
+ @input = get_key('input')
92
+ end
85
93
 
86
- def init
87
- case
88
- when has_key?('spool_from')
89
- @spool_from = get_key('spool_from')
90
- @spooler = true
91
- when has_key?('dump_to')
92
- @dump_to = get_key('dump_to')
93
- @spooler = false
94
- else
95
- forward(STR_CMD_ERR, 'Weder dump_to noch spool_from-Attribut abgegeben')
94
+ def control(cmd, param)
95
+ @input.each(&method(:forward)) if cmd == STR_CMD_TALK
96
96
  end
97
+
97
98
  end
98
99
 
99
- def control(cmd, param)
100
- if @spooler
101
- @spool_from.each { |obj| forward(obj) } if cmd==STR_CMD_TALK
102
- else
103
- @dump_to << AgendaItem.new(cmd, param)
100
+ class TestDumper < self
101
+
102
+ protected
103
+
104
+ def init
105
+ @output = get_key('output')
104
106
  end
105
- end
106
107
 
107
- def process(obj)
108
- @dump_to << obj unless @spooler
109
- end
108
+ def control(cmd, param)
109
+ @output << AgendaItem.new(cmd, param)
110
+ end
110
111
 
111
- end
112
+ def process(obj)
113
+ @output << obj
114
+ end
112
115
 
116
+ end
117
+ end
113
118
  end
@@ -2,10 +2,10 @@
2
2
 
3
3
  require_relative 'test_helper'
4
4
 
5
- class Lingo::Txt2DbmConverter
6
- alias_method :original_initialize, :initialize
7
- def initialize(id, lingo, verbose = false)
8
- original_initialize(id, lingo, verbose)
5
+ class Lingo::Database
6
+ alias_method :original_convert, :convert
7
+ def convert(verbose = false)
8
+ original_convert(verbose)
9
9
  end
10
10
  end
11
11
 
@@ -100,7 +100,8 @@ Wort2=
100
100
  'txt-format' => 'SingleWord',
101
101
  'use-lex' => set_config('lex',
102
102
  'name' => 'de/lingo-dic.txt',
103
- 'txt-format' => 'WordClass'
103
+ 'txt-format' => 'WordClass',
104
+ 'separator' => '='
104
105
  )
105
106
  }, @singleword, {
106
107
  'wort1' => '#s',
@@ -132,7 +133,7 @@ Wort2=
132
133
  'b7501a62cb083be6730a7a179a4ab346d23efe53' => '4b10'
133
134
  })
134
135
 
135
- compare(config, @singleword) { |dbm| {
136
+ compare(config, @singleword) { |db| {
136
137
  'wort1' => '#s',
137
138
  'wort2' => '#s',
138
139
  'juristische personen' => '#s',
@@ -141,7 +142,7 @@ Wort2=
141
142
  'ganz großer und blöder quatsch' => '#s',
142
143
  'ganz großer und blöder mist' => '#s',
143
144
  'ganz großer und blöder schwach sinn' => '#s'
144
- }.each { |key, val| assert_equal([val], dbm[key]) } }
145
+ }.each { |key, val| assert_equal([val], db[key]) } }
145
146
  end
146
147
 
147
148
  def test_keyvalue
@@ -248,12 +249,12 @@ Wort2=
248
249
  FileUtils.mkdir_p(File.dirname(TEST_FILE))
249
250
  File.write(TEST_FILE, input, encoding: Lingo::ENC)
250
251
 
251
- Lingo::DbmFile.open(set_config('tst', config.merge('name' => TEST_FILE)), @lingo) { |dbm|
252
+ Lingo::Database.open(set_config('tst', config.merge('name' => TEST_FILE)), @lingo) { |db|
252
253
  if block_given?
253
- yield dbm
254
+ yield db
254
255
  else
255
- store = dbm.to_h
256
- store.delete(Lingo::SYS_KEY)
256
+ store = db.to_h
257
+ store.delete(Lingo::Database::SYS_KEY)
257
258
 
258
259
  assert_equal(output, store)
259
260
  end
@@ -4,6 +4,8 @@ require_relative 'test_helper'
4
4
 
5
5
  class TestLexicalHash < LingoTestCase
6
6
 
7
+ LH = Lingo::Language::LexicalHash
8
+
7
9
  def setup
8
10
  @lingo = Lingo.new
9
11
  @database_config = @lingo.config['language/dictionary/databases']
@@ -17,7 +19,7 @@ class TestLexicalHash < LingoTestCase
17
19
  old_stderr, $stderr = $stderr, StringIO.new('')
18
20
 
19
21
  # Datenquelle nicht in Konfiguration enthalten
20
- assert_raise(SystemExit) { Lingo::LexicalHash.new('nonsens', @lingo) }
22
+ assert_raise(Lingo::NoDatabaseConfigError) { LH.new('nonsens', @lingo) }
21
23
  ensure
22
24
  $stderr = old_stderr
23
25
  end
@@ -25,7 +27,7 @@ class TestLexicalHash < LingoTestCase
25
27
  # TODO: Crypt testen...
26
28
 
27
29
  def test_cache
28
- ds = Lingo::LexicalHash.new('sys-dic', @lingo)
30
+ ds = LH.new('sys-dic', @lingo)
29
31
  assert_equal([lx('regen|s'), lx('regen|v'), lx('rege|a')], ds['regen'])
30
32
  assert_equal([lx('regen|s'), lx('regen|v'), lx('rege|a')], ds['regen'])
31
33
  assert_equal([lx('regen|s'), lx('regen|v'), lx('rege|a')], ds['regen'])
@@ -33,11 +35,11 @@ class TestLexicalHash < LingoTestCase
33
35
  end
34
36
 
35
37
  def test_report
36
- ds = Lingo::LexicalHash.new('tst-syn', @lingo)
38
+ ds = LH.new('tst-syn', @lingo)
37
39
  ds['abwickeln'] # source read
38
40
  ds['abwickeln'] # cache hit
39
- ds['regen'] # source read
40
- ds['nonesens'] # source read, nothing found
41
+ ds['regen'] # source read
42
+ ds['nonesens'] # source read, nothing found
41
43
 
42
44
  expect = { \
43
45
  "tst-syn: cache hits" => 1, \
@@ -52,26 +54,25 @@ class TestLexicalHash < LingoTestCase
52
54
 
53
55
  def test_auto_create
54
56
  txt_file = @database_config['tst-sgw']['name']
55
- sto_file = Lingo.find(:store, txt_file) << '.pag'
56
57
 
57
- ds = Lingo::LexicalHash.new('tst-sgw', @lingo)
58
+ ds = LH.new('tst-sgw', @lingo)
58
59
  assert_equal([lx('substantiv|s')], ds['substantiv'])
59
60
  ds.close
60
61
 
61
62
  # Keine Store-Datei vorhanden, nur Text vorhanden
62
- File.delete(sto_file)
63
- ds = Lingo::LexicalHash.new('tst-sgw', @lingo)
63
+ File.delete(*Dir["#{Lingo.find(:store, txt_file)}.*"])
64
+ ds = LH.new('tst-sgw', @lingo)
64
65
  assert_equal([lx('substantiv|s')], ds['substantiv'])
65
66
  ds.close
66
67
 
67
68
  # Store vorhanden, aber Text ist neuer
68
- ds = Lingo::LexicalHash.new('tst-sgw', @lingo)
69
+ ds = LH.new('tst-sgw', @lingo)
69
70
  assert_equal([lx('substantiv|s')], ds['substantiv'])
70
71
  ds.close
71
72
  end
72
73
 
73
74
  def test_singleword
74
- ds = Lingo::LexicalHash.new('tst-sgw', @lingo)
75
+ ds = LH.new('tst-sgw', @lingo)
75
76
  assert_equal([lx('substantiv|s')], ds['substantiv'])
76
77
  assert_equal([lx('mehr wort gruppe|s')], ds['mehr wort gruppe'])
77
78
  assert_equal(nil, ds['nicht vorhanden'])
@@ -79,7 +80,7 @@ class TestLexicalHash < LingoTestCase
79
80
  end
80
81
 
81
82
  def test_keyvalue
82
- ds = Lingo::LexicalHash.new('sys-mul', @lingo)
83
+ ds = LH.new('sys-mul', @lingo)
83
84
  assert_equal([lx('abelscher ring ohne nullteiler|m')], ds['abelscher ring ohne nullteiler'])
84
85
  assert_equal(['*4'], ds['abelscher ring ohne'])
85
86
  assert_equal([lx('alleinreisende frau|m')], ds['alleinreisend frau'])
@@ -89,7 +90,7 @@ class TestLexicalHash < LingoTestCase
89
90
  end
90
91
 
91
92
  def test_wordclass
92
- ds = Lingo::LexicalHash.new('sys-dic', @lingo)
93
+ ds = LH.new('sys-dic', @lingo)
93
94
  assert_equal([lx('a-dur|s')], ds['a-dur'])
94
95
  assert_equal([lx('aalen|v'), lx('aalen|e')], ds['aalen'])
95
96
  assert_equal([lx('abarbeitend|a')], ds['abarbeitend'])
@@ -97,7 +98,7 @@ class TestLexicalHash < LingoTestCase
97
98
  end
98
99
 
99
100
  def test_case
100
- ds = Lingo::LexicalHash.new('sys-dic', @lingo)
101
+ ds = LH.new('sys-dic', @lingo)
101
102
  assert_equal([lx('abänderung|s')], ds['abänderung'])
102
103
  assert_equal([lx('abänderung|s')], ds['Abänderung'])
103
104
  assert_equal([lx('abänderung|s')], ds['ABÄNDERUNG'])
@@ -105,9 +106,9 @@ class TestLexicalHash < LingoTestCase
105
106
  end
106
107
 
107
108
  def test_multivalue
108
- ds = Lingo::LexicalHash.new('sys-syn', @lingo)
109
- # assert_equal([lx('abrollen', LA_SYNONYM), lx('abschaffen', LA_SYNONYM), lx('abwickeln', LA_SYNONYM), lx('auflösen (geschäft)','y')], ds['abwickeln'])
110
- # assert_equal([lx('niederschlag', LA_SYNONYM), lx('regen', LA_SYNONYM), lx('schauer', LA_SYNONYM)], ds['regen'])
109
+ ds = LH.new('sys-syn', @lingo)
110
+ assert_equal([lx('abbau <chemie>|y'), lx('chemische abbaureaktion|y'), lx('chemischer abbau|y'), lx('photochemischer abbau|y')], ds['abbaureaktion'])
111
+ assert_equal([lx('dependenz|y'), lx('unselbstständigkeit|y'), lx('unselbständigkeit|y')], ds['abhängigkeit'])
111
112
  ds.close
112
113
  end
113
114
 
@@ -115,21 +116,21 @@ end
115
116
 
116
117
  class TestDictionary < LingoTestCase
117
118
 
119
+ LD = Lingo::Language::Dictionary
120
+
118
121
  def setup
119
122
  @lingo = Lingo.new
120
123
  end
121
124
 
122
125
  def test_params
123
126
  # Keine Sprach-Konfiguration angegeben
124
- #assert_raise(RuntimeError) { Lingo::Dictionary.new({'source'=>['sys-dic']}, @lingo) }
125
- # Keine Parameter angegeben
126
- assert_raise(RuntimeError) { Lingo::Dictionary.new(nil, @lingo) }
127
+ #assert_raise(RuntimeError) { LD.new({'source'=>['sys-dic']}, @lingo) }
127
128
  # Falsche Parameter angegeben (Pflichtparameter ohne Defaultwert)
128
- assert_raise(RuntimeError) { Lingo::Dictionary.new({'course'=>['sys-dic']}, @lingo) }
129
+ assert_raise(ArgumentError) { LD.new({'course'=>['sys-dic']}, @lingo) }
129
130
  end
130
131
 
131
132
  def test_cache
132
- dic = Lingo::Dictionary.new({'source'=>['sys-dic']}, @lingo)
133
+ dic = LD.new({'source'=>['sys-dic']}, @lingo)
133
134
  assert_equal([lx('nase|s')], dic.select('nase'))
134
135
  assert_equal([lx('nase|s')], dic.select('nase'))
135
136
  assert_equal([lx('nase|s')], dic.select('nase'))
@@ -137,7 +138,7 @@ class TestDictionary < LingoTestCase
137
138
  end
138
139
 
139
140
  def test_report
140
- dic = Lingo::Dictionary.new({'source'=>['sys-dic']}, @lingo)
141
+ dic = LD.new({'source'=>['sys-dic']}, @lingo)
141
142
  dic.select('abwickeln') # source read
142
143
  dic.select('abwickeln') # cache hit
143
144
  dic.select('regen') # source read
@@ -155,7 +156,7 @@ class TestDictionary < LingoTestCase
155
156
  end
156
157
 
157
158
  def test_select_one_source
158
- dic = Lingo::Dictionary.new({'source'=>['sys-dic']}, @lingo)
159
+ dic = LD.new({'source'=>['sys-dic']}, @lingo)
159
160
  assert_equal([lx('nase|s')], dic.select('nase'))
160
161
  assert_equal([lx('nase|s')], dic.select('NASE'))
161
162
  assert_equal([], dic.select('hasennasen'))
@@ -163,7 +164,7 @@ class TestDictionary < LingoTestCase
163
164
  end
164
165
 
165
166
  def test_select_two_sources_mode_first
166
- dic = Lingo::Dictionary.new({'source'=>['sys-dic', 'tst-dic'], 'mode'=>'first'}, @lingo)
167
+ dic = LD.new({'source'=>['sys-dic', 'tst-dic'], 'mode'=>'first'}, @lingo)
167
168
  # in keiner Quelle vorhanden
168
169
  assert_equal([], dic.select('hasennasen'))
169
170
  # nur in erster Quelle vorhanden
@@ -176,7 +177,7 @@ class TestDictionary < LingoTestCase
176
177
  end
177
178
 
178
179
  def test_select_two_sources_mode_first_flipped
179
- dic = Lingo::Dictionary.new({'source'=>['tst-dic','sys-dic'], 'mode'=>'first'}, @lingo)
180
+ dic = LD.new({'source'=>['tst-dic','sys-dic'], 'mode'=>'first'}, @lingo)
180
181
  # in keiner Quelle vorhanden
181
182
  assert_equal([], dic.select('hasennasen'))
182
183
  # nur in erster Quelle vorhanden
@@ -189,7 +190,7 @@ class TestDictionary < LingoTestCase
189
190
  end
190
191
 
191
192
  def test_select_two_sources_mode_all
192
- dic = Lingo::Dictionary.new({'source'=>['sys-dic','tst-dic'], 'mode'=>'all'}, @lingo)
193
+ dic = LD.new({'source'=>['sys-dic','tst-dic'], 'mode'=>'all'}, @lingo)
193
194
  # in keiner Quelle vorhanden
194
195
  assert_equal([], dic.select('hasennasen'))
195
196
  # nur in erster Quelle vorhanden
@@ -203,7 +204,7 @@ class TestDictionary < LingoTestCase
203
204
  end
204
205
 
205
206
  def test_select_two_sources_mode_default
206
- dic = Lingo::Dictionary.new({'source'=>['sys-dic','tst-dic']}, @lingo)
207
+ dic = LD.new({'source'=>['sys-dic','tst-dic']}, @lingo)
207
208
  # in keiner Quelle vorhanden
208
209
  assert_equal([], dic.select('hasennasen'))
209
210
  # nur in erster Quelle vorhanden
@@ -217,7 +218,7 @@ class TestDictionary < LingoTestCase
217
218
  end
218
219
 
219
220
  def test_suffix_lexicals
220
- dic = Lingo::Dictionary.new({'source'=>['sys-dic']}, @lingo)
221
+ dic = LD.new({'source'=>['sys-dic']}, @lingo)
221
222
  assert_equal([lx('mau|s'), lx('mauer|s')], dic.suffix_lexicals('mauern'))
222
223
  assert_equal([lx('hasen|s'), lx('hasen|v'), lx('hasen|e')], dic.suffix_lexicals('hasens'))
223
224
  assert_equal([lx('schönst|s'), lx('schön|a'), lx('schönst|a')], dic.suffix_lexicals('schönster'))
@@ -226,13 +227,13 @@ class TestDictionary < LingoTestCase
226
227
  end
227
228
 
228
229
  def test_infix_lexicals
229
- dic = Lingo::Dictionary.new({'source'=>['sys-dic']}, @lingo)
230
+ dic = LD.new({'source'=>['sys-dic']}, @lingo)
230
231
  assert_equal( [lx('information|s'), lx('information|v'), lx('information|e')], dic.suffix_lexicals('informations'))
231
232
  dic.close
232
233
  end
233
234
 
234
235
  def test_select_with_suffix
235
- dic = Lingo::Dictionary.new({'source'=>['sys-dic']}, @lingo)
236
+ dic = LD.new({'source'=>['sys-dic']}, @lingo)
236
237
  assert_equal([lx('mauern|v')], dic.select_with_suffix('mauern'))
237
238
  assert_equal([lx('hase|s')], dic.select_with_suffix('hasen'))
238
239
  assert_equal([lx('schön|a')], dic.select_with_suffix('schönster'))
@@ -241,13 +242,13 @@ class TestDictionary < LingoTestCase
241
242
  end
242
243
 
243
244
  def test_select_with_infix
244
- dic = Lingo::Dictionary.new({'source'=>['sys-dic']}, @lingo)
245
+ dic = LD.new({'source'=>['sys-dic']}, @lingo)
245
246
  assert_equal( [lx('information|s'), lx('information|v'), lx('information|e')], dic.suffix_lexicals('informations'))
246
247
  dic.close
247
248
  end
248
249
 
249
250
  def test_find_word
250
- dic = Lingo::Dictionary.new({'source'=>['sys-dic']}, @lingo)
251
+ dic = LD.new({'source'=>['sys-dic']}, @lingo)
251
252
  assert_equal(wd('hasennasen|?'), dic.find_word('hasennasen'))
252
253
  assert_equal(wd('hase|IDF', 'hase|s'), dic.find_word('hase'))
253
254
  assert_equal(wd('haseses|IDF', 'hase|s'), dic.find_word('haseses'))
@@ -258,6 +259,8 @@ end
258
259
 
259
260
  class TestGrammar < LingoTestCase
260
261
 
262
+ LG = Lingo::Language::Grammar
263
+
261
264
  def setup
262
265
  @lingo = Lingo.new
263
266
  end
@@ -267,7 +270,7 @@ class TestGrammar < LingoTestCase
267
270
  end
268
271
 
269
272
  def test_cache
270
- gra = Lingo::Grammar.new({'source'=>['sys-dic']}, @lingo)
273
+ gra = LG.new({'source'=>['sys-dic']}, @lingo)
271
274
  assert_equal(
272
275
  wd('informationswissenschaften|KOM', 'informationswissenschaft|k', 'information|s+', 'wissenschaft|s+'),
273
276
  gra.find_compositum('informationswissenschaften')
@@ -283,79 +286,126 @@ class TestGrammar < LingoTestCase
283
286
  gra.close
284
287
  end
285
288
 
286
- def t1est_test_compositum
287
- gra = Lingo::Grammar.new({'source'=>['sys-dic']}, @lingo)
289
+ def test_test_compositum
290
+ gra = LG.new({'source'=>['sys-dic']}, @lingo)
291
+
288
292
  # hinterer Teil ist ein Wort mit Suffix
289
- assert_equal([ [5, 6], [lx('hasenbraten|k'), lx('braten|s'), lx('hase|s'), lx('braten|v')] ],
293
+ assert_equal([
294
+ [lx('hasenbraten|k'), lx('hase|s'), lx('braten|v')],
295
+ [5, 6],
296
+ 'sv'
297
+ ],
290
298
  gra.test_compositum('hasen', '', 'braten', 1, false)
291
299
  )
300
+
292
301
  # hinterer Teil ist ein Wort mit Infix ohne Schwanz
293
- assert_equal([ [5, 7], [lx('nasenlaufen|k'), lx('laufen|s'), lx('nase|s'), lx('laufen|v')] ],
302
+ assert_equal([
303
+ [lx('nasenlaufen|k'), lx('nase|s'), lx('laufen|v')],
304
+ [5, 7],
305
+ 'sv'
306
+ ],
294
307
  gra.test_compositum('nasen', '', 'laufens', 1, false)
295
308
  )
309
+
296
310
  # hinterer Teil ist ein Wort mit Infix mit Schwanz
297
- assert_equal([ [5, 7], [lx('nasenlaufens|k'), lx('laufen|s'), lx('nase|s'), lx('laufen|v')] ],
311
+ assert_equal([
312
+ [lx('nasenlaufens|k'), lx('nase|s'), lx('laufen|v')],
313
+ [5, 7],
314
+ 'sv'
315
+ ],
298
316
  gra.test_compositum('nasen', '', 'laufens', 1, true)
299
317
  )
318
+
300
319
  # hinterer Teil ist ein Kompositum nach Bindestrich
301
- assert_equal([ [7, 9, 6], [lx('arrafat-nachfolgebedarf|k'), lx('bedarf|s'), lx('nachfolge|s'), lx('arrafat|x')] ],
320
+ assert_equal([
321
+ [lx('arrafat-nachfolgebedarf|k'), lx('bedarf|s'), lx('nachfolge|s'), lx('arrafat|x')],
322
+ [7, 9, 6],
323
+ 'xss'
324
+ ],
302
325
  gra.test_compositum('arrafat', '-', 'nachfolgebedarf', 1, false)
303
326
  )
327
+
304
328
  # hinterer Teil ist ein TakeItAsIs nach Bindestrich
305
- assert_equal([ [9, 7], [lx('nachfolge-arrafat|k'), lx('nachfolge|s'), lx('arrafat|x')] ],
329
+ assert_equal([
330
+ [lx('nachfolge-arrafat|k'), lx('nachfolge|s'), lx('arrafat|x')],
331
+ [9, 7],
332
+ 'sx'
333
+ ],
306
334
  gra.test_compositum('nachfolge', '-', 'arrafat', 1, false)
307
335
  )
336
+
308
337
  # vorderer Teil ist ein Wort mit Suffix => siehe Hasenbraten
309
338
  # vorderer Teil ist ein Kompositum
310
- assert_equal([ [6, 5, 6], [lx('morgenonkelmantel|k'), lx('mantel|s'), lx('morgen|s'), lx('onkel|s'), lx('morgen|w')] ],
339
+ assert_equal([
340
+ [lx('morgenonkelmantel|k'), lx('mantel|s'), lx('morgen|s'), lx('onkel|s'), lx('morgen|w')],
341
+ [6, 5, 6],
342
+ 'sss'
343
+ ],
311
344
  gra.test_compositum('morgenonkel', '', 'mantel', 1, false)
312
345
  )
346
+
313
347
  # vorderer Teil ist ein TakeItAsIs vor Bindestrich
314
- assert_equal([ [7, 10], [lx('arrafat-nachfolger|k'), lx('nachfolger|s'), lx('arrafat|x')] ],
348
+ assert_equal([
349
+ [lx('arrafat-nachfolger|k'), lx('nachfolger|s'), lx('arrafat|x')],
350
+ [7, 10],
351
+ 'xs'
352
+ ],
315
353
  gra.test_compositum('arrafat', '-', 'nachfolger', 1, false)
316
354
  )
355
+
317
356
  gra.close
318
357
  end
319
358
 
320
- def t1est_permute_compositum
321
- gra = Lingo::Grammar.new({'source'=>['sys-dic']}, @lingo)
359
+ def test_permute_compositum
360
+ gra = LG.new({'source'=>['sys-dic']}, @lingo)
361
+
322
362
  # bindestrichversion
323
- assert_equal([ [7, 10], [lx('arrafat-nachfolger|k'), lx('nachfolger|s'), lx('arrafat|x')] ],
363
+ assert_equal([
364
+ [lx('arrafat-nachfolger|k'), lx('nachfolger|s'), lx('arrafat|x')],
365
+ [7, 10],
366
+ 'xs'
367
+ ],
324
368
  gra.permute_compositum('arrafat-nachfolger', 1, false)
325
369
  )
370
+
326
371
  # bindestrichversion zwei-teilig
327
- assert_equal([ [6, 11], \
328
- [ lx('cd-rom-technologie|k'), \
329
- lx('cd-rom|s'), \
330
- lx('technologie|s')] ], \
331
- gra.permute_compositum('cd-rom-technologie', 1, false) \
372
+ assert_equal([
373
+ [lx('cd-rom-technologie|k'), lx('cd-rom|s'), lx('technologie|s')],
374
+ [6, 11],
375
+ 'ss'
376
+ ],
377
+ gra.permute_compositum('cd-rom-technologie', 1, false)
332
378
  )
379
+
333
380
  # bindestrichversion drei-teilig
334
- assert_equal([ [6, 7, 11], \
335
- [ lx('albert-ludwigs-universität|k'), \
336
- lx('universität|s'), \
337
- lx('albert|e'), \
338
- lx('ludwig|e')] ], \
339
- gra.permute_compositum('albert-ludwigs-universität', 1, false) \
381
+ assert_equal([
382
+ [lx('albert-ludwigs-universität|k'), lx('universität|s'), lx('albert|e'), lx('ludwig|e')],
383
+ [6, 7, 11],
384
+ 'ees'
385
+ ],
386
+ gra.permute_compositum('albert-ludwigs-universität', 1, false)
340
387
  )
388
+
341
389
  # normal mit suggestion
342
- assert_equal([ [8, 9], \
343
- [ lx('benutzerforschung|k'), \
344
- lx('benutzer|s'), \
345
- lx('forschung|s')] ], \
346
- gra.permute_compositum('benutzerforschung', 1, false) \
390
+ assert_equal([
391
+ [lx('benutzerforschung|k'), lx('erforschung|s'), lx('benutzen|v')],
392
+ [6, 11],
393
+ 'vs'
394
+ ],
395
+ gra.permute_compositum('benutzerforschung', 1, false)
347
396
  )
397
+
348
398
  gra.close
349
399
  end
350
400
 
351
401
  def test_find_compositum
352
- gra = Lingo::Grammar.new({'source'=>['sys-dic']}, @lingo)
402
+ gra = LG.new({'source'=>['sys-dic']}, @lingo)
353
403
  assert_equal(
354
404
  wd('informationswissenschaften|KOM', 'informationswissenschaft|k', 'information|s+', 'wissenschaft|s+'),
355
- gra.find_compositum('informationswissenschaften') \
405
+ gra.find_compositum('informationswissenschaften')
356
406
  )
357
407
  assert_equal(
358
- wd('cd-rom-technologie|KOM', 'cd-rom-technologie|k', 'technologie|s+', 'cd-rom|x+'),
408
+ wd('cd-rom-technologie|KOM', 'cd-rom-technologie|k', 'cd-rom|s+', 'technologie|s+'),
359
409
  gra.find_compositum('cd-rom-technologie')
360
410
  )
361
411
  assert_equal(
@@ -378,18 +428,18 @@ class TestGrammar < LingoTestCase
378
428
  end
379
429
 
380
430
  def test_min_word_size
381
- gra = Lingo::Grammar.new({'source'=>['sys-dic']}, @lingo)
431
+ gra = LG.new({'source'=>['sys-dic']}, @lingo)
382
432
  assert_equal( wd('undsund|?'), gra.find_compositum('undsund'))
383
433
  gra.close
384
434
  end
385
435
 
386
436
  def test_max_parts
387
- gra = Lingo::Grammar.new({'source'=>['sys-dic']}, @lingo)
437
+ gra = LG.new({'source'=>['sys-dic']}, @lingo)
388
438
  assert_equal(
389
439
  wd('baumsbaumsbaum|KOM', 'baumsbaumsbaum|k', 'baum|s+'),
390
440
  gra.find_compositum('baumsbaumsbaum')
391
441
  )
392
- assert_equal( Lingo::Word.new('baumsbaumsbaumsbaumsbaumsbaum', Lingo::WA_UNKNOWN), gra.find_compositum('baumsbaumsbaumsbaumsbaumsbaum'))
442
+ assert_equal(Lingo::Language::Word.new('baumsbaumsbaumsbaumsbaumsbaum', Lingo::Language::WA_UNKNOWN), gra.find_compositum('baumsbaumsbaumsbaumsbaumsbaum'))
393
443
  gra.close
394
444
  end
395
445