lingo 1.8.0 → 1.8.1

Sign up to get free protection for your applications and to get access to all the features.
Files changed (100) hide show
  1. data/ChangeLog +13 -0
  2. data/README +49 -29
  3. data/Rakefile +28 -4
  4. data/TODO +2 -9
  5. data/bin/lingo +24 -0
  6. data/bin/lingoctl +24 -0
  7. data/de/lingo-dic.txt +559 -74
  8. data/info/gpl-hdr.txt +21 -24
  9. data/lib/lingo.rb +83 -112
  10. data/lib/lingo/agenda_item.rb +53 -0
  11. data/lib/lingo/attendee.rb +261 -0
  12. data/lib/lingo/attendee/abbreviator.rb +95 -97
  13. data/lib/lingo/attendee/debugger.rb +94 -93
  14. data/lib/lingo/attendee/decomposer.rb +76 -83
  15. data/lib/lingo/attendee/dehyphenizer.rb +141 -144
  16. data/lib/lingo/attendee/formatter.rb +65 -0
  17. data/lib/lingo/attendee/multi_worder.rb +302 -0
  18. data/lib/lingo/attendee/noneword_filter.rb +89 -84
  19. data/lib/lingo/attendee/object_filter.rb +91 -0
  20. data/lib/lingo/attendee/sequencer.rb +159 -158
  21. data/lib/lingo/attendee/synonymer.rb +81 -84
  22. data/lib/lingo/attendee/text_reader.rb +242 -0
  23. data/lib/lingo/attendee/text_writer.rb +169 -0
  24. data/lib/lingo/attendee/tokenizer.rb +192 -191
  25. data/lib/lingo/attendee/variator.rb +152 -156
  26. data/lib/lingo/attendee/vector_filter.rb +140 -135
  27. data/lib/lingo/attendee/word_searcher.rb +98 -0
  28. data/lib/lingo/buffered_attendee.rb +69 -0
  29. data/lib/lingo/cachable.rb +58 -0
  30. data/lib/lingo/call.rb +72 -0
  31. data/lib/lingo/cli.rb +26 -0
  32. data/lib/lingo/config.rb +23 -26
  33. data/lib/lingo/core_ext.rb +42 -0
  34. data/lib/lingo/ctl.rb +239 -173
  35. data/lib/lingo/database.rb +148 -496
  36. data/lib/lingo/database/crypter.rb +85 -0
  37. data/lib/lingo/database/gdbm_store.rb +49 -0
  38. data/lib/lingo/database/hash_store.rb +67 -0
  39. data/lib/lingo/database/libcdb_store.rb +58 -0
  40. data/lib/lingo/database/sdbm_store.rb +64 -0
  41. data/lib/lingo/database/show_progress.rb +81 -0
  42. data/lib/lingo/database/source.rb +134 -0
  43. data/lib/lingo/database/source/key_value.rb +62 -0
  44. data/lib/lingo/database/source/multi_key.rb +65 -0
  45. data/lib/lingo/database/source/multi_value.rb +65 -0
  46. data/lib/lingo/database/source/single_word.rb +60 -0
  47. data/lib/lingo/database/source/word_class.rb +64 -0
  48. data/lib/lingo/error.rb +122 -0
  49. data/lib/lingo/language.rb +78 -518
  50. data/lib/lingo/language/dictionary.rb +173 -0
  51. data/lib/lingo/language/grammar.rb +211 -0
  52. data/lib/lingo/language/lexical.rb +66 -0
  53. data/lib/lingo/language/lexical_hash.rb +88 -0
  54. data/lib/lingo/language/token.rb +48 -0
  55. data/lib/lingo/language/word.rb +130 -0
  56. data/lib/lingo/language/word_form.rb +83 -0
  57. data/lib/lingo/reportable.rb +59 -0
  58. data/lib/lingo/version.rb +1 -1
  59. data/lingo-all.cfg +14 -10
  60. data/lingo-call.cfg +5 -5
  61. data/lingo.cfg +14 -12
  62. data/lingo.rb +26 -0
  63. data/lir.cfg +13 -9
  64. data/spec/spec_helper.rb +1 -0
  65. data/test.cfg +11 -11
  66. data/test/attendee/ts_abbreviator.rb +0 -6
  67. data/test/attendee/ts_decomposer.rb +0 -6
  68. data/test/attendee/{ts_multiworder.rb → ts_multi_worder.rb} +1 -7
  69. data/test/attendee/ts_noneword_filter.rb +1 -7
  70. data/test/attendee/{ts_objectfilter.rb → ts_object_filter.rb} +1 -7
  71. data/test/attendee/ts_sequencer.rb +0 -6
  72. data/test/attendee/ts_synonymer.rb +0 -6
  73. data/test/attendee/{ts_textreader.rb → ts_text_reader.rb} +1 -7
  74. data/test/attendee/{ts_textwriter.rb → ts_text_writer.rb} +1 -7
  75. data/test/attendee/ts_tokenizer.rb +0 -6
  76. data/test/attendee/ts_variator.rb +0 -6
  77. data/test/attendee/ts_vector_filter.rb +1 -7
  78. data/test/attendee/{ts_wordsearcher.rb → ts_word_searcher.rb} +1 -7
  79. data/test/ref/artikel.non +2 -29
  80. data/test/ref/artikel.seq +13 -8
  81. data/test/ref/artikel.vec +30 -15
  82. data/test/ref/artikel.ven +29 -14
  83. data/test/ref/artikel.ver +58 -43
  84. data/test/ref/lir.csv +146 -145
  85. data/test/ref/lir.non +186 -210
  86. data/test/ref/lir.seq +54 -50
  87. data/test/test_helper.rb +41 -36
  88. data/test/ts_database.rb +12 -11
  89. data/test/ts_language.rb +118 -68
  90. metadata +67 -29
  91. data/lib/lingo/attendee/multiworder.rb +0 -301
  92. data/lib/lingo/attendee/objectfilter.rb +0 -86
  93. data/lib/lingo/attendee/textreader.rb +0 -237
  94. data/lib/lingo/attendee/textwriter.rb +0 -196
  95. data/lib/lingo/attendee/wordsearcher.rb +0 -96
  96. data/lib/lingo/attendees.rb +0 -289
  97. data/lib/lingo/const.rb +0 -131
  98. data/lib/lingo/modules.rb +0 -98
  99. data/lib/lingo/types.rb +0 -285
  100. data/lib/lingo/utilities.rb +0 -40
@@ -12,7 +12,7 @@
12
12
  00019*1 erschließung, inhaltlich 1 indexierung, syntaktisch
13
13
  00021*1 selektion, automatisch
14
14
  00022*1 indexiermuster, sachbezogen 1 rahmenregelung, methodisch
15
- 00024*1 darstellung, ausführlich 1 sektion, verschieden 1 wiedergebrauch, effektiv
15
+ 00024*1 darstellung, ausführlich 1 rolle, besonders 1 sektion, verschieden 1 wiedergebrauch, effektiv
16
16
  00025*1 indexierungssystem, alphabetisch
17
17
  00028*1 indexierungsdaten, verbal 1 verarbeitung, maschinell
18
18
  00029*1 basis, abstrakt linguistisch 1 basis, linguistisch 1 grundlage, allgemein 1 sachregister, alphabetisch
@@ -21,21 +21,21 @@
21
21
  00033*1 religion, christlich
22
22
  00034*1 beschreibung, kurz 1 indexierungssystem, verbal 1 sprache, skandinavisch
23
23
  00036*1 ansatz, wichtig 1 indexierungsmodell, statistisch 1 termgewicht, vorgeschlagen
24
- 00038*1 arbeit, intellektuell 1 arbeit, überholt intellektuell 1 bibliothek, einig 1 buch, ganz 1 diskussion, merkwürdig 1 indexierung, breit 1 informationstechnologie, modern 1 informationstechnologie, wirklich modern 1 intellektuelle, überholt 1 katalog, gedruckt 1 mangel, zunehmend 1 moderne, wirklich 1 sacherschließung, bibliothekarisch 1 schlagwort, eng 1 schlagwort, hilfreich 1 thema, indiziert 1 zeit, langsam
24
+ 00038*1 arbeit, intellektuell 1 arbeit, überholt intellektuell 1 bibliothek, einig 1 buch, ganz 1 diskussion, merkwürdig 1 indexierung, breit 1 informationstechnologie, modern 1 informationstechnologie, wirklich modern 1 katalog, gedruckt 1 mangel, zunehmend 1 moderne, wirklich 1 sacherschließung, bibliothekarisch 1 schlagwort, eng 1 schlagwort, hilfreich 1 thema, indiziert 1 zeit, langsam
25
25
  00039*2 thesaurus, allgemein 1 bibliografie, deutsch 1 bibliothek, deutsch 1 schlagwort, verwendet 1 verzeichnis, wöchentlich
26
26
  00040*1 anmerkung, kritisch 1 erörterung, abschließend 1 indexierung, frei 1 indexierung, maschinell 1 indexierung, verbindlich 1 textsuche, frei
27
27
  00041*1 indexierung, automatisch
28
28
  00042*1 objekt, abstrakt
29
29
  00043*1 bereich, international 1 bibliografie, laufend 1 möglichkeit, realisierbar 1 schwerpunkt, inhaltlich 1 thema, vernachlässigt
30
- 00044*2 kategorie, semantisch 1 gut, genügend 1 kategorie, wichtig semantisch 1 text, machend 1 voraussagbar, genügend gut 1 voraussagbar, gut 1 wiedergabetreue, ausreichend 1 zahl, klein
31
- 00045*2 sachregister, alphabetisch 1 zugriff, besseren
30
+ 00044*2 kategorie, semantisch 1 beachtung, besonders 1 beachtung, unter besonders 1 form, gut voraussagbar 1 form, voraussagbar 1 gut, genügend 1 kategorie, wichtig semantisch 1 prozess, zweistufig 1 text, machend 1 wiedergabetreue, ausreichend 1 zahl, klein
31
+ 00045*2 sachregister, alphabetisch 1 begriff, hierarchisch hoch 1 begriff, hoch 1 begriff, spezifisch 1 zugriff, besseren
32
32
  00046*1 grundlage, linguistisch 1 sacherschließungsmethode, verbal
33
- 00047*1 aktuell-synchronischen, unter weitgehend 1 aktuell-synchronischen, weitgehend 1 beschäftigung, praktisch 1 entwicklung, bisherig 1 entwicklung, historisch 1 identität, absolut 1 lösung, praktisch 1 platonismus, dreifach 1 textinhaltsgegebenheit, absolut 1 universalität, absolut identisch 1 universalität, identisch
33
+ 00047*1 aktuell-synchronischen, unter weitgehend 1 aktuell-synchronischen, weitgehend 1 beschäftigung, praktisch 1 entwicklung, bisherig 1 entwicklung, historisch 1 identität, absolut 1 lösung, praktisch 1 platonismus, dreifach 1 statisch-strukturell, sehr 1 textinhaltsgegebenheit, absolut 1 universalität, absolut identisch 1 universalität, identisch
34
34
  00048*1 beispiel, einig 1 fachgebiet, untersucht 1 kategorie, verschieden 1 schema, dargestellt 1 typ, verschieden 1 untersuchung, statistisch
35
35
  00049*1 informationsprofil, individuell 1 informationssystem, betriebseigen
36
36
  00052*2 indexierung, automatisch 1 anpassung, erheblich 1 berücksichtigung, unter 1 system, einfach 1 system, äußerst einfach 1 systemstrategie, jeweilig
37
37
  00053*2 indexierungssystem, automatisch 1 arbeit, vorliegend 1 indexierungswörterbuch, groß 1 vokabular, vorgeschrieben
38
- 00054*1 folge, logisch 1 folge, natürlich logisch 1 indexierung, automatisch 1 indexierungsansatz, theoretisch 1 vektorraum-modell, klassisch
38
+ 00054*1 anwendung, sinnvoll 1 folge, logisch 1 folge, natürlich logisch 1 indexierung, automatisch 1 indexierungsansatz, theoretisch 1 vektorraum-modell, klassisch
39
39
  00055*2 indexierung, automatisch 1 beispiel, trivial 1 forschungsrichtung, weit 1 information-retrieval-system, ideal 1 richtung, aufgezeigt
40
40
  00056*1 bedeutung, unerträglich
41
41
  00057*1 grundlagenforschung, universitär 1 klassifikationssystem, existent 1 vorteil, weit
@@ -50,14 +50,15 @@
50
50
  00071*1 dokumentationsverfahren, maschinell 1 dokumentationsverfahren, orientiert maschinell 1 grundlage, systematisch
51
51
  00074*1 indexierung, automatisch
52
52
  00075*1 indexierung, automatisch
53
- 00078*1 documentalist, blind 1 rundfunk, saarländisch
53
+ 00078*1 rundfunk, saarländisch
54
54
  00079*1 analyse, vergleichend 1 bezugseinheit, dokumentarisch 1 indexierung, intellektuell 1 literaturdatenbank, biomedizinisch 1 online-datenbank, biomedizinisch 1 zuteilung, maschinell 1 zuteilung, verfügbar maschinell
55
55
  00080*1 klassifikation, automatisch thematisch 1 klassifikation, thematisch
56
56
  00081*1 analyse, vergleichend 1 indexierung, automatisch
57
57
  00082*2 register, gedruckt 1 kwoc-verfahren, modifiziert 1 steuerung, genau
58
58
  00083*2 daten, unstrukturiert 1 automatich, weitgehend 1 bedienung, einfach 1 bedienung, möglich einfach 1 benutzer, einzeln 1 benutzerkreis, breit 1 dialogform, verschieden 1 nutzungsflexibilität, hoch 1 oberflächengestaltung, systematisch
59
- 00086*1 beziehung, international 1 database, cooperativ online 1 database, online 1 überlegung, ökonomisch
60
- 00088*1 ergebnis, brauchbar 1 fortsetzung, konsequent 1 indexierung, automatisch 1 indexierung, syntaktisch 1 satzanalyse, vollständig
59
+ 00084*1 berücksichtigung, besonders 1 berücksichtigung, unter besonders
60
+ 00086*1 beziehung, international 1 database, cooperativ online 1 database, online 1 retrieval, online 1 überlegung, ökonomisch
61
+ 00088*1 begriff, komplex 1 ergebnis, brauchbar 1 fortsetzung, konsequent 1 indexierung, automatisch 1 indexierung, syntaktisch 1 satzanalyse, vollständig
61
62
  00089*1 patentinformationssystem, deutsch
62
63
  00090*1 sacherschließung, verbal 1 tagung, international
63
64
  00092*1 erschließung, sachlich 1 indexierung, maschinell
@@ -86,16 +87,17 @@
86
87
  00126*1 informationssystem, biografisch 1 informationssystem, international biografisch
87
88
  00127*1 ausführung, folgend 1 software, betrachtet
88
89
  00128*1 begriffssystem, verwendet 1 fachgebiet, dominierend 1 genauigkeitsrate, hoch 1 indexierung, maschinell 1 nummerierung, fortlaufend 1 variante, verschieden
89
- 00129*1 anregung, interessant 1 beziehung, syntaktisch 1 fachinformationssystem, modern 1 indexierung, syntaktisch 1 kennzeichnung, eindeutig 1 methode, entwickelt 1 ordnungselement, alphabetisch 1 verknüpfungsmittel, syntaktisch
90
+ 00129*1 anregung, interessant 1 begriff, ordnend 1 beziehung, syntaktisch 1 fachinformationssystem, modern 1 indexierung, syntaktisch 1 kennzeichnung, eindeutig 1 methode, entwickelt 1 ordnungselement, alphabetisch 1 verknüpfungsmittel, syntaktisch
91
+ 00132*1 erfordernis, berufsbedingt
90
92
  00133*1 debatte, international 1 horizont, national 1 sacherschließung, verbal 1 verbreitung, zunehmend 1 übersetzung, gekürzt 1 übersetzung, leicht gekürzt
91
93
  00134*1 analyse, semantisch 1 inhaltserschließung, maschinell 1 wort, komplex 1 wort, morphologisch komplex
92
94
  00135*1 ausführung, vorliegend 1 bedeutung, zentral 1 einblick, kurz 1 maß, zunehmend 1 reputation, wissenschaftlich 1 tätigkeit, wissenschaftlich 1 zeitschriftentitel, jeweilig
93
- 00136*1 post, elektronisch
95
+ 00136*1 post, elektronisch 1 post, weltweit elektronisch
94
96
  00137*2 inhalt, neu 1 anpassung, gegenseitig 1 datenbank, vorhanden 1 datenformat, verwendet 1 patentklassifikation, strukturiert 1 änderung, aktuell
95
- 00138*1 abbild, zutreffend 1 einrichtung, wissenschaftlich 1 einwandfreien, methodisch 1 fachdatenbank, elektronisch 1 information, gespeichert 1 ranglisten, erstellt
97
+ 00138*1 abbild, zutreffend 1 einrichtung, wissenschaftlich 1 einwandfrei, methodisch 1 fachdatenbank, elektronisch 1 information, gespeichert 1 rangliste, erstellt
96
98
  00140*1 bibliothek, deutsch 1 bibliotheksinstitut, deutsch 1 form, operational
97
99
  00141*1 bibliothek, öffentlich 1 erschließungstechnik, neu
98
- 00142*1 arbeit, folgend 1 information, ausreichend 1 vergleichsuntersuchung, entsprechend 1 wissenschaftlergruppe, bestimmt
100
+ 00142*1 arbeit, folgend 1 forschungspolitisch, sinnvoll 1 information, ausreichend 1 vergleichsuntersuchung, entsprechend 1 wissenschaftlergruppe, bestimmt
99
101
  00143*1 untersuchung, vergleichend
100
102
  00144*1 inhaltserschließung, automatisch
101
103
  00145*1 indexierung, automatisch
@@ -104,8 +106,9 @@
104
106
  00148*1 information, human
105
107
  00149*1 indexierung, automatisch
106
108
  00150*1 datei, elektronisch 1 post, rheinisch
109
+ 00153*1 expertensystem, groß
107
110
  00154*1 dokumentation, inhaltlich 1 indexierung, kontrolliert 1 komfort, erreicht 1 schnittgenau, gar
108
- 00155*1 ausgabe, gedruckt 1 information, gewünscht 1 inhaltserschließung, gut 1 prüfung, kritisch 1 speicherkapazität, groß 1 zürcher, neu
111
+ 00155*1 ausgabe, gedruckt 1 information, gewünscht 1 inhaltserschließung, gut 1 maß, besonders 1 prüfung, kritisch 1 speicherkapazität, groß 1 zugriff, zielgenau 1 zürcher, neu
109
112
  00156*1 grundlage, linguistisch
110
113
  00158*1 indexierung, automatisch
111
114
  00159*1 indexierung, automatisch 1 inhaltserschließung, bibliothekarisch
@@ -113,25 +116,26 @@
113
116
  00162*1 bibliothekskatalog, groß
114
117
  00163*1 aspekt, qualitativ 1 sacherschließung, verbal
115
118
  00164*1 dokument, relevant 1 informationsmenge, riesig 1 internet, chaotisch organisiert 1 internet, organisiert 1 monat, vergangen 1 nutzung, effektiv 1 online-medium, populär 1 problem, schwerwiegend 1 suchwerkzeug, genannt
116
- 00165*1 analyse, statistisch 1 analyse, umfangreich 1 faszination, stark 1 forschungsgeld, fließend 1 forschungsgeld, knapp fließend 1 gutachter-system, überfordert 1 interpretation, sorgfältig 1 selektionskriterium, geeignet 1 spezialist, wenig
117
- 00166*1 aussage, wichtig 1 indexsprache, kategorisiert 1 mangel, bedingt 1 ordnung, hoch 1 regel, einfach 1 satz, letzte 1 struktur, linear 1 überblick, besseren
118
- 00171*1 marketingstratege, kreativ 1 marketingstratege, unermüdlich kreativ
119
+ 00165*1 analyse, statistisch 1 analyse, umfangreich 1 anwendung, sinnvoll 1 faszination, stark 1 forschungsgeld, fließend 1 forschungsgeld, knapp fließend 1 gutachter-system, überfordert 1 interpretation, sorgfältig 1 selektionskriterium, geeignet 1 spezialist, wenig
120
+ 00166*1 aussage, wichtig 1 begriff, gesucht 1 begriff, syntaktisch verknüpft 1 begriff, verknüpft 1 begriff, zusammengehörend 1 indexsprache, kategorisiert 1 mangel, bedingt 1 ordnung, hoch 1 regel, einfach 1 satz, letzte 1 struktur, linear 1 überblick, besseren
121
+ 00170*1 informationsvermittlung, sinnvoll
122
+ 00171*1 begriff, neu 1 marketingstratege, kreativ 1 marketingstratege, unermüdlich kreativ
119
123
  00173*1 bildschirmschoner, global 1 toilette, öffentlich 1 webpage, seltsam
120
- 00174*3 datenbank, bibliografisch 3 oberfläche, visuell 1 soll, folgend 1 studie, früh
121
- 00176*1 bibliothek, wissenschaftlich 1 form, kurz 1 information, technisch 1 maßnahmen, wesentlich 1 maßnahmen, zugeordnet wesentlich 1 nutzung, verstärkt 1 selbstverwaltung, wissenschaftlich 1 struktur, wesentlich 1 ziel, langfristig 1 ziel, wesentlich 1 zugang, effizient
124
+ 00174*3 datenbank, bibliografisch 3 oberfläche, visuell 1 retrieval, traditionell 1 soll, folgend 1 studie, früh
125
+ 00176*1 bibliothek, wissenschaftlich 1 form, kurz 1 information, technisch 1 maßnahme, wesentlich 1 maßnahme, zugeordnet wesentlich 1 nutzung, verstärkt 1 selbstverwaltung, wissenschaftlich 1 struktur, wesentlich 1 ziel, langfristig 1 ziel, wesentlich 1 zugang, effizient
122
126
  00177*1 arbeitsgang, sonstig 1 datenbank, verbunden 1 datenbanksystem, gesamt 1 datenbanksystem, umfassend 1 dokumenttyp, alle verschieden 1 dokumenttyp, verschieden 1 mediendatenbank, umfassend 1 textdokument, alle 1 zusammenstellung, elektronisch
123
127
  00178*1 bild, digital
124
128
  00181*1 eitelkeit, gelehrt
125
129
  00182*1 kinderbibliothek, gerade 1 medienerlebnis, kreativ 1 medium, neu 1 technologie, neu 1 welt, real 1 zugang, neu
126
130
  00183*1 enzyklopädie, interaktiv 1 kulturfahrplan, groß
127
- 00185*1 indexierung, automatisch 1 indexierung, intellektuell 1 indexierungsverfahren, automatisch 1 klassifikation, automatisch 1 klärung, terminologisch 1 kooperation, eng
131
+ 00185*1 begriff, weit 1 indexierung, automatisch 1 indexierung, intellektuell 1 indexierungsverfahren, automatisch 1 klassifikation, automatisch 1 klärung, terminologisch 1 kooperation, eng
128
132
  00186*2 indexierung, automatisch 2 klassifikation, automatisch 1 dokument, klassifiziert 1 dokumentklassifikation, automatisch 1 einführung, kurz 1 relation, statistisch 1 thema, folgend
129
133
  00187*1 arbeitsgruppe, bibliothekarisch
130
134
  00191*1 erschließung, automatisch 1 klassifikation, hierarchisch 1 klassifikation, thematisch hierarchisch 1 ordnungsstruktur, gewonnen 1 text, wiedergewonnen 1 textklassifikation, automatisch thematisch 1 textklassifikation, thematisch 1 wichtigkeitsstufe, entstanden
131
135
  00192*2 indexierung, automatisch 1 datenbank, groß 1 facettenklassifikation, universal 1 fachwort, wichtig 1 indexierung, unter automatisch 1 klassifikationssystem, vorgegeben 1 sprache, deutsch 1 titel, beliebig 1 veröffentlichung, wissenschaftlich
132
136
  00193*1 abfragbar, online 1 indexierung, numerisch 1 zugang, schnell
133
- 00194*1 indexierung, intellektuell 1 methode, neu 1 system, britisch
134
- 00195*1 indexierung, intellektuell 1 methode, neu 1 system, britisch
137
+ 00194*1 berücksichtigung, besonders 1 berücksichtigung, unter besonders 1 indexierung, intellektuell 1 methode, neu 1 system, britisch
138
+ 00195*1 berücksichtigung, besonders 1 berücksichtigung, unter besonders 1 indexierung, intellektuell 1 methode, neu 1 system, britisch
135
139
  00197*1 arbeit, beruflich 1 beziehung, bestimmt 1 einheit, thematisch 1 inhalt, kommuniziert 1 kern, eigen 1 kerngebiet, komplex 1 potential, technisch 1 veränderung, technisch
136
140
  00198*1 inhaltserschließung, automatisch
137
141
  00199*1 anwendung, unter 1 moderne, befindlich 1 standardsystem, herkömmlich
@@ -139,13 +143,13 @@
139
143
  00201*1 bibliothek, wissenschaftlich 1 bibliothekskongress, deutsch
140
144
  00204*1 konferenz, international
141
145
  00205*1 bibliothek, deutsch
142
- 00206*1 forschungsgemeinschaft, deutsch 1 indexierung, automatisch 1 inhaltserschließung, automatisch 1 projekt, durchgeführt 1 sacherschließung, bibliothekarisch 1 sacherschließung, konventionell bibliothekarisch
143
- 00207*2 stellung, systematisch 1 bezeichnung, taxonomisch 1 eingabe, unter 1 erreger, dazugehörig 1 hilfe, unterstützt 1 indexdatei, vorgegeben 1 nachschlagewerk, verschieden 1 name, wissenschaftlich 1 objekt, biologisch 1 rationalisierung, weit 1 weise, gleich
146
+ 00206*1 forschungsgemeinschaft, deutsch 1 indexierung, automatisch 1 inhaltserschließung, automatisch 1 projekt, durchgeführt 1 sacherschließung, bibliothekarisch 1 sacherschließung, konventionell bibliothekarisch 1 verbindung, sinnvoll
147
+ 00207*2 stellung, systematisch 1 begriff, verändert 1 bezeichnung, taxonomisch 1 eingabe, unter 1 erreger, dazugehörig 1 hilfe, unterstützt 1 indexdatei, vorgegeben 1 nachschlagewerk, verschieden 1 name, wissenschaftlich 1 objekt, biologisch 1 rationalisierung, weit 1 weise, gleich
144
148
  00208*1 anpassung, strukturell 1 bereich, folgend 1 katalog, elektronisch 1 problem, allgemein 1 umfang, erreicht 1 vokabular, universal 1 überarbeitung, grundsätzlich
145
149
  00209*2 umfeldsuche, semantisch 1 ergebnis, unbefriedigend 1 indexierung, maschinell 1 katalog, konventionell 1 online-katalog, bibliothekarisch 1 suche, sachlich 1 umfeld, semantisch 1 vokabular, strukturiert
146
150
  00210*1 bild, entsprechend 1 möglichkeit, technisch 1 speicher, effektiv 1 suchanfragen, formuliert 1 system, verschieden 1 voraussetzung, alle
147
151
  00211*1 fachinformation, sozialwissenschaftlich
148
- 00212*2 informationssuche, effizient 1 kostenfaktor, verschieden 1 multimedia-dokumentkollektion, verteilt 1 multimedial, verteilt 1 ranglist, final 1 ranglisten, individuell 1 skalierbar, beliebig 1 typ, beliebig
152
+ 00212*2 informationssuche, effizient 1 kostenfaktor, verschieden 1 multimedia-dokumentkollektion, verteilt 1 multimedial, verteilt 1 rangliste, final 1 rangliste, individuell 1 skalierbar, beliebig 1 typ, beliebig
149
153
  00213*1 beitrag, vorliegend 1 beziehung, derartig 1 indexierung, automatisch 1 indexierungssystem, automatisch 1 interesse, groß 1 relation, erfasst 1 schätzverfahren, verschieden 1 schätzverfahren, vorgeschlagen
150
154
  00214*1 indexierung, automatisch
151
155
  00215*1 indexierungsfunktion, logistisch
@@ -155,7 +159,7 @@
155
159
  00219*1 praxis, neu
156
160
  00221*1 bibliotheksindex, allgemein 1 system, national
157
161
  00222*1 indexierung, syntaktisch
158
- 00223*1 nachricht, aktuell
162
+ 00223*1 informationsquelle, groß 1 nachricht, aktuell
159
163
  00225*1 deutsche, professionell 1 seite, deutsch 1 seite, professionell deutsch 1 spur, grün 1 umwelt-angebot, unzählig
160
164
  00227*1 datenbank, verschieden 1 datenmenge, gespeichert 1 erkenntnis, allgemein
161
165
  00228*1 studie, neu
@@ -165,7 +169,7 @@
165
169
  00232*2 bibliothek, deutsch 1 dienst, zentral 1 dokumentationssprache, adäquat 1 gleichordnend, augenblicklich 1 indexierungsverfahren, britisch 1 jahr, einig 1 linguistik, modern 1 sacherschließung, verbal 1 sprache, natürlich 1 stande, alternativ 1 version, britisch 1 version, verkürzt
166
170
  00233*1 einsatz, praktisch 1 halbautomatisch, arbeitet 1 heuristik, linguistisch 1 information, gewonnen 1 verantwortung, gesellschaftlich
167
171
  00234*2 patentklassifikation, international 1 auflage, letzte 1 einteilungssystem, ganz 1 information, erfasst 1 klassifikationssymbol, obligatorisch 1 neuerung, gravierend 1 sachgebieten, bestimmt 1 sachverhalt, technisch 1 stelle, passend
168
- 00236*2 patentinformationssystem, deutsch 1 ansatz, allgemein 1 informationswissenschaft, linguistisch 1 patentamt, deutsch
172
+ 00236*2 patentinformationssystem, deutsch 1 ansatz, allgemein 1 informationswissenschaft, linguistisch 1 patentamt, deutsch 1 retrievaltest, extensiv
169
173
  00237*1 dezimalklassifikation, dreisprachig universal 1 dezimalklassifikation, universal 1 erschließung, intellektuell 1 informationsressource, relevant 1 informationsressource, wissenschaftlich relevant 1 internetressource, gesammelt 1 server, relevant 1 server, wissenschaftlich relevant
170
174
  00238*1 informationsressource, relevant 1 informationsressource, wissenschaftlich relevant
171
175
  00239*1 archivsystem, optisch 1 bedingung, alle 1 datenbank, international 1 informationsflut, anwachsend 1 informationsflut, stetig anwachsend 1 umfeld, technisch
@@ -176,7 +180,7 @@
176
180
  00244*1 indexierung, automatisch
177
181
  00246*1 indexierung, manuell
178
182
  00247*1 artikel, zitierend 1 datenbank, einzig 1 einrichtung, allem 1 entwicklungsstand, derzeitig 1 forschungseinrichtung, groß 1 fußnote, gemeinsam 1 information, wissenschaftlich 1 literatur, zitiert 1 produkt, parallel 1 wissenschaftsfächer, mehrere 1 zitationsdatenbank, groß
179
- 00248*1 arbeit, praktisch 1 einsatz, praktisch 1 erfahrung, intensiv praktisch 1 erfahrung, praktisch 1 erschließung, inhaltlich 1 form, rührend 1 gleichermaß, informiert 1 grundlage, theoretisch 1 problem, auftretend 1 register, ausführlich 1 register, ungewöhnlich ausführlich 1 überlegung, gründlich
183
+ 00248*1 arbeit, praktisch 1 einsatz, praktisch 1 erfahrung, intensiv praktisch 1 erfahrung, praktisch 1 erschließung, inhaltlich 1 form, rührend 1 gleichermaß, informiert 1 grundlage, theoretisch 1 problem, auftretend 1 register, ausführlich 1 register, ungewöhnlich ausführlich 1 retrievalmöglichkeit, spät 1 überlegung, gründlich
180
184
  00249*1 bibliothek, deutsch
181
185
  00250*1 abhilfe, automatisch 1 analyseverfahren, neu 1 datenmenge, verfügbar 1 information, relevant 1 pfad, neu
182
186
  00251*1 suchfunktion, ausgereift 1 suchfunktion, eigen 1 webserver, eigen
@@ -186,16 +190,16 @@
186
190
  00255*2 wahrheit, unterdrückt 1 bildbearbeitung, digital 1 fotografie, politisch 1 höhepunkt, vorläufig
187
191
  00258*1 darstellung, besseren 1 fachgesellschaft, wissenschaftlich 1 jahr, einig 1 material, spezifisch 1 methode, technisch 1 methode, verwendet technisch 1 verfügbarkeit, besseren
188
192
  00259*1 lotus, unter 1 version, neu
189
- 00260*1 aktualität, mangelnd 1 anbieter, kommerziell 1 beitrag, folgend 1 erschließung, automatisch 1 internetquell, gefunden 1 link-sammlung, thematisch 1 maß, erheblich stark 1 maß, stark 1 mehr, wohl 1 netz, gesamt 1 quell, erschlossen 1 quell, intellektuell erschlossen 1 suchmaschine, divers
193
+ 00260*1 aktualität, mangelnd 1 anbieter, kommerziell 1 beitrag, folgend 1 erschließung, automatisch 1 internetquelle, gefunden 1 link-sammlung, thematisch 1 maß, erheblich stark 1 maß, stark 1 mehr, wohl 1 netz, gesamt 1 quelle, erschlossen 1 quelle, intellektuell erschlossen 1 suchmaschine, divers
190
194
  00261*2 indexierung, automatisch 1 forschungsgemeinschaft, deutsch 1 projekt, durchgeführt 1 sacherschließung, bibliothekarisch
191
195
  00264*2 indexierung, automatisch 1 mischform, realisiert 1 relevanz, statistisch 1 suchergebnis, sortiert
192
196
  00265*1 datenverarbeitung, elektronisch 1 dokumentationsmethode, wenig 1 fachsprache, starr 1 fachterminologie, akzeptiert 1 philosophie-dokumentation, elektronisch
193
- 00267*1 dokumenterschließung, automatisch 1 indexierung, automatisch 1 milos-verfahren, erweitert 1 projekt, gefördert 1 titeldaten, angereichert
197
+ 00267*1 dokumenterschließung, automatisch 1 indexierung, automatisch 1 milos-verfahren, erweitert 1 projekt, gefördert 1 retrievaltest, umfangreich 1 titeldaten, angereichert
194
198
  00268*1 publikation, elektronisch 1 sicht, bibliothekarisch 1 trend, aktuell
195
199
  00269*1 visualisierungstechnik, innovativ
196
200
  00270*1 inhaltserschließung, verbal 1 literaturbericht, kommentiert
197
201
  00271*1 sacherschließung, verbal
198
- 00273*1 indexierung, syntaktisch
202
+ 00273*2 retrieval, online 1 indexierung, syntaktisch
199
203
  00274*1 database, online 1 dokumenterschließung, inhaltlich
200
204
  00275*1 indexierung, maschinell
201
205
  00276*2 information, relevant 1 information, lokal 1 konsens, breiten 1 suchmaschine, universal 1 teil, relevant 1 web-server, eigen 1 weise, einheitlich 1 zugang, effizient
@@ -204,29 +208,29 @@
204
208
  00280*1 erkenntnis, methodisch
205
209
  00281*1 leistung, wissenschaftlich
206
210
  00283*1 bibliotheksverbund, kooperativ 1 konzept, lokal 1 schnittstelle, technisch
207
- 00284*1 darstellung, begrifflich 1 darstellung, einfach begrifflich 1 suchsystem, basiert 1 suchsystem, semantisch basiert 1 wörterbuch, umfassend 1 zusammenhang, systematisch
211
+ 00284*1 begriff, einfach 1 darstellung, begrifflich 1 darstellung, einfach begrifflich 1 retrieval, semantisch 1 retrievaltechnik, heutig 1 suchsystem, basiert 1 suchsystem, semantisch basiert 1 wörterbuch, umfassend 1 zusammenhang, systematisch
208
212
  00285*1 kriterium, verschieden 1 verteilung, zeitlich 1 verwendung, unter 1 wissenschaftskommunikation, formal
209
213
  00286*2 datenbank, bibliothekarisch 1 ergebnis, konsistent 1 indexierung, einheitlich 1 indexsystem, angegangen 1 konstruktion, unterschiedlich 1 oberfläche, einheitlich 1 problem, einig 1 schnittmenge, gemeinsam 1 schnittmenge, klein gemeinsam 1 suchergebnis, inkonsistent 1 suchschlüssel, gleich 1 suchschlüssel, scheinbar gleich 1 suchschlüssel, unterschiedlich 1 verbreitung, zunehmend
210
- 00287*2 information, smart 1 datei, groß 1 ergebnismenge, groß 1 gruppierung, automatisch 1 internetquell, verschieden 1 nachricht, aktuell 1 nachricht, einzeln 1 nachricht, zusammengestellt 1 sprache, deutsch 1 version, angepasst
214
+ 00287*2 information, smart 1 begriff, frei gewählt 1 begriff, gewählt 1 datei, groß 1 ergebnismenge, groß 1 gruppierung, automatisch 1 internetquelle, verschieden 1 nachricht, aktuell 1 nachricht, einzeln 1 nachricht, zusammengestellt 1 sprache, deutsch 1 version, angepasst
211
215
  00288*1 austausch, allen kommunikativ 1 austausch, kommunikativ 1 datenspeicher, elektronisch 1 erde, ganz 1 informationsverlust, ungewollt 1 objekt, intern 1 patent, international 1 schatz, gigantisch 1 schlüssel, entscheidend 1 speicher, auffindbar 1 sprache, zahlreich 1 suchoption, weit 1 technologie, alle 1 technologie, erfasst alle 1 teil, groß 1 terminologie, gemeinsam 1 terminologie, professionell 1 unternehmen, global 1 weg, benötigt 1 weltwissen, gesamt technisch 1 weltwissen, technisch 1 wirkung, integrativ 1 wirkung, stark integrativ
212
- 00289*1 informationswissenschaftlich, unser 1 known-item-retrievaltest, unser 1 suchwerkzeug, jeweilig
216
+ 00289*1 informationswissenschaftlich, unser 1 known-item-retrievaltest, unser 1 retrievaloberfläche, kund 1 suchwerkzeug, jeweilig
213
217
  00290*1 antwort, konkret 1 aufwand, hoch technologisch 1 aufwand, technologisch 1 auskunft, genau 1 bewertung, intern 1 bewertungsverfahren, kompliziert 1 dateiformat, kryptisch 1 datenbankservermelden, mächtig 1 dokument, ständig verfügbar 1 dokument, verfügbar 1 entscheidung, intuitiv 1 hyperlink, richtig 1 information, bessere 1 intelligenz, human 1 katalog, inhaltlich sortierend 1 katalog, sortierend 1 konzept, gut 1 kriterium, inhaltlich 1 liege, entfernt 1 linkverbindung, gut 1 maschine, automatisch 1 projekt, kalifornisch 1 recherche, automatisch 1 relevanz, inhaltlich 1 roboter, chic unentwegt 1 roboter, unentwegt 1 seite, alle 1 seite, aller 1 seite, zentral 1 sportergebnis, neu 1 studie, früh 1 suchroboter, chic 1 suchsystem, alle 1 suchtechnologie, konventionell 1 surfer, unzählig 1 thema, einig 1 verarbeitung, maschinell 1 verarbeitung, rein maschinell 1 viertel, weit 1 webadresse, beliebig 1 webseite, alle 1 webseite, aller 1 webseite, indiziert 1 webseite, katalogisiert 1 welt, heterogen 1 wort, alle 1 wort, erfasst alle
214
- 00291*3 handschrift, mittelalterlich 2 erschließung, bibliothekarisch 1 anforderung, neu 1 anforderung, völlig neu 1 belastung, stark 1 bereich, automatisiert 1 bereich, partiell automatisiert 1 bibliothek, wenig 1 bibliothekskatalog, allgemein 1 bibliotheksmaterial, herkömmlich 1 darstellung, ausführlich 1 dokument, elektronisch 1 dokument, neu elektronisch 1 festlegung, inhaltlich 1 festlegung, vielfach inhaltlich 1 gesamtindex, früh 1 handschriftenkatalog, gedruckt 1 handschriftenkatalog, gefördert 1 informationsgewinn, erheblich 1 jahr, einig 1 katalog, erstellt 1 katalog, gedruckt 1 katalogsystem, jeweilig 1 kreis, eng 1 material, verschieden 1 problem, entstehend technisch 1 problem, technisch 1 regelwerk, bibliothekarisch 1 richtlinie, gültig 1 suche, vereinheitlicht 1 system, verwendet 1 wirkung, tiefgreifend
215
- 00292*4 inhaltserschließung, automatisch 1 akzeptanz, merklich 1 ansatz, verschieden 1 anstrengung, verstärkt 1 anwenderkreisen, breiten 1 automatisierung, zunehmend 1 informationsflut, steigend 1 interesse, wachsend 1 komponente, bestimmt 1 produkt, neu 1 softwarewerkzeug, kommerziell vertrieben 1 softwarewerkzeug, vertrieben 1 vertrieb, kommerziell 1 zugriffsverfahren, effizient
216
- 00293*1 datenvolumen, groß 1 indexierung, maschinell 1 prozess, iterativ 1 sicht, technisch
217
- 00294*1 ansprüche, verändert 1 benutzer, unser 1 bibliotheksbenutzer, extern 1 form, allgemein 1 form, recht allgemein 1 jahr, letzte 1 problem, häufig 1 recherchemöglichkeit, hervorragend 1 rückgang, stark 1 umfeld, universitär
218
- 00295*1 einstieg, optimal 1 erhebung, ausgearbeitet empirisch 1 erhebung, empirisch 1 indexierung, automatisch 1 informationswissenschaftlich, seriös 1 speerspitze, technologisch 1 suchsystem, unterschiedlich 1 vokabular, geordnet kontrolliert 1 vokabular, kontrolliert
219
- 00296*1 befehlsorientieren, ausschließlich 1 befehlsorientieren, elaboriert 1 benutzerschnittstelle, ergonomisch 1 checklist, unser 1 datensätzen, singulär 1 indexierung, automatisch 1 informationsproduzent, isoliert 1 leistungsindikator, weit 1 methode, automatisch 1 methode, suboptimal 1 online-archiv, kommerziell 1 realisierungsmöglichkeit, technisch 1 suche, gut 1 system, irgendwelch 1 umgebung, experimentell 1 wirdjedoch, vorausgesetzt
218
+ 00291*3 handschrift, mittelalterlich 2 erschließung, bibliothekarisch 1 anforderung, neu 1 anforderung, völlig neu 1 belastung, stark 1 bereich, automatisiert 1 bereich, partiell automatisiert 1 bibliothek, wenig 1 bibliothekskatalog, allgemein 1 bibliotheksmaterial, besonders 1 bibliotheksmaterial, herkömmlich 1 darstellung, ausführlich 1 dokument, elektronisch 1 dokument, neu elektronisch 1 festlegung, inhaltlich 1 festlegung, vielfach inhaltlich 1 gesamtindex, früh 1 handschriftenkatalog, gedruckt 1 handschriftenkatalog, gefördert 1 informationsgewinn, erheblich 1 jahr, einig 1 katalog, erstellt 1 katalog, gedruckt 1 katalogsystem, jeweilig 1 kreis, eng 1 material, verschieden 1 problem, entstehend technisch 1 problem, technisch 1 regelwerk, bibliothekarisch 1 richtlinie, gültig 1 suche, vereinheitlicht 1 system, verwendet 1 wirkung, tiefgreifend
219
+ 00292*4 inhaltserschließung, automatisch 1 akzeptanz, merklich 1 ansatz, verschieden 1 anstrengung, verstärkt 1 anwenderkreisen, breiten 1 automatisierung, zunehmend 1 informationsflut, steigend 1 interesse, wachsend 1 komponente, bestimmt 1 produkt, neu 1 softwarewerkzeug, kommerziell vertrieben 1 softwarewerkzeug, vertrieben 1 vertrieb, kommerziell 1 zugriffsverfahren, effizient 1 zukunft, nah
220
+ 00293*1 begriff, alphabetisch 1 datenvolumen, groß 1 indexierung, maschinell 1 prozess, iterativ 1 sicht, technisch
221
+ 00294*1 ansprüche, verändert 1 benutzer, unser 1 bibliotheksbenutzer, extern 1 form, allgemein 1 form, recht allgemein 1 jahr, letzte 1 maß, besonders 1 problem, häufig 1 recherchemöglichkeit, hervorragend 1 rückgang, stark 1 umfeld, universitär
222
+ 00295*1 einstieg, optimal 1 erhebung, ausgearbeitet empirisch 1 erhebung, empirisch 1 indexierung, automatisch 1 informationswissenschaftlich, seriös 1 speerspitze, technologisch 1 suchsystem, unterschiedlich 1 vokabular, geordnet kontrolliert 1 vokabular, kontrolliert 1 zugriff, zielgenau
223
+ 00296*1 befehlsorientieren, ausschließlich 1 befehlsorientieren, elaboriert 1 benutzerschnittstelle, ergonomisch 1 checkliste, unser 1 datensätzen, singulär 1 indexierung, automatisch 1 informationsproduzent, isoliert 1 leistungsindikator, weit 1 methode, automatisch 1 methode, suboptimal 1 online-archiv, kommerziell 1 realisierungsmöglichkeit, technisch 1 retrievalsystem, gut 1 suche, gut 1 system, irgendwelch 1 umgebung, experimentell 1 wirdjedoch, vorausgesetzt
220
224
  00297*2 problem, methodisch 2 wissenschaftsforschung, empirisch 1 arbeit, vorliegend 1 basis, problematisch 1 bereich, semantisch 1 bereich, syntaktisch 1 charakter, dynamisch 1 faktor, beachtenswert 1 informationstheorie, semantisch 1 leistung, wissenschaftlich 1 problem, alle methodisch 1 problem, auftretend methodisch 1 problem, grundlegend 1 problem, offen 1 problem, spezifisch 1 publikation, elektronisch 1 publikation, zitiert 1 wirkung, wissenschaftlich
221
- 00298*3 text, elektronisch 2 erschließung, inhaltlich 1 aspekt-klassifikation, universal 1 erschließung, automatisch inhaltlich 1 erschließung, syntaktisch inhaltlich 1 klassifikationselement, bezogen 1 klassifikationselement, inhaltlich bezogen 1 recherche, zahlreich 1 suchalgorithmen, bekannt 1 suchgegenstand, jeweilig 1 textdokument, unbekannt
225
+ 00298*3 text, elektronisch 2 erschließung, inhaltlich 1 aspekt-klassifikation, universal 1 erschließung, automatisch inhaltlich 1 erschließung, syntaktisch inhaltlich 1 klassifikationselement, bezogen 1 klassifikationselement, inhaltlich bezogen 1 recherche, zahlreich 1 retrieval, syntaktisch 1 suchalgorithmen, bekannt 1 suchgegenstand, jeweilig 1 textdokument, unbekannt
222
226
  00299*1 angebot, nutzend 1 veröffentlichung, alle 1 übersetzungssystem, automatisch
223
- 00300*1 anwendung, experimentell 1 anwendungsfall, fruchtbar 1 erschließung, inhaltlich 1 migration, sozialwissenschaftlich 1 relation, komplex 1 suche, semantisch
227
+ 00300*1 anwendung, experimentell 1 anwendungsfall, fruchtbar 1 erschließung, inhaltlich 1 interesse, besonders 1 migration, sozialwissenschaftlich 1 relation, komplex 1 suche, semantisch
224
228
  00301*4 daten, inhaltlich 1 daten, formatiert 1 datenarten, inhaltlich 1 form, strukturiert 1 management, integriert 1 text, vorwiegend
225
229
  00302*1 anforderung, speziell 1 anwendungskontext, real 1 erschließung, automatisch inhaltlich 1 erschließung, inhaltlich 1 gesichtspunkt, qualitativ 1 indexierung, automatisch 1 inhaltserschließung, intellektuell 1 mangel, einig 1 methode, anerkannt 1 system, grundsätzlich unterschiedlich 1 system, lernend 1 system, unterschiedlich 1 trainingsvorlage, erstellt 1 trainingsvorlage, intellektuell erstellt
226
230
  00303*1 annotationssystem, verteilt 1 ansatz, konzeptuell 1 anwendungsbereich, exemplarisch 1 artikel, einschlägig 1 aufgabe, komplex 1 aufgabe, verbunden komplex 1 aufgabenbasieren, entsprechend 1 beitrag, vorliegend 1 benutzergruppe, verteilt 1 benutzertyp, verschieden 1 bestand, wachsend 1 datenbestand, gespeichert 1 dokumentenverarbeitung, intelligent 1 filmarchiv, europäisch 1 filmarchiv, groß europäisch 1 filmforschung, historisch 1 jahrhundert, vorig 1 korpus, groß 1 quellenmaterial, historisch 1 technik, dediziert 1 xml-basiert, modern
227
231
  00304*1 indexierung, automatisch
228
232
  00305*2 generierung, maschinell 1 abteilung, verantwortlich 1 auftraggeber, öffentlich 1 beratungsdienstleistung, international 1 beratungsschwerpunkt, weit 1 beratungsunternehmen, führend 1 externe, dokumentiert 1 material, dokumentiert extern 1 material, extern 1 netz, intern 1 projektbericht, aller intern 1 projektbericht, intern 1 stand, derzeitig 1 unternehmen, jung
229
- 00306*5 indexierung, automatisch 1 ansatz, behandelt 1 ansatz, grundsätzlich 1 ansatz, verschieden 1 berg, ständig wachsend 1 berg, wachsend 1 buch, vorliegend 1 charakter, beispielhaft 1 darstellung, einführend 1 information, unstrukturiert 1 informationsbedarf, grundsätzlich 1 informationswirtschaft, betrieblich 1 lehrveranstaltung, entsprechend 1 mittel, manuell 1 praktiker, konfrontiert 1 seite, technisch 1 sprache, verständlich 1 tag, heutig 1 tiefendarstellung, detailliert 1 verarbeitung, schnell 1 verwaltung, öffentlich 1 voraussetzung, jeweilig 1 wirtschaft, abhängig
233
+ 00306*5 indexierung, automatisch 1 ansatz, behandelt 1 ansatz, grundsätzlich 1 ansatz, verschieden 1 bedeutung, groß 1 berg, ständig wachsend 1 berg, wachsend 1 buch, vorliegend 1 charakter, beispielhaft 1 darstellung, einführend 1 information, unstrukturiert 1 informationsbedarf, grundsätzlich 1 informationswirtschaft, betrieblich 1 lehrveranstaltung, entsprechend 1 mittel, manuell 1 praktiker, konfrontiert 1 seite, technisch 1 sprache, verständlich 1 tag, heutig 1 tiefendarstellung, detailliert 1 verarbeitung, schnell 1 verwaltung, öffentlich 1 voraussetzung, jeweilig 1 wirtschaft, abhängig
230
234
  00308*2 zeitschrift, wissenschaftlich 1 anwendungsbereich, fokussiert 1 autor, wissenschaftlich 1 hilfsmittel, notwendig 1 jahrgang, aktuell 1 kriterium, objektiv 1 verbesserungsvorschlag, einig 1 zeitschrift, weich 1 zeitschriftenkommunikation, wissenschaftlich
231
235
  00309*1 datenbank, relational 1 forschungsgemeinschaft, deutsch 1 projekt, gefördert
232
236
  00310*1 aktionsmuster, gewonnen sequentiell 1 aktionsmuster, sequentiell 1 angabe, betreffend 1 aufgabe, allgemein 1 auswertung, rechnerisch 1 forschungsfragen, allgemein 1 informationsraum, inhaltlich komplex 1 informationsraum, komplex 1 interpretation, zusammenfassend 1 phasenmodell, dynamisch 1 schritt, folgend 1 suchmaschinennutzer, unerfahren 1 thema, anschließend 1 untergruppe, unerfahren 1 web-rechercheaufgabe, offen 1 wissensarten, unterschiedlich
@@ -236,14 +240,14 @@
236
240
  00315*1 aspekt, neu 1 gesellschaft, international 1 sektion, deutsch
237
241
  00317*1 anforderung, speziell 1 anwendungskontext, real 1 erschließung, automatisch inhaltlich 1 erschließung, inhaltlich 1 gesichtspunkt, qualitativ 1 indexierung, automatisch 1 inhaltserschließung, intellektuell 1 mangel, einig 1 methode, anerkannt 1 system, grundsätzlich unterschiedlich 1 system, lernend 1 system, unterschiedlich 1 trainingsvorlage, erstellt 1 trainingsvorlage, intellektuell erstellt
238
242
  00318*1 belästigung, sexuell
239
- 00319*2 sprache, natürlich 2 thesaurus, semantisch 1 bedeutung, rasant zunehmend 1 bedeutung, zunehmend 1 beitrag, vorliegend 1 instrument, möglich 1 mach, deutlich 1 programmiersprache, objektorientiert 1 publikationsform, verändernd 1 sprache, unser natürlich 1 text, wissensbasiert
240
- 00320*1 analyse, semantisch 1 bedienbar, leicht 1 begriffsgut, abgebildet 1 begriffssammlung, beliebig geordnet 1 begriffssammlung, geordnet 1 bibliografie, soziologisch 1 datenbank, ursprünglich 1 dokument, relevant 1 dokument, wenig relevant 1 ordnungssystem, bestehend 1 ordnungssystem, speziell 1 schritt, nachfolgend 1 suche, ausschließlich 1 systematik, formal 1 thesaurus, beispielsweise 1 zeichenkettenabgleich, exakt
243
+ 00319*2 sprache, natürlich 2 thesaurus, semantisch 1 bedeutung, rasant zunehmend 1 bedeutung, zunehmend 1 begriff, definierbar 1 beitrag, vorliegend 1 instrument, möglich 1 mach, deutlich 1 programmiersprache, objektorientiert 1 publikationsform, verändernd 1 sprache, unser natürlich 1 text, wissensbasiert
244
+ 00320*1 analyse, semantisch 1 bedienbar, leicht 1 begriffsgut, abgebildet 1 begriffssammlung, beliebig geordnet 1 begriffssammlung, geordnet 1 berücksichtigung, besonders 1 bibliografie, soziologisch 1 datenbank, ursprünglich 1 dokument, relevant 1 dokument, wenig relevant 1 ordnungssystem, bestehend 1 ordnungssystem, speziell 1 retrievalverfahren, nachgeordnet semantisch 1 retrievalverfahren, semantisch 1 schritt, nachfolgend 1 suche, ausschließlich 1 systematik, formal 1 thesaurus, beispielsweise 1 zeichenkettenabgleich, exakt
241
245
  00321*1 basis, theoretisch 1 fixierbar, schriftlich 1 form, alle 1 netz, generalisiert neuronal 1 netz, neuronal 1 notation, formal 1 struktursystem, vorgestellt
242
246
  00322*1 ausgabe, aufgelegt gedruckt 1 ausgabe, gedruckt 1 darstellung, systematisch 1 version, elektronisch
243
- 00323*2 aspekt, pragmatisch 1 bezugnahmen, unter 1 dimension, neu 1 ergebnis, wissenschaftlich 1 information, möglich 1 informationssystem, wissenschaftlich 1 position, philosophisch 1 repräsentationsstruktur, entwickelt 1 standpunkt, unser
247
+ 00323*2 aspekt, pragmatisch 1 bezugnahmen, unter 1 dimension, neu 1 ergebnis, wissenschaftlich 1 information, möglich 1 informationssystem, wissenschaftlich 1 position, philosophisch 1 repräsentationsstruktur, entwickelt 1 retrievalverfahren, effizient 1 standpunkt, unser
244
248
  00324*2 funktion, enzyklopädisch 1 anschauung, herrschend 1 bibliothek, modern 1 disziplin, aller 1 epochenübergreifend, gezielt 1 erscheinungsform, verschieden 1 forschung, künftig 1 forschungsdialog, deutsch 1 forschungsförderung, orientiert 1 gleichbleiben, prinzipiell 1 identitätsfindung, national 1 informationsaustausch, umfassend 1 informationsverarbeitung, enzyklopädisch 1 institut, rührig 1 kulturgeschichte, europäisch 1 kunstsprache, barock 1 masse, wachsend 1 medientechnik, spezifisch 1 modell, europäisch 1 neuzeit, früh 1 person, einzeln 1 philosoph, französisch 1 standard, existierend technisch 1 standard, technisch 1 thema, bestimmt 1 umschau, thematisch 1 werk, enzyklopädisch 1 wirkung, ähnlich 1 wissenssammlung, enzyklopädisch 1 zivilisation, wissenschaftlich 1 überblick, enzyklopädisch 1 überblicksbeiträge, historisch
245
- 00325*2 soziologe, deutsch 1 deutsche, unter 1 forschungsleistung, sozialwissenschaftlich 1 schwachpunkt, bekannte 1 schwachpunkt, bestätigt bekannte 1 soziologe, antwortend 1 soziologe, unter deutsch 1 umfragergebnis, weit 1 untersuchung, durchgeführt
246
- 00326*1 ausbildungseinrichtung, bibliothekarisch 1 ausbildungseinrichtung, deutsch bibliothekarisch 1 beschreibungsebene, strukturiert 1 indexierung, automatisch 1 information, intelligent 1 katalog, lokal 1 netz, heterogen 1 sicht, integrativ 1 thema, folgend 1 trend, folgend
247
- 00329*2 indexierung, adaptiv 1 fragestellung, komplex 1 indexierung, mehrfach 1 indexierungsmethode, konzeptuell 1 konzeptrahm, gebunden 1 tiefenanalyse, selektiv 1 wissensstruktur, relevant 1 zielgruppe, unterschiedlich
248
- 00330*2 maschine, weit 2 seite, weit 1 adresse, alt 1 automat, groß 1 beiträge, neu 1 beiträge, ruppig 1 betrachter, mobil 1 bildersuchen, eigen 1 browserfenster, neu 1 darstellung, einheitlich 1 datei, deutsch 1 datei, verlinkt 1 datenbanksuche, eigen 1 dokument, aufgesucht 1 dokument, elektronisch 1 dokument, findend 1 dokument, frisch aufgesucht 1 durchforschen, alles 1 einblick, klein 1 ergebnis, erstaunlich 1 ergebnis, fremd 1 forum, jeweilig 1 frage, deutsch gestellt 1 frage, gestellt 1 frage, wirklich 1 fünfhundertmal, schätzungsweise 1 google-besuch, letzte 1 hilfe, groß 1 hilfe, praktisch 1 idee, olympisch 1 index, neu 1 inhalt, häufig wechselnd 1 inhalt, klassisch 1 inhalt, wechselnd 1 insel, riesig 1 intelligenz, künstlich 1 intelligenz, maschinell 1 internet-anbieter, groß 1 kind, vermisst 1 kollegialität, unermüdlich 1 kopierbar, vorteilhaft 1 link, sogenannt 1 linux-pc-server, billigen 1 mach, lustig 1 maschinenlesbar, oft 1 mitarbeit, frei 1 monat, einig 1 multimedia-inhalt, kommend 1 nachlese, stündlich 1 netz, ganz 1 netz, unsichtbar 1 netzfreund, aller 1 nichtkommerziell, uralt 1 rahmenlos, möglich 1 rolle, untergeordnet 1 röhre, kommunizierend 1 schleuse, lieb 1 seite, angemeldet 1 seite, durchsucht 1 seite, einfach 1 seite, gefunden 1 seite, gespeichert 1 seite, jeweilig 1 server, kooperierend 1 speicher, eigen 1 speicher, weit 1 suchmaschine, beliebte 1 suchmaschine, deutsch 1 suchseite, englisch 1 suchseite, sehenswert englisch 1 telefonbuchsuche, deutsch 1 text, gefunden 1 thema, bestimmt 1 verweis, einheitlich 1 webformat, neu 1 wettstreit, international 1 wille, gut 1 wort, aller vorkommend 1 wort, paar 1 wort, vorkommend 1 wortgruppe, geschlossen 1 wortgruppe, spät geschlossen 1 wortlaut, genau 1 wunderwelt, offen 1 wunderwerk, technisch 1 übersetzung, maschinell
249
+ 00325*2 soziologe, deutsch 1 deutsche, unter 1 forschungsleistung, sozialwissenschaftlich 1 informationelle, sinnvoll 1 schwachpunkt, bekannte 1 schwachpunkt, bestätigt bekannte 1 soziologe, antwortend 1 soziologe, unter deutsch 1 umfragergebnis, weit 1 untersuchung, durchgeführt
250
+ 00326*1 ausbildungseinrichtung, bibliothekarisch 1 ausbildungseinrichtung, deutsch bibliothekarisch 1 beschreibungsebene, strukturiert 1 indexierung, automatisch 1 information, intelligent 1 interaktionsschnittstelle, benutzerfreundlich 1 katalog, lokal 1 netz, heterogen 1 sicht, integrativ 1 thema, folgend 1 trend, folgend
251
+ 00329*2 indexierung, adaptiv 1 fragestellung, komplex 1 indexierung, mehrfach 1 indexierungsmethode, konzeptuell 1 konzeptrahmen, gebunden 1 tiefenanalyse, selektiv 1 wissensstruktur, relevant 1 zielgruppe, unterschiedlich
252
+ 00330*2 maschine, weit 2 seite, weit 1 adresse, alt 1 automat, groß 1 begriff, eingegeben 1 begriff, selten 1 beiträge, neu 1 beiträge, ruppig 1 betrachter, mobil 1 bildersuchen, eigen 1 browserfenster, neu 1 darstellung, einheitlich 1 datei, deutsch 1 datei, verlinkt 1 datenbanksuche, eigen 1 dokument, aufgesucht 1 dokument, elektronisch 1 dokument, findend 1 dokument, frisch aufgesucht 1 durchforschen, alles 1 einblick, klein 1 ergebnis, erstaunlich 1 ergebnis, fremd 1 forum, jeweilig 1 frage, deutsch gestellt 1 frage, gestellt 1 frage, wirklich 1 fünfhundertmal, schätzungsweise 1 google-besuch, letzte 1 hilfe, groß 1 hilfe, praktisch 1 idee, olympisch 1 index, neu 1 inhalt, häufig wechselnd 1 inhalt, klassisch 1 inhalt, wechselnd 1 insel, riesig 1 intelligenz, künstlich 1 intelligenz, maschinell 1 internet-anbieter, groß 1 kind, vermisst 1 kollegialität, unermüdlich 1 kopierbar, vorteilhaft 1 link, sogenannt 1 linux-pc-server, billigen 1 mach, lustig 1 maschinenlesbar, oft 1 mitarbeit, frei 1 monat, einig 1 multimedia-inhalt, kommend 1 nachlese, stündlich 1 netz, ganz 1 netz, unsichtbar 1 netzfreund, aller 1 nichtkommerziell, uralt 1 rahmenlos, möglich 1 rolle, untergeordnet 1 röhre, kommunizierend 1 schleuse, lieb 1 seite, angemeldet 1 seite, durchsucht 1 seite, einfach 1 seite, gefunden 1 seite, gespeichert 1 seite, jeweilig 1 server, kooperierend 1 sorge, groß 1 speicher, eigen 1 speicher, weit 1 suchmaschine, beliebte 1 suchmaschine, deutsch 1 suchmaschine, groß 1 suchmaschine, sehr beliebte 1 suchseite, englisch 1 suchseite, sehenswert englisch 1 telefonbuchsuche, deutsch 1 text, gefunden 1 thema, bestimmt 1 verweis, einheitlich 1 webformat, neu 1 wettstreit, international 1 wille, gut 1 wort, aller vorkommend 1 wort, paar 1 wort, vorkommend 1 wortgruppe, geschlossen 1 wortgruppe, spät geschlossen 1 wortlaut, genau 1 wunderwelt, offen 1 wunderwerk, technisch 1 übersetzung, maschinell
249
253
  00331*2 bibliothek, öffentlich 1 ekz-daten, indexiert 1 erschließungsmethode, herkömmlich 1 indexierung, maschinell 1 methode, verschieden 1 sachbuchbestand, typisch 1 titel, relevant
@@ -1,3 +1,5 @@
1
+ # encoding: utf-8
2
+
1
3
  require 'test/unit'
2
4
  require 'lingo'
3
5
 
@@ -27,22 +29,22 @@ class LingoTestCase < Test::Unit::TestCase
27
29
  # Erzeugt ein Token-Objekt
28
30
  def tk( text )
29
31
  f, a = split( text )
30
- Lingo::Token.new( f, a )
32
+ Lingo::Language::Token.new( f, a )
31
33
  end
32
34
 
33
35
  # Erzeugt ein Lexical-Objekt
34
36
  def lx( text )
35
37
  f, a = split( text )
36
- Lingo::Lexical.new( f, a )
38
+ Lingo::Language::Lexical.new( f, a )
37
39
  end
38
40
 
39
41
  # Erzeugt ein Word-Objekt
40
42
  def wd( text, *lexis )
41
43
  f, a = split( text )
42
- w = Lingo::Word.new( f, a )
44
+ w = Lingo::Language::Word.new( f, a )
43
45
  lexis.each do |text|
44
46
  f, a = split( text )
45
- w << Lingo::Lexical.new( f, a )
47
+ w << Lingo::Language::Lexical.new( f, a )
46
48
  end
47
49
  w
48
50
  end
@@ -54,22 +56,24 @@ class AttendeeTestCase < LingoTestCase
54
56
  def initialize(fname)
55
57
  super
56
58
 
57
- @attendee = $1.downcase if self.class.to_s =~ /TestAttendee(.*)/
59
+ @attendee = $1 if self.class.to_s =~ /TestAttendee(.*)/
58
60
  @lingo, @output = Lingo.new, []
59
61
  end
60
62
 
61
- def meet(att_cfg, check=true)
62
- std_cfg = {'name'=>@attendee.capitalize}
63
- std_cfg.update({'in'=>'lines'}) unless @input.nil?
64
- std_cfg.update({'out'=>'output'}) unless @output.nil?
63
+ def meet(att_cfg, check = true)
64
+ cfg = { 'name' => @attendee.camelcase }
65
+ cfg.update('in' => 'input') if @input
66
+ cfg.update('out' => 'output') if @output
67
+ cfg.update(att_cfg)
65
68
 
66
69
  @output.clear
67
70
  @lingo.reset
68
- inv_list = []
69
- inv_list << {'helper'=>{'name'=>'Helper', 'out'=>'lines', 'spool_from'=>@input}} unless @input.nil?
70
- inv_list << {@attendee=>std_cfg.update( att_cfg )}
71
- inv_list << {'helper'=>{'name'=>'Helper', 'in'=>'output', 'dump_to'=>@output}} unless @output.nil?
72
- @lingo.invite(inv_list)
71
+
72
+ list = [{ @attendee => cfg }]
73
+ list.unshift 'TestSpooler' => { 'out' => 'input', 'input' => @input } if @input
74
+ list.push 'TestDumper' => { 'in' => 'output', 'output' => @output } if @output
75
+
76
+ @lingo.invite(list)
73
77
  @lingo.start
74
78
 
75
79
  assert_equal(@expect, @output) if check
@@ -78,36 +82,37 @@ class AttendeeTestCase < LingoTestCase
78
82
  end
79
83
 
80
84
  class Lingo
85
+ class Attendee
86
+ class TestSpooler < self
81
87
 
82
- class Attendee::Helper < Attendee
88
+ protected
83
89
 
84
- protected
90
+ def init
91
+ @input = get_key('input')
92
+ end
85
93
 
86
- def init
87
- case
88
- when has_key?('spool_from')
89
- @spool_from = get_key('spool_from')
90
- @spooler = true
91
- when has_key?('dump_to')
92
- @dump_to = get_key('dump_to')
93
- @spooler = false
94
- else
95
- forward(STR_CMD_ERR, 'Weder dump_to noch spool_from-Attribut abgegeben')
94
+ def control(cmd, param)
95
+ @input.each(&method(:forward)) if cmd == STR_CMD_TALK
96
96
  end
97
+
97
98
  end
98
99
 
99
- def control(cmd, param)
100
- if @spooler
101
- @spool_from.each { |obj| forward(obj) } if cmd==STR_CMD_TALK
102
- else
103
- @dump_to << AgendaItem.new(cmd, param)
100
+ class TestDumper < self
101
+
102
+ protected
103
+
104
+ def init
105
+ @output = get_key('output')
104
106
  end
105
- end
106
107
 
107
- def process(obj)
108
- @dump_to << obj unless @spooler
109
- end
108
+ def control(cmd, param)
109
+ @output << AgendaItem.new(cmd, param)
110
+ end
110
111
 
111
- end
112
+ def process(obj)
113
+ @output << obj
114
+ end
112
115
 
116
+ end
117
+ end
113
118
  end
@@ -2,10 +2,10 @@
2
2
 
3
3
  require_relative 'test_helper'
4
4
 
5
- class Lingo::Txt2DbmConverter
6
- alias_method :original_initialize, :initialize
7
- def initialize(id, lingo, verbose = false)
8
- original_initialize(id, lingo, verbose)
5
+ class Lingo::Database
6
+ alias_method :original_convert, :convert
7
+ def convert(verbose = false)
8
+ original_convert(verbose)
9
9
  end
10
10
  end
11
11
 
@@ -100,7 +100,8 @@ Wort2=
100
100
  'txt-format' => 'SingleWord',
101
101
  'use-lex' => set_config('lex',
102
102
  'name' => 'de/lingo-dic.txt',
103
- 'txt-format' => 'WordClass'
103
+ 'txt-format' => 'WordClass',
104
+ 'separator' => '='
104
105
  )
105
106
  }, @singleword, {
106
107
  'wort1' => '#s',
@@ -132,7 +133,7 @@ Wort2=
132
133
  'b7501a62cb083be6730a7a179a4ab346d23efe53' => '4b10'
133
134
  })
134
135
 
135
- compare(config, @singleword) { |dbm| {
136
+ compare(config, @singleword) { |db| {
136
137
  'wort1' => '#s',
137
138
  'wort2' => '#s',
138
139
  'juristische personen' => '#s',
@@ -141,7 +142,7 @@ Wort2=
141
142
  'ganz großer und blöder quatsch' => '#s',
142
143
  'ganz großer und blöder mist' => '#s',
143
144
  'ganz großer und blöder schwach sinn' => '#s'
144
- }.each { |key, val| assert_equal([val], dbm[key]) } }
145
+ }.each { |key, val| assert_equal([val], db[key]) } }
145
146
  end
146
147
 
147
148
  def test_keyvalue
@@ -248,12 +249,12 @@ Wort2=
248
249
  FileUtils.mkdir_p(File.dirname(TEST_FILE))
249
250
  File.write(TEST_FILE, input, encoding: Lingo::ENC)
250
251
 
251
- Lingo::DbmFile.open(set_config('tst', config.merge('name' => TEST_FILE)), @lingo) { |dbm|
252
+ Lingo::Database.open(set_config('tst', config.merge('name' => TEST_FILE)), @lingo) { |db|
252
253
  if block_given?
253
- yield dbm
254
+ yield db
254
255
  else
255
- store = dbm.to_h
256
- store.delete(Lingo::SYS_KEY)
256
+ store = db.to_h
257
+ store.delete(Lingo::Database::SYS_KEY)
257
258
 
258
259
  assert_equal(output, store)
259
260
  end
@@ -4,6 +4,8 @@ require_relative 'test_helper'
4
4
 
5
5
  class TestLexicalHash < LingoTestCase
6
6
 
7
+ LH = Lingo::Language::LexicalHash
8
+
7
9
  def setup
8
10
  @lingo = Lingo.new
9
11
  @database_config = @lingo.config['language/dictionary/databases']
@@ -17,7 +19,7 @@ class TestLexicalHash < LingoTestCase
17
19
  old_stderr, $stderr = $stderr, StringIO.new('')
18
20
 
19
21
  # Datenquelle nicht in Konfiguration enthalten
20
- assert_raise(SystemExit) { Lingo::LexicalHash.new('nonsens', @lingo) }
22
+ assert_raise(Lingo::NoDatabaseConfigError) { LH.new('nonsens', @lingo) }
21
23
  ensure
22
24
  $stderr = old_stderr
23
25
  end
@@ -25,7 +27,7 @@ class TestLexicalHash < LingoTestCase
25
27
  # TODO: Crypt testen...
26
28
 
27
29
  def test_cache
28
- ds = Lingo::LexicalHash.new('sys-dic', @lingo)
30
+ ds = LH.new('sys-dic', @lingo)
29
31
  assert_equal([lx('regen|s'), lx('regen|v'), lx('rege|a')], ds['regen'])
30
32
  assert_equal([lx('regen|s'), lx('regen|v'), lx('rege|a')], ds['regen'])
31
33
  assert_equal([lx('regen|s'), lx('regen|v'), lx('rege|a')], ds['regen'])
@@ -33,11 +35,11 @@ class TestLexicalHash < LingoTestCase
33
35
  end
34
36
 
35
37
  def test_report
36
- ds = Lingo::LexicalHash.new('tst-syn', @lingo)
38
+ ds = LH.new('tst-syn', @lingo)
37
39
  ds['abwickeln'] # source read
38
40
  ds['abwickeln'] # cache hit
39
- ds['regen'] # source read
40
- ds['nonesens'] # source read, nothing found
41
+ ds['regen'] # source read
42
+ ds['nonesens'] # source read, nothing found
41
43
 
42
44
  expect = { \
43
45
  "tst-syn: cache hits" => 1, \
@@ -52,26 +54,25 @@ class TestLexicalHash < LingoTestCase
52
54
 
53
55
  def test_auto_create
54
56
  txt_file = @database_config['tst-sgw']['name']
55
- sto_file = Lingo.find(:store, txt_file) << '.pag'
56
57
 
57
- ds = Lingo::LexicalHash.new('tst-sgw', @lingo)
58
+ ds = LH.new('tst-sgw', @lingo)
58
59
  assert_equal([lx('substantiv|s')], ds['substantiv'])
59
60
  ds.close
60
61
 
61
62
  # Keine Store-Datei vorhanden, nur Text vorhanden
62
- File.delete(sto_file)
63
- ds = Lingo::LexicalHash.new('tst-sgw', @lingo)
63
+ File.delete(*Dir["#{Lingo.find(:store, txt_file)}.*"])
64
+ ds = LH.new('tst-sgw', @lingo)
64
65
  assert_equal([lx('substantiv|s')], ds['substantiv'])
65
66
  ds.close
66
67
 
67
68
  # Store vorhanden, aber Text ist neuer
68
- ds = Lingo::LexicalHash.new('tst-sgw', @lingo)
69
+ ds = LH.new('tst-sgw', @lingo)
69
70
  assert_equal([lx('substantiv|s')], ds['substantiv'])
70
71
  ds.close
71
72
  end
72
73
 
73
74
  def test_singleword
74
- ds = Lingo::LexicalHash.new('tst-sgw', @lingo)
75
+ ds = LH.new('tst-sgw', @lingo)
75
76
  assert_equal([lx('substantiv|s')], ds['substantiv'])
76
77
  assert_equal([lx('mehr wort gruppe|s')], ds['mehr wort gruppe'])
77
78
  assert_equal(nil, ds['nicht vorhanden'])
@@ -79,7 +80,7 @@ class TestLexicalHash < LingoTestCase
79
80
  end
80
81
 
81
82
  def test_keyvalue
82
- ds = Lingo::LexicalHash.new('sys-mul', @lingo)
83
+ ds = LH.new('sys-mul', @lingo)
83
84
  assert_equal([lx('abelscher ring ohne nullteiler|m')], ds['abelscher ring ohne nullteiler'])
84
85
  assert_equal(['*4'], ds['abelscher ring ohne'])
85
86
  assert_equal([lx('alleinreisende frau|m')], ds['alleinreisend frau'])
@@ -89,7 +90,7 @@ class TestLexicalHash < LingoTestCase
89
90
  end
90
91
 
91
92
  def test_wordclass
92
- ds = Lingo::LexicalHash.new('sys-dic', @lingo)
93
+ ds = LH.new('sys-dic', @lingo)
93
94
  assert_equal([lx('a-dur|s')], ds['a-dur'])
94
95
  assert_equal([lx('aalen|v'), lx('aalen|e')], ds['aalen'])
95
96
  assert_equal([lx('abarbeitend|a')], ds['abarbeitend'])
@@ -97,7 +98,7 @@ class TestLexicalHash < LingoTestCase
97
98
  end
98
99
 
99
100
  def test_case
100
- ds = Lingo::LexicalHash.new('sys-dic', @lingo)
101
+ ds = LH.new('sys-dic', @lingo)
101
102
  assert_equal([lx('abänderung|s')], ds['abänderung'])
102
103
  assert_equal([lx('abänderung|s')], ds['Abänderung'])
103
104
  assert_equal([lx('abänderung|s')], ds['ABÄNDERUNG'])
@@ -105,9 +106,9 @@ class TestLexicalHash < LingoTestCase
105
106
  end
106
107
 
107
108
  def test_multivalue
108
- ds = Lingo::LexicalHash.new('sys-syn', @lingo)
109
- # assert_equal([lx('abrollen', LA_SYNONYM), lx('abschaffen', LA_SYNONYM), lx('abwickeln', LA_SYNONYM), lx('auflösen (geschäft)','y')], ds['abwickeln'])
110
- # assert_equal([lx('niederschlag', LA_SYNONYM), lx('regen', LA_SYNONYM), lx('schauer', LA_SYNONYM)], ds['regen'])
109
+ ds = LH.new('sys-syn', @lingo)
110
+ assert_equal([lx('abbau <chemie>|y'), lx('chemische abbaureaktion|y'), lx('chemischer abbau|y'), lx('photochemischer abbau|y')], ds['abbaureaktion'])
111
+ assert_equal([lx('dependenz|y'), lx('unselbstständigkeit|y'), lx('unselbständigkeit|y')], ds['abhängigkeit'])
111
112
  ds.close
112
113
  end
113
114
 
@@ -115,21 +116,21 @@ end
115
116
 
116
117
  class TestDictionary < LingoTestCase
117
118
 
119
+ LD = Lingo::Language::Dictionary
120
+
118
121
  def setup
119
122
  @lingo = Lingo.new
120
123
  end
121
124
 
122
125
  def test_params
123
126
  # Keine Sprach-Konfiguration angegeben
124
- #assert_raise(RuntimeError) { Lingo::Dictionary.new({'source'=>['sys-dic']}, @lingo) }
125
- # Keine Parameter angegeben
126
- assert_raise(RuntimeError) { Lingo::Dictionary.new(nil, @lingo) }
127
+ #assert_raise(RuntimeError) { LD.new({'source'=>['sys-dic']}, @lingo) }
127
128
  # Falsche Parameter angegeben (Pflichtparameter ohne Defaultwert)
128
- assert_raise(RuntimeError) { Lingo::Dictionary.new({'course'=>['sys-dic']}, @lingo) }
129
+ assert_raise(ArgumentError) { LD.new({'course'=>['sys-dic']}, @lingo) }
129
130
  end
130
131
 
131
132
  def test_cache
132
- dic = Lingo::Dictionary.new({'source'=>['sys-dic']}, @lingo)
133
+ dic = LD.new({'source'=>['sys-dic']}, @lingo)
133
134
  assert_equal([lx('nase|s')], dic.select('nase'))
134
135
  assert_equal([lx('nase|s')], dic.select('nase'))
135
136
  assert_equal([lx('nase|s')], dic.select('nase'))
@@ -137,7 +138,7 @@ class TestDictionary < LingoTestCase
137
138
  end
138
139
 
139
140
  def test_report
140
- dic = Lingo::Dictionary.new({'source'=>['sys-dic']}, @lingo)
141
+ dic = LD.new({'source'=>['sys-dic']}, @lingo)
141
142
  dic.select('abwickeln') # source read
142
143
  dic.select('abwickeln') # cache hit
143
144
  dic.select('regen') # source read
@@ -155,7 +156,7 @@ class TestDictionary < LingoTestCase
155
156
  end
156
157
 
157
158
  def test_select_one_source
158
- dic = Lingo::Dictionary.new({'source'=>['sys-dic']}, @lingo)
159
+ dic = LD.new({'source'=>['sys-dic']}, @lingo)
159
160
  assert_equal([lx('nase|s')], dic.select('nase'))
160
161
  assert_equal([lx('nase|s')], dic.select('NASE'))
161
162
  assert_equal([], dic.select('hasennasen'))
@@ -163,7 +164,7 @@ class TestDictionary < LingoTestCase
163
164
  end
164
165
 
165
166
  def test_select_two_sources_mode_first
166
- dic = Lingo::Dictionary.new({'source'=>['sys-dic', 'tst-dic'], 'mode'=>'first'}, @lingo)
167
+ dic = LD.new({'source'=>['sys-dic', 'tst-dic'], 'mode'=>'first'}, @lingo)
167
168
  # in keiner Quelle vorhanden
168
169
  assert_equal([], dic.select('hasennasen'))
169
170
  # nur in erster Quelle vorhanden
@@ -176,7 +177,7 @@ class TestDictionary < LingoTestCase
176
177
  end
177
178
 
178
179
  def test_select_two_sources_mode_first_flipped
179
- dic = Lingo::Dictionary.new({'source'=>['tst-dic','sys-dic'], 'mode'=>'first'}, @lingo)
180
+ dic = LD.new({'source'=>['tst-dic','sys-dic'], 'mode'=>'first'}, @lingo)
180
181
  # in keiner Quelle vorhanden
181
182
  assert_equal([], dic.select('hasennasen'))
182
183
  # nur in erster Quelle vorhanden
@@ -189,7 +190,7 @@ class TestDictionary < LingoTestCase
189
190
  end
190
191
 
191
192
  def test_select_two_sources_mode_all
192
- dic = Lingo::Dictionary.new({'source'=>['sys-dic','tst-dic'], 'mode'=>'all'}, @lingo)
193
+ dic = LD.new({'source'=>['sys-dic','tst-dic'], 'mode'=>'all'}, @lingo)
193
194
  # in keiner Quelle vorhanden
194
195
  assert_equal([], dic.select('hasennasen'))
195
196
  # nur in erster Quelle vorhanden
@@ -203,7 +204,7 @@ class TestDictionary < LingoTestCase
203
204
  end
204
205
 
205
206
  def test_select_two_sources_mode_default
206
- dic = Lingo::Dictionary.new({'source'=>['sys-dic','tst-dic']}, @lingo)
207
+ dic = LD.new({'source'=>['sys-dic','tst-dic']}, @lingo)
207
208
  # in keiner Quelle vorhanden
208
209
  assert_equal([], dic.select('hasennasen'))
209
210
  # nur in erster Quelle vorhanden
@@ -217,7 +218,7 @@ class TestDictionary < LingoTestCase
217
218
  end
218
219
 
219
220
  def test_suffix_lexicals
220
- dic = Lingo::Dictionary.new({'source'=>['sys-dic']}, @lingo)
221
+ dic = LD.new({'source'=>['sys-dic']}, @lingo)
221
222
  assert_equal([lx('mau|s'), lx('mauer|s')], dic.suffix_lexicals('mauern'))
222
223
  assert_equal([lx('hasen|s'), lx('hasen|v'), lx('hasen|e')], dic.suffix_lexicals('hasens'))
223
224
  assert_equal([lx('schönst|s'), lx('schön|a'), lx('schönst|a')], dic.suffix_lexicals('schönster'))
@@ -226,13 +227,13 @@ class TestDictionary < LingoTestCase
226
227
  end
227
228
 
228
229
  def test_infix_lexicals
229
- dic = Lingo::Dictionary.new({'source'=>['sys-dic']}, @lingo)
230
+ dic = LD.new({'source'=>['sys-dic']}, @lingo)
230
231
  assert_equal( [lx('information|s'), lx('information|v'), lx('information|e')], dic.suffix_lexicals('informations'))
231
232
  dic.close
232
233
  end
233
234
 
234
235
  def test_select_with_suffix
235
- dic = Lingo::Dictionary.new({'source'=>['sys-dic']}, @lingo)
236
+ dic = LD.new({'source'=>['sys-dic']}, @lingo)
236
237
  assert_equal([lx('mauern|v')], dic.select_with_suffix('mauern'))
237
238
  assert_equal([lx('hase|s')], dic.select_with_suffix('hasen'))
238
239
  assert_equal([lx('schön|a')], dic.select_with_suffix('schönster'))
@@ -241,13 +242,13 @@ class TestDictionary < LingoTestCase
241
242
  end
242
243
 
243
244
  def test_select_with_infix
244
- dic = Lingo::Dictionary.new({'source'=>['sys-dic']}, @lingo)
245
+ dic = LD.new({'source'=>['sys-dic']}, @lingo)
245
246
  assert_equal( [lx('information|s'), lx('information|v'), lx('information|e')], dic.suffix_lexicals('informations'))
246
247
  dic.close
247
248
  end
248
249
 
249
250
  def test_find_word
250
- dic = Lingo::Dictionary.new({'source'=>['sys-dic']}, @lingo)
251
+ dic = LD.new({'source'=>['sys-dic']}, @lingo)
251
252
  assert_equal(wd('hasennasen|?'), dic.find_word('hasennasen'))
252
253
  assert_equal(wd('hase|IDF', 'hase|s'), dic.find_word('hase'))
253
254
  assert_equal(wd('haseses|IDF', 'hase|s'), dic.find_word('haseses'))
@@ -258,6 +259,8 @@ end
258
259
 
259
260
  class TestGrammar < LingoTestCase
260
261
 
262
+ LG = Lingo::Language::Grammar
263
+
261
264
  def setup
262
265
  @lingo = Lingo.new
263
266
  end
@@ -267,7 +270,7 @@ class TestGrammar < LingoTestCase
267
270
  end
268
271
 
269
272
  def test_cache
270
- gra = Lingo::Grammar.new({'source'=>['sys-dic']}, @lingo)
273
+ gra = LG.new({'source'=>['sys-dic']}, @lingo)
271
274
  assert_equal(
272
275
  wd('informationswissenschaften|KOM', 'informationswissenschaft|k', 'information|s+', 'wissenschaft|s+'),
273
276
  gra.find_compositum('informationswissenschaften')
@@ -283,79 +286,126 @@ class TestGrammar < LingoTestCase
283
286
  gra.close
284
287
  end
285
288
 
286
- def t1est_test_compositum
287
- gra = Lingo::Grammar.new({'source'=>['sys-dic']}, @lingo)
289
+ def test_test_compositum
290
+ gra = LG.new({'source'=>['sys-dic']}, @lingo)
291
+
288
292
  # hinterer Teil ist ein Wort mit Suffix
289
- assert_equal([ [5, 6], [lx('hasenbraten|k'), lx('braten|s'), lx('hase|s'), lx('braten|v')] ],
293
+ assert_equal([
294
+ [lx('hasenbraten|k'), lx('hase|s'), lx('braten|v')],
295
+ [5, 6],
296
+ 'sv'
297
+ ],
290
298
  gra.test_compositum('hasen', '', 'braten', 1, false)
291
299
  )
300
+
292
301
  # hinterer Teil ist ein Wort mit Infix ohne Schwanz
293
- assert_equal([ [5, 7], [lx('nasenlaufen|k'), lx('laufen|s'), lx('nase|s'), lx('laufen|v')] ],
302
+ assert_equal([
303
+ [lx('nasenlaufen|k'), lx('nase|s'), lx('laufen|v')],
304
+ [5, 7],
305
+ 'sv'
306
+ ],
294
307
  gra.test_compositum('nasen', '', 'laufens', 1, false)
295
308
  )
309
+
296
310
  # hinterer Teil ist ein Wort mit Infix mit Schwanz
297
- assert_equal([ [5, 7], [lx('nasenlaufens|k'), lx('laufen|s'), lx('nase|s'), lx('laufen|v')] ],
311
+ assert_equal([
312
+ [lx('nasenlaufens|k'), lx('nase|s'), lx('laufen|v')],
313
+ [5, 7],
314
+ 'sv'
315
+ ],
298
316
  gra.test_compositum('nasen', '', 'laufens', 1, true)
299
317
  )
318
+
300
319
  # hinterer Teil ist ein Kompositum nach Bindestrich
301
- assert_equal([ [7, 9, 6], [lx('arrafat-nachfolgebedarf|k'), lx('bedarf|s'), lx('nachfolge|s'), lx('arrafat|x')] ],
320
+ assert_equal([
321
+ [lx('arrafat-nachfolgebedarf|k'), lx('bedarf|s'), lx('nachfolge|s'), lx('arrafat|x')],
322
+ [7, 9, 6],
323
+ 'xss'
324
+ ],
302
325
  gra.test_compositum('arrafat', '-', 'nachfolgebedarf', 1, false)
303
326
  )
327
+
304
328
  # hinterer Teil ist ein TakeItAsIs nach Bindestrich
305
- assert_equal([ [9, 7], [lx('nachfolge-arrafat|k'), lx('nachfolge|s'), lx('arrafat|x')] ],
329
+ assert_equal([
330
+ [lx('nachfolge-arrafat|k'), lx('nachfolge|s'), lx('arrafat|x')],
331
+ [9, 7],
332
+ 'sx'
333
+ ],
306
334
  gra.test_compositum('nachfolge', '-', 'arrafat', 1, false)
307
335
  )
336
+
308
337
  # vorderer Teil ist ein Wort mit Suffix => siehe Hasenbraten
309
338
  # vorderer Teil ist ein Kompositum
310
- assert_equal([ [6, 5, 6], [lx('morgenonkelmantel|k'), lx('mantel|s'), lx('morgen|s'), lx('onkel|s'), lx('morgen|w')] ],
339
+ assert_equal([
340
+ [lx('morgenonkelmantel|k'), lx('mantel|s'), lx('morgen|s'), lx('onkel|s'), lx('morgen|w')],
341
+ [6, 5, 6],
342
+ 'sss'
343
+ ],
311
344
  gra.test_compositum('morgenonkel', '', 'mantel', 1, false)
312
345
  )
346
+
313
347
  # vorderer Teil ist ein TakeItAsIs vor Bindestrich
314
- assert_equal([ [7, 10], [lx('arrafat-nachfolger|k'), lx('nachfolger|s'), lx('arrafat|x')] ],
348
+ assert_equal([
349
+ [lx('arrafat-nachfolger|k'), lx('nachfolger|s'), lx('arrafat|x')],
350
+ [7, 10],
351
+ 'xs'
352
+ ],
315
353
  gra.test_compositum('arrafat', '-', 'nachfolger', 1, false)
316
354
  )
355
+
317
356
  gra.close
318
357
  end
319
358
 
320
- def t1est_permute_compositum
321
- gra = Lingo::Grammar.new({'source'=>['sys-dic']}, @lingo)
359
+ def test_permute_compositum
360
+ gra = LG.new({'source'=>['sys-dic']}, @lingo)
361
+
322
362
  # bindestrichversion
323
- assert_equal([ [7, 10], [lx('arrafat-nachfolger|k'), lx('nachfolger|s'), lx('arrafat|x')] ],
363
+ assert_equal([
364
+ [lx('arrafat-nachfolger|k'), lx('nachfolger|s'), lx('arrafat|x')],
365
+ [7, 10],
366
+ 'xs'
367
+ ],
324
368
  gra.permute_compositum('arrafat-nachfolger', 1, false)
325
369
  )
370
+
326
371
  # bindestrichversion zwei-teilig
327
- assert_equal([ [6, 11], \
328
- [ lx('cd-rom-technologie|k'), \
329
- lx('cd-rom|s'), \
330
- lx('technologie|s')] ], \
331
- gra.permute_compositum('cd-rom-technologie', 1, false) \
372
+ assert_equal([
373
+ [lx('cd-rom-technologie|k'), lx('cd-rom|s'), lx('technologie|s')],
374
+ [6, 11],
375
+ 'ss'
376
+ ],
377
+ gra.permute_compositum('cd-rom-technologie', 1, false)
332
378
  )
379
+
333
380
  # bindestrichversion drei-teilig
334
- assert_equal([ [6, 7, 11], \
335
- [ lx('albert-ludwigs-universität|k'), \
336
- lx('universität|s'), \
337
- lx('albert|e'), \
338
- lx('ludwig|e')] ], \
339
- gra.permute_compositum('albert-ludwigs-universität', 1, false) \
381
+ assert_equal([
382
+ [lx('albert-ludwigs-universität|k'), lx('universität|s'), lx('albert|e'), lx('ludwig|e')],
383
+ [6, 7, 11],
384
+ 'ees'
385
+ ],
386
+ gra.permute_compositum('albert-ludwigs-universität', 1, false)
340
387
  )
388
+
341
389
  # normal mit suggestion
342
- assert_equal([ [8, 9], \
343
- [ lx('benutzerforschung|k'), \
344
- lx('benutzer|s'), \
345
- lx('forschung|s')] ], \
346
- gra.permute_compositum('benutzerforschung', 1, false) \
390
+ assert_equal([
391
+ [lx('benutzerforschung|k'), lx('erforschung|s'), lx('benutzen|v')],
392
+ [6, 11],
393
+ 'vs'
394
+ ],
395
+ gra.permute_compositum('benutzerforschung', 1, false)
347
396
  )
397
+
348
398
  gra.close
349
399
  end
350
400
 
351
401
  def test_find_compositum
352
- gra = Lingo::Grammar.new({'source'=>['sys-dic']}, @lingo)
402
+ gra = LG.new({'source'=>['sys-dic']}, @lingo)
353
403
  assert_equal(
354
404
  wd('informationswissenschaften|KOM', 'informationswissenschaft|k', 'information|s+', 'wissenschaft|s+'),
355
- gra.find_compositum('informationswissenschaften') \
405
+ gra.find_compositum('informationswissenschaften')
356
406
  )
357
407
  assert_equal(
358
- wd('cd-rom-technologie|KOM', 'cd-rom-technologie|k', 'technologie|s+', 'cd-rom|x+'),
408
+ wd('cd-rom-technologie|KOM', 'cd-rom-technologie|k', 'cd-rom|s+', 'technologie|s+'),
359
409
  gra.find_compositum('cd-rom-technologie')
360
410
  )
361
411
  assert_equal(
@@ -378,18 +428,18 @@ class TestGrammar < LingoTestCase
378
428
  end
379
429
 
380
430
  def test_min_word_size
381
- gra = Lingo::Grammar.new({'source'=>['sys-dic']}, @lingo)
431
+ gra = LG.new({'source'=>['sys-dic']}, @lingo)
382
432
  assert_equal( wd('undsund|?'), gra.find_compositum('undsund'))
383
433
  gra.close
384
434
  end
385
435
 
386
436
  def test_max_parts
387
- gra = Lingo::Grammar.new({'source'=>['sys-dic']}, @lingo)
437
+ gra = LG.new({'source'=>['sys-dic']}, @lingo)
388
438
  assert_equal(
389
439
  wd('baumsbaumsbaum|KOM', 'baumsbaumsbaum|k', 'baum|s+'),
390
440
  gra.find_compositum('baumsbaumsbaum')
391
441
  )
392
- assert_equal( Lingo::Word.new('baumsbaumsbaumsbaumsbaumsbaum', Lingo::WA_UNKNOWN), gra.find_compositum('baumsbaumsbaumsbaumsbaumsbaum'))
442
+ assert_equal(Lingo::Language::Word.new('baumsbaumsbaumsbaumsbaumsbaum', Lingo::Language::WA_UNKNOWN), gra.find_compositum('baumsbaumsbaumsbaumsbaumsbaum'))
393
443
  gra.close
394
444
  end
395
445