lingo 1.8.0 → 1.8.1
Sign up to get free protection for your applications and to get access to all the features.
- data/ChangeLog +13 -0
- data/README +49 -29
- data/Rakefile +28 -4
- data/TODO +2 -9
- data/bin/lingo +24 -0
- data/bin/lingoctl +24 -0
- data/de/lingo-dic.txt +559 -74
- data/info/gpl-hdr.txt +21 -24
- data/lib/lingo.rb +83 -112
- data/lib/lingo/agenda_item.rb +53 -0
- data/lib/lingo/attendee.rb +261 -0
- data/lib/lingo/attendee/abbreviator.rb +95 -97
- data/lib/lingo/attendee/debugger.rb +94 -93
- data/lib/lingo/attendee/decomposer.rb +76 -83
- data/lib/lingo/attendee/dehyphenizer.rb +141 -144
- data/lib/lingo/attendee/formatter.rb +65 -0
- data/lib/lingo/attendee/multi_worder.rb +302 -0
- data/lib/lingo/attendee/noneword_filter.rb +89 -84
- data/lib/lingo/attendee/object_filter.rb +91 -0
- data/lib/lingo/attendee/sequencer.rb +159 -158
- data/lib/lingo/attendee/synonymer.rb +81 -84
- data/lib/lingo/attendee/text_reader.rb +242 -0
- data/lib/lingo/attendee/text_writer.rb +169 -0
- data/lib/lingo/attendee/tokenizer.rb +192 -191
- data/lib/lingo/attendee/variator.rb +152 -156
- data/lib/lingo/attendee/vector_filter.rb +140 -135
- data/lib/lingo/attendee/word_searcher.rb +98 -0
- data/lib/lingo/buffered_attendee.rb +69 -0
- data/lib/lingo/cachable.rb +58 -0
- data/lib/lingo/call.rb +72 -0
- data/lib/lingo/cli.rb +26 -0
- data/lib/lingo/config.rb +23 -26
- data/lib/lingo/core_ext.rb +42 -0
- data/lib/lingo/ctl.rb +239 -173
- data/lib/lingo/database.rb +148 -496
- data/lib/lingo/database/crypter.rb +85 -0
- data/lib/lingo/database/gdbm_store.rb +49 -0
- data/lib/lingo/database/hash_store.rb +67 -0
- data/lib/lingo/database/libcdb_store.rb +58 -0
- data/lib/lingo/database/sdbm_store.rb +64 -0
- data/lib/lingo/database/show_progress.rb +81 -0
- data/lib/lingo/database/source.rb +134 -0
- data/lib/lingo/database/source/key_value.rb +62 -0
- data/lib/lingo/database/source/multi_key.rb +65 -0
- data/lib/lingo/database/source/multi_value.rb +65 -0
- data/lib/lingo/database/source/single_word.rb +60 -0
- data/lib/lingo/database/source/word_class.rb +64 -0
- data/lib/lingo/error.rb +122 -0
- data/lib/lingo/language.rb +78 -518
- data/lib/lingo/language/dictionary.rb +173 -0
- data/lib/lingo/language/grammar.rb +211 -0
- data/lib/lingo/language/lexical.rb +66 -0
- data/lib/lingo/language/lexical_hash.rb +88 -0
- data/lib/lingo/language/token.rb +48 -0
- data/lib/lingo/language/word.rb +130 -0
- data/lib/lingo/language/word_form.rb +83 -0
- data/lib/lingo/reportable.rb +59 -0
- data/lib/lingo/version.rb +1 -1
- data/lingo-all.cfg +14 -10
- data/lingo-call.cfg +5 -5
- data/lingo.cfg +14 -12
- data/lingo.rb +26 -0
- data/lir.cfg +13 -9
- data/spec/spec_helper.rb +1 -0
- data/test.cfg +11 -11
- data/test/attendee/ts_abbreviator.rb +0 -6
- data/test/attendee/ts_decomposer.rb +0 -6
- data/test/attendee/{ts_multiworder.rb → ts_multi_worder.rb} +1 -7
- data/test/attendee/ts_noneword_filter.rb +1 -7
- data/test/attendee/{ts_objectfilter.rb → ts_object_filter.rb} +1 -7
- data/test/attendee/ts_sequencer.rb +0 -6
- data/test/attendee/ts_synonymer.rb +0 -6
- data/test/attendee/{ts_textreader.rb → ts_text_reader.rb} +1 -7
- data/test/attendee/{ts_textwriter.rb → ts_text_writer.rb} +1 -7
- data/test/attendee/ts_tokenizer.rb +0 -6
- data/test/attendee/ts_variator.rb +0 -6
- data/test/attendee/ts_vector_filter.rb +1 -7
- data/test/attendee/{ts_wordsearcher.rb → ts_word_searcher.rb} +1 -7
- data/test/ref/artikel.non +2 -29
- data/test/ref/artikel.seq +13 -8
- data/test/ref/artikel.vec +30 -15
- data/test/ref/artikel.ven +29 -14
- data/test/ref/artikel.ver +58 -43
- data/test/ref/lir.csv +146 -145
- data/test/ref/lir.non +186 -210
- data/test/ref/lir.seq +54 -50
- data/test/test_helper.rb +41 -36
- data/test/ts_database.rb +12 -11
- data/test/ts_language.rb +118 -68
- metadata +67 -29
- data/lib/lingo/attendee/multiworder.rb +0 -301
- data/lib/lingo/attendee/objectfilter.rb +0 -86
- data/lib/lingo/attendee/textreader.rb +0 -237
- data/lib/lingo/attendee/textwriter.rb +0 -196
- data/lib/lingo/attendee/wordsearcher.rb +0 -96
- data/lib/lingo/attendees.rb +0 -289
- data/lib/lingo/const.rb +0 -131
- data/lib/lingo/modules.rb +0 -98
- data/lib/lingo/types.rb +0 -285
- data/lib/lingo/utilities.rb +0 -40
data/test/ref/lir.seq
CHANGED
@@ -12,7 +12,7 @@
|
|
12
12
|
00019*1 erschließung, inhaltlich 1 indexierung, syntaktisch
|
13
13
|
00021*1 selektion, automatisch
|
14
14
|
00022*1 indexiermuster, sachbezogen 1 rahmenregelung, methodisch
|
15
|
-
00024*1 darstellung, ausführlich 1 sektion, verschieden 1 wiedergebrauch, effektiv
|
15
|
+
00024*1 darstellung, ausführlich 1 rolle, besonders 1 sektion, verschieden 1 wiedergebrauch, effektiv
|
16
16
|
00025*1 indexierungssystem, alphabetisch
|
17
17
|
00028*1 indexierungsdaten, verbal 1 verarbeitung, maschinell
|
18
18
|
00029*1 basis, abstrakt linguistisch 1 basis, linguistisch 1 grundlage, allgemein 1 sachregister, alphabetisch
|
@@ -21,21 +21,21 @@
|
|
21
21
|
00033*1 religion, christlich
|
22
22
|
00034*1 beschreibung, kurz 1 indexierungssystem, verbal 1 sprache, skandinavisch
|
23
23
|
00036*1 ansatz, wichtig 1 indexierungsmodell, statistisch 1 termgewicht, vorgeschlagen
|
24
|
-
00038*1 arbeit, intellektuell 1 arbeit, überholt intellektuell 1 bibliothek, einig 1 buch, ganz 1 diskussion, merkwürdig 1 indexierung, breit 1 informationstechnologie, modern 1 informationstechnologie, wirklich modern 1
|
24
|
+
00038*1 arbeit, intellektuell 1 arbeit, überholt intellektuell 1 bibliothek, einig 1 buch, ganz 1 diskussion, merkwürdig 1 indexierung, breit 1 informationstechnologie, modern 1 informationstechnologie, wirklich modern 1 katalog, gedruckt 1 mangel, zunehmend 1 moderne, wirklich 1 sacherschließung, bibliothekarisch 1 schlagwort, eng 1 schlagwort, hilfreich 1 thema, indiziert 1 zeit, langsam
|
25
25
|
00039*2 thesaurus, allgemein 1 bibliografie, deutsch 1 bibliothek, deutsch 1 schlagwort, verwendet 1 verzeichnis, wöchentlich
|
26
26
|
00040*1 anmerkung, kritisch 1 erörterung, abschließend 1 indexierung, frei 1 indexierung, maschinell 1 indexierung, verbindlich 1 textsuche, frei
|
27
27
|
00041*1 indexierung, automatisch
|
28
28
|
00042*1 objekt, abstrakt
|
29
29
|
00043*1 bereich, international 1 bibliografie, laufend 1 möglichkeit, realisierbar 1 schwerpunkt, inhaltlich 1 thema, vernachlässigt
|
30
|
-
00044*2 kategorie, semantisch 1
|
31
|
-
00045*2 sachregister, alphabetisch 1 zugriff, besseren
|
30
|
+
00044*2 kategorie, semantisch 1 beachtung, besonders 1 beachtung, unter besonders 1 form, gut voraussagbar 1 form, voraussagbar 1 gut, genügend 1 kategorie, wichtig semantisch 1 prozess, zweistufig 1 text, machend 1 wiedergabetreue, ausreichend 1 zahl, klein
|
31
|
+
00045*2 sachregister, alphabetisch 1 begriff, hierarchisch hoch 1 begriff, hoch 1 begriff, spezifisch 1 zugriff, besseren
|
32
32
|
00046*1 grundlage, linguistisch 1 sacherschließungsmethode, verbal
|
33
|
-
00047*1 aktuell-synchronischen, unter weitgehend 1 aktuell-synchronischen, weitgehend 1 beschäftigung, praktisch 1 entwicklung, bisherig 1 entwicklung, historisch 1 identität, absolut 1 lösung, praktisch 1 platonismus, dreifach 1 textinhaltsgegebenheit, absolut 1 universalität, absolut identisch 1 universalität, identisch
|
33
|
+
00047*1 aktuell-synchronischen, unter weitgehend 1 aktuell-synchronischen, weitgehend 1 beschäftigung, praktisch 1 entwicklung, bisherig 1 entwicklung, historisch 1 identität, absolut 1 lösung, praktisch 1 platonismus, dreifach 1 statisch-strukturell, sehr 1 textinhaltsgegebenheit, absolut 1 universalität, absolut identisch 1 universalität, identisch
|
34
34
|
00048*1 beispiel, einig 1 fachgebiet, untersucht 1 kategorie, verschieden 1 schema, dargestellt 1 typ, verschieden 1 untersuchung, statistisch
|
35
35
|
00049*1 informationsprofil, individuell 1 informationssystem, betriebseigen
|
36
36
|
00052*2 indexierung, automatisch 1 anpassung, erheblich 1 berücksichtigung, unter 1 system, einfach 1 system, äußerst einfach 1 systemstrategie, jeweilig
|
37
37
|
00053*2 indexierungssystem, automatisch 1 arbeit, vorliegend 1 indexierungswörterbuch, groß 1 vokabular, vorgeschrieben
|
38
|
-
00054*1 folge, logisch 1 folge, natürlich logisch 1 indexierung, automatisch 1 indexierungsansatz, theoretisch 1 vektorraum-modell, klassisch
|
38
|
+
00054*1 anwendung, sinnvoll 1 folge, logisch 1 folge, natürlich logisch 1 indexierung, automatisch 1 indexierungsansatz, theoretisch 1 vektorraum-modell, klassisch
|
39
39
|
00055*2 indexierung, automatisch 1 beispiel, trivial 1 forschungsrichtung, weit 1 information-retrieval-system, ideal 1 richtung, aufgezeigt
|
40
40
|
00056*1 bedeutung, unerträglich
|
41
41
|
00057*1 grundlagenforschung, universitär 1 klassifikationssystem, existent 1 vorteil, weit
|
@@ -50,14 +50,15 @@
|
|
50
50
|
00071*1 dokumentationsverfahren, maschinell 1 dokumentationsverfahren, orientiert maschinell 1 grundlage, systematisch
|
51
51
|
00074*1 indexierung, automatisch
|
52
52
|
00075*1 indexierung, automatisch
|
53
|
-
00078*1
|
53
|
+
00078*1 rundfunk, saarländisch
|
54
54
|
00079*1 analyse, vergleichend 1 bezugseinheit, dokumentarisch 1 indexierung, intellektuell 1 literaturdatenbank, biomedizinisch 1 online-datenbank, biomedizinisch 1 zuteilung, maschinell 1 zuteilung, verfügbar maschinell
|
55
55
|
00080*1 klassifikation, automatisch thematisch 1 klassifikation, thematisch
|
56
56
|
00081*1 analyse, vergleichend 1 indexierung, automatisch
|
57
57
|
00082*2 register, gedruckt 1 kwoc-verfahren, modifiziert 1 steuerung, genau
|
58
58
|
00083*2 daten, unstrukturiert 1 automatich, weitgehend 1 bedienung, einfach 1 bedienung, möglich einfach 1 benutzer, einzeln 1 benutzerkreis, breit 1 dialogform, verschieden 1 nutzungsflexibilität, hoch 1 oberflächengestaltung, systematisch
|
59
|
-
|
60
|
-
|
59
|
+
00084*1 berücksichtigung, besonders 1 berücksichtigung, unter besonders
|
60
|
+
00086*1 beziehung, international 1 database, cooperativ online 1 database, online 1 retrieval, online 1 überlegung, ökonomisch
|
61
|
+
00088*1 begriff, komplex 1 ergebnis, brauchbar 1 fortsetzung, konsequent 1 indexierung, automatisch 1 indexierung, syntaktisch 1 satzanalyse, vollständig
|
61
62
|
00089*1 patentinformationssystem, deutsch
|
62
63
|
00090*1 sacherschließung, verbal 1 tagung, international
|
63
64
|
00092*1 erschließung, sachlich 1 indexierung, maschinell
|
@@ -86,16 +87,17 @@
|
|
86
87
|
00126*1 informationssystem, biografisch 1 informationssystem, international biografisch
|
87
88
|
00127*1 ausführung, folgend 1 software, betrachtet
|
88
89
|
00128*1 begriffssystem, verwendet 1 fachgebiet, dominierend 1 genauigkeitsrate, hoch 1 indexierung, maschinell 1 nummerierung, fortlaufend 1 variante, verschieden
|
89
|
-
00129*1 anregung, interessant 1 beziehung, syntaktisch 1 fachinformationssystem, modern 1 indexierung, syntaktisch 1 kennzeichnung, eindeutig 1 methode, entwickelt 1 ordnungselement, alphabetisch 1 verknüpfungsmittel, syntaktisch
|
90
|
+
00129*1 anregung, interessant 1 begriff, ordnend 1 beziehung, syntaktisch 1 fachinformationssystem, modern 1 indexierung, syntaktisch 1 kennzeichnung, eindeutig 1 methode, entwickelt 1 ordnungselement, alphabetisch 1 verknüpfungsmittel, syntaktisch
|
91
|
+
00132*1 erfordernis, berufsbedingt
|
90
92
|
00133*1 debatte, international 1 horizont, national 1 sacherschließung, verbal 1 verbreitung, zunehmend 1 übersetzung, gekürzt 1 übersetzung, leicht gekürzt
|
91
93
|
00134*1 analyse, semantisch 1 inhaltserschließung, maschinell 1 wort, komplex 1 wort, morphologisch komplex
|
92
94
|
00135*1 ausführung, vorliegend 1 bedeutung, zentral 1 einblick, kurz 1 maß, zunehmend 1 reputation, wissenschaftlich 1 tätigkeit, wissenschaftlich 1 zeitschriftentitel, jeweilig
|
93
|
-
00136*1 post, elektronisch
|
95
|
+
00136*1 post, elektronisch 1 post, weltweit elektronisch
|
94
96
|
00137*2 inhalt, neu 1 anpassung, gegenseitig 1 datenbank, vorhanden 1 datenformat, verwendet 1 patentklassifikation, strukturiert 1 änderung, aktuell
|
95
|
-
00138*1 abbild, zutreffend 1 einrichtung, wissenschaftlich 1
|
97
|
+
00138*1 abbild, zutreffend 1 einrichtung, wissenschaftlich 1 einwandfrei, methodisch 1 fachdatenbank, elektronisch 1 information, gespeichert 1 rangliste, erstellt
|
96
98
|
00140*1 bibliothek, deutsch 1 bibliotheksinstitut, deutsch 1 form, operational
|
97
99
|
00141*1 bibliothek, öffentlich 1 erschließungstechnik, neu
|
98
|
-
00142*1 arbeit, folgend 1 information, ausreichend 1 vergleichsuntersuchung, entsprechend 1 wissenschaftlergruppe, bestimmt
|
100
|
+
00142*1 arbeit, folgend 1 forschungspolitisch, sinnvoll 1 information, ausreichend 1 vergleichsuntersuchung, entsprechend 1 wissenschaftlergruppe, bestimmt
|
99
101
|
00143*1 untersuchung, vergleichend
|
100
102
|
00144*1 inhaltserschließung, automatisch
|
101
103
|
00145*1 indexierung, automatisch
|
@@ -104,8 +106,9 @@
|
|
104
106
|
00148*1 information, human
|
105
107
|
00149*1 indexierung, automatisch
|
106
108
|
00150*1 datei, elektronisch 1 post, rheinisch
|
109
|
+
00153*1 expertensystem, groß
|
107
110
|
00154*1 dokumentation, inhaltlich 1 indexierung, kontrolliert 1 komfort, erreicht 1 schnittgenau, gar
|
108
|
-
00155*1 ausgabe, gedruckt 1 information, gewünscht 1 inhaltserschließung, gut 1 prüfung, kritisch 1 speicherkapazität, groß 1 zürcher, neu
|
111
|
+
00155*1 ausgabe, gedruckt 1 information, gewünscht 1 inhaltserschließung, gut 1 maß, besonders 1 prüfung, kritisch 1 speicherkapazität, groß 1 zugriff, zielgenau 1 zürcher, neu
|
109
112
|
00156*1 grundlage, linguistisch
|
110
113
|
00158*1 indexierung, automatisch
|
111
114
|
00159*1 indexierung, automatisch 1 inhaltserschließung, bibliothekarisch
|
@@ -113,25 +116,26 @@
|
|
113
116
|
00162*1 bibliothekskatalog, groß
|
114
117
|
00163*1 aspekt, qualitativ 1 sacherschließung, verbal
|
115
118
|
00164*1 dokument, relevant 1 informationsmenge, riesig 1 internet, chaotisch organisiert 1 internet, organisiert 1 monat, vergangen 1 nutzung, effektiv 1 online-medium, populär 1 problem, schwerwiegend 1 suchwerkzeug, genannt
|
116
|
-
00165*1 analyse, statistisch 1 analyse, umfangreich 1 faszination, stark 1 forschungsgeld, fließend 1 forschungsgeld, knapp fließend 1 gutachter-system, überfordert 1 interpretation, sorgfältig 1 selektionskriterium, geeignet 1 spezialist, wenig
|
117
|
-
00166*1 aussage, wichtig 1 indexsprache, kategorisiert 1 mangel, bedingt 1 ordnung, hoch 1 regel, einfach 1 satz, letzte 1 struktur, linear 1 überblick, besseren
|
118
|
-
|
119
|
+
00165*1 analyse, statistisch 1 analyse, umfangreich 1 anwendung, sinnvoll 1 faszination, stark 1 forschungsgeld, fließend 1 forschungsgeld, knapp fließend 1 gutachter-system, überfordert 1 interpretation, sorgfältig 1 selektionskriterium, geeignet 1 spezialist, wenig
|
120
|
+
00166*1 aussage, wichtig 1 begriff, gesucht 1 begriff, syntaktisch verknüpft 1 begriff, verknüpft 1 begriff, zusammengehörend 1 indexsprache, kategorisiert 1 mangel, bedingt 1 ordnung, hoch 1 regel, einfach 1 satz, letzte 1 struktur, linear 1 überblick, besseren
|
121
|
+
00170*1 informationsvermittlung, sinnvoll
|
122
|
+
00171*1 begriff, neu 1 marketingstratege, kreativ 1 marketingstratege, unermüdlich kreativ
|
119
123
|
00173*1 bildschirmschoner, global 1 toilette, öffentlich 1 webpage, seltsam
|
120
|
-
00174*3 datenbank, bibliografisch 3 oberfläche, visuell 1 soll, folgend 1 studie, früh
|
121
|
-
00176*1 bibliothek, wissenschaftlich 1 form, kurz 1 information, technisch 1
|
124
|
+
00174*3 datenbank, bibliografisch 3 oberfläche, visuell 1 retrieval, traditionell 1 soll, folgend 1 studie, früh
|
125
|
+
00176*1 bibliothek, wissenschaftlich 1 form, kurz 1 information, technisch 1 maßnahme, wesentlich 1 maßnahme, zugeordnet wesentlich 1 nutzung, verstärkt 1 selbstverwaltung, wissenschaftlich 1 struktur, wesentlich 1 ziel, langfristig 1 ziel, wesentlich 1 zugang, effizient
|
122
126
|
00177*1 arbeitsgang, sonstig 1 datenbank, verbunden 1 datenbanksystem, gesamt 1 datenbanksystem, umfassend 1 dokumenttyp, alle verschieden 1 dokumenttyp, verschieden 1 mediendatenbank, umfassend 1 textdokument, alle 1 zusammenstellung, elektronisch
|
123
127
|
00178*1 bild, digital
|
124
128
|
00181*1 eitelkeit, gelehrt
|
125
129
|
00182*1 kinderbibliothek, gerade 1 medienerlebnis, kreativ 1 medium, neu 1 technologie, neu 1 welt, real 1 zugang, neu
|
126
130
|
00183*1 enzyklopädie, interaktiv 1 kulturfahrplan, groß
|
127
|
-
00185*1 indexierung, automatisch 1 indexierung, intellektuell 1 indexierungsverfahren, automatisch 1 klassifikation, automatisch 1 klärung, terminologisch 1 kooperation, eng
|
131
|
+
00185*1 begriff, weit 1 indexierung, automatisch 1 indexierung, intellektuell 1 indexierungsverfahren, automatisch 1 klassifikation, automatisch 1 klärung, terminologisch 1 kooperation, eng
|
128
132
|
00186*2 indexierung, automatisch 2 klassifikation, automatisch 1 dokument, klassifiziert 1 dokumentklassifikation, automatisch 1 einführung, kurz 1 relation, statistisch 1 thema, folgend
|
129
133
|
00187*1 arbeitsgruppe, bibliothekarisch
|
130
134
|
00191*1 erschließung, automatisch 1 klassifikation, hierarchisch 1 klassifikation, thematisch hierarchisch 1 ordnungsstruktur, gewonnen 1 text, wiedergewonnen 1 textklassifikation, automatisch thematisch 1 textklassifikation, thematisch 1 wichtigkeitsstufe, entstanden
|
131
135
|
00192*2 indexierung, automatisch 1 datenbank, groß 1 facettenklassifikation, universal 1 fachwort, wichtig 1 indexierung, unter automatisch 1 klassifikationssystem, vorgegeben 1 sprache, deutsch 1 titel, beliebig 1 veröffentlichung, wissenschaftlich
|
132
136
|
00193*1 abfragbar, online 1 indexierung, numerisch 1 zugang, schnell
|
133
|
-
00194*1 indexierung, intellektuell 1 methode, neu 1 system, britisch
|
134
|
-
00195*1 indexierung, intellektuell 1 methode, neu 1 system, britisch
|
137
|
+
00194*1 berücksichtigung, besonders 1 berücksichtigung, unter besonders 1 indexierung, intellektuell 1 methode, neu 1 system, britisch
|
138
|
+
00195*1 berücksichtigung, besonders 1 berücksichtigung, unter besonders 1 indexierung, intellektuell 1 methode, neu 1 system, britisch
|
135
139
|
00197*1 arbeit, beruflich 1 beziehung, bestimmt 1 einheit, thematisch 1 inhalt, kommuniziert 1 kern, eigen 1 kerngebiet, komplex 1 potential, technisch 1 veränderung, technisch
|
136
140
|
00198*1 inhaltserschließung, automatisch
|
137
141
|
00199*1 anwendung, unter 1 moderne, befindlich 1 standardsystem, herkömmlich
|
@@ -139,13 +143,13 @@
|
|
139
143
|
00201*1 bibliothek, wissenschaftlich 1 bibliothekskongress, deutsch
|
140
144
|
00204*1 konferenz, international
|
141
145
|
00205*1 bibliothek, deutsch
|
142
|
-
00206*1 forschungsgemeinschaft, deutsch 1 indexierung, automatisch 1 inhaltserschließung, automatisch 1 projekt, durchgeführt 1 sacherschließung, bibliothekarisch 1 sacherschließung, konventionell bibliothekarisch
|
143
|
-
00207*2 stellung, systematisch 1 bezeichnung, taxonomisch 1 eingabe, unter 1 erreger, dazugehörig 1 hilfe, unterstützt 1 indexdatei, vorgegeben 1 nachschlagewerk, verschieden 1 name, wissenschaftlich 1 objekt, biologisch 1 rationalisierung, weit 1 weise, gleich
|
146
|
+
00206*1 forschungsgemeinschaft, deutsch 1 indexierung, automatisch 1 inhaltserschließung, automatisch 1 projekt, durchgeführt 1 sacherschließung, bibliothekarisch 1 sacherschließung, konventionell bibliothekarisch 1 verbindung, sinnvoll
|
147
|
+
00207*2 stellung, systematisch 1 begriff, verändert 1 bezeichnung, taxonomisch 1 eingabe, unter 1 erreger, dazugehörig 1 hilfe, unterstützt 1 indexdatei, vorgegeben 1 nachschlagewerk, verschieden 1 name, wissenschaftlich 1 objekt, biologisch 1 rationalisierung, weit 1 weise, gleich
|
144
148
|
00208*1 anpassung, strukturell 1 bereich, folgend 1 katalog, elektronisch 1 problem, allgemein 1 umfang, erreicht 1 vokabular, universal 1 überarbeitung, grundsätzlich
|
145
149
|
00209*2 umfeldsuche, semantisch 1 ergebnis, unbefriedigend 1 indexierung, maschinell 1 katalog, konventionell 1 online-katalog, bibliothekarisch 1 suche, sachlich 1 umfeld, semantisch 1 vokabular, strukturiert
|
146
150
|
00210*1 bild, entsprechend 1 möglichkeit, technisch 1 speicher, effektiv 1 suchanfragen, formuliert 1 system, verschieden 1 voraussetzung, alle
|
147
151
|
00211*1 fachinformation, sozialwissenschaftlich
|
148
|
-
00212*2 informationssuche, effizient 1 kostenfaktor, verschieden 1 multimedia-dokumentkollektion, verteilt 1 multimedial, verteilt 1
|
152
|
+
00212*2 informationssuche, effizient 1 kostenfaktor, verschieden 1 multimedia-dokumentkollektion, verteilt 1 multimedial, verteilt 1 rangliste, final 1 rangliste, individuell 1 skalierbar, beliebig 1 typ, beliebig
|
149
153
|
00213*1 beitrag, vorliegend 1 beziehung, derartig 1 indexierung, automatisch 1 indexierungssystem, automatisch 1 interesse, groß 1 relation, erfasst 1 schätzverfahren, verschieden 1 schätzverfahren, vorgeschlagen
|
150
154
|
00214*1 indexierung, automatisch
|
151
155
|
00215*1 indexierungsfunktion, logistisch
|
@@ -155,7 +159,7 @@
|
|
155
159
|
00219*1 praxis, neu
|
156
160
|
00221*1 bibliotheksindex, allgemein 1 system, national
|
157
161
|
00222*1 indexierung, syntaktisch
|
158
|
-
00223*1 nachricht, aktuell
|
162
|
+
00223*1 informationsquelle, groß 1 nachricht, aktuell
|
159
163
|
00225*1 deutsche, professionell 1 seite, deutsch 1 seite, professionell deutsch 1 spur, grün 1 umwelt-angebot, unzählig
|
160
164
|
00227*1 datenbank, verschieden 1 datenmenge, gespeichert 1 erkenntnis, allgemein
|
161
165
|
00228*1 studie, neu
|
@@ -165,7 +169,7 @@
|
|
165
169
|
00232*2 bibliothek, deutsch 1 dienst, zentral 1 dokumentationssprache, adäquat 1 gleichordnend, augenblicklich 1 indexierungsverfahren, britisch 1 jahr, einig 1 linguistik, modern 1 sacherschließung, verbal 1 sprache, natürlich 1 stande, alternativ 1 version, britisch 1 version, verkürzt
|
166
170
|
00233*1 einsatz, praktisch 1 halbautomatisch, arbeitet 1 heuristik, linguistisch 1 information, gewonnen 1 verantwortung, gesellschaftlich
|
167
171
|
00234*2 patentklassifikation, international 1 auflage, letzte 1 einteilungssystem, ganz 1 information, erfasst 1 klassifikationssymbol, obligatorisch 1 neuerung, gravierend 1 sachgebieten, bestimmt 1 sachverhalt, technisch 1 stelle, passend
|
168
|
-
00236*2 patentinformationssystem, deutsch 1 ansatz, allgemein 1 informationswissenschaft, linguistisch 1 patentamt, deutsch
|
172
|
+
00236*2 patentinformationssystem, deutsch 1 ansatz, allgemein 1 informationswissenschaft, linguistisch 1 patentamt, deutsch 1 retrievaltest, extensiv
|
169
173
|
00237*1 dezimalklassifikation, dreisprachig universal 1 dezimalklassifikation, universal 1 erschließung, intellektuell 1 informationsressource, relevant 1 informationsressource, wissenschaftlich relevant 1 internetressource, gesammelt 1 server, relevant 1 server, wissenschaftlich relevant
|
170
174
|
00238*1 informationsressource, relevant 1 informationsressource, wissenschaftlich relevant
|
171
175
|
00239*1 archivsystem, optisch 1 bedingung, alle 1 datenbank, international 1 informationsflut, anwachsend 1 informationsflut, stetig anwachsend 1 umfeld, technisch
|
@@ -176,7 +180,7 @@
|
|
176
180
|
00244*1 indexierung, automatisch
|
177
181
|
00246*1 indexierung, manuell
|
178
182
|
00247*1 artikel, zitierend 1 datenbank, einzig 1 einrichtung, allem 1 entwicklungsstand, derzeitig 1 forschungseinrichtung, groß 1 fußnote, gemeinsam 1 information, wissenschaftlich 1 literatur, zitiert 1 produkt, parallel 1 wissenschaftsfächer, mehrere 1 zitationsdatenbank, groß
|
179
|
-
00248*1 arbeit, praktisch 1 einsatz, praktisch 1 erfahrung, intensiv praktisch 1 erfahrung, praktisch 1 erschließung, inhaltlich 1 form, rührend 1 gleichermaß, informiert 1 grundlage, theoretisch 1 problem, auftretend 1 register, ausführlich 1 register, ungewöhnlich ausführlich 1 überlegung, gründlich
|
183
|
+
00248*1 arbeit, praktisch 1 einsatz, praktisch 1 erfahrung, intensiv praktisch 1 erfahrung, praktisch 1 erschließung, inhaltlich 1 form, rührend 1 gleichermaß, informiert 1 grundlage, theoretisch 1 problem, auftretend 1 register, ausführlich 1 register, ungewöhnlich ausführlich 1 retrievalmöglichkeit, spät 1 überlegung, gründlich
|
180
184
|
00249*1 bibliothek, deutsch
|
181
185
|
00250*1 abhilfe, automatisch 1 analyseverfahren, neu 1 datenmenge, verfügbar 1 information, relevant 1 pfad, neu
|
182
186
|
00251*1 suchfunktion, ausgereift 1 suchfunktion, eigen 1 webserver, eigen
|
@@ -186,16 +190,16 @@
|
|
186
190
|
00255*2 wahrheit, unterdrückt 1 bildbearbeitung, digital 1 fotografie, politisch 1 höhepunkt, vorläufig
|
187
191
|
00258*1 darstellung, besseren 1 fachgesellschaft, wissenschaftlich 1 jahr, einig 1 material, spezifisch 1 methode, technisch 1 methode, verwendet technisch 1 verfügbarkeit, besseren
|
188
192
|
00259*1 lotus, unter 1 version, neu
|
189
|
-
00260*1 aktualität, mangelnd 1 anbieter, kommerziell 1 beitrag, folgend 1 erschließung, automatisch 1
|
193
|
+
00260*1 aktualität, mangelnd 1 anbieter, kommerziell 1 beitrag, folgend 1 erschließung, automatisch 1 internetquelle, gefunden 1 link-sammlung, thematisch 1 maß, erheblich stark 1 maß, stark 1 mehr, wohl 1 netz, gesamt 1 quelle, erschlossen 1 quelle, intellektuell erschlossen 1 suchmaschine, divers
|
190
194
|
00261*2 indexierung, automatisch 1 forschungsgemeinschaft, deutsch 1 projekt, durchgeführt 1 sacherschließung, bibliothekarisch
|
191
195
|
00264*2 indexierung, automatisch 1 mischform, realisiert 1 relevanz, statistisch 1 suchergebnis, sortiert
|
192
196
|
00265*1 datenverarbeitung, elektronisch 1 dokumentationsmethode, wenig 1 fachsprache, starr 1 fachterminologie, akzeptiert 1 philosophie-dokumentation, elektronisch
|
193
|
-
00267*1 dokumenterschließung, automatisch 1 indexierung, automatisch 1 milos-verfahren, erweitert 1 projekt, gefördert 1 titeldaten, angereichert
|
197
|
+
00267*1 dokumenterschließung, automatisch 1 indexierung, automatisch 1 milos-verfahren, erweitert 1 projekt, gefördert 1 retrievaltest, umfangreich 1 titeldaten, angereichert
|
194
198
|
00268*1 publikation, elektronisch 1 sicht, bibliothekarisch 1 trend, aktuell
|
195
199
|
00269*1 visualisierungstechnik, innovativ
|
196
200
|
00270*1 inhaltserschließung, verbal 1 literaturbericht, kommentiert
|
197
201
|
00271*1 sacherschließung, verbal
|
198
|
-
00273*1 indexierung, syntaktisch
|
202
|
+
00273*2 retrieval, online 1 indexierung, syntaktisch
|
199
203
|
00274*1 database, online 1 dokumenterschließung, inhaltlich
|
200
204
|
00275*1 indexierung, maschinell
|
201
205
|
00276*2 information, relevant 1 information, lokal 1 konsens, breiten 1 suchmaschine, universal 1 teil, relevant 1 web-server, eigen 1 weise, einheitlich 1 zugang, effizient
|
@@ -204,29 +208,29 @@
|
|
204
208
|
00280*1 erkenntnis, methodisch
|
205
209
|
00281*1 leistung, wissenschaftlich
|
206
210
|
00283*1 bibliotheksverbund, kooperativ 1 konzept, lokal 1 schnittstelle, technisch
|
207
|
-
00284*1 darstellung, begrifflich 1 darstellung, einfach begrifflich 1 suchsystem, basiert 1 suchsystem, semantisch basiert 1 wörterbuch, umfassend 1 zusammenhang, systematisch
|
211
|
+
00284*1 begriff, einfach 1 darstellung, begrifflich 1 darstellung, einfach begrifflich 1 retrieval, semantisch 1 retrievaltechnik, heutig 1 suchsystem, basiert 1 suchsystem, semantisch basiert 1 wörterbuch, umfassend 1 zusammenhang, systematisch
|
208
212
|
00285*1 kriterium, verschieden 1 verteilung, zeitlich 1 verwendung, unter 1 wissenschaftskommunikation, formal
|
209
213
|
00286*2 datenbank, bibliothekarisch 1 ergebnis, konsistent 1 indexierung, einheitlich 1 indexsystem, angegangen 1 konstruktion, unterschiedlich 1 oberfläche, einheitlich 1 problem, einig 1 schnittmenge, gemeinsam 1 schnittmenge, klein gemeinsam 1 suchergebnis, inkonsistent 1 suchschlüssel, gleich 1 suchschlüssel, scheinbar gleich 1 suchschlüssel, unterschiedlich 1 verbreitung, zunehmend
|
210
|
-
00287*2 information, smart 1 datei, groß 1 ergebnismenge, groß 1 gruppierung, automatisch 1
|
214
|
+
00287*2 information, smart 1 begriff, frei gewählt 1 begriff, gewählt 1 datei, groß 1 ergebnismenge, groß 1 gruppierung, automatisch 1 internetquelle, verschieden 1 nachricht, aktuell 1 nachricht, einzeln 1 nachricht, zusammengestellt 1 sprache, deutsch 1 version, angepasst
|
211
215
|
00288*1 austausch, allen kommunikativ 1 austausch, kommunikativ 1 datenspeicher, elektronisch 1 erde, ganz 1 informationsverlust, ungewollt 1 objekt, intern 1 patent, international 1 schatz, gigantisch 1 schlüssel, entscheidend 1 speicher, auffindbar 1 sprache, zahlreich 1 suchoption, weit 1 technologie, alle 1 technologie, erfasst alle 1 teil, groß 1 terminologie, gemeinsam 1 terminologie, professionell 1 unternehmen, global 1 weg, benötigt 1 weltwissen, gesamt technisch 1 weltwissen, technisch 1 wirkung, integrativ 1 wirkung, stark integrativ
|
212
|
-
00289*1 informationswissenschaftlich, unser 1 known-item-retrievaltest, unser 1 suchwerkzeug, jeweilig
|
216
|
+
00289*1 informationswissenschaftlich, unser 1 known-item-retrievaltest, unser 1 retrievaloberfläche, kund 1 suchwerkzeug, jeweilig
|
213
217
|
00290*1 antwort, konkret 1 aufwand, hoch technologisch 1 aufwand, technologisch 1 auskunft, genau 1 bewertung, intern 1 bewertungsverfahren, kompliziert 1 dateiformat, kryptisch 1 datenbankservermelden, mächtig 1 dokument, ständig verfügbar 1 dokument, verfügbar 1 entscheidung, intuitiv 1 hyperlink, richtig 1 information, bessere 1 intelligenz, human 1 katalog, inhaltlich sortierend 1 katalog, sortierend 1 konzept, gut 1 kriterium, inhaltlich 1 liege, entfernt 1 linkverbindung, gut 1 maschine, automatisch 1 projekt, kalifornisch 1 recherche, automatisch 1 relevanz, inhaltlich 1 roboter, chic unentwegt 1 roboter, unentwegt 1 seite, alle 1 seite, aller 1 seite, zentral 1 sportergebnis, neu 1 studie, früh 1 suchroboter, chic 1 suchsystem, alle 1 suchtechnologie, konventionell 1 surfer, unzählig 1 thema, einig 1 verarbeitung, maschinell 1 verarbeitung, rein maschinell 1 viertel, weit 1 webadresse, beliebig 1 webseite, alle 1 webseite, aller 1 webseite, indiziert 1 webseite, katalogisiert 1 welt, heterogen 1 wort, alle 1 wort, erfasst alle
|
214
|
-
00291*3 handschrift, mittelalterlich 2 erschließung, bibliothekarisch 1 anforderung, neu 1 anforderung, völlig neu 1 belastung, stark 1 bereich, automatisiert 1 bereich, partiell automatisiert 1 bibliothek, wenig 1 bibliothekskatalog, allgemein 1 bibliotheksmaterial, herkömmlich 1 darstellung, ausführlich 1 dokument, elektronisch 1 dokument, neu elektronisch 1 festlegung, inhaltlich 1 festlegung, vielfach inhaltlich 1 gesamtindex, früh 1 handschriftenkatalog, gedruckt 1 handschriftenkatalog, gefördert 1 informationsgewinn, erheblich 1 jahr, einig 1 katalog, erstellt 1 katalog, gedruckt 1 katalogsystem, jeweilig 1 kreis, eng 1 material, verschieden 1 problem, entstehend technisch 1 problem, technisch 1 regelwerk, bibliothekarisch 1 richtlinie, gültig 1 suche, vereinheitlicht 1 system, verwendet 1 wirkung, tiefgreifend
|
215
|
-
00292*4 inhaltserschließung, automatisch 1 akzeptanz, merklich 1 ansatz, verschieden 1 anstrengung, verstärkt 1 anwenderkreisen, breiten 1 automatisierung, zunehmend 1 informationsflut, steigend 1 interesse, wachsend 1 komponente, bestimmt 1 produkt, neu 1 softwarewerkzeug, kommerziell vertrieben 1 softwarewerkzeug, vertrieben 1 vertrieb, kommerziell 1 zugriffsverfahren, effizient
|
216
|
-
00293*1 datenvolumen, groß 1 indexierung, maschinell 1 prozess, iterativ 1 sicht, technisch
|
217
|
-
00294*1 ansprüche, verändert 1 benutzer, unser 1 bibliotheksbenutzer, extern 1 form, allgemein 1 form, recht allgemein 1 jahr, letzte 1 problem, häufig 1 recherchemöglichkeit, hervorragend 1 rückgang, stark 1 umfeld, universitär
|
218
|
-
00295*1 einstieg, optimal 1 erhebung, ausgearbeitet empirisch 1 erhebung, empirisch 1 indexierung, automatisch 1 informationswissenschaftlich, seriös 1 speerspitze, technologisch 1 suchsystem, unterschiedlich 1 vokabular, geordnet kontrolliert 1 vokabular, kontrolliert
|
219
|
-
00296*1 befehlsorientieren, ausschließlich 1 befehlsorientieren, elaboriert 1 benutzerschnittstelle, ergonomisch 1
|
218
|
+
00291*3 handschrift, mittelalterlich 2 erschließung, bibliothekarisch 1 anforderung, neu 1 anforderung, völlig neu 1 belastung, stark 1 bereich, automatisiert 1 bereich, partiell automatisiert 1 bibliothek, wenig 1 bibliothekskatalog, allgemein 1 bibliotheksmaterial, besonders 1 bibliotheksmaterial, herkömmlich 1 darstellung, ausführlich 1 dokument, elektronisch 1 dokument, neu elektronisch 1 festlegung, inhaltlich 1 festlegung, vielfach inhaltlich 1 gesamtindex, früh 1 handschriftenkatalog, gedruckt 1 handschriftenkatalog, gefördert 1 informationsgewinn, erheblich 1 jahr, einig 1 katalog, erstellt 1 katalog, gedruckt 1 katalogsystem, jeweilig 1 kreis, eng 1 material, verschieden 1 problem, entstehend technisch 1 problem, technisch 1 regelwerk, bibliothekarisch 1 richtlinie, gültig 1 suche, vereinheitlicht 1 system, verwendet 1 wirkung, tiefgreifend
|
219
|
+
00292*4 inhaltserschließung, automatisch 1 akzeptanz, merklich 1 ansatz, verschieden 1 anstrengung, verstärkt 1 anwenderkreisen, breiten 1 automatisierung, zunehmend 1 informationsflut, steigend 1 interesse, wachsend 1 komponente, bestimmt 1 produkt, neu 1 softwarewerkzeug, kommerziell vertrieben 1 softwarewerkzeug, vertrieben 1 vertrieb, kommerziell 1 zugriffsverfahren, effizient 1 zukunft, nah
|
220
|
+
00293*1 begriff, alphabetisch 1 datenvolumen, groß 1 indexierung, maschinell 1 prozess, iterativ 1 sicht, technisch
|
221
|
+
00294*1 ansprüche, verändert 1 benutzer, unser 1 bibliotheksbenutzer, extern 1 form, allgemein 1 form, recht allgemein 1 jahr, letzte 1 maß, besonders 1 problem, häufig 1 recherchemöglichkeit, hervorragend 1 rückgang, stark 1 umfeld, universitär
|
222
|
+
00295*1 einstieg, optimal 1 erhebung, ausgearbeitet empirisch 1 erhebung, empirisch 1 indexierung, automatisch 1 informationswissenschaftlich, seriös 1 speerspitze, technologisch 1 suchsystem, unterschiedlich 1 vokabular, geordnet kontrolliert 1 vokabular, kontrolliert 1 zugriff, zielgenau
|
223
|
+
00296*1 befehlsorientieren, ausschließlich 1 befehlsorientieren, elaboriert 1 benutzerschnittstelle, ergonomisch 1 checkliste, unser 1 datensätzen, singulär 1 indexierung, automatisch 1 informationsproduzent, isoliert 1 leistungsindikator, weit 1 methode, automatisch 1 methode, suboptimal 1 online-archiv, kommerziell 1 realisierungsmöglichkeit, technisch 1 retrievalsystem, gut 1 suche, gut 1 system, irgendwelch 1 umgebung, experimentell 1 wirdjedoch, vorausgesetzt
|
220
224
|
00297*2 problem, methodisch 2 wissenschaftsforschung, empirisch 1 arbeit, vorliegend 1 basis, problematisch 1 bereich, semantisch 1 bereich, syntaktisch 1 charakter, dynamisch 1 faktor, beachtenswert 1 informationstheorie, semantisch 1 leistung, wissenschaftlich 1 problem, alle methodisch 1 problem, auftretend methodisch 1 problem, grundlegend 1 problem, offen 1 problem, spezifisch 1 publikation, elektronisch 1 publikation, zitiert 1 wirkung, wissenschaftlich
|
221
|
-
00298*3 text, elektronisch 2 erschließung, inhaltlich 1 aspekt-klassifikation, universal 1 erschließung, automatisch inhaltlich 1 erschließung, syntaktisch inhaltlich 1 klassifikationselement, bezogen 1 klassifikationselement, inhaltlich bezogen 1 recherche, zahlreich 1 suchalgorithmen, bekannt 1 suchgegenstand, jeweilig 1 textdokument, unbekannt
|
225
|
+
00298*3 text, elektronisch 2 erschließung, inhaltlich 1 aspekt-klassifikation, universal 1 erschließung, automatisch inhaltlich 1 erschließung, syntaktisch inhaltlich 1 klassifikationselement, bezogen 1 klassifikationselement, inhaltlich bezogen 1 recherche, zahlreich 1 retrieval, syntaktisch 1 suchalgorithmen, bekannt 1 suchgegenstand, jeweilig 1 textdokument, unbekannt
|
222
226
|
00299*1 angebot, nutzend 1 veröffentlichung, alle 1 übersetzungssystem, automatisch
|
223
|
-
00300*1 anwendung, experimentell 1 anwendungsfall, fruchtbar 1 erschließung, inhaltlich 1 migration, sozialwissenschaftlich 1 relation, komplex 1 suche, semantisch
|
227
|
+
00300*1 anwendung, experimentell 1 anwendungsfall, fruchtbar 1 erschließung, inhaltlich 1 interesse, besonders 1 migration, sozialwissenschaftlich 1 relation, komplex 1 suche, semantisch
|
224
228
|
00301*4 daten, inhaltlich 1 daten, formatiert 1 datenarten, inhaltlich 1 form, strukturiert 1 management, integriert 1 text, vorwiegend
|
225
229
|
00302*1 anforderung, speziell 1 anwendungskontext, real 1 erschließung, automatisch inhaltlich 1 erschließung, inhaltlich 1 gesichtspunkt, qualitativ 1 indexierung, automatisch 1 inhaltserschließung, intellektuell 1 mangel, einig 1 methode, anerkannt 1 system, grundsätzlich unterschiedlich 1 system, lernend 1 system, unterschiedlich 1 trainingsvorlage, erstellt 1 trainingsvorlage, intellektuell erstellt
|
226
230
|
00303*1 annotationssystem, verteilt 1 ansatz, konzeptuell 1 anwendungsbereich, exemplarisch 1 artikel, einschlägig 1 aufgabe, komplex 1 aufgabe, verbunden komplex 1 aufgabenbasieren, entsprechend 1 beitrag, vorliegend 1 benutzergruppe, verteilt 1 benutzertyp, verschieden 1 bestand, wachsend 1 datenbestand, gespeichert 1 dokumentenverarbeitung, intelligent 1 filmarchiv, europäisch 1 filmarchiv, groß europäisch 1 filmforschung, historisch 1 jahrhundert, vorig 1 korpus, groß 1 quellenmaterial, historisch 1 technik, dediziert 1 xml-basiert, modern
|
227
231
|
00304*1 indexierung, automatisch
|
228
232
|
00305*2 generierung, maschinell 1 abteilung, verantwortlich 1 auftraggeber, öffentlich 1 beratungsdienstleistung, international 1 beratungsschwerpunkt, weit 1 beratungsunternehmen, führend 1 externe, dokumentiert 1 material, dokumentiert extern 1 material, extern 1 netz, intern 1 projektbericht, aller intern 1 projektbericht, intern 1 stand, derzeitig 1 unternehmen, jung
|
229
|
-
00306*5 indexierung, automatisch 1 ansatz, behandelt 1 ansatz, grundsätzlich 1 ansatz, verschieden 1 berg, ständig wachsend 1 berg, wachsend 1 buch, vorliegend 1 charakter, beispielhaft 1 darstellung, einführend 1 information, unstrukturiert 1 informationsbedarf, grundsätzlich 1 informationswirtschaft, betrieblich 1 lehrveranstaltung, entsprechend 1 mittel, manuell 1 praktiker, konfrontiert 1 seite, technisch 1 sprache, verständlich 1 tag, heutig 1 tiefendarstellung, detailliert 1 verarbeitung, schnell 1 verwaltung, öffentlich 1 voraussetzung, jeweilig 1 wirtschaft, abhängig
|
233
|
+
00306*5 indexierung, automatisch 1 ansatz, behandelt 1 ansatz, grundsätzlich 1 ansatz, verschieden 1 bedeutung, groß 1 berg, ständig wachsend 1 berg, wachsend 1 buch, vorliegend 1 charakter, beispielhaft 1 darstellung, einführend 1 information, unstrukturiert 1 informationsbedarf, grundsätzlich 1 informationswirtschaft, betrieblich 1 lehrveranstaltung, entsprechend 1 mittel, manuell 1 praktiker, konfrontiert 1 seite, technisch 1 sprache, verständlich 1 tag, heutig 1 tiefendarstellung, detailliert 1 verarbeitung, schnell 1 verwaltung, öffentlich 1 voraussetzung, jeweilig 1 wirtschaft, abhängig
|
230
234
|
00308*2 zeitschrift, wissenschaftlich 1 anwendungsbereich, fokussiert 1 autor, wissenschaftlich 1 hilfsmittel, notwendig 1 jahrgang, aktuell 1 kriterium, objektiv 1 verbesserungsvorschlag, einig 1 zeitschrift, weich 1 zeitschriftenkommunikation, wissenschaftlich
|
231
235
|
00309*1 datenbank, relational 1 forschungsgemeinschaft, deutsch 1 projekt, gefördert
|
232
236
|
00310*1 aktionsmuster, gewonnen sequentiell 1 aktionsmuster, sequentiell 1 angabe, betreffend 1 aufgabe, allgemein 1 auswertung, rechnerisch 1 forschungsfragen, allgemein 1 informationsraum, inhaltlich komplex 1 informationsraum, komplex 1 interpretation, zusammenfassend 1 phasenmodell, dynamisch 1 schritt, folgend 1 suchmaschinennutzer, unerfahren 1 thema, anschließend 1 untergruppe, unerfahren 1 web-rechercheaufgabe, offen 1 wissensarten, unterschiedlich
|
@@ -236,14 +240,14 @@
|
|
236
240
|
00315*1 aspekt, neu 1 gesellschaft, international 1 sektion, deutsch
|
237
241
|
00317*1 anforderung, speziell 1 anwendungskontext, real 1 erschließung, automatisch inhaltlich 1 erschließung, inhaltlich 1 gesichtspunkt, qualitativ 1 indexierung, automatisch 1 inhaltserschließung, intellektuell 1 mangel, einig 1 methode, anerkannt 1 system, grundsätzlich unterschiedlich 1 system, lernend 1 system, unterschiedlich 1 trainingsvorlage, erstellt 1 trainingsvorlage, intellektuell erstellt
|
238
242
|
00318*1 belästigung, sexuell
|
239
|
-
00319*2 sprache, natürlich 2 thesaurus, semantisch 1 bedeutung, rasant zunehmend 1 bedeutung, zunehmend 1 beitrag, vorliegend 1 instrument, möglich 1 mach, deutlich 1 programmiersprache, objektorientiert 1 publikationsform, verändernd 1 sprache, unser natürlich 1 text, wissensbasiert
|
240
|
-
00320*1 analyse, semantisch 1 bedienbar, leicht 1 begriffsgut, abgebildet 1 begriffssammlung, beliebig geordnet 1 begriffssammlung, geordnet 1 bibliografie, soziologisch 1 datenbank, ursprünglich 1 dokument, relevant 1 dokument, wenig relevant 1 ordnungssystem, bestehend 1 ordnungssystem, speziell 1 schritt, nachfolgend 1 suche, ausschließlich 1 systematik, formal 1 thesaurus, beispielsweise 1 zeichenkettenabgleich, exakt
|
243
|
+
00319*2 sprache, natürlich 2 thesaurus, semantisch 1 bedeutung, rasant zunehmend 1 bedeutung, zunehmend 1 begriff, definierbar 1 beitrag, vorliegend 1 instrument, möglich 1 mach, deutlich 1 programmiersprache, objektorientiert 1 publikationsform, verändernd 1 sprache, unser natürlich 1 text, wissensbasiert
|
244
|
+
00320*1 analyse, semantisch 1 bedienbar, leicht 1 begriffsgut, abgebildet 1 begriffssammlung, beliebig geordnet 1 begriffssammlung, geordnet 1 berücksichtigung, besonders 1 bibliografie, soziologisch 1 datenbank, ursprünglich 1 dokument, relevant 1 dokument, wenig relevant 1 ordnungssystem, bestehend 1 ordnungssystem, speziell 1 retrievalverfahren, nachgeordnet semantisch 1 retrievalverfahren, semantisch 1 schritt, nachfolgend 1 suche, ausschließlich 1 systematik, formal 1 thesaurus, beispielsweise 1 zeichenkettenabgleich, exakt
|
241
245
|
00321*1 basis, theoretisch 1 fixierbar, schriftlich 1 form, alle 1 netz, generalisiert neuronal 1 netz, neuronal 1 notation, formal 1 struktursystem, vorgestellt
|
242
246
|
00322*1 ausgabe, aufgelegt gedruckt 1 ausgabe, gedruckt 1 darstellung, systematisch 1 version, elektronisch
|
243
|
-
00323*2 aspekt, pragmatisch 1 bezugnahmen, unter 1 dimension, neu 1 ergebnis, wissenschaftlich 1 information, möglich 1 informationssystem, wissenschaftlich 1 position, philosophisch 1 repräsentationsstruktur, entwickelt 1 standpunkt, unser
|
247
|
+
00323*2 aspekt, pragmatisch 1 bezugnahmen, unter 1 dimension, neu 1 ergebnis, wissenschaftlich 1 information, möglich 1 informationssystem, wissenschaftlich 1 position, philosophisch 1 repräsentationsstruktur, entwickelt 1 retrievalverfahren, effizient 1 standpunkt, unser
|
244
248
|
00324*2 funktion, enzyklopädisch 1 anschauung, herrschend 1 bibliothek, modern 1 disziplin, aller 1 epochenübergreifend, gezielt 1 erscheinungsform, verschieden 1 forschung, künftig 1 forschungsdialog, deutsch 1 forschungsförderung, orientiert 1 gleichbleiben, prinzipiell 1 identitätsfindung, national 1 informationsaustausch, umfassend 1 informationsverarbeitung, enzyklopädisch 1 institut, rührig 1 kulturgeschichte, europäisch 1 kunstsprache, barock 1 masse, wachsend 1 medientechnik, spezifisch 1 modell, europäisch 1 neuzeit, früh 1 person, einzeln 1 philosoph, französisch 1 standard, existierend technisch 1 standard, technisch 1 thema, bestimmt 1 umschau, thematisch 1 werk, enzyklopädisch 1 wirkung, ähnlich 1 wissenssammlung, enzyklopädisch 1 zivilisation, wissenschaftlich 1 überblick, enzyklopädisch 1 überblicksbeiträge, historisch
|
245
|
-
00325*2 soziologe, deutsch 1 deutsche, unter 1 forschungsleistung, sozialwissenschaftlich 1 schwachpunkt, bekannte 1 schwachpunkt, bestätigt bekannte 1 soziologe, antwortend 1 soziologe, unter deutsch 1 umfragergebnis, weit 1 untersuchung, durchgeführt
|
246
|
-
00326*1 ausbildungseinrichtung, bibliothekarisch 1 ausbildungseinrichtung, deutsch bibliothekarisch 1 beschreibungsebene, strukturiert 1 indexierung, automatisch 1 information, intelligent 1 katalog, lokal 1 netz, heterogen 1 sicht, integrativ 1 thema, folgend 1 trend, folgend
|
247
|
-
00329*2 indexierung, adaptiv 1 fragestellung, komplex 1 indexierung, mehrfach 1 indexierungsmethode, konzeptuell 1
|
248
|
-
00330*2 maschine, weit 2 seite, weit 1 adresse, alt 1 automat, groß 1 beiträge, neu 1 beiträge, ruppig 1 betrachter, mobil 1 bildersuchen, eigen 1 browserfenster, neu 1 darstellung, einheitlich 1 datei, deutsch 1 datei, verlinkt 1 datenbanksuche, eigen 1 dokument, aufgesucht 1 dokument, elektronisch 1 dokument, findend 1 dokument, frisch aufgesucht 1 durchforschen, alles 1 einblick, klein 1 ergebnis, erstaunlich 1 ergebnis, fremd 1 forum, jeweilig 1 frage, deutsch gestellt 1 frage, gestellt 1 frage, wirklich 1 fünfhundertmal, schätzungsweise 1 google-besuch, letzte 1 hilfe, groß 1 hilfe, praktisch 1 idee, olympisch 1 index, neu 1 inhalt, häufig wechselnd 1 inhalt, klassisch 1 inhalt, wechselnd 1 insel, riesig 1 intelligenz, künstlich 1 intelligenz, maschinell 1 internet-anbieter, groß 1 kind, vermisst 1 kollegialität, unermüdlich 1 kopierbar, vorteilhaft 1 link, sogenannt 1 linux-pc-server, billigen 1 mach, lustig 1 maschinenlesbar, oft 1 mitarbeit, frei 1 monat, einig 1 multimedia-inhalt, kommend 1 nachlese, stündlich 1 netz, ganz 1 netz, unsichtbar 1 netzfreund, aller 1 nichtkommerziell, uralt 1 rahmenlos, möglich 1 rolle, untergeordnet 1 röhre, kommunizierend 1 schleuse, lieb 1 seite, angemeldet 1 seite, durchsucht 1 seite, einfach 1 seite, gefunden 1 seite, gespeichert 1 seite, jeweilig 1 server, kooperierend 1 speicher, eigen 1 speicher, weit 1 suchmaschine, beliebte 1 suchmaschine, deutsch 1 suchseite, englisch 1 suchseite, sehenswert englisch 1 telefonbuchsuche, deutsch 1 text, gefunden 1 thema, bestimmt 1 verweis, einheitlich 1 webformat, neu 1 wettstreit, international 1 wille, gut 1 wort, aller vorkommend 1 wort, paar 1 wort, vorkommend 1 wortgruppe, geschlossen 1 wortgruppe, spät geschlossen 1 wortlaut, genau 1 wunderwelt, offen 1 wunderwerk, technisch 1 übersetzung, maschinell
|
249
|
+
00325*2 soziologe, deutsch 1 deutsche, unter 1 forschungsleistung, sozialwissenschaftlich 1 informationelle, sinnvoll 1 schwachpunkt, bekannte 1 schwachpunkt, bestätigt bekannte 1 soziologe, antwortend 1 soziologe, unter deutsch 1 umfragergebnis, weit 1 untersuchung, durchgeführt
|
250
|
+
00326*1 ausbildungseinrichtung, bibliothekarisch 1 ausbildungseinrichtung, deutsch bibliothekarisch 1 beschreibungsebene, strukturiert 1 indexierung, automatisch 1 information, intelligent 1 interaktionsschnittstelle, benutzerfreundlich 1 katalog, lokal 1 netz, heterogen 1 sicht, integrativ 1 thema, folgend 1 trend, folgend
|
251
|
+
00329*2 indexierung, adaptiv 1 fragestellung, komplex 1 indexierung, mehrfach 1 indexierungsmethode, konzeptuell 1 konzeptrahmen, gebunden 1 tiefenanalyse, selektiv 1 wissensstruktur, relevant 1 zielgruppe, unterschiedlich
|
252
|
+
00330*2 maschine, weit 2 seite, weit 1 adresse, alt 1 automat, groß 1 begriff, eingegeben 1 begriff, selten 1 beiträge, neu 1 beiträge, ruppig 1 betrachter, mobil 1 bildersuchen, eigen 1 browserfenster, neu 1 darstellung, einheitlich 1 datei, deutsch 1 datei, verlinkt 1 datenbanksuche, eigen 1 dokument, aufgesucht 1 dokument, elektronisch 1 dokument, findend 1 dokument, frisch aufgesucht 1 durchforschen, alles 1 einblick, klein 1 ergebnis, erstaunlich 1 ergebnis, fremd 1 forum, jeweilig 1 frage, deutsch gestellt 1 frage, gestellt 1 frage, wirklich 1 fünfhundertmal, schätzungsweise 1 google-besuch, letzte 1 hilfe, groß 1 hilfe, praktisch 1 idee, olympisch 1 index, neu 1 inhalt, häufig wechselnd 1 inhalt, klassisch 1 inhalt, wechselnd 1 insel, riesig 1 intelligenz, künstlich 1 intelligenz, maschinell 1 internet-anbieter, groß 1 kind, vermisst 1 kollegialität, unermüdlich 1 kopierbar, vorteilhaft 1 link, sogenannt 1 linux-pc-server, billigen 1 mach, lustig 1 maschinenlesbar, oft 1 mitarbeit, frei 1 monat, einig 1 multimedia-inhalt, kommend 1 nachlese, stündlich 1 netz, ganz 1 netz, unsichtbar 1 netzfreund, aller 1 nichtkommerziell, uralt 1 rahmenlos, möglich 1 rolle, untergeordnet 1 röhre, kommunizierend 1 schleuse, lieb 1 seite, angemeldet 1 seite, durchsucht 1 seite, einfach 1 seite, gefunden 1 seite, gespeichert 1 seite, jeweilig 1 server, kooperierend 1 sorge, groß 1 speicher, eigen 1 speicher, weit 1 suchmaschine, beliebte 1 suchmaschine, deutsch 1 suchmaschine, groß 1 suchmaschine, sehr beliebte 1 suchseite, englisch 1 suchseite, sehenswert englisch 1 telefonbuchsuche, deutsch 1 text, gefunden 1 thema, bestimmt 1 verweis, einheitlich 1 webformat, neu 1 wettstreit, international 1 wille, gut 1 wort, aller vorkommend 1 wort, paar 1 wort, vorkommend 1 wortgruppe, geschlossen 1 wortgruppe, spät geschlossen 1 wortlaut, genau 1 wunderwelt, offen 1 wunderwerk, technisch 1 übersetzung, maschinell
|
249
253
|
00331*2 bibliothek, öffentlich 1 ekz-daten, indexiert 1 erschließungsmethode, herkömmlich 1 indexierung, maschinell 1 methode, verschieden 1 sachbuchbestand, typisch 1 titel, relevant
|
data/test/test_helper.rb
CHANGED
@@ -1,3 +1,5 @@
|
|
1
|
+
# encoding: utf-8
|
2
|
+
|
1
3
|
require 'test/unit'
|
2
4
|
require 'lingo'
|
3
5
|
|
@@ -27,22 +29,22 @@ class LingoTestCase < Test::Unit::TestCase
|
|
27
29
|
# Erzeugt ein Token-Objekt
|
28
30
|
def tk( text )
|
29
31
|
f, a = split( text )
|
30
|
-
Lingo::Token.new( f, a )
|
32
|
+
Lingo::Language::Token.new( f, a )
|
31
33
|
end
|
32
34
|
|
33
35
|
# Erzeugt ein Lexical-Objekt
|
34
36
|
def lx( text )
|
35
37
|
f, a = split( text )
|
36
|
-
Lingo::Lexical.new( f, a )
|
38
|
+
Lingo::Language::Lexical.new( f, a )
|
37
39
|
end
|
38
40
|
|
39
41
|
# Erzeugt ein Word-Objekt
|
40
42
|
def wd( text, *lexis )
|
41
43
|
f, a = split( text )
|
42
|
-
w = Lingo::Word.new( f, a )
|
44
|
+
w = Lingo::Language::Word.new( f, a )
|
43
45
|
lexis.each do |text|
|
44
46
|
f, a = split( text )
|
45
|
-
w << Lingo::Lexical.new( f, a )
|
47
|
+
w << Lingo::Language::Lexical.new( f, a )
|
46
48
|
end
|
47
49
|
w
|
48
50
|
end
|
@@ -54,22 +56,24 @@ class AttendeeTestCase < LingoTestCase
|
|
54
56
|
def initialize(fname)
|
55
57
|
super
|
56
58
|
|
57
|
-
@attendee = $1
|
59
|
+
@attendee = $1 if self.class.to_s =~ /TestAttendee(.*)/
|
58
60
|
@lingo, @output = Lingo.new, []
|
59
61
|
end
|
60
62
|
|
61
|
-
def meet(att_cfg, check=true)
|
62
|
-
|
63
|
-
|
64
|
-
|
63
|
+
def meet(att_cfg, check = true)
|
64
|
+
cfg = { 'name' => @attendee.camelcase }
|
65
|
+
cfg.update('in' => 'input') if @input
|
66
|
+
cfg.update('out' => 'output') if @output
|
67
|
+
cfg.update(att_cfg)
|
65
68
|
|
66
69
|
@output.clear
|
67
70
|
@lingo.reset
|
68
|
-
|
69
|
-
|
70
|
-
|
71
|
-
|
72
|
-
|
71
|
+
|
72
|
+
list = [{ @attendee => cfg }]
|
73
|
+
list.unshift 'TestSpooler' => { 'out' => 'input', 'input' => @input } if @input
|
74
|
+
list.push 'TestDumper' => { 'in' => 'output', 'output' => @output } if @output
|
75
|
+
|
76
|
+
@lingo.invite(list)
|
73
77
|
@lingo.start
|
74
78
|
|
75
79
|
assert_equal(@expect, @output) if check
|
@@ -78,36 +82,37 @@ class AttendeeTestCase < LingoTestCase
|
|
78
82
|
end
|
79
83
|
|
80
84
|
class Lingo
|
85
|
+
class Attendee
|
86
|
+
class TestSpooler < self
|
81
87
|
|
82
|
-
|
88
|
+
protected
|
83
89
|
|
84
|
-
|
90
|
+
def init
|
91
|
+
@input = get_key('input')
|
92
|
+
end
|
85
93
|
|
86
|
-
|
87
|
-
|
88
|
-
when has_key?('spool_from')
|
89
|
-
@spool_from = get_key('spool_from')
|
90
|
-
@spooler = true
|
91
|
-
when has_key?('dump_to')
|
92
|
-
@dump_to = get_key('dump_to')
|
93
|
-
@spooler = false
|
94
|
-
else
|
95
|
-
forward(STR_CMD_ERR, 'Weder dump_to noch spool_from-Attribut abgegeben')
|
94
|
+
def control(cmd, param)
|
95
|
+
@input.each(&method(:forward)) if cmd == STR_CMD_TALK
|
96
96
|
end
|
97
|
+
|
97
98
|
end
|
98
99
|
|
99
|
-
|
100
|
-
|
101
|
-
|
102
|
-
|
103
|
-
|
100
|
+
class TestDumper < self
|
101
|
+
|
102
|
+
protected
|
103
|
+
|
104
|
+
def init
|
105
|
+
@output = get_key('output')
|
104
106
|
end
|
105
|
-
end
|
106
107
|
|
107
|
-
|
108
|
-
|
109
|
-
|
108
|
+
def control(cmd, param)
|
109
|
+
@output << AgendaItem.new(cmd, param)
|
110
|
+
end
|
110
111
|
|
111
|
-
|
112
|
+
def process(obj)
|
113
|
+
@output << obj
|
114
|
+
end
|
112
115
|
|
116
|
+
end
|
117
|
+
end
|
113
118
|
end
|
data/test/ts_database.rb
CHANGED
@@ -2,10 +2,10 @@
|
|
2
2
|
|
3
3
|
require_relative 'test_helper'
|
4
4
|
|
5
|
-
class Lingo::
|
6
|
-
alias_method :
|
7
|
-
def
|
8
|
-
|
5
|
+
class Lingo::Database
|
6
|
+
alias_method :original_convert, :convert
|
7
|
+
def convert(verbose = false)
|
8
|
+
original_convert(verbose)
|
9
9
|
end
|
10
10
|
end
|
11
11
|
|
@@ -100,7 +100,8 @@ Wort2=
|
|
100
100
|
'txt-format' => 'SingleWord',
|
101
101
|
'use-lex' => set_config('lex',
|
102
102
|
'name' => 'de/lingo-dic.txt',
|
103
|
-
'txt-format' => 'WordClass'
|
103
|
+
'txt-format' => 'WordClass',
|
104
|
+
'separator' => '='
|
104
105
|
)
|
105
106
|
}, @singleword, {
|
106
107
|
'wort1' => '#s',
|
@@ -132,7 +133,7 @@ Wort2=
|
|
132
133
|
'b7501a62cb083be6730a7a179a4ab346d23efe53' => '4b10'
|
133
134
|
})
|
134
135
|
|
135
|
-
compare(config, @singleword) { |
|
136
|
+
compare(config, @singleword) { |db| {
|
136
137
|
'wort1' => '#s',
|
137
138
|
'wort2' => '#s',
|
138
139
|
'juristische personen' => '#s',
|
@@ -141,7 +142,7 @@ Wort2=
|
|
141
142
|
'ganz großer und blöder quatsch' => '#s',
|
142
143
|
'ganz großer und blöder mist' => '#s',
|
143
144
|
'ganz großer und blöder schwach sinn' => '#s'
|
144
|
-
}.each { |key, val| assert_equal([val],
|
145
|
+
}.each { |key, val| assert_equal([val], db[key]) } }
|
145
146
|
end
|
146
147
|
|
147
148
|
def test_keyvalue
|
@@ -248,12 +249,12 @@ Wort2=
|
|
248
249
|
FileUtils.mkdir_p(File.dirname(TEST_FILE))
|
249
250
|
File.write(TEST_FILE, input, encoding: Lingo::ENC)
|
250
251
|
|
251
|
-
Lingo::
|
252
|
+
Lingo::Database.open(set_config('tst', config.merge('name' => TEST_FILE)), @lingo) { |db|
|
252
253
|
if block_given?
|
253
|
-
yield
|
254
|
+
yield db
|
254
255
|
else
|
255
|
-
store =
|
256
|
-
store.delete(Lingo::SYS_KEY)
|
256
|
+
store = db.to_h
|
257
|
+
store.delete(Lingo::Database::SYS_KEY)
|
257
258
|
|
258
259
|
assert_equal(output, store)
|
259
260
|
end
|
data/test/ts_language.rb
CHANGED
@@ -4,6 +4,8 @@ require_relative 'test_helper'
|
|
4
4
|
|
5
5
|
class TestLexicalHash < LingoTestCase
|
6
6
|
|
7
|
+
LH = Lingo::Language::LexicalHash
|
8
|
+
|
7
9
|
def setup
|
8
10
|
@lingo = Lingo.new
|
9
11
|
@database_config = @lingo.config['language/dictionary/databases']
|
@@ -17,7 +19,7 @@ class TestLexicalHash < LingoTestCase
|
|
17
19
|
old_stderr, $stderr = $stderr, StringIO.new('')
|
18
20
|
|
19
21
|
# Datenquelle nicht in Konfiguration enthalten
|
20
|
-
assert_raise(
|
22
|
+
assert_raise(Lingo::NoDatabaseConfigError) { LH.new('nonsens', @lingo) }
|
21
23
|
ensure
|
22
24
|
$stderr = old_stderr
|
23
25
|
end
|
@@ -25,7 +27,7 @@ class TestLexicalHash < LingoTestCase
|
|
25
27
|
# TODO: Crypt testen...
|
26
28
|
|
27
29
|
def test_cache
|
28
|
-
ds =
|
30
|
+
ds = LH.new('sys-dic', @lingo)
|
29
31
|
assert_equal([lx('regen|s'), lx('regen|v'), lx('rege|a')], ds['regen'])
|
30
32
|
assert_equal([lx('regen|s'), lx('regen|v'), lx('rege|a')], ds['regen'])
|
31
33
|
assert_equal([lx('regen|s'), lx('regen|v'), lx('rege|a')], ds['regen'])
|
@@ -33,11 +35,11 @@ class TestLexicalHash < LingoTestCase
|
|
33
35
|
end
|
34
36
|
|
35
37
|
def test_report
|
36
|
-
ds =
|
38
|
+
ds = LH.new('tst-syn', @lingo)
|
37
39
|
ds['abwickeln'] # source read
|
38
40
|
ds['abwickeln'] # cache hit
|
39
|
-
ds['regen']
|
40
|
-
ds['nonesens']
|
41
|
+
ds['regen'] # source read
|
42
|
+
ds['nonesens'] # source read, nothing found
|
41
43
|
|
42
44
|
expect = { \
|
43
45
|
"tst-syn: cache hits" => 1, \
|
@@ -52,26 +54,25 @@ class TestLexicalHash < LingoTestCase
|
|
52
54
|
|
53
55
|
def test_auto_create
|
54
56
|
txt_file = @database_config['tst-sgw']['name']
|
55
|
-
sto_file = Lingo.find(:store, txt_file) << '.pag'
|
56
57
|
|
57
|
-
ds =
|
58
|
+
ds = LH.new('tst-sgw', @lingo)
|
58
59
|
assert_equal([lx('substantiv|s')], ds['substantiv'])
|
59
60
|
ds.close
|
60
61
|
|
61
62
|
# Keine Store-Datei vorhanden, nur Text vorhanden
|
62
|
-
File.delete(
|
63
|
-
ds =
|
63
|
+
File.delete(*Dir["#{Lingo.find(:store, txt_file)}.*"])
|
64
|
+
ds = LH.new('tst-sgw', @lingo)
|
64
65
|
assert_equal([lx('substantiv|s')], ds['substantiv'])
|
65
66
|
ds.close
|
66
67
|
|
67
68
|
# Store vorhanden, aber Text ist neuer
|
68
|
-
ds =
|
69
|
+
ds = LH.new('tst-sgw', @lingo)
|
69
70
|
assert_equal([lx('substantiv|s')], ds['substantiv'])
|
70
71
|
ds.close
|
71
72
|
end
|
72
73
|
|
73
74
|
def test_singleword
|
74
|
-
ds =
|
75
|
+
ds = LH.new('tst-sgw', @lingo)
|
75
76
|
assert_equal([lx('substantiv|s')], ds['substantiv'])
|
76
77
|
assert_equal([lx('mehr wort gruppe|s')], ds['mehr wort gruppe'])
|
77
78
|
assert_equal(nil, ds['nicht vorhanden'])
|
@@ -79,7 +80,7 @@ class TestLexicalHash < LingoTestCase
|
|
79
80
|
end
|
80
81
|
|
81
82
|
def test_keyvalue
|
82
|
-
ds =
|
83
|
+
ds = LH.new('sys-mul', @lingo)
|
83
84
|
assert_equal([lx('abelscher ring ohne nullteiler|m')], ds['abelscher ring ohne nullteiler'])
|
84
85
|
assert_equal(['*4'], ds['abelscher ring ohne'])
|
85
86
|
assert_equal([lx('alleinreisende frau|m')], ds['alleinreisend frau'])
|
@@ -89,7 +90,7 @@ class TestLexicalHash < LingoTestCase
|
|
89
90
|
end
|
90
91
|
|
91
92
|
def test_wordclass
|
92
|
-
ds =
|
93
|
+
ds = LH.new('sys-dic', @lingo)
|
93
94
|
assert_equal([lx('a-dur|s')], ds['a-dur'])
|
94
95
|
assert_equal([lx('aalen|v'), lx('aalen|e')], ds['aalen'])
|
95
96
|
assert_equal([lx('abarbeitend|a')], ds['abarbeitend'])
|
@@ -97,7 +98,7 @@ class TestLexicalHash < LingoTestCase
|
|
97
98
|
end
|
98
99
|
|
99
100
|
def test_case
|
100
|
-
ds =
|
101
|
+
ds = LH.new('sys-dic', @lingo)
|
101
102
|
assert_equal([lx('abänderung|s')], ds['abänderung'])
|
102
103
|
assert_equal([lx('abänderung|s')], ds['Abänderung'])
|
103
104
|
assert_equal([lx('abänderung|s')], ds['ABÄNDERUNG'])
|
@@ -105,9 +106,9 @@ class TestLexicalHash < LingoTestCase
|
|
105
106
|
end
|
106
107
|
|
107
108
|
def test_multivalue
|
108
|
-
ds =
|
109
|
-
|
110
|
-
|
109
|
+
ds = LH.new('sys-syn', @lingo)
|
110
|
+
assert_equal([lx('abbau <chemie>|y'), lx('chemische abbaureaktion|y'), lx('chemischer abbau|y'), lx('photochemischer abbau|y')], ds['abbaureaktion'])
|
111
|
+
assert_equal([lx('dependenz|y'), lx('unselbstständigkeit|y'), lx('unselbständigkeit|y')], ds['abhängigkeit'])
|
111
112
|
ds.close
|
112
113
|
end
|
113
114
|
|
@@ -115,21 +116,21 @@ end
|
|
115
116
|
|
116
117
|
class TestDictionary < LingoTestCase
|
117
118
|
|
119
|
+
LD = Lingo::Language::Dictionary
|
120
|
+
|
118
121
|
def setup
|
119
122
|
@lingo = Lingo.new
|
120
123
|
end
|
121
124
|
|
122
125
|
def test_params
|
123
126
|
# Keine Sprach-Konfiguration angegeben
|
124
|
-
|
125
|
-
# Keine Parameter angegeben
|
126
|
-
assert_raise(RuntimeError) { Lingo::Dictionary.new(nil, @lingo) }
|
127
|
+
#assert_raise(RuntimeError) { LD.new({'source'=>['sys-dic']}, @lingo) }
|
127
128
|
# Falsche Parameter angegeben (Pflichtparameter ohne Defaultwert)
|
128
|
-
assert_raise(
|
129
|
+
assert_raise(ArgumentError) { LD.new({'course'=>['sys-dic']}, @lingo) }
|
129
130
|
end
|
130
131
|
|
131
132
|
def test_cache
|
132
|
-
dic =
|
133
|
+
dic = LD.new({'source'=>['sys-dic']}, @lingo)
|
133
134
|
assert_equal([lx('nase|s')], dic.select('nase'))
|
134
135
|
assert_equal([lx('nase|s')], dic.select('nase'))
|
135
136
|
assert_equal([lx('nase|s')], dic.select('nase'))
|
@@ -137,7 +138,7 @@ class TestDictionary < LingoTestCase
|
|
137
138
|
end
|
138
139
|
|
139
140
|
def test_report
|
140
|
-
dic =
|
141
|
+
dic = LD.new({'source'=>['sys-dic']}, @lingo)
|
141
142
|
dic.select('abwickeln') # source read
|
142
143
|
dic.select('abwickeln') # cache hit
|
143
144
|
dic.select('regen') # source read
|
@@ -155,7 +156,7 @@ class TestDictionary < LingoTestCase
|
|
155
156
|
end
|
156
157
|
|
157
158
|
def test_select_one_source
|
158
|
-
dic =
|
159
|
+
dic = LD.new({'source'=>['sys-dic']}, @lingo)
|
159
160
|
assert_equal([lx('nase|s')], dic.select('nase'))
|
160
161
|
assert_equal([lx('nase|s')], dic.select('NASE'))
|
161
162
|
assert_equal([], dic.select('hasennasen'))
|
@@ -163,7 +164,7 @@ class TestDictionary < LingoTestCase
|
|
163
164
|
end
|
164
165
|
|
165
166
|
def test_select_two_sources_mode_first
|
166
|
-
dic =
|
167
|
+
dic = LD.new({'source'=>['sys-dic', 'tst-dic'], 'mode'=>'first'}, @lingo)
|
167
168
|
# in keiner Quelle vorhanden
|
168
169
|
assert_equal([], dic.select('hasennasen'))
|
169
170
|
# nur in erster Quelle vorhanden
|
@@ -176,7 +177,7 @@ class TestDictionary < LingoTestCase
|
|
176
177
|
end
|
177
178
|
|
178
179
|
def test_select_two_sources_mode_first_flipped
|
179
|
-
dic =
|
180
|
+
dic = LD.new({'source'=>['tst-dic','sys-dic'], 'mode'=>'first'}, @lingo)
|
180
181
|
# in keiner Quelle vorhanden
|
181
182
|
assert_equal([], dic.select('hasennasen'))
|
182
183
|
# nur in erster Quelle vorhanden
|
@@ -189,7 +190,7 @@ class TestDictionary < LingoTestCase
|
|
189
190
|
end
|
190
191
|
|
191
192
|
def test_select_two_sources_mode_all
|
192
|
-
dic =
|
193
|
+
dic = LD.new({'source'=>['sys-dic','tst-dic'], 'mode'=>'all'}, @lingo)
|
193
194
|
# in keiner Quelle vorhanden
|
194
195
|
assert_equal([], dic.select('hasennasen'))
|
195
196
|
# nur in erster Quelle vorhanden
|
@@ -203,7 +204,7 @@ class TestDictionary < LingoTestCase
|
|
203
204
|
end
|
204
205
|
|
205
206
|
def test_select_two_sources_mode_default
|
206
|
-
dic =
|
207
|
+
dic = LD.new({'source'=>['sys-dic','tst-dic']}, @lingo)
|
207
208
|
# in keiner Quelle vorhanden
|
208
209
|
assert_equal([], dic.select('hasennasen'))
|
209
210
|
# nur in erster Quelle vorhanden
|
@@ -217,7 +218,7 @@ class TestDictionary < LingoTestCase
|
|
217
218
|
end
|
218
219
|
|
219
220
|
def test_suffix_lexicals
|
220
|
-
dic =
|
221
|
+
dic = LD.new({'source'=>['sys-dic']}, @lingo)
|
221
222
|
assert_equal([lx('mau|s'), lx('mauer|s')], dic.suffix_lexicals('mauern'))
|
222
223
|
assert_equal([lx('hasen|s'), lx('hasen|v'), lx('hasen|e')], dic.suffix_lexicals('hasens'))
|
223
224
|
assert_equal([lx('schönst|s'), lx('schön|a'), lx('schönst|a')], dic.suffix_lexicals('schönster'))
|
@@ -226,13 +227,13 @@ class TestDictionary < LingoTestCase
|
|
226
227
|
end
|
227
228
|
|
228
229
|
def test_infix_lexicals
|
229
|
-
dic =
|
230
|
+
dic = LD.new({'source'=>['sys-dic']}, @lingo)
|
230
231
|
assert_equal( [lx('information|s'), lx('information|v'), lx('information|e')], dic.suffix_lexicals('informations'))
|
231
232
|
dic.close
|
232
233
|
end
|
233
234
|
|
234
235
|
def test_select_with_suffix
|
235
|
-
dic =
|
236
|
+
dic = LD.new({'source'=>['sys-dic']}, @lingo)
|
236
237
|
assert_equal([lx('mauern|v')], dic.select_with_suffix('mauern'))
|
237
238
|
assert_equal([lx('hase|s')], dic.select_with_suffix('hasen'))
|
238
239
|
assert_equal([lx('schön|a')], dic.select_with_suffix('schönster'))
|
@@ -241,13 +242,13 @@ class TestDictionary < LingoTestCase
|
|
241
242
|
end
|
242
243
|
|
243
244
|
def test_select_with_infix
|
244
|
-
dic =
|
245
|
+
dic = LD.new({'source'=>['sys-dic']}, @lingo)
|
245
246
|
assert_equal( [lx('information|s'), lx('information|v'), lx('information|e')], dic.suffix_lexicals('informations'))
|
246
247
|
dic.close
|
247
248
|
end
|
248
249
|
|
249
250
|
def test_find_word
|
250
|
-
dic =
|
251
|
+
dic = LD.new({'source'=>['sys-dic']}, @lingo)
|
251
252
|
assert_equal(wd('hasennasen|?'), dic.find_word('hasennasen'))
|
252
253
|
assert_equal(wd('hase|IDF', 'hase|s'), dic.find_word('hase'))
|
253
254
|
assert_equal(wd('haseses|IDF', 'hase|s'), dic.find_word('haseses'))
|
@@ -258,6 +259,8 @@ end
|
|
258
259
|
|
259
260
|
class TestGrammar < LingoTestCase
|
260
261
|
|
262
|
+
LG = Lingo::Language::Grammar
|
263
|
+
|
261
264
|
def setup
|
262
265
|
@lingo = Lingo.new
|
263
266
|
end
|
@@ -267,7 +270,7 @@ class TestGrammar < LingoTestCase
|
|
267
270
|
end
|
268
271
|
|
269
272
|
def test_cache
|
270
|
-
gra =
|
273
|
+
gra = LG.new({'source'=>['sys-dic']}, @lingo)
|
271
274
|
assert_equal(
|
272
275
|
wd('informationswissenschaften|KOM', 'informationswissenschaft|k', 'information|s+', 'wissenschaft|s+'),
|
273
276
|
gra.find_compositum('informationswissenschaften')
|
@@ -283,79 +286,126 @@ class TestGrammar < LingoTestCase
|
|
283
286
|
gra.close
|
284
287
|
end
|
285
288
|
|
286
|
-
def
|
287
|
-
gra =
|
289
|
+
def test_test_compositum
|
290
|
+
gra = LG.new({'source'=>['sys-dic']}, @lingo)
|
291
|
+
|
288
292
|
# hinterer Teil ist ein Wort mit Suffix
|
289
|
-
assert_equal([
|
293
|
+
assert_equal([
|
294
|
+
[lx('hasenbraten|k'), lx('hase|s'), lx('braten|v')],
|
295
|
+
[5, 6],
|
296
|
+
'sv'
|
297
|
+
],
|
290
298
|
gra.test_compositum('hasen', '', 'braten', 1, false)
|
291
299
|
)
|
300
|
+
|
292
301
|
# hinterer Teil ist ein Wort mit Infix ohne Schwanz
|
293
|
-
assert_equal([
|
302
|
+
assert_equal([
|
303
|
+
[lx('nasenlaufen|k'), lx('nase|s'), lx('laufen|v')],
|
304
|
+
[5, 7],
|
305
|
+
'sv'
|
306
|
+
],
|
294
307
|
gra.test_compositum('nasen', '', 'laufens', 1, false)
|
295
308
|
)
|
309
|
+
|
296
310
|
# hinterer Teil ist ein Wort mit Infix mit Schwanz
|
297
|
-
assert_equal([
|
311
|
+
assert_equal([
|
312
|
+
[lx('nasenlaufens|k'), lx('nase|s'), lx('laufen|v')],
|
313
|
+
[5, 7],
|
314
|
+
'sv'
|
315
|
+
],
|
298
316
|
gra.test_compositum('nasen', '', 'laufens', 1, true)
|
299
317
|
)
|
318
|
+
|
300
319
|
# hinterer Teil ist ein Kompositum nach Bindestrich
|
301
|
-
assert_equal([
|
320
|
+
assert_equal([
|
321
|
+
[lx('arrafat-nachfolgebedarf|k'), lx('bedarf|s'), lx('nachfolge|s'), lx('arrafat|x')],
|
322
|
+
[7, 9, 6],
|
323
|
+
'xss'
|
324
|
+
],
|
302
325
|
gra.test_compositum('arrafat', '-', 'nachfolgebedarf', 1, false)
|
303
326
|
)
|
327
|
+
|
304
328
|
# hinterer Teil ist ein TakeItAsIs nach Bindestrich
|
305
|
-
assert_equal([
|
329
|
+
assert_equal([
|
330
|
+
[lx('nachfolge-arrafat|k'), lx('nachfolge|s'), lx('arrafat|x')],
|
331
|
+
[9, 7],
|
332
|
+
'sx'
|
333
|
+
],
|
306
334
|
gra.test_compositum('nachfolge', '-', 'arrafat', 1, false)
|
307
335
|
)
|
336
|
+
|
308
337
|
# vorderer Teil ist ein Wort mit Suffix => siehe Hasenbraten
|
309
338
|
# vorderer Teil ist ein Kompositum
|
310
|
-
assert_equal([
|
339
|
+
assert_equal([
|
340
|
+
[lx('morgenonkelmantel|k'), lx('mantel|s'), lx('morgen|s'), lx('onkel|s'), lx('morgen|w')],
|
341
|
+
[6, 5, 6],
|
342
|
+
'sss'
|
343
|
+
],
|
311
344
|
gra.test_compositum('morgenonkel', '', 'mantel', 1, false)
|
312
345
|
)
|
346
|
+
|
313
347
|
# vorderer Teil ist ein TakeItAsIs vor Bindestrich
|
314
|
-
assert_equal([
|
348
|
+
assert_equal([
|
349
|
+
[lx('arrafat-nachfolger|k'), lx('nachfolger|s'), lx('arrafat|x')],
|
350
|
+
[7, 10],
|
351
|
+
'xs'
|
352
|
+
],
|
315
353
|
gra.test_compositum('arrafat', '-', 'nachfolger', 1, false)
|
316
354
|
)
|
355
|
+
|
317
356
|
gra.close
|
318
357
|
end
|
319
358
|
|
320
|
-
def
|
321
|
-
gra =
|
359
|
+
def test_permute_compositum
|
360
|
+
gra = LG.new({'source'=>['sys-dic']}, @lingo)
|
361
|
+
|
322
362
|
# bindestrichversion
|
323
|
-
assert_equal([
|
363
|
+
assert_equal([
|
364
|
+
[lx('arrafat-nachfolger|k'), lx('nachfolger|s'), lx('arrafat|x')],
|
365
|
+
[7, 10],
|
366
|
+
'xs'
|
367
|
+
],
|
324
368
|
gra.permute_compositum('arrafat-nachfolger', 1, false)
|
325
369
|
)
|
370
|
+
|
326
371
|
# bindestrichversion zwei-teilig
|
327
|
-
assert_equal([
|
328
|
-
[
|
329
|
-
|
330
|
-
|
331
|
-
|
372
|
+
assert_equal([
|
373
|
+
[lx('cd-rom-technologie|k'), lx('cd-rom|s'), lx('technologie|s')],
|
374
|
+
[6, 11],
|
375
|
+
'ss'
|
376
|
+
],
|
377
|
+
gra.permute_compositum('cd-rom-technologie', 1, false)
|
332
378
|
)
|
379
|
+
|
333
380
|
# bindestrichversion drei-teilig
|
334
|
-
assert_equal([
|
335
|
-
[
|
336
|
-
|
337
|
-
|
338
|
-
|
339
|
-
gra.permute_compositum('albert-ludwigs-universität', 1, false)
|
381
|
+
assert_equal([
|
382
|
+
[lx('albert-ludwigs-universität|k'), lx('universität|s'), lx('albert|e'), lx('ludwig|e')],
|
383
|
+
[6, 7, 11],
|
384
|
+
'ees'
|
385
|
+
],
|
386
|
+
gra.permute_compositum('albert-ludwigs-universität', 1, false)
|
340
387
|
)
|
388
|
+
|
341
389
|
# normal mit suggestion
|
342
|
-
assert_equal([
|
343
|
-
[
|
344
|
-
|
345
|
-
|
346
|
-
|
390
|
+
assert_equal([
|
391
|
+
[lx('benutzerforschung|k'), lx('erforschung|s'), lx('benutzen|v')],
|
392
|
+
[6, 11],
|
393
|
+
'vs'
|
394
|
+
],
|
395
|
+
gra.permute_compositum('benutzerforschung', 1, false)
|
347
396
|
)
|
397
|
+
|
348
398
|
gra.close
|
349
399
|
end
|
350
400
|
|
351
401
|
def test_find_compositum
|
352
|
-
gra =
|
402
|
+
gra = LG.new({'source'=>['sys-dic']}, @lingo)
|
353
403
|
assert_equal(
|
354
404
|
wd('informationswissenschaften|KOM', 'informationswissenschaft|k', 'information|s+', 'wissenschaft|s+'),
|
355
|
-
gra.find_compositum('informationswissenschaften')
|
405
|
+
gra.find_compositum('informationswissenschaften')
|
356
406
|
)
|
357
407
|
assert_equal(
|
358
|
-
wd('cd-rom-technologie|KOM', 'cd-rom-technologie|k', '
|
408
|
+
wd('cd-rom-technologie|KOM', 'cd-rom-technologie|k', 'cd-rom|s+', 'technologie|s+'),
|
359
409
|
gra.find_compositum('cd-rom-technologie')
|
360
410
|
)
|
361
411
|
assert_equal(
|
@@ -378,18 +428,18 @@ class TestGrammar < LingoTestCase
|
|
378
428
|
end
|
379
429
|
|
380
430
|
def test_min_word_size
|
381
|
-
gra =
|
431
|
+
gra = LG.new({'source'=>['sys-dic']}, @lingo)
|
382
432
|
assert_equal( wd('undsund|?'), gra.find_compositum('undsund'))
|
383
433
|
gra.close
|
384
434
|
end
|
385
435
|
|
386
436
|
def test_max_parts
|
387
|
-
gra =
|
437
|
+
gra = LG.new({'source'=>['sys-dic']}, @lingo)
|
388
438
|
assert_equal(
|
389
439
|
wd('baumsbaumsbaum|KOM', 'baumsbaumsbaum|k', 'baum|s+'),
|
390
440
|
gra.find_compositum('baumsbaumsbaum')
|
391
441
|
)
|
392
|
-
assert_equal(
|
442
|
+
assert_equal(Lingo::Language::Word.new('baumsbaumsbaumsbaumsbaumsbaum', Lingo::Language::WA_UNKNOWN), gra.find_compositum('baumsbaumsbaumsbaumsbaumsbaum'))
|
393
443
|
gra.close
|
394
444
|
end
|
395
445
|
|