lingo 1.8.0 → 1.8.1
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- data/ChangeLog +13 -0
- data/README +49 -29
- data/Rakefile +28 -4
- data/TODO +2 -9
- data/bin/lingo +24 -0
- data/bin/lingoctl +24 -0
- data/de/lingo-dic.txt +559 -74
- data/info/gpl-hdr.txt +21 -24
- data/lib/lingo.rb +83 -112
- data/lib/lingo/agenda_item.rb +53 -0
- data/lib/lingo/attendee.rb +261 -0
- data/lib/lingo/attendee/abbreviator.rb +95 -97
- data/lib/lingo/attendee/debugger.rb +94 -93
- data/lib/lingo/attendee/decomposer.rb +76 -83
- data/lib/lingo/attendee/dehyphenizer.rb +141 -144
- data/lib/lingo/attendee/formatter.rb +65 -0
- data/lib/lingo/attendee/multi_worder.rb +302 -0
- data/lib/lingo/attendee/noneword_filter.rb +89 -84
- data/lib/lingo/attendee/object_filter.rb +91 -0
- data/lib/lingo/attendee/sequencer.rb +159 -158
- data/lib/lingo/attendee/synonymer.rb +81 -84
- data/lib/lingo/attendee/text_reader.rb +242 -0
- data/lib/lingo/attendee/text_writer.rb +169 -0
- data/lib/lingo/attendee/tokenizer.rb +192 -191
- data/lib/lingo/attendee/variator.rb +152 -156
- data/lib/lingo/attendee/vector_filter.rb +140 -135
- data/lib/lingo/attendee/word_searcher.rb +98 -0
- data/lib/lingo/buffered_attendee.rb +69 -0
- data/lib/lingo/cachable.rb +58 -0
- data/lib/lingo/call.rb +72 -0
- data/lib/lingo/cli.rb +26 -0
- data/lib/lingo/config.rb +23 -26
- data/lib/lingo/core_ext.rb +42 -0
- data/lib/lingo/ctl.rb +239 -173
- data/lib/lingo/database.rb +148 -496
- data/lib/lingo/database/crypter.rb +85 -0
- data/lib/lingo/database/gdbm_store.rb +49 -0
- data/lib/lingo/database/hash_store.rb +67 -0
- data/lib/lingo/database/libcdb_store.rb +58 -0
- data/lib/lingo/database/sdbm_store.rb +64 -0
- data/lib/lingo/database/show_progress.rb +81 -0
- data/lib/lingo/database/source.rb +134 -0
- data/lib/lingo/database/source/key_value.rb +62 -0
- data/lib/lingo/database/source/multi_key.rb +65 -0
- data/lib/lingo/database/source/multi_value.rb +65 -0
- data/lib/lingo/database/source/single_word.rb +60 -0
- data/lib/lingo/database/source/word_class.rb +64 -0
- data/lib/lingo/error.rb +122 -0
- data/lib/lingo/language.rb +78 -518
- data/lib/lingo/language/dictionary.rb +173 -0
- data/lib/lingo/language/grammar.rb +211 -0
- data/lib/lingo/language/lexical.rb +66 -0
- data/lib/lingo/language/lexical_hash.rb +88 -0
- data/lib/lingo/language/token.rb +48 -0
- data/lib/lingo/language/word.rb +130 -0
- data/lib/lingo/language/word_form.rb +83 -0
- data/lib/lingo/reportable.rb +59 -0
- data/lib/lingo/version.rb +1 -1
- data/lingo-all.cfg +14 -10
- data/lingo-call.cfg +5 -5
- data/lingo.cfg +14 -12
- data/lingo.rb +26 -0
- data/lir.cfg +13 -9
- data/spec/spec_helper.rb +1 -0
- data/test.cfg +11 -11
- data/test/attendee/ts_abbreviator.rb +0 -6
- data/test/attendee/ts_decomposer.rb +0 -6
- data/test/attendee/{ts_multiworder.rb → ts_multi_worder.rb} +1 -7
- data/test/attendee/ts_noneword_filter.rb +1 -7
- data/test/attendee/{ts_objectfilter.rb → ts_object_filter.rb} +1 -7
- data/test/attendee/ts_sequencer.rb +0 -6
- data/test/attendee/ts_synonymer.rb +0 -6
- data/test/attendee/{ts_textreader.rb → ts_text_reader.rb} +1 -7
- data/test/attendee/{ts_textwriter.rb → ts_text_writer.rb} +1 -7
- data/test/attendee/ts_tokenizer.rb +0 -6
- data/test/attendee/ts_variator.rb +0 -6
- data/test/attendee/ts_vector_filter.rb +1 -7
- data/test/attendee/{ts_wordsearcher.rb → ts_word_searcher.rb} +1 -7
- data/test/ref/artikel.non +2 -29
- data/test/ref/artikel.seq +13 -8
- data/test/ref/artikel.vec +30 -15
- data/test/ref/artikel.ven +29 -14
- data/test/ref/artikel.ver +58 -43
- data/test/ref/lir.csv +146 -145
- data/test/ref/lir.non +186 -210
- data/test/ref/lir.seq +54 -50
- data/test/test_helper.rb +41 -36
- data/test/ts_database.rb +12 -11
- data/test/ts_language.rb +118 -68
- metadata +67 -29
- data/lib/lingo/attendee/multiworder.rb +0 -301
- data/lib/lingo/attendee/objectfilter.rb +0 -86
- data/lib/lingo/attendee/textreader.rb +0 -237
- data/lib/lingo/attendee/textwriter.rb +0 -196
- data/lib/lingo/attendee/wordsearcher.rb +0 -96
- data/lib/lingo/attendees.rb +0 -289
- data/lib/lingo/const.rb +0 -131
- data/lib/lingo/modules.rb +0 -98
- data/lib/lingo/types.rb +0 -285
- data/lib/lingo/utilities.rb +0 -40
data/test/ref/lir.seq
CHANGED
|
@@ -12,7 +12,7 @@
|
|
|
12
12
|
00019*1 erschließung, inhaltlich 1 indexierung, syntaktisch
|
|
13
13
|
00021*1 selektion, automatisch
|
|
14
14
|
00022*1 indexiermuster, sachbezogen 1 rahmenregelung, methodisch
|
|
15
|
-
00024*1 darstellung, ausführlich 1 sektion, verschieden 1 wiedergebrauch, effektiv
|
|
15
|
+
00024*1 darstellung, ausführlich 1 rolle, besonders 1 sektion, verschieden 1 wiedergebrauch, effektiv
|
|
16
16
|
00025*1 indexierungssystem, alphabetisch
|
|
17
17
|
00028*1 indexierungsdaten, verbal 1 verarbeitung, maschinell
|
|
18
18
|
00029*1 basis, abstrakt linguistisch 1 basis, linguistisch 1 grundlage, allgemein 1 sachregister, alphabetisch
|
|
@@ -21,21 +21,21 @@
|
|
|
21
21
|
00033*1 religion, christlich
|
|
22
22
|
00034*1 beschreibung, kurz 1 indexierungssystem, verbal 1 sprache, skandinavisch
|
|
23
23
|
00036*1 ansatz, wichtig 1 indexierungsmodell, statistisch 1 termgewicht, vorgeschlagen
|
|
24
|
-
00038*1 arbeit, intellektuell 1 arbeit, überholt intellektuell 1 bibliothek, einig 1 buch, ganz 1 diskussion, merkwürdig 1 indexierung, breit 1 informationstechnologie, modern 1 informationstechnologie, wirklich modern 1
|
|
24
|
+
00038*1 arbeit, intellektuell 1 arbeit, überholt intellektuell 1 bibliothek, einig 1 buch, ganz 1 diskussion, merkwürdig 1 indexierung, breit 1 informationstechnologie, modern 1 informationstechnologie, wirklich modern 1 katalog, gedruckt 1 mangel, zunehmend 1 moderne, wirklich 1 sacherschließung, bibliothekarisch 1 schlagwort, eng 1 schlagwort, hilfreich 1 thema, indiziert 1 zeit, langsam
|
|
25
25
|
00039*2 thesaurus, allgemein 1 bibliografie, deutsch 1 bibliothek, deutsch 1 schlagwort, verwendet 1 verzeichnis, wöchentlich
|
|
26
26
|
00040*1 anmerkung, kritisch 1 erörterung, abschließend 1 indexierung, frei 1 indexierung, maschinell 1 indexierung, verbindlich 1 textsuche, frei
|
|
27
27
|
00041*1 indexierung, automatisch
|
|
28
28
|
00042*1 objekt, abstrakt
|
|
29
29
|
00043*1 bereich, international 1 bibliografie, laufend 1 möglichkeit, realisierbar 1 schwerpunkt, inhaltlich 1 thema, vernachlässigt
|
|
30
|
-
00044*2 kategorie, semantisch 1
|
|
31
|
-
00045*2 sachregister, alphabetisch 1 zugriff, besseren
|
|
30
|
+
00044*2 kategorie, semantisch 1 beachtung, besonders 1 beachtung, unter besonders 1 form, gut voraussagbar 1 form, voraussagbar 1 gut, genügend 1 kategorie, wichtig semantisch 1 prozess, zweistufig 1 text, machend 1 wiedergabetreue, ausreichend 1 zahl, klein
|
|
31
|
+
00045*2 sachregister, alphabetisch 1 begriff, hierarchisch hoch 1 begriff, hoch 1 begriff, spezifisch 1 zugriff, besseren
|
|
32
32
|
00046*1 grundlage, linguistisch 1 sacherschließungsmethode, verbal
|
|
33
|
-
00047*1 aktuell-synchronischen, unter weitgehend 1 aktuell-synchronischen, weitgehend 1 beschäftigung, praktisch 1 entwicklung, bisherig 1 entwicklung, historisch 1 identität, absolut 1 lösung, praktisch 1 platonismus, dreifach 1 textinhaltsgegebenheit, absolut 1 universalität, absolut identisch 1 universalität, identisch
|
|
33
|
+
00047*1 aktuell-synchronischen, unter weitgehend 1 aktuell-synchronischen, weitgehend 1 beschäftigung, praktisch 1 entwicklung, bisherig 1 entwicklung, historisch 1 identität, absolut 1 lösung, praktisch 1 platonismus, dreifach 1 statisch-strukturell, sehr 1 textinhaltsgegebenheit, absolut 1 universalität, absolut identisch 1 universalität, identisch
|
|
34
34
|
00048*1 beispiel, einig 1 fachgebiet, untersucht 1 kategorie, verschieden 1 schema, dargestellt 1 typ, verschieden 1 untersuchung, statistisch
|
|
35
35
|
00049*1 informationsprofil, individuell 1 informationssystem, betriebseigen
|
|
36
36
|
00052*2 indexierung, automatisch 1 anpassung, erheblich 1 berücksichtigung, unter 1 system, einfach 1 system, äußerst einfach 1 systemstrategie, jeweilig
|
|
37
37
|
00053*2 indexierungssystem, automatisch 1 arbeit, vorliegend 1 indexierungswörterbuch, groß 1 vokabular, vorgeschrieben
|
|
38
|
-
00054*1 folge, logisch 1 folge, natürlich logisch 1 indexierung, automatisch 1 indexierungsansatz, theoretisch 1 vektorraum-modell, klassisch
|
|
38
|
+
00054*1 anwendung, sinnvoll 1 folge, logisch 1 folge, natürlich logisch 1 indexierung, automatisch 1 indexierungsansatz, theoretisch 1 vektorraum-modell, klassisch
|
|
39
39
|
00055*2 indexierung, automatisch 1 beispiel, trivial 1 forschungsrichtung, weit 1 information-retrieval-system, ideal 1 richtung, aufgezeigt
|
|
40
40
|
00056*1 bedeutung, unerträglich
|
|
41
41
|
00057*1 grundlagenforschung, universitär 1 klassifikationssystem, existent 1 vorteil, weit
|
|
@@ -50,14 +50,15 @@
|
|
|
50
50
|
00071*1 dokumentationsverfahren, maschinell 1 dokumentationsverfahren, orientiert maschinell 1 grundlage, systematisch
|
|
51
51
|
00074*1 indexierung, automatisch
|
|
52
52
|
00075*1 indexierung, automatisch
|
|
53
|
-
00078*1
|
|
53
|
+
00078*1 rundfunk, saarländisch
|
|
54
54
|
00079*1 analyse, vergleichend 1 bezugseinheit, dokumentarisch 1 indexierung, intellektuell 1 literaturdatenbank, biomedizinisch 1 online-datenbank, biomedizinisch 1 zuteilung, maschinell 1 zuteilung, verfügbar maschinell
|
|
55
55
|
00080*1 klassifikation, automatisch thematisch 1 klassifikation, thematisch
|
|
56
56
|
00081*1 analyse, vergleichend 1 indexierung, automatisch
|
|
57
57
|
00082*2 register, gedruckt 1 kwoc-verfahren, modifiziert 1 steuerung, genau
|
|
58
58
|
00083*2 daten, unstrukturiert 1 automatich, weitgehend 1 bedienung, einfach 1 bedienung, möglich einfach 1 benutzer, einzeln 1 benutzerkreis, breit 1 dialogform, verschieden 1 nutzungsflexibilität, hoch 1 oberflächengestaltung, systematisch
|
|
59
|
-
|
|
60
|
-
|
|
59
|
+
00084*1 berücksichtigung, besonders 1 berücksichtigung, unter besonders
|
|
60
|
+
00086*1 beziehung, international 1 database, cooperativ online 1 database, online 1 retrieval, online 1 überlegung, ökonomisch
|
|
61
|
+
00088*1 begriff, komplex 1 ergebnis, brauchbar 1 fortsetzung, konsequent 1 indexierung, automatisch 1 indexierung, syntaktisch 1 satzanalyse, vollständig
|
|
61
62
|
00089*1 patentinformationssystem, deutsch
|
|
62
63
|
00090*1 sacherschließung, verbal 1 tagung, international
|
|
63
64
|
00092*1 erschließung, sachlich 1 indexierung, maschinell
|
|
@@ -86,16 +87,17 @@
|
|
|
86
87
|
00126*1 informationssystem, biografisch 1 informationssystem, international biografisch
|
|
87
88
|
00127*1 ausführung, folgend 1 software, betrachtet
|
|
88
89
|
00128*1 begriffssystem, verwendet 1 fachgebiet, dominierend 1 genauigkeitsrate, hoch 1 indexierung, maschinell 1 nummerierung, fortlaufend 1 variante, verschieden
|
|
89
|
-
00129*1 anregung, interessant 1 beziehung, syntaktisch 1 fachinformationssystem, modern 1 indexierung, syntaktisch 1 kennzeichnung, eindeutig 1 methode, entwickelt 1 ordnungselement, alphabetisch 1 verknüpfungsmittel, syntaktisch
|
|
90
|
+
00129*1 anregung, interessant 1 begriff, ordnend 1 beziehung, syntaktisch 1 fachinformationssystem, modern 1 indexierung, syntaktisch 1 kennzeichnung, eindeutig 1 methode, entwickelt 1 ordnungselement, alphabetisch 1 verknüpfungsmittel, syntaktisch
|
|
91
|
+
00132*1 erfordernis, berufsbedingt
|
|
90
92
|
00133*1 debatte, international 1 horizont, national 1 sacherschließung, verbal 1 verbreitung, zunehmend 1 übersetzung, gekürzt 1 übersetzung, leicht gekürzt
|
|
91
93
|
00134*1 analyse, semantisch 1 inhaltserschließung, maschinell 1 wort, komplex 1 wort, morphologisch komplex
|
|
92
94
|
00135*1 ausführung, vorliegend 1 bedeutung, zentral 1 einblick, kurz 1 maß, zunehmend 1 reputation, wissenschaftlich 1 tätigkeit, wissenschaftlich 1 zeitschriftentitel, jeweilig
|
|
93
|
-
00136*1 post, elektronisch
|
|
95
|
+
00136*1 post, elektronisch 1 post, weltweit elektronisch
|
|
94
96
|
00137*2 inhalt, neu 1 anpassung, gegenseitig 1 datenbank, vorhanden 1 datenformat, verwendet 1 patentklassifikation, strukturiert 1 änderung, aktuell
|
|
95
|
-
00138*1 abbild, zutreffend 1 einrichtung, wissenschaftlich 1
|
|
97
|
+
00138*1 abbild, zutreffend 1 einrichtung, wissenschaftlich 1 einwandfrei, methodisch 1 fachdatenbank, elektronisch 1 information, gespeichert 1 rangliste, erstellt
|
|
96
98
|
00140*1 bibliothek, deutsch 1 bibliotheksinstitut, deutsch 1 form, operational
|
|
97
99
|
00141*1 bibliothek, öffentlich 1 erschließungstechnik, neu
|
|
98
|
-
00142*1 arbeit, folgend 1 information, ausreichend 1 vergleichsuntersuchung, entsprechend 1 wissenschaftlergruppe, bestimmt
|
|
100
|
+
00142*1 arbeit, folgend 1 forschungspolitisch, sinnvoll 1 information, ausreichend 1 vergleichsuntersuchung, entsprechend 1 wissenschaftlergruppe, bestimmt
|
|
99
101
|
00143*1 untersuchung, vergleichend
|
|
100
102
|
00144*1 inhaltserschließung, automatisch
|
|
101
103
|
00145*1 indexierung, automatisch
|
|
@@ -104,8 +106,9 @@
|
|
|
104
106
|
00148*1 information, human
|
|
105
107
|
00149*1 indexierung, automatisch
|
|
106
108
|
00150*1 datei, elektronisch 1 post, rheinisch
|
|
109
|
+
00153*1 expertensystem, groß
|
|
107
110
|
00154*1 dokumentation, inhaltlich 1 indexierung, kontrolliert 1 komfort, erreicht 1 schnittgenau, gar
|
|
108
|
-
00155*1 ausgabe, gedruckt 1 information, gewünscht 1 inhaltserschließung, gut 1 prüfung, kritisch 1 speicherkapazität, groß 1 zürcher, neu
|
|
111
|
+
00155*1 ausgabe, gedruckt 1 information, gewünscht 1 inhaltserschließung, gut 1 maß, besonders 1 prüfung, kritisch 1 speicherkapazität, groß 1 zugriff, zielgenau 1 zürcher, neu
|
|
109
112
|
00156*1 grundlage, linguistisch
|
|
110
113
|
00158*1 indexierung, automatisch
|
|
111
114
|
00159*1 indexierung, automatisch 1 inhaltserschließung, bibliothekarisch
|
|
@@ -113,25 +116,26 @@
|
|
|
113
116
|
00162*1 bibliothekskatalog, groß
|
|
114
117
|
00163*1 aspekt, qualitativ 1 sacherschließung, verbal
|
|
115
118
|
00164*1 dokument, relevant 1 informationsmenge, riesig 1 internet, chaotisch organisiert 1 internet, organisiert 1 monat, vergangen 1 nutzung, effektiv 1 online-medium, populär 1 problem, schwerwiegend 1 suchwerkzeug, genannt
|
|
116
|
-
00165*1 analyse, statistisch 1 analyse, umfangreich 1 faszination, stark 1 forschungsgeld, fließend 1 forschungsgeld, knapp fließend 1 gutachter-system, überfordert 1 interpretation, sorgfältig 1 selektionskriterium, geeignet 1 spezialist, wenig
|
|
117
|
-
00166*1 aussage, wichtig 1 indexsprache, kategorisiert 1 mangel, bedingt 1 ordnung, hoch 1 regel, einfach 1 satz, letzte 1 struktur, linear 1 überblick, besseren
|
|
118
|
-
|
|
119
|
+
00165*1 analyse, statistisch 1 analyse, umfangreich 1 anwendung, sinnvoll 1 faszination, stark 1 forschungsgeld, fließend 1 forschungsgeld, knapp fließend 1 gutachter-system, überfordert 1 interpretation, sorgfältig 1 selektionskriterium, geeignet 1 spezialist, wenig
|
|
120
|
+
00166*1 aussage, wichtig 1 begriff, gesucht 1 begriff, syntaktisch verknüpft 1 begriff, verknüpft 1 begriff, zusammengehörend 1 indexsprache, kategorisiert 1 mangel, bedingt 1 ordnung, hoch 1 regel, einfach 1 satz, letzte 1 struktur, linear 1 überblick, besseren
|
|
121
|
+
00170*1 informationsvermittlung, sinnvoll
|
|
122
|
+
00171*1 begriff, neu 1 marketingstratege, kreativ 1 marketingstratege, unermüdlich kreativ
|
|
119
123
|
00173*1 bildschirmschoner, global 1 toilette, öffentlich 1 webpage, seltsam
|
|
120
|
-
00174*3 datenbank, bibliografisch 3 oberfläche, visuell 1 soll, folgend 1 studie, früh
|
|
121
|
-
00176*1 bibliothek, wissenschaftlich 1 form, kurz 1 information, technisch 1
|
|
124
|
+
00174*3 datenbank, bibliografisch 3 oberfläche, visuell 1 retrieval, traditionell 1 soll, folgend 1 studie, früh
|
|
125
|
+
00176*1 bibliothek, wissenschaftlich 1 form, kurz 1 information, technisch 1 maßnahme, wesentlich 1 maßnahme, zugeordnet wesentlich 1 nutzung, verstärkt 1 selbstverwaltung, wissenschaftlich 1 struktur, wesentlich 1 ziel, langfristig 1 ziel, wesentlich 1 zugang, effizient
|
|
122
126
|
00177*1 arbeitsgang, sonstig 1 datenbank, verbunden 1 datenbanksystem, gesamt 1 datenbanksystem, umfassend 1 dokumenttyp, alle verschieden 1 dokumenttyp, verschieden 1 mediendatenbank, umfassend 1 textdokument, alle 1 zusammenstellung, elektronisch
|
|
123
127
|
00178*1 bild, digital
|
|
124
128
|
00181*1 eitelkeit, gelehrt
|
|
125
129
|
00182*1 kinderbibliothek, gerade 1 medienerlebnis, kreativ 1 medium, neu 1 technologie, neu 1 welt, real 1 zugang, neu
|
|
126
130
|
00183*1 enzyklopädie, interaktiv 1 kulturfahrplan, groß
|
|
127
|
-
00185*1 indexierung, automatisch 1 indexierung, intellektuell 1 indexierungsverfahren, automatisch 1 klassifikation, automatisch 1 klärung, terminologisch 1 kooperation, eng
|
|
131
|
+
00185*1 begriff, weit 1 indexierung, automatisch 1 indexierung, intellektuell 1 indexierungsverfahren, automatisch 1 klassifikation, automatisch 1 klärung, terminologisch 1 kooperation, eng
|
|
128
132
|
00186*2 indexierung, automatisch 2 klassifikation, automatisch 1 dokument, klassifiziert 1 dokumentklassifikation, automatisch 1 einführung, kurz 1 relation, statistisch 1 thema, folgend
|
|
129
133
|
00187*1 arbeitsgruppe, bibliothekarisch
|
|
130
134
|
00191*1 erschließung, automatisch 1 klassifikation, hierarchisch 1 klassifikation, thematisch hierarchisch 1 ordnungsstruktur, gewonnen 1 text, wiedergewonnen 1 textklassifikation, automatisch thematisch 1 textklassifikation, thematisch 1 wichtigkeitsstufe, entstanden
|
|
131
135
|
00192*2 indexierung, automatisch 1 datenbank, groß 1 facettenklassifikation, universal 1 fachwort, wichtig 1 indexierung, unter automatisch 1 klassifikationssystem, vorgegeben 1 sprache, deutsch 1 titel, beliebig 1 veröffentlichung, wissenschaftlich
|
|
132
136
|
00193*1 abfragbar, online 1 indexierung, numerisch 1 zugang, schnell
|
|
133
|
-
00194*1 indexierung, intellektuell 1 methode, neu 1 system, britisch
|
|
134
|
-
00195*1 indexierung, intellektuell 1 methode, neu 1 system, britisch
|
|
137
|
+
00194*1 berücksichtigung, besonders 1 berücksichtigung, unter besonders 1 indexierung, intellektuell 1 methode, neu 1 system, britisch
|
|
138
|
+
00195*1 berücksichtigung, besonders 1 berücksichtigung, unter besonders 1 indexierung, intellektuell 1 methode, neu 1 system, britisch
|
|
135
139
|
00197*1 arbeit, beruflich 1 beziehung, bestimmt 1 einheit, thematisch 1 inhalt, kommuniziert 1 kern, eigen 1 kerngebiet, komplex 1 potential, technisch 1 veränderung, technisch
|
|
136
140
|
00198*1 inhaltserschließung, automatisch
|
|
137
141
|
00199*1 anwendung, unter 1 moderne, befindlich 1 standardsystem, herkömmlich
|
|
@@ -139,13 +143,13 @@
|
|
|
139
143
|
00201*1 bibliothek, wissenschaftlich 1 bibliothekskongress, deutsch
|
|
140
144
|
00204*1 konferenz, international
|
|
141
145
|
00205*1 bibliothek, deutsch
|
|
142
|
-
00206*1 forschungsgemeinschaft, deutsch 1 indexierung, automatisch 1 inhaltserschließung, automatisch 1 projekt, durchgeführt 1 sacherschließung, bibliothekarisch 1 sacherschließung, konventionell bibliothekarisch
|
|
143
|
-
00207*2 stellung, systematisch 1 bezeichnung, taxonomisch 1 eingabe, unter 1 erreger, dazugehörig 1 hilfe, unterstützt 1 indexdatei, vorgegeben 1 nachschlagewerk, verschieden 1 name, wissenschaftlich 1 objekt, biologisch 1 rationalisierung, weit 1 weise, gleich
|
|
146
|
+
00206*1 forschungsgemeinschaft, deutsch 1 indexierung, automatisch 1 inhaltserschließung, automatisch 1 projekt, durchgeführt 1 sacherschließung, bibliothekarisch 1 sacherschließung, konventionell bibliothekarisch 1 verbindung, sinnvoll
|
|
147
|
+
00207*2 stellung, systematisch 1 begriff, verändert 1 bezeichnung, taxonomisch 1 eingabe, unter 1 erreger, dazugehörig 1 hilfe, unterstützt 1 indexdatei, vorgegeben 1 nachschlagewerk, verschieden 1 name, wissenschaftlich 1 objekt, biologisch 1 rationalisierung, weit 1 weise, gleich
|
|
144
148
|
00208*1 anpassung, strukturell 1 bereich, folgend 1 katalog, elektronisch 1 problem, allgemein 1 umfang, erreicht 1 vokabular, universal 1 überarbeitung, grundsätzlich
|
|
145
149
|
00209*2 umfeldsuche, semantisch 1 ergebnis, unbefriedigend 1 indexierung, maschinell 1 katalog, konventionell 1 online-katalog, bibliothekarisch 1 suche, sachlich 1 umfeld, semantisch 1 vokabular, strukturiert
|
|
146
150
|
00210*1 bild, entsprechend 1 möglichkeit, technisch 1 speicher, effektiv 1 suchanfragen, formuliert 1 system, verschieden 1 voraussetzung, alle
|
|
147
151
|
00211*1 fachinformation, sozialwissenschaftlich
|
|
148
|
-
00212*2 informationssuche, effizient 1 kostenfaktor, verschieden 1 multimedia-dokumentkollektion, verteilt 1 multimedial, verteilt 1
|
|
152
|
+
00212*2 informationssuche, effizient 1 kostenfaktor, verschieden 1 multimedia-dokumentkollektion, verteilt 1 multimedial, verteilt 1 rangliste, final 1 rangliste, individuell 1 skalierbar, beliebig 1 typ, beliebig
|
|
149
153
|
00213*1 beitrag, vorliegend 1 beziehung, derartig 1 indexierung, automatisch 1 indexierungssystem, automatisch 1 interesse, groß 1 relation, erfasst 1 schätzverfahren, verschieden 1 schätzverfahren, vorgeschlagen
|
|
150
154
|
00214*1 indexierung, automatisch
|
|
151
155
|
00215*1 indexierungsfunktion, logistisch
|
|
@@ -155,7 +159,7 @@
|
|
|
155
159
|
00219*1 praxis, neu
|
|
156
160
|
00221*1 bibliotheksindex, allgemein 1 system, national
|
|
157
161
|
00222*1 indexierung, syntaktisch
|
|
158
|
-
00223*1 nachricht, aktuell
|
|
162
|
+
00223*1 informationsquelle, groß 1 nachricht, aktuell
|
|
159
163
|
00225*1 deutsche, professionell 1 seite, deutsch 1 seite, professionell deutsch 1 spur, grün 1 umwelt-angebot, unzählig
|
|
160
164
|
00227*1 datenbank, verschieden 1 datenmenge, gespeichert 1 erkenntnis, allgemein
|
|
161
165
|
00228*1 studie, neu
|
|
@@ -165,7 +169,7 @@
|
|
|
165
169
|
00232*2 bibliothek, deutsch 1 dienst, zentral 1 dokumentationssprache, adäquat 1 gleichordnend, augenblicklich 1 indexierungsverfahren, britisch 1 jahr, einig 1 linguistik, modern 1 sacherschließung, verbal 1 sprache, natürlich 1 stande, alternativ 1 version, britisch 1 version, verkürzt
|
|
166
170
|
00233*1 einsatz, praktisch 1 halbautomatisch, arbeitet 1 heuristik, linguistisch 1 information, gewonnen 1 verantwortung, gesellschaftlich
|
|
167
171
|
00234*2 patentklassifikation, international 1 auflage, letzte 1 einteilungssystem, ganz 1 information, erfasst 1 klassifikationssymbol, obligatorisch 1 neuerung, gravierend 1 sachgebieten, bestimmt 1 sachverhalt, technisch 1 stelle, passend
|
|
168
|
-
00236*2 patentinformationssystem, deutsch 1 ansatz, allgemein 1 informationswissenschaft, linguistisch 1 patentamt, deutsch
|
|
172
|
+
00236*2 patentinformationssystem, deutsch 1 ansatz, allgemein 1 informationswissenschaft, linguistisch 1 patentamt, deutsch 1 retrievaltest, extensiv
|
|
169
173
|
00237*1 dezimalklassifikation, dreisprachig universal 1 dezimalklassifikation, universal 1 erschließung, intellektuell 1 informationsressource, relevant 1 informationsressource, wissenschaftlich relevant 1 internetressource, gesammelt 1 server, relevant 1 server, wissenschaftlich relevant
|
|
170
174
|
00238*1 informationsressource, relevant 1 informationsressource, wissenschaftlich relevant
|
|
171
175
|
00239*1 archivsystem, optisch 1 bedingung, alle 1 datenbank, international 1 informationsflut, anwachsend 1 informationsflut, stetig anwachsend 1 umfeld, technisch
|
|
@@ -176,7 +180,7 @@
|
|
|
176
180
|
00244*1 indexierung, automatisch
|
|
177
181
|
00246*1 indexierung, manuell
|
|
178
182
|
00247*1 artikel, zitierend 1 datenbank, einzig 1 einrichtung, allem 1 entwicklungsstand, derzeitig 1 forschungseinrichtung, groß 1 fußnote, gemeinsam 1 information, wissenschaftlich 1 literatur, zitiert 1 produkt, parallel 1 wissenschaftsfächer, mehrere 1 zitationsdatenbank, groß
|
|
179
|
-
00248*1 arbeit, praktisch 1 einsatz, praktisch 1 erfahrung, intensiv praktisch 1 erfahrung, praktisch 1 erschließung, inhaltlich 1 form, rührend 1 gleichermaß, informiert 1 grundlage, theoretisch 1 problem, auftretend 1 register, ausführlich 1 register, ungewöhnlich ausführlich 1 überlegung, gründlich
|
|
183
|
+
00248*1 arbeit, praktisch 1 einsatz, praktisch 1 erfahrung, intensiv praktisch 1 erfahrung, praktisch 1 erschließung, inhaltlich 1 form, rührend 1 gleichermaß, informiert 1 grundlage, theoretisch 1 problem, auftretend 1 register, ausführlich 1 register, ungewöhnlich ausführlich 1 retrievalmöglichkeit, spät 1 überlegung, gründlich
|
|
180
184
|
00249*1 bibliothek, deutsch
|
|
181
185
|
00250*1 abhilfe, automatisch 1 analyseverfahren, neu 1 datenmenge, verfügbar 1 information, relevant 1 pfad, neu
|
|
182
186
|
00251*1 suchfunktion, ausgereift 1 suchfunktion, eigen 1 webserver, eigen
|
|
@@ -186,16 +190,16 @@
|
|
|
186
190
|
00255*2 wahrheit, unterdrückt 1 bildbearbeitung, digital 1 fotografie, politisch 1 höhepunkt, vorläufig
|
|
187
191
|
00258*1 darstellung, besseren 1 fachgesellschaft, wissenschaftlich 1 jahr, einig 1 material, spezifisch 1 methode, technisch 1 methode, verwendet technisch 1 verfügbarkeit, besseren
|
|
188
192
|
00259*1 lotus, unter 1 version, neu
|
|
189
|
-
00260*1 aktualität, mangelnd 1 anbieter, kommerziell 1 beitrag, folgend 1 erschließung, automatisch 1
|
|
193
|
+
00260*1 aktualität, mangelnd 1 anbieter, kommerziell 1 beitrag, folgend 1 erschließung, automatisch 1 internetquelle, gefunden 1 link-sammlung, thematisch 1 maß, erheblich stark 1 maß, stark 1 mehr, wohl 1 netz, gesamt 1 quelle, erschlossen 1 quelle, intellektuell erschlossen 1 suchmaschine, divers
|
|
190
194
|
00261*2 indexierung, automatisch 1 forschungsgemeinschaft, deutsch 1 projekt, durchgeführt 1 sacherschließung, bibliothekarisch
|
|
191
195
|
00264*2 indexierung, automatisch 1 mischform, realisiert 1 relevanz, statistisch 1 suchergebnis, sortiert
|
|
192
196
|
00265*1 datenverarbeitung, elektronisch 1 dokumentationsmethode, wenig 1 fachsprache, starr 1 fachterminologie, akzeptiert 1 philosophie-dokumentation, elektronisch
|
|
193
|
-
00267*1 dokumenterschließung, automatisch 1 indexierung, automatisch 1 milos-verfahren, erweitert 1 projekt, gefördert 1 titeldaten, angereichert
|
|
197
|
+
00267*1 dokumenterschließung, automatisch 1 indexierung, automatisch 1 milos-verfahren, erweitert 1 projekt, gefördert 1 retrievaltest, umfangreich 1 titeldaten, angereichert
|
|
194
198
|
00268*1 publikation, elektronisch 1 sicht, bibliothekarisch 1 trend, aktuell
|
|
195
199
|
00269*1 visualisierungstechnik, innovativ
|
|
196
200
|
00270*1 inhaltserschließung, verbal 1 literaturbericht, kommentiert
|
|
197
201
|
00271*1 sacherschließung, verbal
|
|
198
|
-
00273*1 indexierung, syntaktisch
|
|
202
|
+
00273*2 retrieval, online 1 indexierung, syntaktisch
|
|
199
203
|
00274*1 database, online 1 dokumenterschließung, inhaltlich
|
|
200
204
|
00275*1 indexierung, maschinell
|
|
201
205
|
00276*2 information, relevant 1 information, lokal 1 konsens, breiten 1 suchmaschine, universal 1 teil, relevant 1 web-server, eigen 1 weise, einheitlich 1 zugang, effizient
|
|
@@ -204,29 +208,29 @@
|
|
|
204
208
|
00280*1 erkenntnis, methodisch
|
|
205
209
|
00281*1 leistung, wissenschaftlich
|
|
206
210
|
00283*1 bibliotheksverbund, kooperativ 1 konzept, lokal 1 schnittstelle, technisch
|
|
207
|
-
00284*1 darstellung, begrifflich 1 darstellung, einfach begrifflich 1 suchsystem, basiert 1 suchsystem, semantisch basiert 1 wörterbuch, umfassend 1 zusammenhang, systematisch
|
|
211
|
+
00284*1 begriff, einfach 1 darstellung, begrifflich 1 darstellung, einfach begrifflich 1 retrieval, semantisch 1 retrievaltechnik, heutig 1 suchsystem, basiert 1 suchsystem, semantisch basiert 1 wörterbuch, umfassend 1 zusammenhang, systematisch
|
|
208
212
|
00285*1 kriterium, verschieden 1 verteilung, zeitlich 1 verwendung, unter 1 wissenschaftskommunikation, formal
|
|
209
213
|
00286*2 datenbank, bibliothekarisch 1 ergebnis, konsistent 1 indexierung, einheitlich 1 indexsystem, angegangen 1 konstruktion, unterschiedlich 1 oberfläche, einheitlich 1 problem, einig 1 schnittmenge, gemeinsam 1 schnittmenge, klein gemeinsam 1 suchergebnis, inkonsistent 1 suchschlüssel, gleich 1 suchschlüssel, scheinbar gleich 1 suchschlüssel, unterschiedlich 1 verbreitung, zunehmend
|
|
210
|
-
00287*2 information, smart 1 datei, groß 1 ergebnismenge, groß 1 gruppierung, automatisch 1
|
|
214
|
+
00287*2 information, smart 1 begriff, frei gewählt 1 begriff, gewählt 1 datei, groß 1 ergebnismenge, groß 1 gruppierung, automatisch 1 internetquelle, verschieden 1 nachricht, aktuell 1 nachricht, einzeln 1 nachricht, zusammengestellt 1 sprache, deutsch 1 version, angepasst
|
|
211
215
|
00288*1 austausch, allen kommunikativ 1 austausch, kommunikativ 1 datenspeicher, elektronisch 1 erde, ganz 1 informationsverlust, ungewollt 1 objekt, intern 1 patent, international 1 schatz, gigantisch 1 schlüssel, entscheidend 1 speicher, auffindbar 1 sprache, zahlreich 1 suchoption, weit 1 technologie, alle 1 technologie, erfasst alle 1 teil, groß 1 terminologie, gemeinsam 1 terminologie, professionell 1 unternehmen, global 1 weg, benötigt 1 weltwissen, gesamt technisch 1 weltwissen, technisch 1 wirkung, integrativ 1 wirkung, stark integrativ
|
|
212
|
-
00289*1 informationswissenschaftlich, unser 1 known-item-retrievaltest, unser 1 suchwerkzeug, jeweilig
|
|
216
|
+
00289*1 informationswissenschaftlich, unser 1 known-item-retrievaltest, unser 1 retrievaloberfläche, kund 1 suchwerkzeug, jeweilig
|
|
213
217
|
00290*1 antwort, konkret 1 aufwand, hoch technologisch 1 aufwand, technologisch 1 auskunft, genau 1 bewertung, intern 1 bewertungsverfahren, kompliziert 1 dateiformat, kryptisch 1 datenbankservermelden, mächtig 1 dokument, ständig verfügbar 1 dokument, verfügbar 1 entscheidung, intuitiv 1 hyperlink, richtig 1 information, bessere 1 intelligenz, human 1 katalog, inhaltlich sortierend 1 katalog, sortierend 1 konzept, gut 1 kriterium, inhaltlich 1 liege, entfernt 1 linkverbindung, gut 1 maschine, automatisch 1 projekt, kalifornisch 1 recherche, automatisch 1 relevanz, inhaltlich 1 roboter, chic unentwegt 1 roboter, unentwegt 1 seite, alle 1 seite, aller 1 seite, zentral 1 sportergebnis, neu 1 studie, früh 1 suchroboter, chic 1 suchsystem, alle 1 suchtechnologie, konventionell 1 surfer, unzählig 1 thema, einig 1 verarbeitung, maschinell 1 verarbeitung, rein maschinell 1 viertel, weit 1 webadresse, beliebig 1 webseite, alle 1 webseite, aller 1 webseite, indiziert 1 webseite, katalogisiert 1 welt, heterogen 1 wort, alle 1 wort, erfasst alle
|
|
214
|
-
00291*3 handschrift, mittelalterlich 2 erschließung, bibliothekarisch 1 anforderung, neu 1 anforderung, völlig neu 1 belastung, stark 1 bereich, automatisiert 1 bereich, partiell automatisiert 1 bibliothek, wenig 1 bibliothekskatalog, allgemein 1 bibliotheksmaterial, herkömmlich 1 darstellung, ausführlich 1 dokument, elektronisch 1 dokument, neu elektronisch 1 festlegung, inhaltlich 1 festlegung, vielfach inhaltlich 1 gesamtindex, früh 1 handschriftenkatalog, gedruckt 1 handschriftenkatalog, gefördert 1 informationsgewinn, erheblich 1 jahr, einig 1 katalog, erstellt 1 katalog, gedruckt 1 katalogsystem, jeweilig 1 kreis, eng 1 material, verschieden 1 problem, entstehend technisch 1 problem, technisch 1 regelwerk, bibliothekarisch 1 richtlinie, gültig 1 suche, vereinheitlicht 1 system, verwendet 1 wirkung, tiefgreifend
|
|
215
|
-
00292*4 inhaltserschließung, automatisch 1 akzeptanz, merklich 1 ansatz, verschieden 1 anstrengung, verstärkt 1 anwenderkreisen, breiten 1 automatisierung, zunehmend 1 informationsflut, steigend 1 interesse, wachsend 1 komponente, bestimmt 1 produkt, neu 1 softwarewerkzeug, kommerziell vertrieben 1 softwarewerkzeug, vertrieben 1 vertrieb, kommerziell 1 zugriffsverfahren, effizient
|
|
216
|
-
00293*1 datenvolumen, groß 1 indexierung, maschinell 1 prozess, iterativ 1 sicht, technisch
|
|
217
|
-
00294*1 ansprüche, verändert 1 benutzer, unser 1 bibliotheksbenutzer, extern 1 form, allgemein 1 form, recht allgemein 1 jahr, letzte 1 problem, häufig 1 recherchemöglichkeit, hervorragend 1 rückgang, stark 1 umfeld, universitär
|
|
218
|
-
00295*1 einstieg, optimal 1 erhebung, ausgearbeitet empirisch 1 erhebung, empirisch 1 indexierung, automatisch 1 informationswissenschaftlich, seriös 1 speerspitze, technologisch 1 suchsystem, unterschiedlich 1 vokabular, geordnet kontrolliert 1 vokabular, kontrolliert
|
|
219
|
-
00296*1 befehlsorientieren, ausschließlich 1 befehlsorientieren, elaboriert 1 benutzerschnittstelle, ergonomisch 1
|
|
218
|
+
00291*3 handschrift, mittelalterlich 2 erschließung, bibliothekarisch 1 anforderung, neu 1 anforderung, völlig neu 1 belastung, stark 1 bereich, automatisiert 1 bereich, partiell automatisiert 1 bibliothek, wenig 1 bibliothekskatalog, allgemein 1 bibliotheksmaterial, besonders 1 bibliotheksmaterial, herkömmlich 1 darstellung, ausführlich 1 dokument, elektronisch 1 dokument, neu elektronisch 1 festlegung, inhaltlich 1 festlegung, vielfach inhaltlich 1 gesamtindex, früh 1 handschriftenkatalog, gedruckt 1 handschriftenkatalog, gefördert 1 informationsgewinn, erheblich 1 jahr, einig 1 katalog, erstellt 1 katalog, gedruckt 1 katalogsystem, jeweilig 1 kreis, eng 1 material, verschieden 1 problem, entstehend technisch 1 problem, technisch 1 regelwerk, bibliothekarisch 1 richtlinie, gültig 1 suche, vereinheitlicht 1 system, verwendet 1 wirkung, tiefgreifend
|
|
219
|
+
00292*4 inhaltserschließung, automatisch 1 akzeptanz, merklich 1 ansatz, verschieden 1 anstrengung, verstärkt 1 anwenderkreisen, breiten 1 automatisierung, zunehmend 1 informationsflut, steigend 1 interesse, wachsend 1 komponente, bestimmt 1 produkt, neu 1 softwarewerkzeug, kommerziell vertrieben 1 softwarewerkzeug, vertrieben 1 vertrieb, kommerziell 1 zugriffsverfahren, effizient 1 zukunft, nah
|
|
220
|
+
00293*1 begriff, alphabetisch 1 datenvolumen, groß 1 indexierung, maschinell 1 prozess, iterativ 1 sicht, technisch
|
|
221
|
+
00294*1 ansprüche, verändert 1 benutzer, unser 1 bibliotheksbenutzer, extern 1 form, allgemein 1 form, recht allgemein 1 jahr, letzte 1 maß, besonders 1 problem, häufig 1 recherchemöglichkeit, hervorragend 1 rückgang, stark 1 umfeld, universitär
|
|
222
|
+
00295*1 einstieg, optimal 1 erhebung, ausgearbeitet empirisch 1 erhebung, empirisch 1 indexierung, automatisch 1 informationswissenschaftlich, seriös 1 speerspitze, technologisch 1 suchsystem, unterschiedlich 1 vokabular, geordnet kontrolliert 1 vokabular, kontrolliert 1 zugriff, zielgenau
|
|
223
|
+
00296*1 befehlsorientieren, ausschließlich 1 befehlsorientieren, elaboriert 1 benutzerschnittstelle, ergonomisch 1 checkliste, unser 1 datensätzen, singulär 1 indexierung, automatisch 1 informationsproduzent, isoliert 1 leistungsindikator, weit 1 methode, automatisch 1 methode, suboptimal 1 online-archiv, kommerziell 1 realisierungsmöglichkeit, technisch 1 retrievalsystem, gut 1 suche, gut 1 system, irgendwelch 1 umgebung, experimentell 1 wirdjedoch, vorausgesetzt
|
|
220
224
|
00297*2 problem, methodisch 2 wissenschaftsforschung, empirisch 1 arbeit, vorliegend 1 basis, problematisch 1 bereich, semantisch 1 bereich, syntaktisch 1 charakter, dynamisch 1 faktor, beachtenswert 1 informationstheorie, semantisch 1 leistung, wissenschaftlich 1 problem, alle methodisch 1 problem, auftretend methodisch 1 problem, grundlegend 1 problem, offen 1 problem, spezifisch 1 publikation, elektronisch 1 publikation, zitiert 1 wirkung, wissenschaftlich
|
|
221
|
-
00298*3 text, elektronisch 2 erschließung, inhaltlich 1 aspekt-klassifikation, universal 1 erschließung, automatisch inhaltlich 1 erschließung, syntaktisch inhaltlich 1 klassifikationselement, bezogen 1 klassifikationselement, inhaltlich bezogen 1 recherche, zahlreich 1 suchalgorithmen, bekannt 1 suchgegenstand, jeweilig 1 textdokument, unbekannt
|
|
225
|
+
00298*3 text, elektronisch 2 erschließung, inhaltlich 1 aspekt-klassifikation, universal 1 erschließung, automatisch inhaltlich 1 erschließung, syntaktisch inhaltlich 1 klassifikationselement, bezogen 1 klassifikationselement, inhaltlich bezogen 1 recherche, zahlreich 1 retrieval, syntaktisch 1 suchalgorithmen, bekannt 1 suchgegenstand, jeweilig 1 textdokument, unbekannt
|
|
222
226
|
00299*1 angebot, nutzend 1 veröffentlichung, alle 1 übersetzungssystem, automatisch
|
|
223
|
-
00300*1 anwendung, experimentell 1 anwendungsfall, fruchtbar 1 erschließung, inhaltlich 1 migration, sozialwissenschaftlich 1 relation, komplex 1 suche, semantisch
|
|
227
|
+
00300*1 anwendung, experimentell 1 anwendungsfall, fruchtbar 1 erschließung, inhaltlich 1 interesse, besonders 1 migration, sozialwissenschaftlich 1 relation, komplex 1 suche, semantisch
|
|
224
228
|
00301*4 daten, inhaltlich 1 daten, formatiert 1 datenarten, inhaltlich 1 form, strukturiert 1 management, integriert 1 text, vorwiegend
|
|
225
229
|
00302*1 anforderung, speziell 1 anwendungskontext, real 1 erschließung, automatisch inhaltlich 1 erschließung, inhaltlich 1 gesichtspunkt, qualitativ 1 indexierung, automatisch 1 inhaltserschließung, intellektuell 1 mangel, einig 1 methode, anerkannt 1 system, grundsätzlich unterschiedlich 1 system, lernend 1 system, unterschiedlich 1 trainingsvorlage, erstellt 1 trainingsvorlage, intellektuell erstellt
|
|
226
230
|
00303*1 annotationssystem, verteilt 1 ansatz, konzeptuell 1 anwendungsbereich, exemplarisch 1 artikel, einschlägig 1 aufgabe, komplex 1 aufgabe, verbunden komplex 1 aufgabenbasieren, entsprechend 1 beitrag, vorliegend 1 benutzergruppe, verteilt 1 benutzertyp, verschieden 1 bestand, wachsend 1 datenbestand, gespeichert 1 dokumentenverarbeitung, intelligent 1 filmarchiv, europäisch 1 filmarchiv, groß europäisch 1 filmforschung, historisch 1 jahrhundert, vorig 1 korpus, groß 1 quellenmaterial, historisch 1 technik, dediziert 1 xml-basiert, modern
|
|
227
231
|
00304*1 indexierung, automatisch
|
|
228
232
|
00305*2 generierung, maschinell 1 abteilung, verantwortlich 1 auftraggeber, öffentlich 1 beratungsdienstleistung, international 1 beratungsschwerpunkt, weit 1 beratungsunternehmen, führend 1 externe, dokumentiert 1 material, dokumentiert extern 1 material, extern 1 netz, intern 1 projektbericht, aller intern 1 projektbericht, intern 1 stand, derzeitig 1 unternehmen, jung
|
|
229
|
-
00306*5 indexierung, automatisch 1 ansatz, behandelt 1 ansatz, grundsätzlich 1 ansatz, verschieden 1 berg, ständig wachsend 1 berg, wachsend 1 buch, vorliegend 1 charakter, beispielhaft 1 darstellung, einführend 1 information, unstrukturiert 1 informationsbedarf, grundsätzlich 1 informationswirtschaft, betrieblich 1 lehrveranstaltung, entsprechend 1 mittel, manuell 1 praktiker, konfrontiert 1 seite, technisch 1 sprache, verständlich 1 tag, heutig 1 tiefendarstellung, detailliert 1 verarbeitung, schnell 1 verwaltung, öffentlich 1 voraussetzung, jeweilig 1 wirtschaft, abhängig
|
|
233
|
+
00306*5 indexierung, automatisch 1 ansatz, behandelt 1 ansatz, grundsätzlich 1 ansatz, verschieden 1 bedeutung, groß 1 berg, ständig wachsend 1 berg, wachsend 1 buch, vorliegend 1 charakter, beispielhaft 1 darstellung, einführend 1 information, unstrukturiert 1 informationsbedarf, grundsätzlich 1 informationswirtschaft, betrieblich 1 lehrveranstaltung, entsprechend 1 mittel, manuell 1 praktiker, konfrontiert 1 seite, technisch 1 sprache, verständlich 1 tag, heutig 1 tiefendarstellung, detailliert 1 verarbeitung, schnell 1 verwaltung, öffentlich 1 voraussetzung, jeweilig 1 wirtschaft, abhängig
|
|
230
234
|
00308*2 zeitschrift, wissenschaftlich 1 anwendungsbereich, fokussiert 1 autor, wissenschaftlich 1 hilfsmittel, notwendig 1 jahrgang, aktuell 1 kriterium, objektiv 1 verbesserungsvorschlag, einig 1 zeitschrift, weich 1 zeitschriftenkommunikation, wissenschaftlich
|
|
231
235
|
00309*1 datenbank, relational 1 forschungsgemeinschaft, deutsch 1 projekt, gefördert
|
|
232
236
|
00310*1 aktionsmuster, gewonnen sequentiell 1 aktionsmuster, sequentiell 1 angabe, betreffend 1 aufgabe, allgemein 1 auswertung, rechnerisch 1 forschungsfragen, allgemein 1 informationsraum, inhaltlich komplex 1 informationsraum, komplex 1 interpretation, zusammenfassend 1 phasenmodell, dynamisch 1 schritt, folgend 1 suchmaschinennutzer, unerfahren 1 thema, anschließend 1 untergruppe, unerfahren 1 web-rechercheaufgabe, offen 1 wissensarten, unterschiedlich
|
|
@@ -236,14 +240,14 @@
|
|
|
236
240
|
00315*1 aspekt, neu 1 gesellschaft, international 1 sektion, deutsch
|
|
237
241
|
00317*1 anforderung, speziell 1 anwendungskontext, real 1 erschließung, automatisch inhaltlich 1 erschließung, inhaltlich 1 gesichtspunkt, qualitativ 1 indexierung, automatisch 1 inhaltserschließung, intellektuell 1 mangel, einig 1 methode, anerkannt 1 system, grundsätzlich unterschiedlich 1 system, lernend 1 system, unterschiedlich 1 trainingsvorlage, erstellt 1 trainingsvorlage, intellektuell erstellt
|
|
238
242
|
00318*1 belästigung, sexuell
|
|
239
|
-
00319*2 sprache, natürlich 2 thesaurus, semantisch 1 bedeutung, rasant zunehmend 1 bedeutung, zunehmend 1 beitrag, vorliegend 1 instrument, möglich 1 mach, deutlich 1 programmiersprache, objektorientiert 1 publikationsform, verändernd 1 sprache, unser natürlich 1 text, wissensbasiert
|
|
240
|
-
00320*1 analyse, semantisch 1 bedienbar, leicht 1 begriffsgut, abgebildet 1 begriffssammlung, beliebig geordnet 1 begriffssammlung, geordnet 1 bibliografie, soziologisch 1 datenbank, ursprünglich 1 dokument, relevant 1 dokument, wenig relevant 1 ordnungssystem, bestehend 1 ordnungssystem, speziell 1 schritt, nachfolgend 1 suche, ausschließlich 1 systematik, formal 1 thesaurus, beispielsweise 1 zeichenkettenabgleich, exakt
|
|
243
|
+
00319*2 sprache, natürlich 2 thesaurus, semantisch 1 bedeutung, rasant zunehmend 1 bedeutung, zunehmend 1 begriff, definierbar 1 beitrag, vorliegend 1 instrument, möglich 1 mach, deutlich 1 programmiersprache, objektorientiert 1 publikationsform, verändernd 1 sprache, unser natürlich 1 text, wissensbasiert
|
|
244
|
+
00320*1 analyse, semantisch 1 bedienbar, leicht 1 begriffsgut, abgebildet 1 begriffssammlung, beliebig geordnet 1 begriffssammlung, geordnet 1 berücksichtigung, besonders 1 bibliografie, soziologisch 1 datenbank, ursprünglich 1 dokument, relevant 1 dokument, wenig relevant 1 ordnungssystem, bestehend 1 ordnungssystem, speziell 1 retrievalverfahren, nachgeordnet semantisch 1 retrievalverfahren, semantisch 1 schritt, nachfolgend 1 suche, ausschließlich 1 systematik, formal 1 thesaurus, beispielsweise 1 zeichenkettenabgleich, exakt
|
|
241
245
|
00321*1 basis, theoretisch 1 fixierbar, schriftlich 1 form, alle 1 netz, generalisiert neuronal 1 netz, neuronal 1 notation, formal 1 struktursystem, vorgestellt
|
|
242
246
|
00322*1 ausgabe, aufgelegt gedruckt 1 ausgabe, gedruckt 1 darstellung, systematisch 1 version, elektronisch
|
|
243
|
-
00323*2 aspekt, pragmatisch 1 bezugnahmen, unter 1 dimension, neu 1 ergebnis, wissenschaftlich 1 information, möglich 1 informationssystem, wissenschaftlich 1 position, philosophisch 1 repräsentationsstruktur, entwickelt 1 standpunkt, unser
|
|
247
|
+
00323*2 aspekt, pragmatisch 1 bezugnahmen, unter 1 dimension, neu 1 ergebnis, wissenschaftlich 1 information, möglich 1 informationssystem, wissenschaftlich 1 position, philosophisch 1 repräsentationsstruktur, entwickelt 1 retrievalverfahren, effizient 1 standpunkt, unser
|
|
244
248
|
00324*2 funktion, enzyklopädisch 1 anschauung, herrschend 1 bibliothek, modern 1 disziplin, aller 1 epochenübergreifend, gezielt 1 erscheinungsform, verschieden 1 forschung, künftig 1 forschungsdialog, deutsch 1 forschungsförderung, orientiert 1 gleichbleiben, prinzipiell 1 identitätsfindung, national 1 informationsaustausch, umfassend 1 informationsverarbeitung, enzyklopädisch 1 institut, rührig 1 kulturgeschichte, europäisch 1 kunstsprache, barock 1 masse, wachsend 1 medientechnik, spezifisch 1 modell, europäisch 1 neuzeit, früh 1 person, einzeln 1 philosoph, französisch 1 standard, existierend technisch 1 standard, technisch 1 thema, bestimmt 1 umschau, thematisch 1 werk, enzyklopädisch 1 wirkung, ähnlich 1 wissenssammlung, enzyklopädisch 1 zivilisation, wissenschaftlich 1 überblick, enzyklopädisch 1 überblicksbeiträge, historisch
|
|
245
|
-
00325*2 soziologe, deutsch 1 deutsche, unter 1 forschungsleistung, sozialwissenschaftlich 1 schwachpunkt, bekannte 1 schwachpunkt, bestätigt bekannte 1 soziologe, antwortend 1 soziologe, unter deutsch 1 umfragergebnis, weit 1 untersuchung, durchgeführt
|
|
246
|
-
00326*1 ausbildungseinrichtung, bibliothekarisch 1 ausbildungseinrichtung, deutsch bibliothekarisch 1 beschreibungsebene, strukturiert 1 indexierung, automatisch 1 information, intelligent 1 katalog, lokal 1 netz, heterogen 1 sicht, integrativ 1 thema, folgend 1 trend, folgend
|
|
247
|
-
00329*2 indexierung, adaptiv 1 fragestellung, komplex 1 indexierung, mehrfach 1 indexierungsmethode, konzeptuell 1
|
|
248
|
-
00330*2 maschine, weit 2 seite, weit 1 adresse, alt 1 automat, groß 1 beiträge, neu 1 beiträge, ruppig 1 betrachter, mobil 1 bildersuchen, eigen 1 browserfenster, neu 1 darstellung, einheitlich 1 datei, deutsch 1 datei, verlinkt 1 datenbanksuche, eigen 1 dokument, aufgesucht 1 dokument, elektronisch 1 dokument, findend 1 dokument, frisch aufgesucht 1 durchforschen, alles 1 einblick, klein 1 ergebnis, erstaunlich 1 ergebnis, fremd 1 forum, jeweilig 1 frage, deutsch gestellt 1 frage, gestellt 1 frage, wirklich 1 fünfhundertmal, schätzungsweise 1 google-besuch, letzte 1 hilfe, groß 1 hilfe, praktisch 1 idee, olympisch 1 index, neu 1 inhalt, häufig wechselnd 1 inhalt, klassisch 1 inhalt, wechselnd 1 insel, riesig 1 intelligenz, künstlich 1 intelligenz, maschinell 1 internet-anbieter, groß 1 kind, vermisst 1 kollegialität, unermüdlich 1 kopierbar, vorteilhaft 1 link, sogenannt 1 linux-pc-server, billigen 1 mach, lustig 1 maschinenlesbar, oft 1 mitarbeit, frei 1 monat, einig 1 multimedia-inhalt, kommend 1 nachlese, stündlich 1 netz, ganz 1 netz, unsichtbar 1 netzfreund, aller 1 nichtkommerziell, uralt 1 rahmenlos, möglich 1 rolle, untergeordnet 1 röhre, kommunizierend 1 schleuse, lieb 1 seite, angemeldet 1 seite, durchsucht 1 seite, einfach 1 seite, gefunden 1 seite, gespeichert 1 seite, jeweilig 1 server, kooperierend 1 speicher, eigen 1 speicher, weit 1 suchmaschine, beliebte 1 suchmaschine, deutsch 1 suchseite, englisch 1 suchseite, sehenswert englisch 1 telefonbuchsuche, deutsch 1 text, gefunden 1 thema, bestimmt 1 verweis, einheitlich 1 webformat, neu 1 wettstreit, international 1 wille, gut 1 wort, aller vorkommend 1 wort, paar 1 wort, vorkommend 1 wortgruppe, geschlossen 1 wortgruppe, spät geschlossen 1 wortlaut, genau 1 wunderwelt, offen 1 wunderwerk, technisch 1 übersetzung, maschinell
|
|
249
|
+
00325*2 soziologe, deutsch 1 deutsche, unter 1 forschungsleistung, sozialwissenschaftlich 1 informationelle, sinnvoll 1 schwachpunkt, bekannte 1 schwachpunkt, bestätigt bekannte 1 soziologe, antwortend 1 soziologe, unter deutsch 1 umfragergebnis, weit 1 untersuchung, durchgeführt
|
|
250
|
+
00326*1 ausbildungseinrichtung, bibliothekarisch 1 ausbildungseinrichtung, deutsch bibliothekarisch 1 beschreibungsebene, strukturiert 1 indexierung, automatisch 1 information, intelligent 1 interaktionsschnittstelle, benutzerfreundlich 1 katalog, lokal 1 netz, heterogen 1 sicht, integrativ 1 thema, folgend 1 trend, folgend
|
|
251
|
+
00329*2 indexierung, adaptiv 1 fragestellung, komplex 1 indexierung, mehrfach 1 indexierungsmethode, konzeptuell 1 konzeptrahmen, gebunden 1 tiefenanalyse, selektiv 1 wissensstruktur, relevant 1 zielgruppe, unterschiedlich
|
|
252
|
+
00330*2 maschine, weit 2 seite, weit 1 adresse, alt 1 automat, groß 1 begriff, eingegeben 1 begriff, selten 1 beiträge, neu 1 beiträge, ruppig 1 betrachter, mobil 1 bildersuchen, eigen 1 browserfenster, neu 1 darstellung, einheitlich 1 datei, deutsch 1 datei, verlinkt 1 datenbanksuche, eigen 1 dokument, aufgesucht 1 dokument, elektronisch 1 dokument, findend 1 dokument, frisch aufgesucht 1 durchforschen, alles 1 einblick, klein 1 ergebnis, erstaunlich 1 ergebnis, fremd 1 forum, jeweilig 1 frage, deutsch gestellt 1 frage, gestellt 1 frage, wirklich 1 fünfhundertmal, schätzungsweise 1 google-besuch, letzte 1 hilfe, groß 1 hilfe, praktisch 1 idee, olympisch 1 index, neu 1 inhalt, häufig wechselnd 1 inhalt, klassisch 1 inhalt, wechselnd 1 insel, riesig 1 intelligenz, künstlich 1 intelligenz, maschinell 1 internet-anbieter, groß 1 kind, vermisst 1 kollegialität, unermüdlich 1 kopierbar, vorteilhaft 1 link, sogenannt 1 linux-pc-server, billigen 1 mach, lustig 1 maschinenlesbar, oft 1 mitarbeit, frei 1 monat, einig 1 multimedia-inhalt, kommend 1 nachlese, stündlich 1 netz, ganz 1 netz, unsichtbar 1 netzfreund, aller 1 nichtkommerziell, uralt 1 rahmenlos, möglich 1 rolle, untergeordnet 1 röhre, kommunizierend 1 schleuse, lieb 1 seite, angemeldet 1 seite, durchsucht 1 seite, einfach 1 seite, gefunden 1 seite, gespeichert 1 seite, jeweilig 1 server, kooperierend 1 sorge, groß 1 speicher, eigen 1 speicher, weit 1 suchmaschine, beliebte 1 suchmaschine, deutsch 1 suchmaschine, groß 1 suchmaschine, sehr beliebte 1 suchseite, englisch 1 suchseite, sehenswert englisch 1 telefonbuchsuche, deutsch 1 text, gefunden 1 thema, bestimmt 1 verweis, einheitlich 1 webformat, neu 1 wettstreit, international 1 wille, gut 1 wort, aller vorkommend 1 wort, paar 1 wort, vorkommend 1 wortgruppe, geschlossen 1 wortgruppe, spät geschlossen 1 wortlaut, genau 1 wunderwelt, offen 1 wunderwerk, technisch 1 übersetzung, maschinell
|
|
249
253
|
00331*2 bibliothek, öffentlich 1 ekz-daten, indexiert 1 erschließungsmethode, herkömmlich 1 indexierung, maschinell 1 methode, verschieden 1 sachbuchbestand, typisch 1 titel, relevant
|
data/test/test_helper.rb
CHANGED
|
@@ -1,3 +1,5 @@
|
|
|
1
|
+
# encoding: utf-8
|
|
2
|
+
|
|
1
3
|
require 'test/unit'
|
|
2
4
|
require 'lingo'
|
|
3
5
|
|
|
@@ -27,22 +29,22 @@ class LingoTestCase < Test::Unit::TestCase
|
|
|
27
29
|
# Erzeugt ein Token-Objekt
|
|
28
30
|
def tk( text )
|
|
29
31
|
f, a = split( text )
|
|
30
|
-
Lingo::Token.new( f, a )
|
|
32
|
+
Lingo::Language::Token.new( f, a )
|
|
31
33
|
end
|
|
32
34
|
|
|
33
35
|
# Erzeugt ein Lexical-Objekt
|
|
34
36
|
def lx( text )
|
|
35
37
|
f, a = split( text )
|
|
36
|
-
Lingo::Lexical.new( f, a )
|
|
38
|
+
Lingo::Language::Lexical.new( f, a )
|
|
37
39
|
end
|
|
38
40
|
|
|
39
41
|
# Erzeugt ein Word-Objekt
|
|
40
42
|
def wd( text, *lexis )
|
|
41
43
|
f, a = split( text )
|
|
42
|
-
w = Lingo::Word.new( f, a )
|
|
44
|
+
w = Lingo::Language::Word.new( f, a )
|
|
43
45
|
lexis.each do |text|
|
|
44
46
|
f, a = split( text )
|
|
45
|
-
w << Lingo::Lexical.new( f, a )
|
|
47
|
+
w << Lingo::Language::Lexical.new( f, a )
|
|
46
48
|
end
|
|
47
49
|
w
|
|
48
50
|
end
|
|
@@ -54,22 +56,24 @@ class AttendeeTestCase < LingoTestCase
|
|
|
54
56
|
def initialize(fname)
|
|
55
57
|
super
|
|
56
58
|
|
|
57
|
-
@attendee = $1
|
|
59
|
+
@attendee = $1 if self.class.to_s =~ /TestAttendee(.*)/
|
|
58
60
|
@lingo, @output = Lingo.new, []
|
|
59
61
|
end
|
|
60
62
|
|
|
61
|
-
def meet(att_cfg, check=true)
|
|
62
|
-
|
|
63
|
-
|
|
64
|
-
|
|
63
|
+
def meet(att_cfg, check = true)
|
|
64
|
+
cfg = { 'name' => @attendee.camelcase }
|
|
65
|
+
cfg.update('in' => 'input') if @input
|
|
66
|
+
cfg.update('out' => 'output') if @output
|
|
67
|
+
cfg.update(att_cfg)
|
|
65
68
|
|
|
66
69
|
@output.clear
|
|
67
70
|
@lingo.reset
|
|
68
|
-
|
|
69
|
-
|
|
70
|
-
|
|
71
|
-
|
|
72
|
-
|
|
71
|
+
|
|
72
|
+
list = [{ @attendee => cfg }]
|
|
73
|
+
list.unshift 'TestSpooler' => { 'out' => 'input', 'input' => @input } if @input
|
|
74
|
+
list.push 'TestDumper' => { 'in' => 'output', 'output' => @output } if @output
|
|
75
|
+
|
|
76
|
+
@lingo.invite(list)
|
|
73
77
|
@lingo.start
|
|
74
78
|
|
|
75
79
|
assert_equal(@expect, @output) if check
|
|
@@ -78,36 +82,37 @@ class AttendeeTestCase < LingoTestCase
|
|
|
78
82
|
end
|
|
79
83
|
|
|
80
84
|
class Lingo
|
|
85
|
+
class Attendee
|
|
86
|
+
class TestSpooler < self
|
|
81
87
|
|
|
82
|
-
|
|
88
|
+
protected
|
|
83
89
|
|
|
84
|
-
|
|
90
|
+
def init
|
|
91
|
+
@input = get_key('input')
|
|
92
|
+
end
|
|
85
93
|
|
|
86
|
-
|
|
87
|
-
|
|
88
|
-
when has_key?('spool_from')
|
|
89
|
-
@spool_from = get_key('spool_from')
|
|
90
|
-
@spooler = true
|
|
91
|
-
when has_key?('dump_to')
|
|
92
|
-
@dump_to = get_key('dump_to')
|
|
93
|
-
@spooler = false
|
|
94
|
-
else
|
|
95
|
-
forward(STR_CMD_ERR, 'Weder dump_to noch spool_from-Attribut abgegeben')
|
|
94
|
+
def control(cmd, param)
|
|
95
|
+
@input.each(&method(:forward)) if cmd == STR_CMD_TALK
|
|
96
96
|
end
|
|
97
|
+
|
|
97
98
|
end
|
|
98
99
|
|
|
99
|
-
|
|
100
|
-
|
|
101
|
-
|
|
102
|
-
|
|
103
|
-
|
|
100
|
+
class TestDumper < self
|
|
101
|
+
|
|
102
|
+
protected
|
|
103
|
+
|
|
104
|
+
def init
|
|
105
|
+
@output = get_key('output')
|
|
104
106
|
end
|
|
105
|
-
end
|
|
106
107
|
|
|
107
|
-
|
|
108
|
-
|
|
109
|
-
|
|
108
|
+
def control(cmd, param)
|
|
109
|
+
@output << AgendaItem.new(cmd, param)
|
|
110
|
+
end
|
|
110
111
|
|
|
111
|
-
|
|
112
|
+
def process(obj)
|
|
113
|
+
@output << obj
|
|
114
|
+
end
|
|
112
115
|
|
|
116
|
+
end
|
|
117
|
+
end
|
|
113
118
|
end
|
data/test/ts_database.rb
CHANGED
|
@@ -2,10 +2,10 @@
|
|
|
2
2
|
|
|
3
3
|
require_relative 'test_helper'
|
|
4
4
|
|
|
5
|
-
class Lingo::
|
|
6
|
-
alias_method :
|
|
7
|
-
def
|
|
8
|
-
|
|
5
|
+
class Lingo::Database
|
|
6
|
+
alias_method :original_convert, :convert
|
|
7
|
+
def convert(verbose = false)
|
|
8
|
+
original_convert(verbose)
|
|
9
9
|
end
|
|
10
10
|
end
|
|
11
11
|
|
|
@@ -100,7 +100,8 @@ Wort2=
|
|
|
100
100
|
'txt-format' => 'SingleWord',
|
|
101
101
|
'use-lex' => set_config('lex',
|
|
102
102
|
'name' => 'de/lingo-dic.txt',
|
|
103
|
-
'txt-format' => 'WordClass'
|
|
103
|
+
'txt-format' => 'WordClass',
|
|
104
|
+
'separator' => '='
|
|
104
105
|
)
|
|
105
106
|
}, @singleword, {
|
|
106
107
|
'wort1' => '#s',
|
|
@@ -132,7 +133,7 @@ Wort2=
|
|
|
132
133
|
'b7501a62cb083be6730a7a179a4ab346d23efe53' => '4b10'
|
|
133
134
|
})
|
|
134
135
|
|
|
135
|
-
compare(config, @singleword) { |
|
|
136
|
+
compare(config, @singleword) { |db| {
|
|
136
137
|
'wort1' => '#s',
|
|
137
138
|
'wort2' => '#s',
|
|
138
139
|
'juristische personen' => '#s',
|
|
@@ -141,7 +142,7 @@ Wort2=
|
|
|
141
142
|
'ganz großer und blöder quatsch' => '#s',
|
|
142
143
|
'ganz großer und blöder mist' => '#s',
|
|
143
144
|
'ganz großer und blöder schwach sinn' => '#s'
|
|
144
|
-
}.each { |key, val| assert_equal([val],
|
|
145
|
+
}.each { |key, val| assert_equal([val], db[key]) } }
|
|
145
146
|
end
|
|
146
147
|
|
|
147
148
|
def test_keyvalue
|
|
@@ -248,12 +249,12 @@ Wort2=
|
|
|
248
249
|
FileUtils.mkdir_p(File.dirname(TEST_FILE))
|
|
249
250
|
File.write(TEST_FILE, input, encoding: Lingo::ENC)
|
|
250
251
|
|
|
251
|
-
Lingo::
|
|
252
|
+
Lingo::Database.open(set_config('tst', config.merge('name' => TEST_FILE)), @lingo) { |db|
|
|
252
253
|
if block_given?
|
|
253
|
-
yield
|
|
254
|
+
yield db
|
|
254
255
|
else
|
|
255
|
-
store =
|
|
256
|
-
store.delete(Lingo::SYS_KEY)
|
|
256
|
+
store = db.to_h
|
|
257
|
+
store.delete(Lingo::Database::SYS_KEY)
|
|
257
258
|
|
|
258
259
|
assert_equal(output, store)
|
|
259
260
|
end
|
data/test/ts_language.rb
CHANGED
|
@@ -4,6 +4,8 @@ require_relative 'test_helper'
|
|
|
4
4
|
|
|
5
5
|
class TestLexicalHash < LingoTestCase
|
|
6
6
|
|
|
7
|
+
LH = Lingo::Language::LexicalHash
|
|
8
|
+
|
|
7
9
|
def setup
|
|
8
10
|
@lingo = Lingo.new
|
|
9
11
|
@database_config = @lingo.config['language/dictionary/databases']
|
|
@@ -17,7 +19,7 @@ class TestLexicalHash < LingoTestCase
|
|
|
17
19
|
old_stderr, $stderr = $stderr, StringIO.new('')
|
|
18
20
|
|
|
19
21
|
# Datenquelle nicht in Konfiguration enthalten
|
|
20
|
-
assert_raise(
|
|
22
|
+
assert_raise(Lingo::NoDatabaseConfigError) { LH.new('nonsens', @lingo) }
|
|
21
23
|
ensure
|
|
22
24
|
$stderr = old_stderr
|
|
23
25
|
end
|
|
@@ -25,7 +27,7 @@ class TestLexicalHash < LingoTestCase
|
|
|
25
27
|
# TODO: Crypt testen...
|
|
26
28
|
|
|
27
29
|
def test_cache
|
|
28
|
-
ds =
|
|
30
|
+
ds = LH.new('sys-dic', @lingo)
|
|
29
31
|
assert_equal([lx('regen|s'), lx('regen|v'), lx('rege|a')], ds['regen'])
|
|
30
32
|
assert_equal([lx('regen|s'), lx('regen|v'), lx('rege|a')], ds['regen'])
|
|
31
33
|
assert_equal([lx('regen|s'), lx('regen|v'), lx('rege|a')], ds['regen'])
|
|
@@ -33,11 +35,11 @@ class TestLexicalHash < LingoTestCase
|
|
|
33
35
|
end
|
|
34
36
|
|
|
35
37
|
def test_report
|
|
36
|
-
ds =
|
|
38
|
+
ds = LH.new('tst-syn', @lingo)
|
|
37
39
|
ds['abwickeln'] # source read
|
|
38
40
|
ds['abwickeln'] # cache hit
|
|
39
|
-
ds['regen']
|
|
40
|
-
ds['nonesens']
|
|
41
|
+
ds['regen'] # source read
|
|
42
|
+
ds['nonesens'] # source read, nothing found
|
|
41
43
|
|
|
42
44
|
expect = { \
|
|
43
45
|
"tst-syn: cache hits" => 1, \
|
|
@@ -52,26 +54,25 @@ class TestLexicalHash < LingoTestCase
|
|
|
52
54
|
|
|
53
55
|
def test_auto_create
|
|
54
56
|
txt_file = @database_config['tst-sgw']['name']
|
|
55
|
-
sto_file = Lingo.find(:store, txt_file) << '.pag'
|
|
56
57
|
|
|
57
|
-
ds =
|
|
58
|
+
ds = LH.new('tst-sgw', @lingo)
|
|
58
59
|
assert_equal([lx('substantiv|s')], ds['substantiv'])
|
|
59
60
|
ds.close
|
|
60
61
|
|
|
61
62
|
# Keine Store-Datei vorhanden, nur Text vorhanden
|
|
62
|
-
File.delete(
|
|
63
|
-
ds =
|
|
63
|
+
File.delete(*Dir["#{Lingo.find(:store, txt_file)}.*"])
|
|
64
|
+
ds = LH.new('tst-sgw', @lingo)
|
|
64
65
|
assert_equal([lx('substantiv|s')], ds['substantiv'])
|
|
65
66
|
ds.close
|
|
66
67
|
|
|
67
68
|
# Store vorhanden, aber Text ist neuer
|
|
68
|
-
ds =
|
|
69
|
+
ds = LH.new('tst-sgw', @lingo)
|
|
69
70
|
assert_equal([lx('substantiv|s')], ds['substantiv'])
|
|
70
71
|
ds.close
|
|
71
72
|
end
|
|
72
73
|
|
|
73
74
|
def test_singleword
|
|
74
|
-
ds =
|
|
75
|
+
ds = LH.new('tst-sgw', @lingo)
|
|
75
76
|
assert_equal([lx('substantiv|s')], ds['substantiv'])
|
|
76
77
|
assert_equal([lx('mehr wort gruppe|s')], ds['mehr wort gruppe'])
|
|
77
78
|
assert_equal(nil, ds['nicht vorhanden'])
|
|
@@ -79,7 +80,7 @@ class TestLexicalHash < LingoTestCase
|
|
|
79
80
|
end
|
|
80
81
|
|
|
81
82
|
def test_keyvalue
|
|
82
|
-
ds =
|
|
83
|
+
ds = LH.new('sys-mul', @lingo)
|
|
83
84
|
assert_equal([lx('abelscher ring ohne nullteiler|m')], ds['abelscher ring ohne nullteiler'])
|
|
84
85
|
assert_equal(['*4'], ds['abelscher ring ohne'])
|
|
85
86
|
assert_equal([lx('alleinreisende frau|m')], ds['alleinreisend frau'])
|
|
@@ -89,7 +90,7 @@ class TestLexicalHash < LingoTestCase
|
|
|
89
90
|
end
|
|
90
91
|
|
|
91
92
|
def test_wordclass
|
|
92
|
-
ds =
|
|
93
|
+
ds = LH.new('sys-dic', @lingo)
|
|
93
94
|
assert_equal([lx('a-dur|s')], ds['a-dur'])
|
|
94
95
|
assert_equal([lx('aalen|v'), lx('aalen|e')], ds['aalen'])
|
|
95
96
|
assert_equal([lx('abarbeitend|a')], ds['abarbeitend'])
|
|
@@ -97,7 +98,7 @@ class TestLexicalHash < LingoTestCase
|
|
|
97
98
|
end
|
|
98
99
|
|
|
99
100
|
def test_case
|
|
100
|
-
ds =
|
|
101
|
+
ds = LH.new('sys-dic', @lingo)
|
|
101
102
|
assert_equal([lx('abänderung|s')], ds['abänderung'])
|
|
102
103
|
assert_equal([lx('abänderung|s')], ds['Abänderung'])
|
|
103
104
|
assert_equal([lx('abänderung|s')], ds['ABÄNDERUNG'])
|
|
@@ -105,9 +106,9 @@ class TestLexicalHash < LingoTestCase
|
|
|
105
106
|
end
|
|
106
107
|
|
|
107
108
|
def test_multivalue
|
|
108
|
-
ds =
|
|
109
|
-
|
|
110
|
-
|
|
109
|
+
ds = LH.new('sys-syn', @lingo)
|
|
110
|
+
assert_equal([lx('abbau <chemie>|y'), lx('chemische abbaureaktion|y'), lx('chemischer abbau|y'), lx('photochemischer abbau|y')], ds['abbaureaktion'])
|
|
111
|
+
assert_equal([lx('dependenz|y'), lx('unselbstständigkeit|y'), lx('unselbständigkeit|y')], ds['abhängigkeit'])
|
|
111
112
|
ds.close
|
|
112
113
|
end
|
|
113
114
|
|
|
@@ -115,21 +116,21 @@ end
|
|
|
115
116
|
|
|
116
117
|
class TestDictionary < LingoTestCase
|
|
117
118
|
|
|
119
|
+
LD = Lingo::Language::Dictionary
|
|
120
|
+
|
|
118
121
|
def setup
|
|
119
122
|
@lingo = Lingo.new
|
|
120
123
|
end
|
|
121
124
|
|
|
122
125
|
def test_params
|
|
123
126
|
# Keine Sprach-Konfiguration angegeben
|
|
124
|
-
|
|
125
|
-
# Keine Parameter angegeben
|
|
126
|
-
assert_raise(RuntimeError) { Lingo::Dictionary.new(nil, @lingo) }
|
|
127
|
+
#assert_raise(RuntimeError) { LD.new({'source'=>['sys-dic']}, @lingo) }
|
|
127
128
|
# Falsche Parameter angegeben (Pflichtparameter ohne Defaultwert)
|
|
128
|
-
assert_raise(
|
|
129
|
+
assert_raise(ArgumentError) { LD.new({'course'=>['sys-dic']}, @lingo) }
|
|
129
130
|
end
|
|
130
131
|
|
|
131
132
|
def test_cache
|
|
132
|
-
dic =
|
|
133
|
+
dic = LD.new({'source'=>['sys-dic']}, @lingo)
|
|
133
134
|
assert_equal([lx('nase|s')], dic.select('nase'))
|
|
134
135
|
assert_equal([lx('nase|s')], dic.select('nase'))
|
|
135
136
|
assert_equal([lx('nase|s')], dic.select('nase'))
|
|
@@ -137,7 +138,7 @@ class TestDictionary < LingoTestCase
|
|
|
137
138
|
end
|
|
138
139
|
|
|
139
140
|
def test_report
|
|
140
|
-
dic =
|
|
141
|
+
dic = LD.new({'source'=>['sys-dic']}, @lingo)
|
|
141
142
|
dic.select('abwickeln') # source read
|
|
142
143
|
dic.select('abwickeln') # cache hit
|
|
143
144
|
dic.select('regen') # source read
|
|
@@ -155,7 +156,7 @@ class TestDictionary < LingoTestCase
|
|
|
155
156
|
end
|
|
156
157
|
|
|
157
158
|
def test_select_one_source
|
|
158
|
-
dic =
|
|
159
|
+
dic = LD.new({'source'=>['sys-dic']}, @lingo)
|
|
159
160
|
assert_equal([lx('nase|s')], dic.select('nase'))
|
|
160
161
|
assert_equal([lx('nase|s')], dic.select('NASE'))
|
|
161
162
|
assert_equal([], dic.select('hasennasen'))
|
|
@@ -163,7 +164,7 @@ class TestDictionary < LingoTestCase
|
|
|
163
164
|
end
|
|
164
165
|
|
|
165
166
|
def test_select_two_sources_mode_first
|
|
166
|
-
dic =
|
|
167
|
+
dic = LD.new({'source'=>['sys-dic', 'tst-dic'], 'mode'=>'first'}, @lingo)
|
|
167
168
|
# in keiner Quelle vorhanden
|
|
168
169
|
assert_equal([], dic.select('hasennasen'))
|
|
169
170
|
# nur in erster Quelle vorhanden
|
|
@@ -176,7 +177,7 @@ class TestDictionary < LingoTestCase
|
|
|
176
177
|
end
|
|
177
178
|
|
|
178
179
|
def test_select_two_sources_mode_first_flipped
|
|
179
|
-
dic =
|
|
180
|
+
dic = LD.new({'source'=>['tst-dic','sys-dic'], 'mode'=>'first'}, @lingo)
|
|
180
181
|
# in keiner Quelle vorhanden
|
|
181
182
|
assert_equal([], dic.select('hasennasen'))
|
|
182
183
|
# nur in erster Quelle vorhanden
|
|
@@ -189,7 +190,7 @@ class TestDictionary < LingoTestCase
|
|
|
189
190
|
end
|
|
190
191
|
|
|
191
192
|
def test_select_two_sources_mode_all
|
|
192
|
-
dic =
|
|
193
|
+
dic = LD.new({'source'=>['sys-dic','tst-dic'], 'mode'=>'all'}, @lingo)
|
|
193
194
|
# in keiner Quelle vorhanden
|
|
194
195
|
assert_equal([], dic.select('hasennasen'))
|
|
195
196
|
# nur in erster Quelle vorhanden
|
|
@@ -203,7 +204,7 @@ class TestDictionary < LingoTestCase
|
|
|
203
204
|
end
|
|
204
205
|
|
|
205
206
|
def test_select_two_sources_mode_default
|
|
206
|
-
dic =
|
|
207
|
+
dic = LD.new({'source'=>['sys-dic','tst-dic']}, @lingo)
|
|
207
208
|
# in keiner Quelle vorhanden
|
|
208
209
|
assert_equal([], dic.select('hasennasen'))
|
|
209
210
|
# nur in erster Quelle vorhanden
|
|
@@ -217,7 +218,7 @@ class TestDictionary < LingoTestCase
|
|
|
217
218
|
end
|
|
218
219
|
|
|
219
220
|
def test_suffix_lexicals
|
|
220
|
-
dic =
|
|
221
|
+
dic = LD.new({'source'=>['sys-dic']}, @lingo)
|
|
221
222
|
assert_equal([lx('mau|s'), lx('mauer|s')], dic.suffix_lexicals('mauern'))
|
|
222
223
|
assert_equal([lx('hasen|s'), lx('hasen|v'), lx('hasen|e')], dic.suffix_lexicals('hasens'))
|
|
223
224
|
assert_equal([lx('schönst|s'), lx('schön|a'), lx('schönst|a')], dic.suffix_lexicals('schönster'))
|
|
@@ -226,13 +227,13 @@ class TestDictionary < LingoTestCase
|
|
|
226
227
|
end
|
|
227
228
|
|
|
228
229
|
def test_infix_lexicals
|
|
229
|
-
dic =
|
|
230
|
+
dic = LD.new({'source'=>['sys-dic']}, @lingo)
|
|
230
231
|
assert_equal( [lx('information|s'), lx('information|v'), lx('information|e')], dic.suffix_lexicals('informations'))
|
|
231
232
|
dic.close
|
|
232
233
|
end
|
|
233
234
|
|
|
234
235
|
def test_select_with_suffix
|
|
235
|
-
dic =
|
|
236
|
+
dic = LD.new({'source'=>['sys-dic']}, @lingo)
|
|
236
237
|
assert_equal([lx('mauern|v')], dic.select_with_suffix('mauern'))
|
|
237
238
|
assert_equal([lx('hase|s')], dic.select_with_suffix('hasen'))
|
|
238
239
|
assert_equal([lx('schön|a')], dic.select_with_suffix('schönster'))
|
|
@@ -241,13 +242,13 @@ class TestDictionary < LingoTestCase
|
|
|
241
242
|
end
|
|
242
243
|
|
|
243
244
|
def test_select_with_infix
|
|
244
|
-
dic =
|
|
245
|
+
dic = LD.new({'source'=>['sys-dic']}, @lingo)
|
|
245
246
|
assert_equal( [lx('information|s'), lx('information|v'), lx('information|e')], dic.suffix_lexicals('informations'))
|
|
246
247
|
dic.close
|
|
247
248
|
end
|
|
248
249
|
|
|
249
250
|
def test_find_word
|
|
250
|
-
dic =
|
|
251
|
+
dic = LD.new({'source'=>['sys-dic']}, @lingo)
|
|
251
252
|
assert_equal(wd('hasennasen|?'), dic.find_word('hasennasen'))
|
|
252
253
|
assert_equal(wd('hase|IDF', 'hase|s'), dic.find_word('hase'))
|
|
253
254
|
assert_equal(wd('haseses|IDF', 'hase|s'), dic.find_word('haseses'))
|
|
@@ -258,6 +259,8 @@ end
|
|
|
258
259
|
|
|
259
260
|
class TestGrammar < LingoTestCase
|
|
260
261
|
|
|
262
|
+
LG = Lingo::Language::Grammar
|
|
263
|
+
|
|
261
264
|
def setup
|
|
262
265
|
@lingo = Lingo.new
|
|
263
266
|
end
|
|
@@ -267,7 +270,7 @@ class TestGrammar < LingoTestCase
|
|
|
267
270
|
end
|
|
268
271
|
|
|
269
272
|
def test_cache
|
|
270
|
-
gra =
|
|
273
|
+
gra = LG.new({'source'=>['sys-dic']}, @lingo)
|
|
271
274
|
assert_equal(
|
|
272
275
|
wd('informationswissenschaften|KOM', 'informationswissenschaft|k', 'information|s+', 'wissenschaft|s+'),
|
|
273
276
|
gra.find_compositum('informationswissenschaften')
|
|
@@ -283,79 +286,126 @@ class TestGrammar < LingoTestCase
|
|
|
283
286
|
gra.close
|
|
284
287
|
end
|
|
285
288
|
|
|
286
|
-
def
|
|
287
|
-
gra =
|
|
289
|
+
def test_test_compositum
|
|
290
|
+
gra = LG.new({'source'=>['sys-dic']}, @lingo)
|
|
291
|
+
|
|
288
292
|
# hinterer Teil ist ein Wort mit Suffix
|
|
289
|
-
assert_equal([
|
|
293
|
+
assert_equal([
|
|
294
|
+
[lx('hasenbraten|k'), lx('hase|s'), lx('braten|v')],
|
|
295
|
+
[5, 6],
|
|
296
|
+
'sv'
|
|
297
|
+
],
|
|
290
298
|
gra.test_compositum('hasen', '', 'braten', 1, false)
|
|
291
299
|
)
|
|
300
|
+
|
|
292
301
|
# hinterer Teil ist ein Wort mit Infix ohne Schwanz
|
|
293
|
-
assert_equal([
|
|
302
|
+
assert_equal([
|
|
303
|
+
[lx('nasenlaufen|k'), lx('nase|s'), lx('laufen|v')],
|
|
304
|
+
[5, 7],
|
|
305
|
+
'sv'
|
|
306
|
+
],
|
|
294
307
|
gra.test_compositum('nasen', '', 'laufens', 1, false)
|
|
295
308
|
)
|
|
309
|
+
|
|
296
310
|
# hinterer Teil ist ein Wort mit Infix mit Schwanz
|
|
297
|
-
assert_equal([
|
|
311
|
+
assert_equal([
|
|
312
|
+
[lx('nasenlaufens|k'), lx('nase|s'), lx('laufen|v')],
|
|
313
|
+
[5, 7],
|
|
314
|
+
'sv'
|
|
315
|
+
],
|
|
298
316
|
gra.test_compositum('nasen', '', 'laufens', 1, true)
|
|
299
317
|
)
|
|
318
|
+
|
|
300
319
|
# hinterer Teil ist ein Kompositum nach Bindestrich
|
|
301
|
-
assert_equal([
|
|
320
|
+
assert_equal([
|
|
321
|
+
[lx('arrafat-nachfolgebedarf|k'), lx('bedarf|s'), lx('nachfolge|s'), lx('arrafat|x')],
|
|
322
|
+
[7, 9, 6],
|
|
323
|
+
'xss'
|
|
324
|
+
],
|
|
302
325
|
gra.test_compositum('arrafat', '-', 'nachfolgebedarf', 1, false)
|
|
303
326
|
)
|
|
327
|
+
|
|
304
328
|
# hinterer Teil ist ein TakeItAsIs nach Bindestrich
|
|
305
|
-
assert_equal([
|
|
329
|
+
assert_equal([
|
|
330
|
+
[lx('nachfolge-arrafat|k'), lx('nachfolge|s'), lx('arrafat|x')],
|
|
331
|
+
[9, 7],
|
|
332
|
+
'sx'
|
|
333
|
+
],
|
|
306
334
|
gra.test_compositum('nachfolge', '-', 'arrafat', 1, false)
|
|
307
335
|
)
|
|
336
|
+
|
|
308
337
|
# vorderer Teil ist ein Wort mit Suffix => siehe Hasenbraten
|
|
309
338
|
# vorderer Teil ist ein Kompositum
|
|
310
|
-
assert_equal([
|
|
339
|
+
assert_equal([
|
|
340
|
+
[lx('morgenonkelmantel|k'), lx('mantel|s'), lx('morgen|s'), lx('onkel|s'), lx('morgen|w')],
|
|
341
|
+
[6, 5, 6],
|
|
342
|
+
'sss'
|
|
343
|
+
],
|
|
311
344
|
gra.test_compositum('morgenonkel', '', 'mantel', 1, false)
|
|
312
345
|
)
|
|
346
|
+
|
|
313
347
|
# vorderer Teil ist ein TakeItAsIs vor Bindestrich
|
|
314
|
-
assert_equal([
|
|
348
|
+
assert_equal([
|
|
349
|
+
[lx('arrafat-nachfolger|k'), lx('nachfolger|s'), lx('arrafat|x')],
|
|
350
|
+
[7, 10],
|
|
351
|
+
'xs'
|
|
352
|
+
],
|
|
315
353
|
gra.test_compositum('arrafat', '-', 'nachfolger', 1, false)
|
|
316
354
|
)
|
|
355
|
+
|
|
317
356
|
gra.close
|
|
318
357
|
end
|
|
319
358
|
|
|
320
|
-
def
|
|
321
|
-
gra =
|
|
359
|
+
def test_permute_compositum
|
|
360
|
+
gra = LG.new({'source'=>['sys-dic']}, @lingo)
|
|
361
|
+
|
|
322
362
|
# bindestrichversion
|
|
323
|
-
assert_equal([
|
|
363
|
+
assert_equal([
|
|
364
|
+
[lx('arrafat-nachfolger|k'), lx('nachfolger|s'), lx('arrafat|x')],
|
|
365
|
+
[7, 10],
|
|
366
|
+
'xs'
|
|
367
|
+
],
|
|
324
368
|
gra.permute_compositum('arrafat-nachfolger', 1, false)
|
|
325
369
|
)
|
|
370
|
+
|
|
326
371
|
# bindestrichversion zwei-teilig
|
|
327
|
-
assert_equal([
|
|
328
|
-
[
|
|
329
|
-
|
|
330
|
-
|
|
331
|
-
|
|
372
|
+
assert_equal([
|
|
373
|
+
[lx('cd-rom-technologie|k'), lx('cd-rom|s'), lx('technologie|s')],
|
|
374
|
+
[6, 11],
|
|
375
|
+
'ss'
|
|
376
|
+
],
|
|
377
|
+
gra.permute_compositum('cd-rom-technologie', 1, false)
|
|
332
378
|
)
|
|
379
|
+
|
|
333
380
|
# bindestrichversion drei-teilig
|
|
334
|
-
assert_equal([
|
|
335
|
-
[
|
|
336
|
-
|
|
337
|
-
|
|
338
|
-
|
|
339
|
-
gra.permute_compositum('albert-ludwigs-universität', 1, false)
|
|
381
|
+
assert_equal([
|
|
382
|
+
[lx('albert-ludwigs-universität|k'), lx('universität|s'), lx('albert|e'), lx('ludwig|e')],
|
|
383
|
+
[6, 7, 11],
|
|
384
|
+
'ees'
|
|
385
|
+
],
|
|
386
|
+
gra.permute_compositum('albert-ludwigs-universität', 1, false)
|
|
340
387
|
)
|
|
388
|
+
|
|
341
389
|
# normal mit suggestion
|
|
342
|
-
assert_equal([
|
|
343
|
-
[
|
|
344
|
-
|
|
345
|
-
|
|
346
|
-
|
|
390
|
+
assert_equal([
|
|
391
|
+
[lx('benutzerforschung|k'), lx('erforschung|s'), lx('benutzen|v')],
|
|
392
|
+
[6, 11],
|
|
393
|
+
'vs'
|
|
394
|
+
],
|
|
395
|
+
gra.permute_compositum('benutzerforschung', 1, false)
|
|
347
396
|
)
|
|
397
|
+
|
|
348
398
|
gra.close
|
|
349
399
|
end
|
|
350
400
|
|
|
351
401
|
def test_find_compositum
|
|
352
|
-
gra =
|
|
402
|
+
gra = LG.new({'source'=>['sys-dic']}, @lingo)
|
|
353
403
|
assert_equal(
|
|
354
404
|
wd('informationswissenschaften|KOM', 'informationswissenschaft|k', 'information|s+', 'wissenschaft|s+'),
|
|
355
|
-
gra.find_compositum('informationswissenschaften')
|
|
405
|
+
gra.find_compositum('informationswissenschaften')
|
|
356
406
|
)
|
|
357
407
|
assert_equal(
|
|
358
|
-
wd('cd-rom-technologie|KOM', 'cd-rom-technologie|k', '
|
|
408
|
+
wd('cd-rom-technologie|KOM', 'cd-rom-technologie|k', 'cd-rom|s+', 'technologie|s+'),
|
|
359
409
|
gra.find_compositum('cd-rom-technologie')
|
|
360
410
|
)
|
|
361
411
|
assert_equal(
|
|
@@ -378,18 +428,18 @@ class TestGrammar < LingoTestCase
|
|
|
378
428
|
end
|
|
379
429
|
|
|
380
430
|
def test_min_word_size
|
|
381
|
-
gra =
|
|
431
|
+
gra = LG.new({'source'=>['sys-dic']}, @lingo)
|
|
382
432
|
assert_equal( wd('undsund|?'), gra.find_compositum('undsund'))
|
|
383
433
|
gra.close
|
|
384
434
|
end
|
|
385
435
|
|
|
386
436
|
def test_max_parts
|
|
387
|
-
gra =
|
|
437
|
+
gra = LG.new({'source'=>['sys-dic']}, @lingo)
|
|
388
438
|
assert_equal(
|
|
389
439
|
wd('baumsbaumsbaum|KOM', 'baumsbaumsbaum|k', 'baum|s+'),
|
|
390
440
|
gra.find_compositum('baumsbaumsbaum')
|
|
391
441
|
)
|
|
392
|
-
assert_equal(
|
|
442
|
+
assert_equal(Lingo::Language::Word.new('baumsbaumsbaumsbaumsbaumsbaum', Lingo::Language::WA_UNKNOWN), gra.find_compositum('baumsbaumsbaumsbaumsbaumsbaum'))
|
|
393
443
|
gra.close
|
|
394
444
|
end
|
|
395
445
|
|