lingo 1.8.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (108) hide show
  1. data/.rspec +1 -0
  2. data/COPYING +663 -0
  3. data/ChangeLog +754 -0
  4. data/README +322 -0
  5. data/Rakefile +100 -0
  6. data/TODO +28 -0
  7. data/bin/lingo +5 -0
  8. data/bin/lingoctl +6 -0
  9. data/de.lang +121 -0
  10. data/de/lingo-abk.txt +74 -0
  11. data/de/lingo-dic.txt +56822 -0
  12. data/de/lingo-mul.txt +3209 -0
  13. data/de/lingo-syn.txt +14841 -0
  14. data/de/test_dic.txt +24 -0
  15. data/de/test_mul.txt +17 -0
  16. data/de/test_mul2.txt +2 -0
  17. data/de/test_singleword.txt +2 -0
  18. data/de/test_syn.txt +4 -0
  19. data/de/test_syn2.txt +1 -0
  20. data/de/user-dic.txt +10 -0
  21. data/en.lang +113 -0
  22. data/en/lingo-dic.txt +55434 -0
  23. data/en/lingo-mul.txt +456 -0
  24. data/en/user-dic.txt +5 -0
  25. data/info/Objekte.png +0 -0
  26. data/info/Typen.png +0 -0
  27. data/info/database.png +0 -0
  28. data/info/db_small.png +0 -0
  29. data/info/download.png +0 -0
  30. data/info/gpl-hdr.txt +27 -0
  31. data/info/kerze.png +0 -0
  32. data/info/language.png +0 -0
  33. data/info/lingo.png +0 -0
  34. data/info/logo.png +0 -0
  35. data/info/meeting.png +0 -0
  36. data/info/types.png +0 -0
  37. data/lib/lingo.rb +321 -0
  38. data/lib/lingo/attendee/abbreviator.rb +119 -0
  39. data/lib/lingo/attendee/debugger.rb +111 -0
  40. data/lib/lingo/attendee/decomposer.rb +101 -0
  41. data/lib/lingo/attendee/dehyphenizer.rb +167 -0
  42. data/lib/lingo/attendee/multiworder.rb +301 -0
  43. data/lib/lingo/attendee/noneword_filter.rb +103 -0
  44. data/lib/lingo/attendee/objectfilter.rb +86 -0
  45. data/lib/lingo/attendee/sequencer.rb +190 -0
  46. data/lib/lingo/attendee/synonymer.rb +105 -0
  47. data/lib/lingo/attendee/textreader.rb +237 -0
  48. data/lib/lingo/attendee/textwriter.rb +196 -0
  49. data/lib/lingo/attendee/tokenizer.rb +218 -0
  50. data/lib/lingo/attendee/variator.rb +185 -0
  51. data/lib/lingo/attendee/vector_filter.rb +158 -0
  52. data/lib/lingo/attendee/wordsearcher.rb +96 -0
  53. data/lib/lingo/attendees.rb +289 -0
  54. data/lib/lingo/cli.rb +62 -0
  55. data/lib/lingo/config.rb +104 -0
  56. data/lib/lingo/const.rb +131 -0
  57. data/lib/lingo/ctl.rb +173 -0
  58. data/lib/lingo/database.rb +587 -0
  59. data/lib/lingo/language.rb +530 -0
  60. data/lib/lingo/modules.rb +98 -0
  61. data/lib/lingo/types.rb +285 -0
  62. data/lib/lingo/utilities.rb +40 -0
  63. data/lib/lingo/version.rb +27 -0
  64. data/lingo-all.cfg +85 -0
  65. data/lingo-call.cfg +15 -0
  66. data/lingo.cfg +78 -0
  67. data/lingo.rb +3 -0
  68. data/lir.cfg +72 -0
  69. data/porter/stem.cfg +311 -0
  70. data/porter/stem.rb +150 -0
  71. data/spec/spec_helper.rb +0 -0
  72. data/test.cfg +79 -0
  73. data/test/attendee/ts_abbreviator.rb +35 -0
  74. data/test/attendee/ts_decomposer.rb +31 -0
  75. data/test/attendee/ts_multiworder.rb +390 -0
  76. data/test/attendee/ts_noneword_filter.rb +19 -0
  77. data/test/attendee/ts_objectfilter.rb +19 -0
  78. data/test/attendee/ts_sequencer.rb +43 -0
  79. data/test/attendee/ts_synonymer.rb +33 -0
  80. data/test/attendee/ts_textreader.rb +58 -0
  81. data/test/attendee/ts_textwriter.rb +98 -0
  82. data/test/attendee/ts_tokenizer.rb +32 -0
  83. data/test/attendee/ts_variator.rb +24 -0
  84. data/test/attendee/ts_vector_filter.rb +62 -0
  85. data/test/attendee/ts_wordsearcher.rb +119 -0
  86. data/test/lir.csv +3 -0
  87. data/test/lir.txt +12 -0
  88. data/test/lir2.txt +12 -0
  89. data/test/mul.txt +1 -0
  90. data/test/ref/artikel.mul +1 -0
  91. data/test/ref/artikel.non +159 -0
  92. data/test/ref/artikel.seq +270 -0
  93. data/test/ref/artikel.syn +16 -0
  94. data/test/ref/artikel.vec +928 -0
  95. data/test/ref/artikel.ven +928 -0
  96. data/test/ref/artikel.ver +928 -0
  97. data/test/ref/lir.csv +328 -0
  98. data/test/ref/lir.mul +1 -0
  99. data/test/ref/lir.non +274 -0
  100. data/test/ref/lir.seq +249 -0
  101. data/test/ref/lir.syn +94 -0
  102. data/test/test_helper.rb +113 -0
  103. data/test/ts_database.rb +269 -0
  104. data/test/ts_language.rb +396 -0
  105. data/txt/artikel-en.txt +157 -0
  106. data/txt/artikel.txt +170 -0
  107. data/txt/lir.txt +1317 -0
  108. metadata +211 -0
data/test/ref/lir.seq ADDED
@@ -0,0 +1,249 @@
1
+ 00002*1 beispiel, ausgewählt
2
+ 00003*1 bibliothek, deutsch 1 indexierungsverfahren, englisch
3
+ 00006*1 analyse, kritisch 1 computer, personal 1 dokumentationssprache, basiert 1 tendenz, aktuell 1 thesaurus-software, ausgewählt autonom 1 thesaurus-software, autonom
4
+ 00007*1 kombinationsform, möglich
5
+ 00008*1 regelwerk, neu
6
+ 00011*1 grundlage, theoretisch
7
+ 00012*1 indexierung, präzis
8
+ 00013*1 gesellschaft, deutsch 1 sitzung, öffentlich
9
+ 00015*1 indexierung, syntaktisch
10
+ 00016*1 index, verbessert 1 katalog, systematisch 1 schlagwort-register, alphabetisch
11
+ 00017*1 indexierungsstruktur, transparent 1 modell, skizziert 1 prinzip, methodisch 1 sacherschließung, verbal 1 schlagwort, standardisiert 1 schlagwortkatalog, konventionell 1 struktur, methodisch
12
+ 00019*1 erschließung, inhaltlich 1 indexierung, syntaktisch
13
+ 00021*1 selektion, automatisch
14
+ 00022*1 indexiermuster, sachbezogen 1 rahmenregelung, methodisch
15
+ 00024*1 darstellung, ausführlich 1 sektion, verschieden 1 wiedergebrauch, effektiv
16
+ 00025*1 indexierungssystem, alphabetisch
17
+ 00028*1 indexierungsdaten, verbal 1 verarbeitung, maschinell
18
+ 00029*1 basis, abstrakt linguistisch 1 basis, linguistisch 1 grundlage, allgemein 1 sachregister, alphabetisch
19
+ 00030*1 modell, formal mathematisch 1 modell, mathematisch
20
+ 00032*1 ansatz, verschieden 1 einbeziehung, unter
21
+ 00033*1 religion, christlich
22
+ 00034*1 beschreibung, kurz 1 indexierungssystem, verbal 1 sprache, skandinavisch
23
+ 00036*1 ansatz, wichtig 1 indexierungsmodell, statistisch 1 termgewicht, vorgeschlagen
24
+ 00038*1 arbeit, intellektuell 1 arbeit, überholt intellektuell 1 bibliothek, einig 1 buch, ganz 1 diskussion, merkwürdig 1 indexierung, breit 1 informationstechnologie, modern 1 informationstechnologie, wirklich modern 1 intellektuelle, überholt 1 katalog, gedruckt 1 mangel, zunehmend 1 moderne, wirklich 1 sacherschließung, bibliothekarisch 1 schlagwort, eng 1 schlagwort, hilfreich 1 thema, indiziert 1 zeit, langsam
25
+ 00039*2 thesaurus, allgemein 1 bibliografie, deutsch 1 bibliothek, deutsch 1 schlagwort, verwendet 1 verzeichnis, wöchentlich
26
+ 00040*1 anmerkung, kritisch 1 erörterung, abschließend 1 indexierung, frei 1 indexierung, maschinell 1 indexierung, verbindlich 1 textsuche, frei
27
+ 00041*1 indexierung, automatisch
28
+ 00042*1 objekt, abstrakt
29
+ 00043*1 bereich, international 1 bibliografie, laufend 1 möglichkeit, realisierbar 1 schwerpunkt, inhaltlich 1 thema, vernachlässigt
30
+ 00044*2 kategorie, semantisch 1 gut, genügend 1 kategorie, wichtig semantisch 1 text, machend 1 voraussagbar, genügend gut 1 voraussagbar, gut 1 wiedergabetreue, ausreichend 1 zahl, klein
31
+ 00045*2 sachregister, alphabetisch 1 zugriff, besseren
32
+ 00046*1 grundlage, linguistisch 1 sacherschließungsmethode, verbal
33
+ 00047*1 aktuell-synchronischen, unter weitgehend 1 aktuell-synchronischen, weitgehend 1 beschäftigung, praktisch 1 entwicklung, bisherig 1 entwicklung, historisch 1 identität, absolut 1 lösung, praktisch 1 platonismus, dreifach 1 textinhaltsgegebenheit, absolut 1 universalität, absolut identisch 1 universalität, identisch
34
+ 00048*1 beispiel, einig 1 fachgebiet, untersucht 1 kategorie, verschieden 1 schema, dargestellt 1 typ, verschieden 1 untersuchung, statistisch
35
+ 00049*1 informationsprofil, individuell 1 informationssystem, betriebseigen
36
+ 00052*2 indexierung, automatisch 1 anpassung, erheblich 1 berücksichtigung, unter 1 system, einfach 1 system, äußerst einfach 1 systemstrategie, jeweilig
37
+ 00053*2 indexierungssystem, automatisch 1 arbeit, vorliegend 1 indexierungswörterbuch, groß 1 vokabular, vorgeschrieben
38
+ 00054*1 folge, logisch 1 folge, natürlich logisch 1 indexierung, automatisch 1 indexierungsansatz, theoretisch 1 vektorraum-modell, klassisch
39
+ 00055*2 indexierung, automatisch 1 beispiel, trivial 1 forschungsrichtung, weit 1 information-retrieval-system, ideal 1 richtung, aufgezeigt
40
+ 00056*1 bedeutung, unerträglich
41
+ 00057*1 grundlagenforschung, universitär 1 klassifikationssystem, existent 1 vorteil, weit
42
+ 00058*1 indexierung, manuell
43
+ 00059*1 forschungsinstitut, mathematisch
44
+ 00060*1 zugriff, sachlich
45
+ 00061*1 grundlage, linguistisch
46
+ 00062*1 beitrag, vorliegend 1 datenmenge, groß 1 interesse, groß 1 verarbeitung, integriert 1 vorgangsbearbeitung, integriert
47
+ 00064*1 katalogisierung, alphabetisch
48
+ 00068*1 musikbibliothek, öffentlich
49
+ 00069*1 dokumenterschließung, automatisch
50
+ 00071*1 dokumentationsverfahren, maschinell 1 dokumentationsverfahren, orientiert maschinell 1 grundlage, systematisch
51
+ 00074*1 indexierung, automatisch
52
+ 00075*1 indexierung, automatisch
53
+ 00078*1 documentalist, blind 1 rundfunk, saarländisch
54
+ 00079*1 analyse, vergleichend 1 bezugseinheit, dokumentarisch 1 indexierung, intellektuell 1 literaturdatenbank, biomedizinisch 1 online-datenbank, biomedizinisch 1 zuteilung, maschinell 1 zuteilung, verfügbar maschinell
55
+ 00080*1 klassifikation, automatisch thematisch 1 klassifikation, thematisch
56
+ 00081*1 analyse, vergleichend 1 indexierung, automatisch
57
+ 00082*2 register, gedruckt 1 kwoc-verfahren, modifiziert 1 steuerung, genau
58
+ 00083*2 daten, unstrukturiert 1 automatich, weitgehend 1 bedienung, einfach 1 bedienung, möglich einfach 1 benutzer, einzeln 1 benutzerkreis, breit 1 dialogform, verschieden 1 nutzungsflexibilität, hoch 1 oberflächengestaltung, systematisch
59
+ 00086*1 beziehung, international 1 database, cooperativ online 1 database, online 1 überlegung, ökonomisch
60
+ 00088*1 ergebnis, brauchbar 1 fortsetzung, konsequent 1 indexierung, automatisch 1 indexierung, syntaktisch 1 satzanalyse, vollständig
61
+ 00089*1 patentinformationssystem, deutsch
62
+ 00090*1 sacherschließung, verbal 1 tagung, international
63
+ 00092*1 erschließung, sachlich 1 indexierung, maschinell
64
+ 00093*2 sacherschließung, verbal 1 form, vorliegend 1 hochdifferenzieren, gefordert 1 indexierung, einheitlich 1 indexkatalog, traditionell 1 information, modern 1 regel, komplex 1 suche, effizient
65
+ 00094*1 grundlage, theoretisch
66
+ 00095*1 akquisition, automatisch 1 indexierung, automatisch 1 vorwissen, benötigt
67
+ 00096*1 bibliothek, wissenschaftlich 1 sacherschließung, verbal
68
+ 00098*1 dokument, relevant 1 dokument, zusätzlich relevant 1 ergänzung, erfolgreich 1 ergänzung, wohl erfolgreich 1 experiment, neu 1 information, juristisch 1 information, wissenschaftlich 1 informationssystem, juristisch 1 methode, neu 1 rechtsgebiet, alle 1 zitierverhalten, richterlich
69
+ 00102*1 bibliothek, deutsch 1 form, vereinfacht 1 indexierungsverfahren, syntaktisch
70
+ 00103*1 bibliothek, öffentlich 1 systematik, allgemein
71
+ 00104*1 fachrichtung, aller
72
+ 00105*1 daten, ungenügend 1 hilfestellung, unwirksam 1 option, unverständlich 1 rechtschreibkorrektur, automatisch 1 schwierigkeit, einig wesentlich 1 schwierigkeit, wesentlich 1 wortformenreduktion, automatisch
73
+ 00106*2 indexierung, automatisch 1 recherchemöglichkeit, verbessert 1 textmenge, groß 1 thesaurusverwaltung, maschinell
74
+ 00109*1 textmaterial, indexiert
75
+ 00111*1 dokument, automatisch indexiert 1 dokument, indexiert
76
+ 00112*1 sinn, eng
77
+ 00114*1 indexierung, automatisch
78
+ 00115*1 nominalgruppe, komplex
79
+ 00117*1 indexierung, automatisch
80
+ 00118*1 indexierungssystem, automatisch
81
+ 00119*1 indexierung, gewichtet
82
+ 00121*1 literaturdatenbank, selektiv
83
+ 00122*1 indexierungssystem, automatisch
84
+ 00124*1 indexierungssystem, automatisch
85
+ 00125*1 datenanbieter, alle 1 durchblick, total 1 einführung, kurz 1 index, dazugehörig 1 übersetzung, deutsch 1 übersicht, alphabetisch 1 übersicht, komplett
86
+ 00126*1 informationssystem, biografisch 1 informationssystem, international biografisch
87
+ 00127*1 ausführung, folgend 1 software, betrachtet
88
+ 00128*1 begriffssystem, verwendet 1 fachgebiet, dominierend 1 genauigkeitsrate, hoch 1 indexierung, maschinell 1 nummerierung, fortlaufend 1 variante, verschieden
89
+ 00129*1 anregung, interessant 1 beziehung, syntaktisch 1 fachinformationssystem, modern 1 indexierung, syntaktisch 1 kennzeichnung, eindeutig 1 methode, entwickelt 1 ordnungselement, alphabetisch 1 verknüpfungsmittel, syntaktisch
90
+ 00133*1 debatte, international 1 horizont, national 1 sacherschließung, verbal 1 verbreitung, zunehmend 1 übersetzung, gekürzt 1 übersetzung, leicht gekürzt
91
+ 00134*1 analyse, semantisch 1 inhaltserschließung, maschinell 1 wort, komplex 1 wort, morphologisch komplex
92
+ 00135*1 ausführung, vorliegend 1 bedeutung, zentral 1 einblick, kurz 1 maß, zunehmend 1 reputation, wissenschaftlich 1 tätigkeit, wissenschaftlich 1 zeitschriftentitel, jeweilig
93
+ 00136*1 post, elektronisch
94
+ 00137*2 inhalt, neu 1 anpassung, gegenseitig 1 datenbank, vorhanden 1 datenformat, verwendet 1 patentklassifikation, strukturiert 1 änderung, aktuell
95
+ 00138*1 abbild, zutreffend 1 einrichtung, wissenschaftlich 1 einwandfreien, methodisch 1 fachdatenbank, elektronisch 1 information, gespeichert 1 ranglisten, erstellt
96
+ 00140*1 bibliothek, deutsch 1 bibliotheksinstitut, deutsch 1 form, operational
97
+ 00141*1 bibliothek, öffentlich 1 erschließungstechnik, neu
98
+ 00142*1 arbeit, folgend 1 information, ausreichend 1 vergleichsuntersuchung, entsprechend 1 wissenschaftlergruppe, bestimmt
99
+ 00143*1 untersuchung, vergleichend
100
+ 00144*1 inhaltserschließung, automatisch
101
+ 00145*1 indexierung, automatisch
102
+ 00146*1 suche, sachlich
103
+ 00147*1 klassifikation, automatisch semantisch 1 klassifikation, semantisch
104
+ 00148*1 information, human
105
+ 00149*1 indexierung, automatisch
106
+ 00150*1 datei, elektronisch 1 post, rheinisch
107
+ 00154*1 dokumentation, inhaltlich 1 indexierung, kontrolliert 1 komfort, erreicht 1 schnittgenau, gar
108
+ 00155*1 ausgabe, gedruckt 1 information, gewünscht 1 inhaltserschließung, gut 1 prüfung, kritisch 1 speicherkapazität, groß 1 zürcher, neu
109
+ 00156*1 grundlage, linguistisch
110
+ 00158*1 indexierung, automatisch
111
+ 00159*1 indexierung, automatisch 1 inhaltserschließung, bibliothekarisch
112
+ 00161*1 indexierung, automatisch
113
+ 00162*1 bibliothekskatalog, groß
114
+ 00163*1 aspekt, qualitativ 1 sacherschließung, verbal
115
+ 00164*1 dokument, relevant 1 informationsmenge, riesig 1 internet, chaotisch organisiert 1 internet, organisiert 1 monat, vergangen 1 nutzung, effektiv 1 online-medium, populär 1 problem, schwerwiegend 1 suchwerkzeug, genannt
116
+ 00165*1 analyse, statistisch 1 analyse, umfangreich 1 faszination, stark 1 forschungsgeld, fließend 1 forschungsgeld, knapp fließend 1 gutachter-system, überfordert 1 interpretation, sorgfältig 1 selektionskriterium, geeignet 1 spezialist, wenig
117
+ 00166*1 aussage, wichtig 1 indexsprache, kategorisiert 1 mangel, bedingt 1 ordnung, hoch 1 regel, einfach 1 satz, letzte 1 struktur, linear 1 überblick, besseren
118
+ 00171*1 marketingstratege, kreativ 1 marketingstratege, unermüdlich kreativ
119
+ 00173*1 bildschirmschoner, global 1 toilette, öffentlich 1 webpage, seltsam
120
+ 00174*3 datenbank, bibliografisch 3 oberfläche, visuell 1 soll, folgend 1 studie, früh
121
+ 00176*1 bibliothek, wissenschaftlich 1 form, kurz 1 information, technisch 1 maßnahmen, wesentlich 1 maßnahmen, zugeordnet wesentlich 1 nutzung, verstärkt 1 selbstverwaltung, wissenschaftlich 1 struktur, wesentlich 1 ziel, langfristig 1 ziel, wesentlich 1 zugang, effizient
122
+ 00177*1 arbeitsgang, sonstig 1 datenbank, verbunden 1 datenbanksystem, gesamt 1 datenbanksystem, umfassend 1 dokumenttyp, alle verschieden 1 dokumenttyp, verschieden 1 mediendatenbank, umfassend 1 textdokument, alle 1 zusammenstellung, elektronisch
123
+ 00178*1 bild, digital
124
+ 00181*1 eitelkeit, gelehrt
125
+ 00182*1 kinderbibliothek, gerade 1 medienerlebnis, kreativ 1 medium, neu 1 technologie, neu 1 welt, real 1 zugang, neu
126
+ 00183*1 enzyklopädie, interaktiv 1 kulturfahrplan, groß
127
+ 00185*1 indexierung, automatisch 1 indexierung, intellektuell 1 indexierungsverfahren, automatisch 1 klassifikation, automatisch 1 klärung, terminologisch 1 kooperation, eng
128
+ 00186*2 indexierung, automatisch 2 klassifikation, automatisch 1 dokument, klassifiziert 1 dokumentklassifikation, automatisch 1 einführung, kurz 1 relation, statistisch 1 thema, folgend
129
+ 00187*1 arbeitsgruppe, bibliothekarisch
130
+ 00191*1 erschließung, automatisch 1 klassifikation, hierarchisch 1 klassifikation, thematisch hierarchisch 1 ordnungsstruktur, gewonnen 1 text, wiedergewonnen 1 textklassifikation, automatisch thematisch 1 textklassifikation, thematisch 1 wichtigkeitsstufe, entstanden
131
+ 00192*2 indexierung, automatisch 1 datenbank, groß 1 facettenklassifikation, universal 1 fachwort, wichtig 1 indexierung, unter automatisch 1 klassifikationssystem, vorgegeben 1 sprache, deutsch 1 titel, beliebig 1 veröffentlichung, wissenschaftlich
132
+ 00193*1 abfragbar, online 1 indexierung, numerisch 1 zugang, schnell
133
+ 00194*1 indexierung, intellektuell 1 methode, neu 1 system, britisch
134
+ 00195*1 indexierung, intellektuell 1 methode, neu 1 system, britisch
135
+ 00197*1 arbeit, beruflich 1 beziehung, bestimmt 1 einheit, thematisch 1 inhalt, kommuniziert 1 kern, eigen 1 kerngebiet, komplex 1 potential, technisch 1 veränderung, technisch
136
+ 00198*1 inhaltserschließung, automatisch
137
+ 00199*1 anwendung, unter 1 moderne, befindlich 1 standardsystem, herkömmlich
138
+ 00200*1 sacherschließung, intellektuell
139
+ 00201*1 bibliothek, wissenschaftlich 1 bibliothekskongress, deutsch
140
+ 00204*1 konferenz, international
141
+ 00205*1 bibliothek, deutsch
142
+ 00206*1 forschungsgemeinschaft, deutsch 1 indexierung, automatisch 1 inhaltserschließung, automatisch 1 projekt, durchgeführt 1 sacherschließung, bibliothekarisch 1 sacherschließung, konventionell bibliothekarisch
143
+ 00207*2 stellung, systematisch 1 bezeichnung, taxonomisch 1 eingabe, unter 1 erreger, dazugehörig 1 hilfe, unterstützt 1 indexdatei, vorgegeben 1 nachschlagewerk, verschieden 1 name, wissenschaftlich 1 objekt, biologisch 1 rationalisierung, weit 1 weise, gleich
144
+ 00208*1 anpassung, strukturell 1 bereich, folgend 1 katalog, elektronisch 1 problem, allgemein 1 umfang, erreicht 1 vokabular, universal 1 überarbeitung, grundsätzlich
145
+ 00209*2 umfeldsuche, semantisch 1 ergebnis, unbefriedigend 1 indexierung, maschinell 1 katalog, konventionell 1 online-katalog, bibliothekarisch 1 suche, sachlich 1 umfeld, semantisch 1 vokabular, strukturiert
146
+ 00210*1 bild, entsprechend 1 möglichkeit, technisch 1 speicher, effektiv 1 suchanfragen, formuliert 1 system, verschieden 1 voraussetzung, alle
147
+ 00211*1 fachinformation, sozialwissenschaftlich
148
+ 00212*2 informationssuche, effizient 1 kostenfaktor, verschieden 1 multimedia-dokumentkollektion, verteilt 1 multimedial, verteilt 1 ranglist, final 1 ranglisten, individuell 1 skalierbar, beliebig 1 typ, beliebig
149
+ 00213*1 beitrag, vorliegend 1 beziehung, derartig 1 indexierung, automatisch 1 indexierungssystem, automatisch 1 interesse, groß 1 relation, erfasst 1 schätzverfahren, verschieden 1 schätzverfahren, vorgeschlagen
150
+ 00214*1 indexierung, automatisch
151
+ 00215*1 indexierungsfunktion, logistisch
152
+ 00216*1 analyse, kritisch 1 bibliothek, öffentlich
153
+ 00217*1 inhaltserschließung, automatisch
154
+ 00218*1 bibliothek, virtuell 1 bibliotheksverbund, kooperativ
155
+ 00219*1 praxis, neu
156
+ 00221*1 bibliotheksindex, allgemein 1 system, national
157
+ 00222*1 indexierung, syntaktisch
158
+ 00223*1 nachricht, aktuell
159
+ 00225*1 deutsche, professionell 1 seite, deutsch 1 seite, professionell deutsch 1 spur, grün 1 umwelt-angebot, unzählig
160
+ 00227*1 datenbank, verschieden 1 datenmenge, gespeichert 1 erkenntnis, allgemein
161
+ 00228*1 studie, neu
162
+ 00229*1 indexierung, automatisch 1 jahr, letzte 1 online-archiv, kommerziell
163
+ 00230*1 dokumentmenge, fiktiv 1 vorteil, früh gefunden 1 vorteil, gefunden
164
+ 00231*1 bibliothek, deutsch 1 untersuchung, vergleichend
165
+ 00232*2 bibliothek, deutsch 1 dienst, zentral 1 dokumentationssprache, adäquat 1 gleichordnend, augenblicklich 1 indexierungsverfahren, britisch 1 jahr, einig 1 linguistik, modern 1 sacherschließung, verbal 1 sprache, natürlich 1 stande, alternativ 1 version, britisch 1 version, verkürzt
166
+ 00233*1 einsatz, praktisch 1 halbautomatisch, arbeitet 1 heuristik, linguistisch 1 information, gewonnen 1 verantwortung, gesellschaftlich
167
+ 00234*2 patentklassifikation, international 1 auflage, letzte 1 einteilungssystem, ganz 1 information, erfasst 1 klassifikationssymbol, obligatorisch 1 neuerung, gravierend 1 sachgebieten, bestimmt 1 sachverhalt, technisch 1 stelle, passend
168
+ 00236*2 patentinformationssystem, deutsch 1 ansatz, allgemein 1 informationswissenschaft, linguistisch 1 patentamt, deutsch
169
+ 00237*1 dezimalklassifikation, dreisprachig universal 1 dezimalklassifikation, universal 1 erschließung, intellektuell 1 informationsressource, relevant 1 informationsressource, wissenschaftlich relevant 1 internetressource, gesammelt 1 server, relevant 1 server, wissenschaftlich relevant
170
+ 00238*1 informationsressource, relevant 1 informationsressource, wissenschaftlich relevant
171
+ 00239*1 archivsystem, optisch 1 bedingung, alle 1 datenbank, international 1 informationsflut, anwachsend 1 informationsflut, stetig anwachsend 1 umfeld, technisch
172
+ 00240*1 zitierkette, bemerkenswert
173
+ 00241*1 analyse, inhaltlich 1 ansatz, methodisch weiterführend 1 ansatz, weiterführend 1 aufgabe, einig weit 1 aufgabe, weit 1 bewertung, qualitativ 1 charakter, subjektiv 1 charakter, vermeintlich subjektiv 1 dokumenterschließung, inhaltlich 1 gegenstand, genau 1 stellung, zentral 1 teilprozess, elementar
174
+ 00242*1 erschließungsverfahren, automatisch
175
+ 00243*1 ansatz, orientiert 1 datenbank, unformatiert 1 information, intelligent
176
+ 00244*1 indexierung, automatisch
177
+ 00246*1 indexierung, manuell
178
+ 00247*1 artikel, zitierend 1 datenbank, einzig 1 einrichtung, allem 1 entwicklungsstand, derzeitig 1 forschungseinrichtung, groß 1 fußnote, gemeinsam 1 information, wissenschaftlich 1 literatur, zitiert 1 produkt, parallel 1 wissenschaftsfächer, mehrere 1 zitationsdatenbank, groß
179
+ 00248*1 arbeit, praktisch 1 einsatz, praktisch 1 erfahrung, intensiv praktisch 1 erfahrung, praktisch 1 erschließung, inhaltlich 1 form, rührend 1 gleichermaß, informiert 1 grundlage, theoretisch 1 problem, auftretend 1 register, ausführlich 1 register, ungewöhnlich ausführlich 1 überlegung, gründlich
180
+ 00249*1 bibliothek, deutsch
181
+ 00250*1 abhilfe, automatisch 1 analyseverfahren, neu 1 datenmenge, verfügbar 1 information, relevant 1 pfad, neu
182
+ 00251*1 suchfunktion, ausgereift 1 suchfunktion, eigen 1 webserver, eigen
183
+ 00252*1 bewertung, vergleichend 1 indexierung, intellektuell 1 inhaltserschließung, innovativ 1 pressedokumentation, digital 1 text-dossier, digital 1 textdossier, digital
184
+ 00253*1 text-dossier, digital
185
+ 00254*1 sprache, deutsch 1 thesaurus-version, aktuell 1 vokabular, gesamt
186
+ 00255*2 wahrheit, unterdrückt 1 bildbearbeitung, digital 1 fotografie, politisch 1 höhepunkt, vorläufig
187
+ 00258*1 darstellung, besseren 1 fachgesellschaft, wissenschaftlich 1 jahr, einig 1 material, spezifisch 1 methode, technisch 1 methode, verwendet technisch 1 verfügbarkeit, besseren
188
+ 00259*1 lotus, unter 1 version, neu
189
+ 00260*1 aktualität, mangelnd 1 anbieter, kommerziell 1 beitrag, folgend 1 erschließung, automatisch 1 internetquell, gefunden 1 link-sammlung, thematisch 1 maß, erheblich stark 1 maß, stark 1 mehr, wohl 1 netz, gesamt 1 quell, erschlossen 1 quell, intellektuell erschlossen 1 suchmaschine, divers
190
+ 00261*2 indexierung, automatisch 1 forschungsgemeinschaft, deutsch 1 projekt, durchgeführt 1 sacherschließung, bibliothekarisch
191
+ 00264*2 indexierung, automatisch 1 mischform, realisiert 1 relevanz, statistisch 1 suchergebnis, sortiert
192
+ 00265*1 datenverarbeitung, elektronisch 1 dokumentationsmethode, wenig 1 fachsprache, starr 1 fachterminologie, akzeptiert 1 philosophie-dokumentation, elektronisch
193
+ 00267*1 dokumenterschließung, automatisch 1 indexierung, automatisch 1 milos-verfahren, erweitert 1 projekt, gefördert 1 titeldaten, angereichert
194
+ 00268*1 publikation, elektronisch 1 sicht, bibliothekarisch 1 trend, aktuell
195
+ 00269*1 visualisierungstechnik, innovativ
196
+ 00270*1 inhaltserschließung, verbal 1 literaturbericht, kommentiert
197
+ 00271*1 sacherschließung, verbal
198
+ 00273*1 indexierung, syntaktisch
199
+ 00274*1 database, online 1 dokumenterschließung, inhaltlich
200
+ 00275*1 indexierung, maschinell
201
+ 00276*2 information, relevant 1 information, lokal 1 konsens, breiten 1 suchmaschine, universal 1 teil, relevant 1 web-server, eigen 1 weise, einheitlich 1 zugang, effizient
202
+ 00277*1 ausführung, nachfolgend 1 bestimmung, automatisch 1 datenbank, arbeitend 1 entscheidung, notwendig strategisch 1 entscheidung, strategisch 1 fragestellung, dokumentarisch 1 indexierung, automatisch 1 mittel, morphologisch 1 phänomen, entscheidend 1 pronomen, anaphorisch 1 regel, syntaktisch 1 sprache, natürlich 1 textmenge, groß 1 vollindexierung, automatisch 1 ziel, abschließend
203
+ 00279*1 information, praktisch 1 informationsarbeit, fachlich
204
+ 00280*1 erkenntnis, methodisch
205
+ 00281*1 leistung, wissenschaftlich
206
+ 00283*1 bibliotheksverbund, kooperativ 1 konzept, lokal 1 schnittstelle, technisch
207
+ 00284*1 darstellung, begrifflich 1 darstellung, einfach begrifflich 1 suchsystem, basiert 1 suchsystem, semantisch basiert 1 wörterbuch, umfassend 1 zusammenhang, systematisch
208
+ 00285*1 kriterium, verschieden 1 verteilung, zeitlich 1 verwendung, unter 1 wissenschaftskommunikation, formal
209
+ 00286*2 datenbank, bibliothekarisch 1 ergebnis, konsistent 1 indexierung, einheitlich 1 indexsystem, angegangen 1 konstruktion, unterschiedlich 1 oberfläche, einheitlich 1 problem, einig 1 schnittmenge, gemeinsam 1 schnittmenge, klein gemeinsam 1 suchergebnis, inkonsistent 1 suchschlüssel, gleich 1 suchschlüssel, scheinbar gleich 1 suchschlüssel, unterschiedlich 1 verbreitung, zunehmend
210
+ 00287*2 information, smart 1 datei, groß 1 ergebnismenge, groß 1 gruppierung, automatisch 1 internetquell, verschieden 1 nachricht, aktuell 1 nachricht, einzeln 1 nachricht, zusammengestellt 1 sprache, deutsch 1 version, angepasst
211
+ 00288*1 austausch, allen kommunikativ 1 austausch, kommunikativ 1 datenspeicher, elektronisch 1 erde, ganz 1 informationsverlust, ungewollt 1 objekt, intern 1 patent, international 1 schatz, gigantisch 1 schlüssel, entscheidend 1 speicher, auffindbar 1 sprache, zahlreich 1 suchoption, weit 1 technologie, alle 1 technologie, erfasst alle 1 teil, groß 1 terminologie, gemeinsam 1 terminologie, professionell 1 unternehmen, global 1 weg, benötigt 1 weltwissen, gesamt technisch 1 weltwissen, technisch 1 wirkung, integrativ 1 wirkung, stark integrativ
212
+ 00289*1 informationswissenschaftlich, unser 1 known-item-retrievaltest, unser 1 suchwerkzeug, jeweilig
213
+ 00290*1 antwort, konkret 1 aufwand, hoch technologisch 1 aufwand, technologisch 1 auskunft, genau 1 bewertung, intern 1 bewertungsverfahren, kompliziert 1 dateiformat, kryptisch 1 datenbankservermelden, mächtig 1 dokument, ständig verfügbar 1 dokument, verfügbar 1 entscheidung, intuitiv 1 hyperlink, richtig 1 information, bessere 1 intelligenz, human 1 katalog, inhaltlich sortierend 1 katalog, sortierend 1 konzept, gut 1 kriterium, inhaltlich 1 liege, entfernt 1 linkverbindung, gut 1 maschine, automatisch 1 projekt, kalifornisch 1 recherche, automatisch 1 relevanz, inhaltlich 1 roboter, chic unentwegt 1 roboter, unentwegt 1 seite, alle 1 seite, aller 1 seite, zentral 1 sportergebnis, neu 1 studie, früh 1 suchroboter, chic 1 suchsystem, alle 1 suchtechnologie, konventionell 1 surfer, unzählig 1 thema, einig 1 verarbeitung, maschinell 1 verarbeitung, rein maschinell 1 viertel, weit 1 webadresse, beliebig 1 webseite, alle 1 webseite, aller 1 webseite, indiziert 1 webseite, katalogisiert 1 welt, heterogen 1 wort, alle 1 wort, erfasst alle
214
+ 00291*3 handschrift, mittelalterlich 2 erschließung, bibliothekarisch 1 anforderung, neu 1 anforderung, völlig neu 1 belastung, stark 1 bereich, automatisiert 1 bereich, partiell automatisiert 1 bibliothek, wenig 1 bibliothekskatalog, allgemein 1 bibliotheksmaterial, herkömmlich 1 darstellung, ausführlich 1 dokument, elektronisch 1 dokument, neu elektronisch 1 festlegung, inhaltlich 1 festlegung, vielfach inhaltlich 1 gesamtindex, früh 1 handschriftenkatalog, gedruckt 1 handschriftenkatalog, gefördert 1 informationsgewinn, erheblich 1 jahr, einig 1 katalog, erstellt 1 katalog, gedruckt 1 katalogsystem, jeweilig 1 kreis, eng 1 material, verschieden 1 problem, entstehend technisch 1 problem, technisch 1 regelwerk, bibliothekarisch 1 richtlinie, gültig 1 suche, vereinheitlicht 1 system, verwendet 1 wirkung, tiefgreifend
215
+ 00292*4 inhaltserschließung, automatisch 1 akzeptanz, merklich 1 ansatz, verschieden 1 anstrengung, verstärkt 1 anwenderkreisen, breiten 1 automatisierung, zunehmend 1 informationsflut, steigend 1 interesse, wachsend 1 komponente, bestimmt 1 produkt, neu 1 softwarewerkzeug, kommerziell vertrieben 1 softwarewerkzeug, vertrieben 1 vertrieb, kommerziell 1 zugriffsverfahren, effizient
216
+ 00293*1 datenvolumen, groß 1 indexierung, maschinell 1 prozess, iterativ 1 sicht, technisch
217
+ 00294*1 ansprüche, verändert 1 benutzer, unser 1 bibliotheksbenutzer, extern 1 form, allgemein 1 form, recht allgemein 1 jahr, letzte 1 problem, häufig 1 recherchemöglichkeit, hervorragend 1 rückgang, stark 1 umfeld, universitär
218
+ 00295*1 einstieg, optimal 1 erhebung, ausgearbeitet empirisch 1 erhebung, empirisch 1 indexierung, automatisch 1 informationswissenschaftlich, seriös 1 speerspitze, technologisch 1 suchsystem, unterschiedlich 1 vokabular, geordnet kontrolliert 1 vokabular, kontrolliert
219
+ 00296*1 befehlsorientieren, ausschließlich 1 befehlsorientieren, elaboriert 1 benutzerschnittstelle, ergonomisch 1 checklist, unser 1 datensätzen, singulär 1 indexierung, automatisch 1 informationsproduzent, isoliert 1 leistungsindikator, weit 1 methode, automatisch 1 methode, suboptimal 1 online-archiv, kommerziell 1 realisierungsmöglichkeit, technisch 1 suche, gut 1 system, irgendwelch 1 umgebung, experimentell 1 wirdjedoch, vorausgesetzt
220
+ 00297*2 problem, methodisch 2 wissenschaftsforschung, empirisch 1 arbeit, vorliegend 1 basis, problematisch 1 bereich, semantisch 1 bereich, syntaktisch 1 charakter, dynamisch 1 faktor, beachtenswert 1 informationstheorie, semantisch 1 leistung, wissenschaftlich 1 problem, alle methodisch 1 problem, auftretend methodisch 1 problem, grundlegend 1 problem, offen 1 problem, spezifisch 1 publikation, elektronisch 1 publikation, zitiert 1 wirkung, wissenschaftlich
221
+ 00298*3 text, elektronisch 2 erschließung, inhaltlich 1 aspekt-klassifikation, universal 1 erschließung, automatisch inhaltlich 1 erschließung, syntaktisch inhaltlich 1 klassifikationselement, bezogen 1 klassifikationselement, inhaltlich bezogen 1 recherche, zahlreich 1 suchalgorithmen, bekannt 1 suchgegenstand, jeweilig 1 textdokument, unbekannt
222
+ 00299*1 angebot, nutzend 1 veröffentlichung, alle 1 übersetzungssystem, automatisch
223
+ 00300*1 anwendung, experimentell 1 anwendungsfall, fruchtbar 1 erschließung, inhaltlich 1 migration, sozialwissenschaftlich 1 relation, komplex 1 suche, semantisch
224
+ 00301*4 daten, inhaltlich 1 daten, formatiert 1 datenarten, inhaltlich 1 form, strukturiert 1 management, integriert 1 text, vorwiegend
225
+ 00302*1 anforderung, speziell 1 anwendungskontext, real 1 erschließung, automatisch inhaltlich 1 erschließung, inhaltlich 1 gesichtspunkt, qualitativ 1 indexierung, automatisch 1 inhaltserschließung, intellektuell 1 mangel, einig 1 methode, anerkannt 1 system, grundsätzlich unterschiedlich 1 system, lernend 1 system, unterschiedlich 1 trainingsvorlage, erstellt 1 trainingsvorlage, intellektuell erstellt
226
+ 00303*1 annotationssystem, verteilt 1 ansatz, konzeptuell 1 anwendungsbereich, exemplarisch 1 artikel, einschlägig 1 aufgabe, komplex 1 aufgabe, verbunden komplex 1 aufgabenbasieren, entsprechend 1 beitrag, vorliegend 1 benutzergruppe, verteilt 1 benutzertyp, verschieden 1 bestand, wachsend 1 datenbestand, gespeichert 1 dokumentenverarbeitung, intelligent 1 filmarchiv, europäisch 1 filmarchiv, groß europäisch 1 filmforschung, historisch 1 jahrhundert, vorig 1 korpus, groß 1 quellenmaterial, historisch 1 technik, dediziert 1 xml-basiert, modern
227
+ 00304*1 indexierung, automatisch
228
+ 00305*2 generierung, maschinell 1 abteilung, verantwortlich 1 auftraggeber, öffentlich 1 beratungsdienstleistung, international 1 beratungsschwerpunkt, weit 1 beratungsunternehmen, führend 1 externe, dokumentiert 1 material, dokumentiert extern 1 material, extern 1 netz, intern 1 projektbericht, aller intern 1 projektbericht, intern 1 stand, derzeitig 1 unternehmen, jung
229
+ 00306*5 indexierung, automatisch 1 ansatz, behandelt 1 ansatz, grundsätzlich 1 ansatz, verschieden 1 berg, ständig wachsend 1 berg, wachsend 1 buch, vorliegend 1 charakter, beispielhaft 1 darstellung, einführend 1 information, unstrukturiert 1 informationsbedarf, grundsätzlich 1 informationswirtschaft, betrieblich 1 lehrveranstaltung, entsprechend 1 mittel, manuell 1 praktiker, konfrontiert 1 seite, technisch 1 sprache, verständlich 1 tag, heutig 1 tiefendarstellung, detailliert 1 verarbeitung, schnell 1 verwaltung, öffentlich 1 voraussetzung, jeweilig 1 wirtschaft, abhängig
230
+ 00308*2 zeitschrift, wissenschaftlich 1 anwendungsbereich, fokussiert 1 autor, wissenschaftlich 1 hilfsmittel, notwendig 1 jahrgang, aktuell 1 kriterium, objektiv 1 verbesserungsvorschlag, einig 1 zeitschrift, weich 1 zeitschriftenkommunikation, wissenschaftlich
231
+ 00309*1 datenbank, relational 1 forschungsgemeinschaft, deutsch 1 projekt, gefördert
232
+ 00310*1 aktionsmuster, gewonnen sequentiell 1 aktionsmuster, sequentiell 1 angabe, betreffend 1 aufgabe, allgemein 1 auswertung, rechnerisch 1 forschungsfragen, allgemein 1 informationsraum, inhaltlich komplex 1 informationsraum, komplex 1 interpretation, zusammenfassend 1 phasenmodell, dynamisch 1 schritt, folgend 1 suchmaschinennutzer, unerfahren 1 thema, anschließend 1 untergruppe, unerfahren 1 web-rechercheaufgabe, offen 1 wissensarten, unterschiedlich
233
+ 00312*4 sacherschließung, verbal 1 abschluss, relativ 1 aufgabe, weit 1 datenstruktur, flach 1 einstieg, verbal 1 gebrauch, reichlich 1 hilfetext, englisch 1 jahr, einig 1 literatur, erschienen theologisch 1 literatur, theologisch 1 projekt, durchgeführt klein 1 projekt, klein 1 regelwerk, legend 1 sacherschließen, verbal 1 sacherschließung, doppelt verbal 1 sacherschließung, zusätzlich verbal 1 sprache, englisch 1 teil, groß
234
+ 00313*2 schaden, aufgeführt 1 anteil, unerheblich 1 ausnahme, gewiss 1 diskussion, bibliothekarisch 1 feld, verknüpft 1 fernleihen, vermeidbar 1 forschungsprojekt, betreffend 1 indexierung, automatisch 1 kostenverursachen, mittelbar 1 kostenverursachen, unmittelbar 1 neubeschaffung, vermeidbar 1 schaden, entstehend 1 schadensweise, banal 1 schreibweise, korrekt 1 schreibweise, zutreffend 1 sinn, volkswirtschaftlich 1 titelaufnahme, defizitär 1 titelaufnahme, gesucht 1 weg, vermeidbar
235
+ 00314*1 grundlagenartikel, erklärt unser 1 grundlagenartikel, unser 1 information, wichtig 1 information, wirklich wichtig 1 mach, greifbar
236
+ 00315*1 aspekt, neu 1 gesellschaft, international 1 sektion, deutsch
237
+ 00317*1 anforderung, speziell 1 anwendungskontext, real 1 erschließung, automatisch inhaltlich 1 erschließung, inhaltlich 1 gesichtspunkt, qualitativ 1 indexierung, automatisch 1 inhaltserschließung, intellektuell 1 mangel, einig 1 methode, anerkannt 1 system, grundsätzlich unterschiedlich 1 system, lernend 1 system, unterschiedlich 1 trainingsvorlage, erstellt 1 trainingsvorlage, intellektuell erstellt
238
+ 00318*1 belästigung, sexuell
239
+ 00319*2 sprache, natürlich 2 thesaurus, semantisch 1 bedeutung, rasant zunehmend 1 bedeutung, zunehmend 1 beitrag, vorliegend 1 instrument, möglich 1 mach, deutlich 1 programmiersprache, objektorientiert 1 publikationsform, verändernd 1 sprache, unser natürlich 1 text, wissensbasiert
240
+ 00320*1 analyse, semantisch 1 bedienbar, leicht 1 begriffsgut, abgebildet 1 begriffssammlung, beliebig geordnet 1 begriffssammlung, geordnet 1 bibliografie, soziologisch 1 datenbank, ursprünglich 1 dokument, relevant 1 dokument, wenig relevant 1 ordnungssystem, bestehend 1 ordnungssystem, speziell 1 schritt, nachfolgend 1 suche, ausschließlich 1 systematik, formal 1 thesaurus, beispielsweise 1 zeichenkettenabgleich, exakt
241
+ 00321*1 basis, theoretisch 1 fixierbar, schriftlich 1 form, alle 1 netz, generalisiert neuronal 1 netz, neuronal 1 notation, formal 1 struktursystem, vorgestellt
242
+ 00322*1 ausgabe, aufgelegt gedruckt 1 ausgabe, gedruckt 1 darstellung, systematisch 1 version, elektronisch
243
+ 00323*2 aspekt, pragmatisch 1 bezugnahmen, unter 1 dimension, neu 1 ergebnis, wissenschaftlich 1 information, möglich 1 informationssystem, wissenschaftlich 1 position, philosophisch 1 repräsentationsstruktur, entwickelt 1 standpunkt, unser
244
+ 00324*2 funktion, enzyklopädisch 1 anschauung, herrschend 1 bibliothek, modern 1 disziplin, aller 1 epochenübergreifend, gezielt 1 erscheinungsform, verschieden 1 forschung, künftig 1 forschungsdialog, deutsch 1 forschungsförderung, orientiert 1 gleichbleiben, prinzipiell 1 identitätsfindung, national 1 informationsaustausch, umfassend 1 informationsverarbeitung, enzyklopädisch 1 institut, rührig 1 kulturgeschichte, europäisch 1 kunstsprache, barock 1 masse, wachsend 1 medientechnik, spezifisch 1 modell, europäisch 1 neuzeit, früh 1 person, einzeln 1 philosoph, französisch 1 standard, existierend technisch 1 standard, technisch 1 thema, bestimmt 1 umschau, thematisch 1 werk, enzyklopädisch 1 wirkung, ähnlich 1 wissenssammlung, enzyklopädisch 1 zivilisation, wissenschaftlich 1 überblick, enzyklopädisch 1 überblicksbeiträge, historisch
245
+ 00325*2 soziologe, deutsch 1 deutsche, unter 1 forschungsleistung, sozialwissenschaftlich 1 schwachpunkt, bekannte 1 schwachpunkt, bestätigt bekannte 1 soziologe, antwortend 1 soziologe, unter deutsch 1 umfragergebnis, weit 1 untersuchung, durchgeführt
246
+ 00326*1 ausbildungseinrichtung, bibliothekarisch 1 ausbildungseinrichtung, deutsch bibliothekarisch 1 beschreibungsebene, strukturiert 1 indexierung, automatisch 1 information, intelligent 1 katalog, lokal 1 netz, heterogen 1 sicht, integrativ 1 thema, folgend 1 trend, folgend
247
+ 00329*2 indexierung, adaptiv 1 fragestellung, komplex 1 indexierung, mehrfach 1 indexierungsmethode, konzeptuell 1 konzeptrahm, gebunden 1 tiefenanalyse, selektiv 1 wissensstruktur, relevant 1 zielgruppe, unterschiedlich
248
+ 00330*2 maschine, weit 2 seite, weit 1 adresse, alt 1 automat, groß 1 beiträge, neu 1 beiträge, ruppig 1 betrachter, mobil 1 bildersuchen, eigen 1 browserfenster, neu 1 darstellung, einheitlich 1 datei, deutsch 1 datei, verlinkt 1 datenbanksuche, eigen 1 dokument, aufgesucht 1 dokument, elektronisch 1 dokument, findend 1 dokument, frisch aufgesucht 1 durchforschen, alles 1 einblick, klein 1 ergebnis, erstaunlich 1 ergebnis, fremd 1 forum, jeweilig 1 frage, deutsch gestellt 1 frage, gestellt 1 frage, wirklich 1 fünfhundertmal, schätzungsweise 1 google-besuch, letzte 1 hilfe, groß 1 hilfe, praktisch 1 idee, olympisch 1 index, neu 1 inhalt, häufig wechselnd 1 inhalt, klassisch 1 inhalt, wechselnd 1 insel, riesig 1 intelligenz, künstlich 1 intelligenz, maschinell 1 internet-anbieter, groß 1 kind, vermisst 1 kollegialität, unermüdlich 1 kopierbar, vorteilhaft 1 link, sogenannt 1 linux-pc-server, billigen 1 mach, lustig 1 maschinenlesbar, oft 1 mitarbeit, frei 1 monat, einig 1 multimedia-inhalt, kommend 1 nachlese, stündlich 1 netz, ganz 1 netz, unsichtbar 1 netzfreund, aller 1 nichtkommerziell, uralt 1 rahmenlos, möglich 1 rolle, untergeordnet 1 röhre, kommunizierend 1 schleuse, lieb 1 seite, angemeldet 1 seite, durchsucht 1 seite, einfach 1 seite, gefunden 1 seite, gespeichert 1 seite, jeweilig 1 server, kooperierend 1 speicher, eigen 1 speicher, weit 1 suchmaschine, beliebte 1 suchmaschine, deutsch 1 suchseite, englisch 1 suchseite, sehenswert englisch 1 telefonbuchsuche, deutsch 1 text, gefunden 1 thema, bestimmt 1 verweis, einheitlich 1 webformat, neu 1 wettstreit, international 1 wille, gut 1 wort, aller vorkommend 1 wort, paar 1 wort, vorkommend 1 wortgruppe, geschlossen 1 wortgruppe, spät geschlossen 1 wortlaut, genau 1 wunderwelt, offen 1 wunderwerk, technisch 1 übersetzung, maschinell
249
+ 00331*2 bibliothek, öffentlich 1 ekz-daten, indexiert 1 erschließungsmethode, herkömmlich 1 indexierung, maschinell 1 methode, verschieden 1 sachbuchbestand, typisch 1 titel, relevant
data/test/ref/lir.syn ADDED
@@ -0,0 +1,94 @@
1
+ 00002*1 analytik
2
+ 00004*1 query language
3
+ 00006*1 analytik
4
+ 00024*1 automation 1 deutsch / aufsatz 1 deutschaufsatz 1 schulaufsatz
5
+ 00028*1 aufgabenstellung 1 aufgabentyp
6
+ 00029*1 alteration 1 modifikation <änderung> 1 veränderung
7
+ 00034*1 auswechslung 1 tausch <austausch> 1 äußere erscheinung
8
+ 00038*1 erwerbsarbeit
9
+ 00047*1 verfasser
10
+ 00048*1 prestige 1 verfasser
11
+ 00049*1 adaptation 1 adaption 1 akkommodation
12
+ 00052*1 adaptation 1 adaption 1 akkommodation
13
+ 00053*1 erwerbsarbeit
14
+ 00054*1 propadien
15
+ 00055*1 aufgabe 1 prestige
16
+ 00058*1 analytik
17
+ 00059*1 arbeitsprodukt
18
+ 00064*1 formalerschließung 1 formalkatalogisierung 1 katalogisat <titelaufnahme> 1 titelaufnahme
19
+ 00067*1 archivwesen 1 repertorium <archiv>
20
+ 00078*1 archivwesen 1 erwerbsarbeit 1 repertorium <archiv>
21
+ 00079*1 analytik
22
+ 00081*1 analytik
23
+ 00093*1 aufgabenstellung 1 aufgabentyp 1 erwerbsarbeit
24
+ 00105*1 folge 1 fortwirken 1 nachwirkung <auswirkung>
25
+ 00128*1 dependenz 1 unselbstständigkeit 1 unselbständigkeit
26
+ 00133*1 ausbreitungsmodell 1 ausbreitungsrechnung
27
+ 00134*1 analytik
28
+ 00135*1 erwerbsarbeit
29
+ 00137*1 adaptation 1 adaption 1 akkommodation 1 alteration 1 modifikation <änderung> 1 veränderung
30
+ 00142*1 analytik 1 erwerbsarbeit
31
+ 00148*1 mathematische analysis
32
+ 00150*1 archivwesen 1 repertorium <archiv>
33
+ 00152*1 automation
34
+ 00154*1 arbeitsumgebung
35
+ 00165*2 analytik
36
+ 00166*1 beginn
37
+ 00171*1 äußere erscheinung
38
+ 00174*1 aufgabenstellung 1 aufgabentyp
39
+ 00176*1 arbeitsplatzcomputer
40
+ 00177*1 erwerbsarbeit 1 unternehmen / abteilung
41
+ 00179*1 auskunft <auskunftsdienst> 1 auskunfts- und informationstätigkeit 1 auskunftstätigkeit
42
+ 00180*2 mathematische analysis
43
+ 00182*1 aktivum 1 alter mensch 1 alterungsprozess 1 alterungsprozess <physiologie> 1 altwerden 1 anti-aging 1 betagter 1 seneszenz 1 tätigkeitsform
44
+ 00187*1 kleingruppe / betrieb 1 team / betrieb
45
+ 00197*1 argumentation 1 aufgabenstellung 1 aufgabentyp 1 erwerbsarbeit
46
+ 00206*1 individuelle arbeitsweise
47
+ 00207*1 aktualisierung
48
+ 00208*1 adaptation 1 adaption 1 akkommodation 1 aufforderung zu straftaten 1 entsprechung 1 öffentliche aufforderung zu straftaten
49
+ 00209*1 prestige
50
+ 00213*1 anwendungsbereich 1 dependenz 1 unselbstständigkeit 1 unselbständigkeit
51
+ 00216*1 analytik
52
+ 00220*1 auskunft <auskunftsdienst> 1 auskunfts- und informationstätigkeit 1 auskunftstätigkeit
53
+ 00229*1 dauerbeobachtungsfähigkeit 1 dauerüberwachungsfähigkeit 1 konzentration <psychologie> 1 vigilanz 1 wachsamkeit
54
+ 00233*2 analytik 2 deutsch / aufsatz 2 deutschaufsatz 2 schulaufsatz
55
+ 00239*1 archivierungssystem 1 aussicht 1 elektronisches archivierungssystem
56
+ 00240*1 deutsch / aufsatz 1 deutschaufsatz 1 schulaufsatz
57
+ 00241*1 analytik 1 aufgabenstellung 1 aufgabentyp
58
+ 00248*1 erwerbsarbeit 1 folge 1 fortwirken 1 nachwirkung <auswirkung>
59
+ 00250*1 ausblick
60
+ 00252*2 erwerbsarbeit
61
+ 00254*1 aktualisierung
62
+ 00257*1 steinartefakt
63
+ 00258*1 arbeitsprodukt 1 kleingruppe / betrieb 1 team / betrieb
64
+ 00260*2 bezugsquelle 1 aktueller bezug 1 gegenwartsbezug 1 zeitnähe
65
+ 00261*1 individuelle arbeitsweise
66
+ 00271*1 mathematische analysis
67
+ 00272*1 verwaltung
68
+ 00277*1 aktualisieren 1 beginn 1 erwerbsarbeit 1 evidenzhaltung 1 laufendhaltung
69
+ 00278*1 bezugsquelle
70
+ 00285*1 verfasser
71
+ 00286*2 kleingruppe / betrieb 2 team / betrieb 1 verfasser
72
+ 00288*1 auswechslung 1 propadien 1 tausch <austausch>
73
+ 00289*1 analytik
74
+ 00290*1 auskunftshaftung 1 erwerbsarbeit
75
+ 00291*1 aufgabenstellung 1 aufgabentyp 1 deutsch / aufsatz 1 deutschaufsatz 1 schulaufsatz
76
+ 00292*1 automation
77
+ 00293*1 similarity search
78
+ 00294*2 auskunftshaftung 1 arbeitsumgebung
79
+ 00296*1 abschiedsfeier 1 verabschiedung
80
+ 00297*1 erwerbsarbeit
81
+ 00298*1 propadien
82
+ 00301*1 analoges signal
83
+ 00303*2 arbeitsplatz 1 anwendung / bereich 1 anwendungsgebiet 1 aufgabenstellung 1 aufgabentyp 1 erwerbsarbeit
84
+ 00305*1 benutzer 1 bezugsquelle 1 unternehmen / abteilung
85
+ 00308*4 verfasser 1 anwendung / bereich 1 anwendungsgebiet
86
+ 00309*1 analytik
87
+ 00310*3 verfasser 2 aufgabenstellung 2 aufgabentyp 1 aussicht 1 erwerbsarbeit 1 verlauf
88
+ 00312*1 aufgabenstellung 1 aufgabentyp 1 gehörlosensprache 1 taubstummensprache
89
+ 00320*1 analytik 1 arbeit / aufwand
90
+ 00323*1 analytik
91
+ 00324*1 innere anschauung
92
+ 00326*1 ausbildungsstätte
93
+ 00329*1 argumentation
94
+ 00330*2 äußere erscheinung 1 archivwesen 1 aufforderung zu straftaten 1 genealogie 1 gänsefüßchen 1 query 1 repertorium <archiv> 1 ältestenamt 1 öffentliche aufforderung zu straftaten
@@ -0,0 +1,113 @@
1
+ require 'test/unit'
2
+ require 'lingo'
3
+
4
+ class LingoTestCase < Test::Unit::TestCase
5
+
6
+ unless const_defined?(:TEST_FILE)
7
+ TEST_FILE = 'test/de/test.txt'
8
+ dir, name = File.split(TEST_FILE)
9
+ TEST_GLOB = "{#{dir}/,store/#{File.basename(dir)}/}#{name.chomp('.txt')}*"
10
+ end
11
+
12
+ def cleanup_store
13
+ Dir[TEST_GLOB].each { |f| File.unlink(f) }
14
+ end
15
+
16
+ def split( text )
17
+ text =~ /^([^|]+)\|([^|]*)$/
18
+ [$1.nil? ? '' : $1, $2.nil? ? '' : $2]
19
+ end
20
+
21
+ # Erzeugt ein AgendaItem-Objekt
22
+ def ai( text )
23
+ c, p = split( text )
24
+ Lingo::AgendaItem.new( c, p )
25
+ end
26
+
27
+ # Erzeugt ein Token-Objekt
28
+ def tk( text )
29
+ f, a = split( text )
30
+ Lingo::Token.new( f, a )
31
+ end
32
+
33
+ # Erzeugt ein Lexical-Objekt
34
+ def lx( text )
35
+ f, a = split( text )
36
+ Lingo::Lexical.new( f, a )
37
+ end
38
+
39
+ # Erzeugt ein Word-Objekt
40
+ def wd( text, *lexis )
41
+ f, a = split( text )
42
+ w = Lingo::Word.new( f, a )
43
+ lexis.each do |text|
44
+ f, a = split( text )
45
+ w << Lingo::Lexical.new( f, a )
46
+ end
47
+ w
48
+ end
49
+
50
+ end
51
+
52
+ class AttendeeTestCase < LingoTestCase
53
+
54
+ def initialize(fname)
55
+ super
56
+
57
+ @attendee = $1.downcase if self.class.to_s =~ /TestAttendee(.*)/
58
+ @lingo, @output = Lingo.new, []
59
+ end
60
+
61
+ def meet(att_cfg, check=true)
62
+ std_cfg = {'name'=>@attendee.capitalize}
63
+ std_cfg.update({'in'=>'lines'}) unless @input.nil?
64
+ std_cfg.update({'out'=>'output'}) unless @output.nil?
65
+
66
+ @output.clear
67
+ @lingo.reset
68
+ inv_list = []
69
+ inv_list << {'helper'=>{'name'=>'Helper', 'out'=>'lines', 'spool_from'=>@input}} unless @input.nil?
70
+ inv_list << {@attendee=>std_cfg.update( att_cfg )}
71
+ inv_list << {'helper'=>{'name'=>'Helper', 'in'=>'output', 'dump_to'=>@output}} unless @output.nil?
72
+ @lingo.invite(inv_list)
73
+ @lingo.start
74
+
75
+ assert_equal(@expect, @output) if check
76
+ end
77
+
78
+ end
79
+
80
+ class Lingo
81
+
82
+ class Attendee::Helper < Attendee
83
+
84
+ protected
85
+
86
+ def init
87
+ case
88
+ when has_key?('spool_from')
89
+ @spool_from = get_key('spool_from')
90
+ @spooler = true
91
+ when has_key?('dump_to')
92
+ @dump_to = get_key('dump_to')
93
+ @spooler = false
94
+ else
95
+ forward(STR_CMD_ERR, 'Weder dump_to noch spool_from-Attribut abgegeben')
96
+ end
97
+ end
98
+
99
+ def control(cmd, param)
100
+ if @spooler
101
+ @spool_from.each { |obj| forward(obj) } if cmd==STR_CMD_TALK
102
+ else
103
+ @dump_to << AgendaItem.new(cmd, param)
104
+ end
105
+ end
106
+
107
+ def process(obj)
108
+ @dump_to << obj unless @spooler
109
+ end
110
+
111
+ end
112
+
113
+ end