lingo 1.8.1 → 1.8.2

Sign up to get free protection for your applications and to get access to all the features.
Files changed (99) hide show
  1. data/ChangeLog +23 -5
  2. data/README +1 -1
  3. data/Rakefile +5 -7
  4. data/TODO +2 -0
  5. data/bin/lingo +5 -1
  6. data/de.lang +1 -1
  7. data/en/lingo-syn.txt +0 -0
  8. data/en.lang +2 -1
  9. data/lib/lingo/attendee/abbreviator.rb +8 -9
  10. data/lib/lingo/attendee/debugger.rb +5 -4
  11. data/lib/lingo/attendee/decomposer.rb +8 -3
  12. data/lib/lingo/attendee/dehyphenizer.rb +19 -63
  13. data/lib/lingo/attendee/formatter.rb +1 -1
  14. data/lib/lingo/attendee/multi_worder.rb +67 -155
  15. data/lib/lingo/attendee/noneword_filter.rb +16 -9
  16. data/lib/lingo/attendee/object_filter.rb +1 -1
  17. data/lib/lingo/attendee/sequencer.rb +32 -63
  18. data/lib/lingo/attendee/stemmer/porter.rb +343 -0
  19. data/{info/gpl-hdr.txt → lib/lingo/attendee/stemmer.rb} +33 -0
  20. data/lib/lingo/attendee/synonymer.rb +10 -9
  21. data/lib/lingo/attendee/text_reader.rb +102 -76
  22. data/lib/lingo/attendee/text_writer.rb +23 -26
  23. data/lib/lingo/attendee/tokenizer.rb +13 -27
  24. data/lib/lingo/attendee/variator.rb +26 -66
  25. data/lib/lingo/attendee/vector_filter.rb +42 -43
  26. data/lib/lingo/attendee/word_searcher.rb +6 -7
  27. data/lib/lingo/attendee.rb +25 -7
  28. data/lib/lingo/buffered_attendee.rb +36 -10
  29. data/lib/lingo/cachable.rb +8 -8
  30. data/lib/lingo/config.rb +5 -6
  31. data/lib/lingo/ctl.rb +2 -3
  32. data/lib/lingo/database/crypter.rb +9 -26
  33. data/lib/lingo/database/gdbm_store.rb +3 -5
  34. data/lib/lingo/database/libcdb_store.rb +4 -6
  35. data/lib/lingo/database/sdbm_store.rb +11 -6
  36. data/lib/lingo/database/show_progress.rb +3 -43
  37. data/lib/lingo/database/source/key_value.rb +2 -6
  38. data/lib/lingo/database/source/multi_key.rb +3 -5
  39. data/lib/lingo/database/source/multi_value.rb +2 -6
  40. data/lib/lingo/database/source/single_word.rb +4 -6
  41. data/lib/lingo/database/source/word_class.rb +4 -10
  42. data/lib/lingo/database/source.rb +20 -18
  43. data/lib/lingo/database.rb +84 -59
  44. data/lib/lingo/error.rb +57 -1
  45. data/lib/lingo/language/dictionary.rb +21 -18
  46. data/lib/lingo/language/grammar.rb +40 -49
  47. data/lib/lingo/language/lexical.rb +6 -6
  48. data/lib/lingo/language/lexical_hash.rb +6 -0
  49. data/lib/lingo/language/word.rb +32 -15
  50. data/lib/lingo/language/word_form.rb +1 -1
  51. data/lib/lingo/language.rb +14 -25
  52. data/lib/lingo/reportable.rb +12 -10
  53. data/lib/lingo/show_progress.rb +81 -0
  54. data/lib/lingo/version.rb +1 -1
  55. data/lib/lingo.rb +63 -24
  56. data/lingo-call.cfg +6 -10
  57. data/lingo.cfg +60 -44
  58. data/lir.cfg +42 -41
  59. data/test/attendee/ts_abbreviator.rb +3 -5
  60. data/test/attendee/ts_decomposer.rb +3 -5
  61. data/test/attendee/ts_multi_worder.rb +87 -145
  62. data/test/attendee/ts_noneword_filter.rb +5 -3
  63. data/test/attendee/ts_object_filter.rb +5 -3
  64. data/test/attendee/ts_sequencer.rb +3 -5
  65. data/test/attendee/ts_stemmer.rb +309 -0
  66. data/test/attendee/ts_synonymer.rb +15 -11
  67. data/test/attendee/ts_text_reader.rb +12 -15
  68. data/test/attendee/ts_text_writer.rb +24 -29
  69. data/test/attendee/ts_tokenizer.rb +9 -7
  70. data/test/attendee/ts_variator.rb +4 -4
  71. data/test/attendee/ts_vector_filter.rb +24 -16
  72. data/test/attendee/ts_word_searcher.rb +20 -36
  73. data/test/{lir.csv → lir.vec} +0 -0
  74. data/test/ref/artikel.vec +943 -943
  75. data/test/ref/artikel.ven +943 -943
  76. data/test/ref/lir.non +201 -201
  77. data/test/ref/lir.seq +178 -178
  78. data/test/ref/lir.syn +49 -49
  79. data/test/ref/lir.vec +329 -0
  80. data/test/test_helper.rb +20 -36
  81. data/test/ts_database.rb +10 -10
  82. data/test/ts_language.rb +279 -319
  83. metadata +93 -104
  84. data/info/Objekte.png +0 -0
  85. data/info/Typen.png +0 -0
  86. data/info/database.png +0 -0
  87. data/info/db_small.png +0 -0
  88. data/info/download.png +0 -0
  89. data/info/kerze.png +0 -0
  90. data/info/language.png +0 -0
  91. data/info/lingo.png +0 -0
  92. data/info/logo.png +0 -0
  93. data/info/meeting.png +0 -0
  94. data/info/types.png +0 -0
  95. data/lingo-all.cfg +0 -89
  96. data/porter/stem.cfg +0 -311
  97. data/porter/stem.rb +0 -150
  98. data/test/ref/lir.csv +0 -329
  99. data/test.cfg +0 -79
data/test/ref/lir.non CHANGED
@@ -1,250 +1,250 @@
1
1
  00002*als
2
2
  00003*precis
3
- 00006*natürlichsprachig pc
4
- 00008*bibliotheks- precis rswk
3
+ 00006*natürlichsprachig|pc
4
+ 00008*bibliotheks-|precis|rswk
5
5
  00010*tourdefrance
6
- 00016*haager kluth schen
7
- 00017*dad schlagwortgebung
6
+ 00016*haager|kluth|schen
7
+ 00017*dad|schlagwortgebung
8
8
  00018*precis
9
- 00019*deskriptoren din t
9
+ 00019*deskriptoren|din|t
10
10
  00023*din
11
- 00024*bibliographic british library office on-line precis präkoordinierten subject
11
+ 00024*bibliographic|british|library|office|on-line|precis|präkoordinierten|subject
12
12
  00025*precis
13
13
  00026*precis
14
- 00028*als anderer bnb british library precis vor
15
- 00029*british context library mehrsprachigen precis preserved reörtert
16
- 00033*als asb sfb ssd
17
- 00034*and anderen precis
18
- 00036*probabilistische probabilistischen vom
19
- 00037*a allegro-c and as available established keyword of the with
20
- 00038*als bibliodata d-mark erster rswk so unspezifischen
21
- 00039*a als db db-thesaurus deskriptoren
22
- 00040*agris fsta vor-
14
+ 00028*als|anderer|bnb|british|library|precis|vor
15
+ 00029*british|context|library|mehrsprachigen|precis|preserved|reörtert
16
+ 00033*als|asb|sfb|ssd
17
+ 00034*and|anderen|precis
18
+ 00036*probabilistische|probabilistischen|vom
19
+ 00037*a|allegro-c|and|as|available|established|keyword|of|the|with
20
+ 00038*als|bibliodata|d-mark|erster|rswk|so|unspezifischen
21
+ 00039*a|als|db|db-thesaurus|deskriptoren
22
+ 00040*agris|fsta|vor-
23
23
  00042*als
24
- 00043*-entwicklung classification proceedingsbänden
25
- 00044*a b begroffen besonders detailliertheit monokategorialen präkombinationen ubiquitätren
26
- 00045*als boek buch- ersten het
24
+ 00043*-entwicklung|classification|proceedingsbänden
25
+ 00044*a|b|begroffen|besonders|detailliertheit|monokategorialen|präkombinationen|ubiquitätren
26
+ 00045*als|boek|buch-|ersten|het
27
27
  00046*precis
28
- 00047*bzw krtisch so
28
+ 00047*bzw|krtisch|so
29
29
  00048*als
30
- 00049*facettierung präkoordinierungsindexes
30
+ 00049*facettierung|präkoordinierungsindexes
31
31
  00050*als
32
- 00051*kwic-indexing luhn
33
- 00052*-retrieval als höherwertige vor
34
- 00053*air deskriptoren englischsprachigen inputproduktion phys
35
- 00054*als clustering dokumenten- term- vorklassifizierten
36
- 00055*- -selbst als art deskriptorensystem
37
- 00057*als ctx cui deskriptoren deskriptorliste deutschsprachigen einbringung input wort-
32
+ 00051*kwic-indexing|luhn
33
+ 00052*-retrieval|als|höherwertige|vor
34
+ 00053*air|deskriptoren|englischsprachigen|inputproduktion|phys
35
+ 00054*als|clustering|dokumenten-|term-|vorklassifizierten
36
+ 00055*-|-selbst|als|art|deskriptorensystem
37
+ 00057*als|ctx|cui|deskriptoren|deskriptorliste|deutschsprachigen|einbringung|input|wort-
38
38
  00058*abstracts
39
- 00059*oberwolfach-walke vom
39
+ 00059*oberwolfach-walke|vom
40
40
  00061*judo-ds
41
41
  00062*cscw
42
- 00067*a accessible advanced and at audio-visual automated av-materialien be been began cataloguing college compatible computerised covered decentralised departments facilities from has integrated is later library local monographs of opac other planned printed provided scores since so that the to using well with
42
+ 00067*a|accessible|advanced|and|at|audio-visual|automated|av-materialien|be|been|began|cataloguing|college|compatible|computerised|covered|decentralised|departments|facilities|from|has|integrated|is|later|library|local|monographs|of|opac|other|planned|printed|provided|scores|since|so|that|the|to|using|well|with
43
43
  00068*durham
44
- 00069*kascade scanning
45
- 00070*citation science
44
+ 00069*kascade|scanning
45
+ 00070*citation|science
46
46
  00072*gruner
47
- 00076*citation indexing
48
- 00077*and indexing probabilistisches
49
- 00078*a at by dbase describes documentalist facilitates heading introduction is it of programmed subject the use used using which
50
- 00079*als biosis dbes deskriptoren deskriptorenzuteilungen dokumentationseinheien embase inahltliche medline previews proximity recall scisearch
47
+ 00076*citation|indexing
48
+ 00077*and|indexing|probabilistisches
49
+ 00078*a|at|by|dbase|describes|documentalist|facilitates|heading|introduction|is|it|of|programmed|subject|the|use|used|using|which
50
+ 00079*als|biosis|dbes|deskriptoren|deskriptorenzuteilungen|dokumentationseinheien|embase|inahltliche|medline|previews|proximity|recall|scisearch
51
51
  00080*deskribierung
52
- 00081*condor ctx golem stairs
53
- 00082*bildschrimtextanschluß dv-drucker gruner indexierer
54
- 00083*als condor db- ir-systems verarbeiet
55
- 00086*- and at been centres describes development discusses discussion examples for germany good have indexing integrated intellectual is library needing network of okapi opacs pica project results some stage the time uk used while
56
- 00088*besonders parser
52
+ 00081*condor|ctx|golem|stairs
53
+ 00082*bildschrimtextanschluß|dv-drucker|gruner|indexierer
54
+ 00083*als|condor|db-|ir-systems|verarbeiet
55
+ 00086*-|and|at|been|centres|describes|development|discusses|discussion|examples|for|germany|good|have|indexing|integrated|intellectual|is|library|needing|network|of|okapi|opacs|pica|project|results|some|stage|the|time|uk|used|while
56
+ 00088*besonders|parser
57
57
  00090*neunziger
58
- 00091*and classification indexing on section
59
- 00093*als edv is opac opacs rswk vielfältigen
60
- 00096*oberwolfach vom
61
- 00097*air indexierungs-
62
- 00098*-praxis als bibliographic boolescher citation coupling erhaltenen finanz- juris kozitationsanalyse läßt precision recall sci science vor zitationsbezügen
58
+ 00091*and|classification|indexing|on|section
59
+ 00093*als|edv|is|opac|opacs|rswk|vielfältigen
60
+ 00096*oberwolfach|vom
61
+ 00097*air|indexierungs-
62
+ 00098*-praxis|als|bibliographic|boolescher|citation|coupling|erhaltenen|finanz-|juris|kozitationsanalyse|läßt|precision|recall|sci|science|vor|zitationsbezügen
63
63
  00100*s
64
- 00102*british library precis u
65
- 00103*asb sfb ssd swi t
66
- 00105*koindexaten opacs orientierungslosigkeit ranking recall relevance softwareseitige
67
- 00106*deutschsprachige pcs
68
- 00107*indexing wai
69
- 00115*als condor
70
- 00116*als deskriptoren
64
+ 00102*british|library|precis|u
65
+ 00103*asb|sfb|ssd|swi|t
66
+ 00105*koindexaten|opacs|orientierungslosigkeit|ranking|recall|relevance|softwareseitige
67
+ 00106*deutschsprachige|pcs
68
+ 00107*indexing|wai
69
+ 00115*als|condor
70
+ 00116*als|deskriptoren
71
71
  00117*air
72
72
  00121*als
73
- 00122*air phys
73
+ 00122*air|phys
74
74
  00123*phys
75
- 00124*air phys
76
- 00125*adreßbuch yellow übersichtlichkeit
77
- 00127*als hypertextfähigkeiten
78
- 00128*läßt selegiert vollständigkeits- vom
79
- 00129*als deskriptorgattungen eppelsheimer facettierung vor
75
+ 00124*air|phys
76
+ 00125*adreßbuch|yellow|übersichtlichkeit
77
+ 00127*als|hypertextfähigkeiten
78
+ 00128*läßt|selegiert|vollständigkeits-|vom
79
+ 00129*als|deskriptorgattungen|eppelsheimer|facettierung|vor
80
80
  00130*wortrelationierung
81
- 00131*a agencies agency and are austria available be been established for germany have ismn italy lithuania luxembourg music of on participating published recording scheme sept should st switzerland the titles
82
- 00132*advantages and as by documents efficient examines exploring for importance increase indexing libraries new of offered outlines possibility public retrieving storing subject technology the value well
83
- 00133*- and ifla indexing nein opac practices principles prä- präkoordination rswk s subject the vor-
84
- 00135*als vor
85
- 00136*ab agency black men security
86
- 00137*als besonders
87
- 00138*als publikations-
88
- 00140*a amount and available be bibiothek bibliographic bodies by central changes clearly collection converted corporate defined depends effectivity entries exchange floppy for from further guidelines has heading include into is keyword library magnetic may microfiche more new of on over particular planned possible precise produced publication reduced reference selective tape the topical unimarc upon
89
- 00141*a and as at boolean by card catalogue catalogues cataloguing compared computerised concept configuration describes entries essential examines fields for free from function functions including indexing its library linked looks of offered opac oppor-tunities other outside principles restricted rules search searches searching specific structure subject techniques the title to topics traditional vague well with
90
- 00142*bzw möglichekeiten wissenschafts-
81
+ 00131*a|agencies|agency|and|are|austria|available|be|been|established|for|germany|have|ismn|italy|lithuania|luxembourg|music|of|on|participating|published|recording|scheme|sept|should|st|switzerland|the|titles
82
+ 00132*advantages|and|as|by|documents|efficient|examines|exploring|for|importance|increase|indexing|libraries|new|of|offered|outlines|possibility|public|retrieving|storing|subject|technology|the|value|well
83
+ 00133*-|and|ifla|indexing|nein|opac|practices|principles|prä-|präkoordination|rswk|s|subject|the|vor-
84
+ 00135*als|vor
85
+ 00136*ab|agency|black|men|security
86
+ 00137*als|besonders
87
+ 00138*als|publikations-
88
+ 00140*a|amount|and|available|be|bibiothek|bibliographic|bodies|by|central|changes|clearly|collection|converted|corporate|defined|depends|effectivity|entries|exchange|floppy|for|from|further|guidelines|has|heading|include|into|is|keyword|library|magnetic|may|microfiche|more|new|of|on|over|particular|planned|possible|precise|produced|publication|reduced|reference|selective|tape|the|topical|unimarc|upon
89
+ 00141*a|and|as|at|boolean|by|card|catalogue|catalogues|cataloguing|compared|computerised|concept|configuration|describes|entries|essential|examines|fields|for|free|from|function|functions|including|indexing|its|library|linked|looks|of|offered|opac|oppor-tunities|other|outside|principles|restricted|rules|search|searches|searching|specific|structure|subject|techniques|the|title|to|topics|traditional|vague|well|with
90
+ 00142*bzw|möglichekeiten|wissenschafts-
91
91
  00143*pc-thesaurusprogrammen
92
92
  00144*faz
93
93
  00145*evaluierung
94
- 00146*opac universitäts-
95
- 00148*a academic and are argued back-of-the-book be between branch by can cognitive comprehension concept consists debeloped differences dijk discussed document followed for indexed indexing is it kintsch mind of process processing production set such suggested testing that the to van
96
- 00149*a and areas automated automatic automatically average be being combination documents each economic effectiveness energy examines for from growth immediate included indexed indexing intellectual it of per presents randomly ranged ranging recall references results search seems selected should sources study subject that the there therefore to topic topics ulb used were while with
94
+ 00146*opac|universitäts-
95
+ 00148*a|academic|and|are|argued|back-of-the-book|be|between|branch|by|can|cognitive|comprehension|concept|consists|debeloped|differences|dijk|discussed|document|followed|for|indexed|indexing|is|it|kintsch|mind|of|process|processing|production|set|such|suggested|testing|that|the|to|van
96
+ 00149*a|and|areas|automated|automatic|automatically|average|be|being|combination|documents|each|economic|effectiveness|energy|examines|for|from|growth|immediate|included|indexed|indexing|intellectual|it|of|per|presents|randomly|ranged|ranging|recall|references|results|search|seems|selected|should|sources|study|subject|that|the|there|therefore|to|topic|topics|ulb|used|were|while|with
97
97
  00150*als
98
98
  00151*world-wide-web
99
- 00153*a and between bibliographic by citation cocitation commercial difference discusses example for illustrates implemented linking means of offer on presents sci science so-called st the time within
100
- 00154*-ebenen als amphore pc-arbeitsplätze sequenz- so vor
101
- 00155*als deutschsprachige deutschsprachigen faz nzz taz trunkierungsmöglichkeiten
99
+ 00153*a|and|between|bibliographic|by|citation|cocitation|commercial|difference|discusses|example|for|illustrates|implemented|linking|means|of|offer|on|presents|sci|science|so-called|st|the|time|within
100
+ 00154*-ebenen|als|amphore|pc-arbeitsplätze|sequenz-|so|vor
101
+ 00155*als|deutschsprachige|deutschsprachigen|faz|nzz|taz|trunkierungsmöglichkeiten
102
102
  00157*opac
103
103
  00158*alektronische
104
- 00159*i milos
104
+ 00159*i|milos
105
105
  00161*milos
106
- 00164*engines search web wide world www
107
- 00165*- als bibliometrischer citation host science stn vor
108
- 00166*dier entlinearisierung natursprachigen so
109
- 00167*- and deutschsprachige erschließungs- german girt indexing
110
- 00168*beijing bibliographic conference control ifla iv
111
- 00169*alphabetical and appeared bavarian began between catalogue computerization entries erlanger filmed for from has introduced libraries library microfiche now of one periodicals printed produced publication saw the third to university using went
112
- 00170*-konzept a added and are as at attempts between bring can clearinghouse concentration concept consequences cooperation despite dfg discusses for from german groups increasing indexing job librarians libraries library mechanisms methods networked of on other outlines perspective realm relatively research search several similar society sources sourvces special specific structuring subject such technical the to together unstructured use value work
113
- 00171*ersten mag zukunftsmärkte
106
+ 00164*engines|search|web|wide|world|www
107
+ 00165*-|als|bibliometrischer|citation|host|science|stn|vor
108
+ 00166*dier|entlinearisierung|natursprachigen|so
109
+ 00167*-|and|deutschsprachige|erschließungs-|german|girt|indexing
110
+ 00168*beijing|bibliographic|conference|control|ifla|iv
111
+ 00169*alphabetical|and|appeared|bavarian|began|between|catalogue|computerization|entries|erlanger|filmed|for|from|has|introduced|libraries|library|microfiche|now|of|one|periodicals|printed|produced|publication|saw|the|third|to|university|using|went
112
+ 00170*-konzept|a|added|and|are|as|at|attempts|between|bring|can|clearinghouse|concentration|concept|consequences|cooperation|despite|dfg|discusses|for|from|german|groups|increasing|indexing|job|librarians|libraries|library|mechanisms|methods|networked|of|on|other|outlines|perspective|realm|relatively|research|search|several|similar|society|sources|sourvces|special|specific|structuring|subject|such|technical|the|to|together|unstructured|use|value|work
113
+ 00171*ersten|mag|zukunftsmärkte
114
114
  00172*web
115
- 00173*- hillarys melbournes
116
- 00174*bibliometrics bibliometrische bibliometrischen cd-edition citation rückkopplung science social visual vor
117
- 00175*alphabetic and comparison coordinate experimental subject
118
- 00176*als bmbf fiz förderkonzept insti kmu medoc vom vor
119
- 00177*audio- informations- iud- ocr presse- radio- so workgrouping
120
- 00178*accessible and are at before catalogue century collection countries described digitization for from german-speaking graphic incipit incorporating incunabula known libraries makes more of old printed project projects representation short th than the title university up vd17 works
115
+ 00173*-|hillarys|melbournes
116
+ 00174*bibliometrics|bibliometrische|bibliometrischen|cd-edition|citation|rückkopplung|science|social|visual|vor
117
+ 00175*alphabetic|and|comparison|coordinate|experimental|subject
118
+ 00176*als|bmbf|fiz|förderkonzept|insti|kmu|medoc|vom|vor
119
+ 00177*audio-|informations-|iud-|ocr|presse-|radio-|so|workgrouping
120
+ 00178*accessible|and|are|at|before|catalogue|century|collection|countries|described|digitization|for|from|german-speaking|graphic|incipit|incorporating|incunabula|known|libraries|makes|more|of|old|printed|project|projects|representation|short|th|than|the|title|university|up|vd17|works
121
121
  00179*adreßsammlungen
122
- 00180*a analyzing and be by can canal catalogue catalogues compared compounds consequently field found german if library linguistic linguistically ls mehrsprachigen of presents psychology question questions reduces required results search searching simplifies so that the their them they title titles to translating variants with
122
+ 00180*a|analyzing|and|be|by|can|canal|catalogue|catalogues|compared|compounds|consequently|field|found|german|if|library|linguistic|linguistically|ls|mehrsprachigen|of|presents|psychology|question|questions|reduces|required|results|search|searching|simplifies|so|that|the|their|them|they|title|titles|to|translating|variants|with
123
123
  00181*so
124
- 00182*chilias eu-projekt medien- www
125
- 00184*excalibur fulcrum inmagic pls verity zylab
126
- 00185*automatichen clustering
127
- 00186*air als wai
128
- 00188*hyperkatalog opac vom
129
- 00191*als begriffs- clusteringverfahrens prioritätsklassen so
130
- 00192*als stich- vermittels
124
+ 00182*chilias|eu-projekt|medien-|www
125
+ 00184*excalibur|fulcrum|inmagic|pls|verity|zylab
126
+ 00185*automatichen|clustering
127
+ 00186*air|als|wai
128
+ 00188*hyperkatalog|opac|vom
129
+ 00191*als|begriffs-|clusteringverfahrens|prioritätsklassen|so
130
+ 00192*als|stich-|vermittels
131
131
  00193*dk
132
132
  00194*precis
133
133
  00195*precis
134
- 00197*dokumentare relevenaz vor
134
+ 00197*dokumentare|relevenaz|vor
135
135
  00198*kascade
136
- 00199*and bzw freewaissf german girt indexierungs- indexing pretest
136
+ 00199*and|bzw|freewaissf|german|girt|indexierungs-|indexing|pretest
137
137
  00200*-
138
- 00202*about advantages and are arising as chain choice correction cumulation described detailed dictionary disadvantages discussed emphasis entries explained feasibilities following from given here is kwic kwoc laid limited machine-readable method methods of on procedure procedures processing production recording records setting sorting studied the their use used various when with
139
- 00203*and bibliographic conference control council ifla iv
140
- 00204*- aacr aacr2r and beitraege c carrier content delsey fattahi graham hirons howarth j logic modeling of opac principles r records seriality t the toronto u ueber
141
- 00205*opacs subito vlb
142
- 00206*milos universitäts-
143
- 00207*apple deskriptoren edv mikroorganismen ms-access phytomedizinischer protugiesisch scab vielfältigen
144
- 00208*- als art disambiguierung fremdsprachiger relationierung swd systematisierung
145
- 00209*als indexat
146
- 00210*digitalisierter indexierungs- mining textuelle
147
- 00211*girt indexierungs- iz
148
- 00212*bzw probabilistische probabilistischen subkollektionen subkollektionsspezifischen übredies
149
- 00213*besonders deskriptoren deskriptorensystem h hüther mehreren so vor
150
- 00217*kascade universitäts-
138
+ 00202*about|advantages|and|are|arising|as|chain|choice|correction|cumulation|described|detailed|dictionary|disadvantages|discussed|emphasis|entries|explained|feasibilities|following|from|given|here|is|kwic|kwoc|laid|limited|machine-readable|method|methods|of|on|procedure|procedures|processing|production|recording|records|setting|sorting|studied|the|their|use|used|various|when|with
139
+ 00203*and|bibliographic|conference|control|council|ifla|iv
140
+ 00204*-|aacr|aacr2r|and|beitraege|c|carrier|content|delsey|fattahi|graham|hirons|howarth|j|logic|modeling|of|opac|principles|r|records|seriality|t|the|toronto|u|ueber
141
+ 00205*opacs|subito|vlb
142
+ 00206*milos|universitäts-
143
+ 00207*apple|deskriptoren|edv|mikroorganismen|ms-access|phytomedizinischer|protugiesisch|scab|vielfältigen
144
+ 00208*-|als|art|disambiguierung|fremdsprachiger|relationierung|swd|systematisierung
145
+ 00209*als|indexat
146
+ 00210*digitalisierter|indexierungs-|mining|textuelle
147
+ 00211*girt|indexierungs-|iz
148
+ 00212*bzw|probabilistische|probabilistischen|subkollektionen|subkollektionsspezifischen|übredies
149
+ 00213*besonders|deskriptoren|deskriptorensystem|h|hüther|mehreren|so|vor
150
+ 00217*kascade|universitäts-
151
151
  00218*opac
152
- 00219*rswk universitäts-
153
- 00221*a and as be compared consumer decreases describe increases input library modelled on over previous price processing produced quality quantity reactions reflect should showing the this whole with would years
152
+ 00219*rswk|universitäts-
153
+ 00221*a|and|as|be|compared|consumer|decreases|describe|increases|input|library|modelled|on|over|previous|price|processing|produced|quality|quantity|reactions|reflect|should|showing|the|this|whole|with|would|years
154
154
  00222*din
155
- 00223*- als
155
+ 00223*-|als
156
156
  00224*philosophicus
157
- 00226*and bibliographic bibliography classification conference control ifla indexing iv on s section
158
- 00227*- baer citation informationswisenschaftlichen science vor
159
- 00228*manche onliner psychologen
160
- 00229*- booleschen freestyle lexis-nexis like more natürlichsprachige professionals this
161
- 00230*als anderen aspektische aspektischen controlled trunkierung zweiten
157
+ 00226*and|bibliographic|bibliography|classification|conference|control|ifla|indexing|iv|on|s|section
158
+ 00227*-|baer|citation|informationswisenschaftlichen|science|vor
159
+ 00228*manche|onliner|psychologen
160
+ 00229*-|booleschen|freestyle|lexis-nexis|like|more|natürlichsprachige|professionals|this
161
+ 00230*als|anderen|aspektische|aspektischen|controlled|trunkierung|zweiten
162
162
  00231*rswk
163
- 00232*- ab als basiern db db-version precis rswk sacherschließunf
164
- 00233*- dbase document fiff iv matching nachberarbeitung parametrisiertes so vom
165
- 00234*and aufl cataloguing classification erste headings incompatibility ipc ipc3 ipc4 issues library monohierarchisch of sog subject
163
+ 00232*-|ab|als|basiern|db|db-version|precis|rswk|sacherschließunf
164
+ 00233*-|dbase|document|fiff|iv|matching|nachberarbeitung|parametrisiertes|so|vom
165
+ 00234*and|aufl|cataloguing|classification|erste|headings|incompatibility|ipc|ipc3|ipc4|issues|library|monohierarchisch|of|sog|subject
166
166
  00235*padok
167
- 00236*evaluierungsergebnisse meheren padok-ii
168
- 00237*anderen such- web wide world yahoo
169
- 00238*web wide world
170
- 00239*ab als dokumentars vademecum vor-
171
- 00240*a preus preuss
172
- 00242*universitäts- vom
167
+ 00236*evaluierungsergebnisse|meheren|padok-ii
168
+ 00237*anderen|such-|web|wide|world|yahoo
169
+ 00238*web|wide|world
170
+ 00239*ab|als|dokumentars|vademecum|vor-
171
+ 00240*a|preus|preuss
172
+ 00242*universitäts-|vom
173
173
  00244*ins
174
- 00245*gbv tib
175
- 00247*als bündelt delivery document enthaltenen intranet- isi mill multidisziplinarität of philadelphia science vor web www
176
- 00248*als klassifikatorischer kompendium
177
- 00249*metadatenformat metadatenschnittstelle
178
- 00250*www zweite
179
- 00252*ersten vor zweiten
180
- 00254*american apa association deskriptoren ins of psychological psycinfo psyndex psytkom records subject verschlagwortet zpid
181
- 00255*als beiratsmiglied censorship geziehen of on ruge uta vor
174
+ 00245*gbv|tib
175
+ 00247*als|bündelt|delivery|document|enthaltenen|intranet-|isi|mill|multidisziplinarität|of|philadelphia|science|vor|web|www
176
+ 00248*als|klassifikatorischer|kompendium
177
+ 00249*metadatenformat|metadatenschnittstelle
178
+ 00250*www|zweite
179
+ 00252*ersten|vor|zweiten
180
+ 00254*american|apa|association|deskriptoren|ins|of|psychological|psycinfo|psyndex|psytkom|records|subject|verschlagwortet|zpid
181
+ 00255*als|beiratsmiglied|censorship|geziehen|of|on|ruge|uta|vor
182
182
  00256*editoral
183
183
  00257*szeintometrie
184
- 00258*core hochwertiges mathematics metadaten preprint search
184
+ 00258*core|hochwertiges|mathematics|metadaten|preprint|search
185
185
  00259*ic
186
- 00260*- als anderer mehreren
187
- 00261*deutschsprachiger i ii kascade milos ulb
188
- 00262*niedersächsischen oclc staats-
189
- 00263*als ic knowledge web
190
- 00264*als boole deskriptoren fulcrum girt iz recall sche vergebenen vom
191
- 00265*- classification ddc dewey henrichs melvil ranganathan sozial-
192
- 00266*als ic knowledge web
193
- 00267*dfg kascade scanning selix theas
194
- 00268*- ii
195
- 00270*a about als and application beyond by catalogues classification conventional current documentation explains explores faceted go ideas identifying indexing input investigates its keyword language languages library narrow need occurring of on on-line points principle regularly replacement searches searching structure subject syntactical terminology the their theory thinking to traditional view with
196
- 00271*a american and applications are been by characteristics classification consistency descriptors detailed done field firstly following for given has headings increase indexing is its little mathematical mathematics needs now of practical presented presents proposal quality results scheme society some special study studying subject such terminology the to up using very which work
197
- 00272*a and are bismas cataloguing categories category cologne construct content described description descriptive disciplines document does fhbd for free fringe further is library mainly now on permit possibilities project provided ran scheme school so the to using whole
198
- 00273*- a achieved and arrival as ask be boolean building catalogues cataloguing categories component consequences could descriptive essential for fur indexing introduction inversion is librarians might number of or prepared public result role rswk rules since subject syntactic the vom whether with
199
- 00274*a address advantages and as assessment automatic card catalogues concludes content cr-rom development disadvantages document effective examines existing indexing library make methods more needs of opacs postcoordinated precoordinated presents regard relevance representation storage such that the to with
200
- 00275*-aug a and avoiding between book college cologne demands from fur helpful high ii indexing is keyword librarianship mechanised mechanized methods milos more no nov numbers of or proved published quality ran reducing result searches semantic standardized successful than the title titles unsatisfied used vocabulary
201
- 00276*ab als and engines informations- kornmunikationssystem math-net search web
202
- 00277*als as d deskriptoren deskriptorterm deskriptorterme indexierungssparche natürlichsprachige nominalsyntagma nominalsyntagmas nominalsyntagmen nominalsyntagna nonimalsyntagma nutzbarmachung referentielle referentiellen sydo-lyon
203
- 00278*- heimanwender
204
- 00281*- usa
205
- 00282*- developments meta-lib metadata new sub
206
- 00284*ab als concepto lenunaindexierung
207
- 00285*citation science social szientometrische szientometrischen
208
- 00286*- ag erste etc gaukelt km kobv kvk mueller udenscheid vor
209
- 00287*als audesc autindex ca deskribierungsmodul deskriptoren iai label mehrsprachigen newscan
210
- 00288*- classification egal ipc knowledge mehrsprachigkeit so
211
- 00289*- -statistik ab alta altavista google northern the vista web wide world
212
- 00290*- -mal ab alltheweb allthewebs als altavista anderen andrei audiodateien betrieben bright brin broder compac components connected deutschsprachiger dritter economy enthaltenen giant gliedert google googol handverlesene ibm info- larry looksmart masseninedium mehrsprachigen mono- new rechercheure scc scooter sergej so speichert strongly tendrils university us-softwareunternehmen vom vorstrukturierte web werbepreise wide world www yahoo zweite
213
- 00291*als anderen betrieben dfg erfassungssystern erstes hida nachlässe so stäcker textverarbeitung7 vom vor
214
- 00292*als informations- workflow
215
- 00293*- als anderen grundzügen irs koordinativer nikolaj phonetische phonologische precision recall s trubetzkoy vor
216
- 00294*als angloamerikanischen beschrieb faq hochwertigen kornmunikationsmedium leicester librarians mangelt of pc per project the to ub university vom
217
- 00295*- als engines homonym- known search searches synonym- web wide world
218
- 00296*- bzw egal how independents informetrischen know minimalismus natürlichsprachiger professional vom web wide world
219
- 00297*als factor impact publikations- vor working
220
- 00298*anderen aspectix bzw fachgebiets- precision recall textcorpus unähnlich www
221
- 00300*cases donnerte erste iec iso maps multiple topic use xtm
222
- 00301*- a anderen b klassen ordnungs- u unüberschaubare z
223
- 00302*autonomy booleschem doccat ersteres g gruner ibm inc j probabilistisches so vom
224
- 00303*als annotieren collate digitalisiertem dokumentmanagement- kollaborativen komfortable metadaten vom wissens- www
225
- 00305*consult content eutelis ic regulatorischen smartcardanwendungen telecom telekommunikation telekommunikations- telekommunikationsdiensten
226
- 00306*als thernatik urnstandes vor
227
- 00308*- -außer anderen bzw citation factor for immediacy impact informetrische informetrischen jcr periodikabestände scientific so soziogramme vor
228
- 00309*dfg elib engines mwk niedersächsischen search textuellen volltexdatenbanken
229
- 00310*- ab als aufgaben- deutschsprachigen erfahrene erfahrener ko-selektion logfiles per performance- web wide world
230
- 00311*alembert cacouacs d diderot encyclopédie
231
- 00312*- allegro als american anderem association atla ca desiderat englischsprachige englischsprachigen etliche indexierer libraries of parergon provenienz rezenter rswk swid theological tübinger vor zid
232
- 00313*- auflagen- bzw ins kollationsangaben mag opac urheber- usw verfasser- vom vorakzessionsarbeiten
233
- 00314*based content
234
- 00315*globalisierung proceedings
186
+ 00260*-|als|anderer|mehreren
187
+ 00261*deutschsprachiger|i|ii|kascade|milos|ulb
188
+ 00262*niedersächsischen|oclc|staats-
189
+ 00263*als|ic|knowledge|web
190
+ 00264*als|boole|deskriptoren|fulcrum|girt|iz|recall|sche|vergebenen|vom
191
+ 00265*-|classification|ddc|dewey|henrichs|melvil|ranganathan|sozial-
192
+ 00266*als|ic|knowledge|web
193
+ 00267*dfg|kascade|scanning|selix|theas
194
+ 00268*-|ii
195
+ 00270*a|about|als|and|application|beyond|by|catalogues|classification|conventional|current|documentation|explains|explores|faceted|go|ideas|identifying|indexing|input|investigates|its|keyword|language|languages|library|narrow|need|occurring|of|on|on-line|points|principle|regularly|replacement|searches|searching|structure|subject|syntactical|terminology|the|their|theory|thinking|to|traditional|view|with
196
+ 00271*a|american|and|applications|are|been|by|characteristics|classification|consistency|descriptors|detailed|done|field|firstly|following|for|given|has|headings|increase|indexing|is|its|little|mathematical|mathematics|needs|now|of|practical|presented|presents|proposal|quality|results|scheme|society|some|special|study|studying|subject|such|terminology|the|to|up|using|very|which|work
197
+ 00272*a|and|are|bismas|cataloguing|categories|category|cologne|construct|content|described|description|descriptive|disciplines|document|does|fhbd|for|free|fringe|further|is|library|mainly|now|on|permit|possibilities|project|provided|ran|scheme|school|so|the|to|using|whole
198
+ 00273*-|a|achieved|and|arrival|as|ask|be|boolean|building|catalogues|cataloguing|categories|component|consequences|could|descriptive|essential|for|fur|indexing|introduction|inversion|is|librarians|might|number|of|or|prepared|public|result|role|rswk|rules|since|subject|syntactic|the|vom|whether|with
199
+ 00274*a|address|advantages|and|as|assessment|automatic|card|catalogues|concludes|content|cr-rom|development|disadvantages|document|effective|examines|existing|indexing|library|make|methods|more|needs|of|opacs|postcoordinated|precoordinated|presents|regard|relevance|representation|storage|such|that|the|to|with
200
+ 00275*-aug|a|and|avoiding|between|book|college|cologne|demands|from|fur|helpful|high|ii|indexing|is|keyword|librarianship|mechanised|mechanized|methods|milos|more|no|nov|numbers|of|or|proved|published|quality|ran|reducing|result|searches|semantic|standardized|successful|than|the|title|titles|unsatisfied|used|vocabulary
201
+ 00276*ab|als|and|engines|informations-|kornmunikationssystem|math-net|search|web
202
+ 00277*als|as|d|deskriptoren|deskriptorterm|deskriptorterme|indexierungssparche|natürlichsprachige|nominalsyntagma|nominalsyntagmas|nominalsyntagmen|nominalsyntagna|nonimalsyntagma|nutzbarmachung|referentielle|referentiellen|sydo-lyon
203
+ 00278*-|heimanwender
204
+ 00281*-|usa
205
+ 00282*-|developments|meta-lib|metadata|new|sub
206
+ 00284*ab|als|concepto|lenunaindexierung
207
+ 00285*citation|science|social|szientometrische|szientometrischen
208
+ 00286*-|ag|erste|etc|gaukelt|km|kobv|kvk|mueller|udenscheid|vor
209
+ 00287*als|audesc|autindex|ca|deskribierungsmodul|deskriptoren|iai|label|mehrsprachigen|newscan
210
+ 00288*-|classification|egal|ipc|knowledge|mehrsprachigkeit|so
211
+ 00289*-|-statistik|ab|alta|altavista|google|northern|the|vista|web|wide|world
212
+ 00290*-|-mal|ab|alltheweb|allthewebs|als|altavista|anderen|andrei|audiodateien|betrieben|bright|brin|broder|compac|components|connected|deutschsprachiger|dritter|economy|enthaltenen|giant|gliedert|google|googol|handverlesene|ibm|info-|larry|looksmart|masseninedium|mehrsprachigen|mono-|new|rechercheure|scc|scooter|sergej|so|speichert|strongly|tendrils|university|us-softwareunternehmen|vom|vorstrukturierte|web|werbepreise|wide|world|www|yahoo|zweite
213
+ 00291*als|anderen|betrieben|dfg|erfassungssystern|erstes|hida|nachlässe|so|stäcker|textverarbeitung7|vom|vor
214
+ 00292*als|informations-|workflow
215
+ 00293*-|als|anderen|grundzügen|irs|koordinativer|nikolaj|phonetische|phonologische|precision|recall|s|trubetzkoy|vor
216
+ 00294*als|angloamerikanischen|beschrieb|faq|hochwertigen|kornmunikationsmedium|leicester|librarians|mangelt|of|pc|per|project|the|to|ub|university|vom
217
+ 00295*-|als|engines|homonym-|known|search|searches|synonym-|web|wide|world
218
+ 00296*-|bzw|egal|how|independents|informetrischen|know|minimalismus|natürlichsprachiger|professional|vom|web|wide|world
219
+ 00297*als|factor|impact|publikations-|vor|working
220
+ 00298*anderen|aspectix|bzw|fachgebiets-|precision|recall|textcorpus|unähnlich|www
221
+ 00300*cases|donnerte|erste|iec|iso|maps|multiple|topic|use|xtm
222
+ 00301*-|a|anderen|b|klassen|ordnungs-|u|unüberschaubare|z
223
+ 00302*autonomy|booleschem|doccat|ersteres|g|gruner|ibm|inc|j|probabilistisches|so|vom
224
+ 00303*als|annotieren|collate|digitalisiertem|dokumentmanagement-|kollaborativen|komfortable|metadaten|vom|wissens-|www
225
+ 00305*consult|content|eutelis|ic|regulatorischen|smartcardanwendungen|telecom|telekommunikation|telekommunikations-|telekommunikationsdiensten
226
+ 00306*als|thernatik|urnstandes|vor
227
+ 00308*-|-außer|anderen|bzw|citation|factor|for|immediacy|impact|informetrische|informetrischen|jcr|periodikabestände|scientific|so|soziogramme|vor
228
+ 00309*dfg|elib|engines|mwk|niedersächsischen|search|textuellen|volltexdatenbanken
229
+ 00310*-|ab|als|aufgaben-|deutschsprachigen|erfahrene|erfahrener|ko-selektion|logfiles|per|performance-|web|wide|world
230
+ 00311*alembert|cacouacs|d|diderot|encyclopédie
231
+ 00312*-|allegro|als|american|anderem|association|atla|ca|desiderat|englischsprachige|englischsprachigen|etliche|indexierer|libraries|of|parergon|provenienz|rezenter|rswk|swid|theological|tübinger|vor|zid
232
+ 00313*-|auflagen-|bzw|ins|kollationsangaben|mag|opac|urheber-|usw|verfasser-|vom|vorakzessionsarbeiten
233
+ 00314*based|content
234
+ 00315*globalisierung|proceedings
235
235
  00316*fulcrum-evaluierung
236
- 00317*autonomy booleschem doccat ersteres g gruner ibm inc j probabilistisches so vom
237
- 00318*ins web
238
- 00319*anderem besonders daten- document dtd generalized html hypertext language markup metasprache objektorientiertheit sgml web wide world www
239
- 00320*-effizienz als deskriptorenfeldern eher so vor
240
- 00321*biosphäre demarkationen gnn polanyi so
241
- 00322*englischsprachiger foris solis
242
- 00323*forschungs- vor
243
- 00324*- ab alembert als d denis diderot encyclopedie encyclopédie enzyklopädistik iso jorio le maps rond topic um- versprach vom weiterzuentwickeln zotter
244
- 00325*als citation for nahmen phanomen science scientific social ssci unsubstanzieller
245
- 00326*- -technik anderen metadaten opacs vom webopacs
246
- 00327*erl-5 webspirs-5
247
- 00328*and bibliographic bibliography cataloguing classification conference control ifla indexing iv on section
248
- 00329*multiple multipler
249
- 00330*- a ab alltheweb als altavista alto anderen ans art atomz auskunftei auskunfteien beiträgen berners-lee besonders brin britannica britney cern chtml compact deja domane e-mails encyclopedia ersten exotika factory fanden fido- flash freefind fünfte gb gluonenkraft google googles hotbot html hypertext imode index- infoseek inktomi ins its julius katalogisierer kepnt krabbelprogrammen krabbler krabbler-pcs krabblern könnte- la larry legebatterie look luis macromedia mag manche mantua meal mehreren meta-crawler monier mönatlich netzausforschung northern palo petabyte placement plexiglas quelltext rubriziert s sailer search sergey so spears speichert stöbert t-online terabyte threads tim trenker uberblick unauffindbar url-adreßdatenbank usancen verbitten vom vor wapinhalte web webbrain webtop wide world xipolis yahoo zollund zuläßt zweiter zügen à übersuchmaschinen
250
- 00331*- idx stich-
236
+ 00317*autonomy|booleschem|doccat|ersteres|g|gruner|ibm|inc|j|probabilistisches|so|vom
237
+ 00318*ins|web
238
+ 00319*anderem|besonders|daten-|document|dtd|generalized|html|hypertext|language|markup|metasprache|objektorientiertheit|sgml|web|wide|world|www
239
+ 00320*-effizienz|als|deskriptorenfeldern|eher|so|vor
240
+ 00321*biosphäre|demarkationen|gnn|polanyi|so
241
+ 00322*englischsprachiger|foris|solis
242
+ 00323*forschungs-|vor
243
+ 00324*-|ab|alembert|als|d|denis|diderot|encyclopedie|encyclopédie|enzyklopädistik|iso|jorio|le|maps|rond|topic|um-|versprach|vom|weiterzuentwickeln|zotter
244
+ 00325*als|citation|for|nahmen|phanomen|science|scientific|social|ssci|unsubstanzieller
245
+ 00326*-|-technik|anderen|metadaten|opacs|vom|webopacs
246
+ 00327*erl-5|webspirs-5
247
+ 00328*and|bibliographic|bibliography|cataloguing|classification|conference|control|ifla|indexing|iv|on|section
248
+ 00329*multiple|multipler
249
+ 00330*-|a|ab|alltheweb|als|altavista|alto|anderen|ans|art|atomz|auskunftei|auskunfteien|beiträgen|berners-lee|besonders|brin|britannica|britney|cern|chtml|compact|deja|domane|e-mails|encyclopedia|ersten|exotika|factory|fanden|fido-|flash|freefind|fünfte|gb|gluonenkraft|google|googles|hotbot|html|hypertext|imode|index-|infoseek|inktomi|ins|its|julius|katalogisierer|kepnt|krabbelprogrammen|krabbler|krabbler-pcs|krabblern|könnte-|la|larry|legebatterie|look|luis|macromedia|mag|manche|mantua|meal|mehreren|meta-crawler|monier|mönatlich|netzausforschung|northern|palo|petabyte|placement|plexiglas|quelltext|rubriziert|s|sailer|search|sergey|so|spears|speichert|stöbert|t-online|terabyte|threads|tim|trenker|uberblick|unauffindbar|url-adreßdatenbank|usancen|verbitten|vom|vor|wapinhalte|web|webbrain|webtop|wide|world|xipolis|yahoo|zollund|zuläßt|zweiter|zügen|à|übersuchmaschinen
250
+ 00331*-|idx|stich-