keyphrase 0.1.2 → 0.2.0
Sign up to get free protection for your applications and to get access to all the features.
- checksums.yaml +4 -4
- data/README.md +5 -4
- data/lib/keyphrase/stoplist/afr.rb +14 -0
- data/lib/keyphrase/stoplist/aka.rb +10 -0
- data/lib/keyphrase/stoplist/amh.rb +10 -0
- data/lib/keyphrase/stoplist/ara.rb +490 -0
- data/lib/keyphrase/stoplist/aze.rb +175 -0
- data/lib/keyphrase/stoplist/bel.rb +11 -0
- data/lib/keyphrase/stoplist/ben.rb +408 -0
- data/lib/keyphrase/stoplist/bul.rb +528 -0
- data/lib/keyphrase/stoplist/cat.rb +711 -0
- data/lib/keyphrase/stoplist/ces.rb +560 -0
- data/lib/keyphrase/stoplist/cmn.rb +1119 -0
- data/lib/keyphrase/stoplist/dan.rb +25 -0
- data/lib/keyphrase/stoplist/deu.rb +631 -0
- data/lib/keyphrase/stoplist/ell.rb +275 -0
- data/lib/keyphrase/stoplist/eng.rb +2 -589
- data/lib/keyphrase/stoplist/epo.rb +183 -0
- data/lib/keyphrase/stoplist/est.rb +13 -0
- data/lib/keyphrase/stoplist/fin.rb +857 -0
- data/lib/keyphrase/stoplist/fra.rb +699 -0
- data/lib/keyphrase/stoplist/guj.rb +234 -0
- data/lib/keyphrase/stoplist/heb.rb +204 -0
- data/lib/keyphrase/stoplist/hin.rb +235 -0
- data/lib/keyphrase/stoplist/hrv.rb +25 -0
- data/lib/keyphrase/stoplist/hun.rb +1195 -0
- data/lib/keyphrase/stoplist/hye.rb +55 -0
- data/lib/keyphrase/stoplist/ind.rb +768 -0
- data/lib/keyphrase/stoplist/ita.rb +670 -0
- data/lib/keyphrase/stoplist/jav.rb +10 -0
- data/lib/keyphrase/stoplist/jpn.rb +144 -0
- data/lib/keyphrase/stoplist/kan.rb +92 -0
- data/lib/keyphrase/stoplist/kat.rb +383 -0
- data/lib/keyphrase/stoplist/khm.rb +245 -0
- data/lib/keyphrase/stoplist/kor.rb +610 -0
- data/lib/keyphrase/stoplist/lat.rb +14 -0
- data/lib/keyphrase/stoplist/lav.rb +171 -0
- data/lib/keyphrase/stoplist/lit.rb +484 -0
- data/lib/keyphrase/stoplist/mal.rb +11 -0
- data/lib/keyphrase/stoplist/mar.rb +109 -0
- data/lib/keyphrase/stoplist/mkd.rb +11 -0
- data/lib/keyphrase/stoplist/mya.rb +285 -0
- data/lib/keyphrase/stoplist/nep.rb +265 -0
- data/lib/keyphrase/stoplist/nld.rb +423 -0
- data/lib/keyphrase/stoplist/nob.rb +186 -0
- data/lib/keyphrase/stoplist/ori.rb +11 -0
- data/lib/keyphrase/stoplist/pan.rb +473 -0
- data/lib/keyphrase/stoplist/pes.rb +801 -0
- data/lib/keyphrase/stoplist/pol.rb +338 -0
- data/lib/keyphrase/stoplist/por.rb +570 -0
- data/lib/keyphrase/stoplist/ron.rb +444 -0
- data/lib/keyphrase/stoplist/rus.rb +569 -0
- data/lib/keyphrase/stoplist/sin.rb +10 -0
- data/lib/keyphrase/stoplist/slk.rb +428 -0
- data/lib/keyphrase/stoplist/slv.rb +456 -0
- data/lib/keyphrase/stoplist/sna.rb +11 -0
- data/lib/keyphrase/stoplist/spa.rb +731 -0
- data/lib/keyphrase/stoplist/srp.rb +11 -0
- data/lib/keyphrase/stoplist/swe.rb +428 -0
- data/lib/keyphrase/stoplist/tam.rb +135 -0
- data/lib/keyphrase/stoplist/tel.rb +10 -0
- data/lib/keyphrase/stoplist/tgl.rb +157 -0
- data/lib/keyphrase/stoplist/tha.rb +125 -0
- data/lib/keyphrase/stoplist/tuk.rb +11 -0
- data/lib/keyphrase/stoplist/tur.rb +514 -0
- data/lib/keyphrase/stoplist/ukr.rb +38 -0
- data/lib/keyphrase/stoplist/urd.rb +527 -0
- data/lib/keyphrase/stoplist/uzb.rb +10 -0
- data/lib/keyphrase/stoplist/vie.rb +655 -0
- data/lib/keyphrase/stoplist/yid.rb +204 -0
- data/lib/keyphrase/stoplist/zul.rb +39 -0
- data/lib/keyphrase/stoplist.rb +13 -10
- data/lib/keyphrase/version.rb +1 -1
- data/lib/keyphrase.rb +20 -12
- metadata +71 -3
@@ -0,0 +1,428 @@
|
|
1
|
+
class Keyphrase
|
2
|
+
module Stoplist
|
3
|
+
class Slk
|
4
|
+
def self.stopwords
|
5
|
+
@@stopwords ||= [
|
6
|
+
"a",
|
7
|
+
"aby",
|
8
|
+
"aj",
|
9
|
+
"ak",
|
10
|
+
"akej",
|
11
|
+
"akejže",
|
12
|
+
"ako",
|
13
|
+
"akom",
|
14
|
+
"akomže",
|
15
|
+
"akou",
|
16
|
+
"akouže",
|
17
|
+
"akože",
|
18
|
+
"aká",
|
19
|
+
"akáže",
|
20
|
+
"aké",
|
21
|
+
"akého",
|
22
|
+
"akéhože",
|
23
|
+
"akému",
|
24
|
+
"akémuže",
|
25
|
+
"akéže",
|
26
|
+
"akú",
|
27
|
+
"akúže",
|
28
|
+
"aký",
|
29
|
+
"akých",
|
30
|
+
"akýchže",
|
31
|
+
"akým",
|
32
|
+
"akými",
|
33
|
+
"akýmiže",
|
34
|
+
"akýmže",
|
35
|
+
"akýže",
|
36
|
+
"ale",
|
37
|
+
"alebo",
|
38
|
+
"ani",
|
39
|
+
"asi",
|
40
|
+
"avšak",
|
41
|
+
"až",
|
42
|
+
"ba",
|
43
|
+
"bez",
|
44
|
+
"bezo",
|
45
|
+
"bol",
|
46
|
+
"bola",
|
47
|
+
"boli",
|
48
|
+
"bolo",
|
49
|
+
"bude",
|
50
|
+
"budem",
|
51
|
+
"budeme",
|
52
|
+
"budete",
|
53
|
+
"budeš",
|
54
|
+
"budú",
|
55
|
+
"buď",
|
56
|
+
"by",
|
57
|
+
"byť",
|
58
|
+
"cez",
|
59
|
+
"cezo",
|
60
|
+
"dnes",
|
61
|
+
"do",
|
62
|
+
"ešte",
|
63
|
+
"ho",
|
64
|
+
"hoci",
|
65
|
+
"i",
|
66
|
+
"iba",
|
67
|
+
"ich",
|
68
|
+
"im",
|
69
|
+
"inej",
|
70
|
+
"inom",
|
71
|
+
"iná",
|
72
|
+
"iné",
|
73
|
+
"iného",
|
74
|
+
"inému",
|
75
|
+
"iní",
|
76
|
+
"inú",
|
77
|
+
"iný",
|
78
|
+
"iných",
|
79
|
+
"iným",
|
80
|
+
"inými",
|
81
|
+
"ja",
|
82
|
+
"je",
|
83
|
+
"jeho",
|
84
|
+
"jej",
|
85
|
+
"jemu",
|
86
|
+
"ju",
|
87
|
+
"k",
|
88
|
+
"kam",
|
89
|
+
"kamže",
|
90
|
+
"každou",
|
91
|
+
"každá",
|
92
|
+
"každé",
|
93
|
+
"každého",
|
94
|
+
"každému",
|
95
|
+
"každí",
|
96
|
+
"každú",
|
97
|
+
"každý",
|
98
|
+
"každých",
|
99
|
+
"každým",
|
100
|
+
"každými",
|
101
|
+
"kde",
|
102
|
+
"kej",
|
103
|
+
"kejže",
|
104
|
+
"keď",
|
105
|
+
"keďže",
|
106
|
+
"kie",
|
107
|
+
"kieho",
|
108
|
+
"kiehože",
|
109
|
+
"kiemu",
|
110
|
+
"kiemuže",
|
111
|
+
"kieže",
|
112
|
+
"koho",
|
113
|
+
"kom",
|
114
|
+
"komu",
|
115
|
+
"kou",
|
116
|
+
"kouže",
|
117
|
+
"kto",
|
118
|
+
"ktorej",
|
119
|
+
"ktorou",
|
120
|
+
"ktorá",
|
121
|
+
"ktoré",
|
122
|
+
"ktorí",
|
123
|
+
"ktorú",
|
124
|
+
"ktorý",
|
125
|
+
"ktorých",
|
126
|
+
"ktorým",
|
127
|
+
"ktorými",
|
128
|
+
"ku",
|
129
|
+
"ká",
|
130
|
+
"káže",
|
131
|
+
"ké",
|
132
|
+
"kéže",
|
133
|
+
"kú",
|
134
|
+
"kúže",
|
135
|
+
"ký",
|
136
|
+
"kýho",
|
137
|
+
"kýhože",
|
138
|
+
"kým",
|
139
|
+
"kýmu",
|
140
|
+
"kýmuže",
|
141
|
+
"kýže",
|
142
|
+
"lebo",
|
143
|
+
"leda",
|
144
|
+
"ledaže",
|
145
|
+
"len",
|
146
|
+
"ma",
|
147
|
+
"majú",
|
148
|
+
"mal",
|
149
|
+
"mala",
|
150
|
+
"mali",
|
151
|
+
"mať",
|
152
|
+
"medzi",
|
153
|
+
"mi",
|
154
|
+
"mne",
|
155
|
+
"mnou",
|
156
|
+
"moja",
|
157
|
+
"moje",
|
158
|
+
"mojej",
|
159
|
+
"mojich",
|
160
|
+
"mojim",
|
161
|
+
"mojimi",
|
162
|
+
"mojou",
|
163
|
+
"moju",
|
164
|
+
"možno",
|
165
|
+
"mu",
|
166
|
+
"musia",
|
167
|
+
"musieť",
|
168
|
+
"musí",
|
169
|
+
"musím",
|
170
|
+
"musíme",
|
171
|
+
"musíte",
|
172
|
+
"musíš",
|
173
|
+
"my",
|
174
|
+
"má",
|
175
|
+
"mám",
|
176
|
+
"máme",
|
177
|
+
"máte",
|
178
|
+
"máš",
|
179
|
+
"môcť",
|
180
|
+
"môj",
|
181
|
+
"môjho",
|
182
|
+
"môže",
|
183
|
+
"môžem",
|
184
|
+
"môžeme",
|
185
|
+
"môžete",
|
186
|
+
"môžeš",
|
187
|
+
"môžu",
|
188
|
+
"mňa",
|
189
|
+
"na",
|
190
|
+
"nad",
|
191
|
+
"nado",
|
192
|
+
"najmä",
|
193
|
+
"nami",
|
194
|
+
"naša",
|
195
|
+
"naše",
|
196
|
+
"našej",
|
197
|
+
"naši",
|
198
|
+
"našich",
|
199
|
+
"našim",
|
200
|
+
"našimi",
|
201
|
+
"našou",
|
202
|
+
"ne",
|
203
|
+
"nech",
|
204
|
+
"neho",
|
205
|
+
"nej",
|
206
|
+
"nejakej",
|
207
|
+
"nejakom",
|
208
|
+
"nejakou",
|
209
|
+
"nejaká",
|
210
|
+
"nejaké",
|
211
|
+
"nejakého",
|
212
|
+
"nejakému",
|
213
|
+
"nejakú",
|
214
|
+
"nejaký",
|
215
|
+
"nejakých",
|
216
|
+
"nejakým",
|
217
|
+
"nejakými",
|
218
|
+
"nemu",
|
219
|
+
"než",
|
220
|
+
"nich",
|
221
|
+
"nie",
|
222
|
+
"niektorej",
|
223
|
+
"niektorom",
|
224
|
+
"niektorou",
|
225
|
+
"niektorá",
|
226
|
+
"niektoré",
|
227
|
+
"niektorého",
|
228
|
+
"niektorému",
|
229
|
+
"niektorú",
|
230
|
+
"niektorý",
|
231
|
+
"niektorých",
|
232
|
+
"niektorým",
|
233
|
+
"niektorými",
|
234
|
+
"nielen",
|
235
|
+
"niečo",
|
236
|
+
"nim",
|
237
|
+
"nimi",
|
238
|
+
"nič",
|
239
|
+
"ničoho",
|
240
|
+
"ničom",
|
241
|
+
"ničomu",
|
242
|
+
"ničím",
|
243
|
+
"no",
|
244
|
+
"nám",
|
245
|
+
"nás",
|
246
|
+
"náš",
|
247
|
+
"nášho",
|
248
|
+
"ním",
|
249
|
+
"o",
|
250
|
+
"od",
|
251
|
+
"odo",
|
252
|
+
"on",
|
253
|
+
"ona",
|
254
|
+
"oni",
|
255
|
+
"ono",
|
256
|
+
"ony",
|
257
|
+
"oň",
|
258
|
+
"oňho",
|
259
|
+
"po",
|
260
|
+
"pod",
|
261
|
+
"podo",
|
262
|
+
"podľa",
|
263
|
+
"pokiaľ",
|
264
|
+
"popod",
|
265
|
+
"popri",
|
266
|
+
"potom",
|
267
|
+
"poza",
|
268
|
+
"pre",
|
269
|
+
"pred",
|
270
|
+
"predo",
|
271
|
+
"preto",
|
272
|
+
"pretože",
|
273
|
+
"prečo",
|
274
|
+
"pri",
|
275
|
+
"práve",
|
276
|
+
"s",
|
277
|
+
"sa",
|
278
|
+
"seba",
|
279
|
+
"sebe",
|
280
|
+
"sebou",
|
281
|
+
"sem",
|
282
|
+
"si",
|
283
|
+
"sme",
|
284
|
+
"so",
|
285
|
+
"som",
|
286
|
+
"ste",
|
287
|
+
"svoj",
|
288
|
+
"svoja",
|
289
|
+
"svoje",
|
290
|
+
"svojho",
|
291
|
+
"svojich",
|
292
|
+
"svojim",
|
293
|
+
"svojimi",
|
294
|
+
"svojou",
|
295
|
+
"svoju",
|
296
|
+
"svojím",
|
297
|
+
"sú",
|
298
|
+
"ta",
|
299
|
+
"tak",
|
300
|
+
"takej",
|
301
|
+
"takejto",
|
302
|
+
"taká",
|
303
|
+
"takáto",
|
304
|
+
"také",
|
305
|
+
"takého",
|
306
|
+
"takéhoto",
|
307
|
+
"takému",
|
308
|
+
"takémuto",
|
309
|
+
"takéto",
|
310
|
+
"takí",
|
311
|
+
"takú",
|
312
|
+
"takúto",
|
313
|
+
"taký",
|
314
|
+
"takýto",
|
315
|
+
"takže",
|
316
|
+
"tam",
|
317
|
+
"teba",
|
318
|
+
"tebe",
|
319
|
+
"tebou",
|
320
|
+
"teda",
|
321
|
+
"tej",
|
322
|
+
"tejto",
|
323
|
+
"ten",
|
324
|
+
"tento",
|
325
|
+
"ti",
|
326
|
+
"tie",
|
327
|
+
"tieto",
|
328
|
+
"tiež",
|
329
|
+
"to",
|
330
|
+
"toho",
|
331
|
+
"tohoto",
|
332
|
+
"tohto",
|
333
|
+
"tom",
|
334
|
+
"tomto",
|
335
|
+
"tomu",
|
336
|
+
"tomuto",
|
337
|
+
"toto",
|
338
|
+
"tou",
|
339
|
+
"touto",
|
340
|
+
"tu",
|
341
|
+
"tvoj",
|
342
|
+
"tvoja",
|
343
|
+
"tvoje",
|
344
|
+
"tvojej",
|
345
|
+
"tvojho",
|
346
|
+
"tvoji",
|
347
|
+
"tvojich",
|
348
|
+
"tvojim",
|
349
|
+
"tvojimi",
|
350
|
+
"tvojím",
|
351
|
+
"ty",
|
352
|
+
"tá",
|
353
|
+
"táto",
|
354
|
+
"tí",
|
355
|
+
"títo",
|
356
|
+
"tú",
|
357
|
+
"túto",
|
358
|
+
"tých",
|
359
|
+
"tým",
|
360
|
+
"tými",
|
361
|
+
"týmto",
|
362
|
+
"u",
|
363
|
+
"už",
|
364
|
+
"v",
|
365
|
+
"vami",
|
366
|
+
"vaša",
|
367
|
+
"vaše",
|
368
|
+
"vašej",
|
369
|
+
"vaši",
|
370
|
+
"vašich",
|
371
|
+
"vašim",
|
372
|
+
"vaším",
|
373
|
+
"veď",
|
374
|
+
"viac",
|
375
|
+
"vo",
|
376
|
+
"vy",
|
377
|
+
"vám",
|
378
|
+
"vás",
|
379
|
+
"váš",
|
380
|
+
"vášho",
|
381
|
+
"však",
|
382
|
+
"všetci",
|
383
|
+
"všetka",
|
384
|
+
"všetko",
|
385
|
+
"všetky",
|
386
|
+
"všetok",
|
387
|
+
"z",
|
388
|
+
"za",
|
389
|
+
"začo",
|
390
|
+
"začože",
|
391
|
+
"zo",
|
392
|
+
"áno",
|
393
|
+
"čej",
|
394
|
+
"či",
|
395
|
+
"čia",
|
396
|
+
"čie",
|
397
|
+
"čieho",
|
398
|
+
"čiemu",
|
399
|
+
"čiu",
|
400
|
+
"čo",
|
401
|
+
"čoho",
|
402
|
+
"čom",
|
403
|
+
"čomu",
|
404
|
+
"čou",
|
405
|
+
"čože",
|
406
|
+
"čí",
|
407
|
+
"čím",
|
408
|
+
"čími",
|
409
|
+
"ďalšia",
|
410
|
+
"ďalšie",
|
411
|
+
"ďalšieho",
|
412
|
+
"ďalšiemu",
|
413
|
+
"ďalšiu",
|
414
|
+
"ďalšom",
|
415
|
+
"ďalšou",
|
416
|
+
"ďalší",
|
417
|
+
"ďalších",
|
418
|
+
"ďalším",
|
419
|
+
"ďalšími",
|
420
|
+
"ňom",
|
421
|
+
"ňou",
|
422
|
+
"ňu",
|
423
|
+
"že",
|
424
|
+
]
|
425
|
+
end
|
426
|
+
end
|
427
|
+
end
|
428
|
+
end
|