stemmers 0.0.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (74) hide show
  1. checksums.yaml +7 -0
  2. data/.rubocop.yml +13 -0
  3. data/CHANGELOG.md +5 -0
  4. data/CODE_OF_CONDUCT.md +132 -0
  5. data/Cargo.lock +547 -0
  6. data/Cargo.toml +7 -0
  7. data/LICENSE.txt +21 -0
  8. data/README.md +113 -0
  9. data/Rakefile +23 -0
  10. data/ext/stemmers/Cargo.toml +16 -0
  11. data/ext/stemmers/extconf.rb +6 -0
  12. data/ext/stemmers/src/lib.rs +105 -0
  13. data/lib/stemmers/stopwords/af.json +53 -0
  14. data/lib/stemmers/stopwords/ar.json +482 -0
  15. data/lib/stemmers/stopwords/bg.json +261 -0
  16. data/lib/stemmers/stopwords/bn.json +400 -0
  17. data/lib/stemmers/stopwords/br.json +1205 -0
  18. data/lib/stemmers/stopwords/ca.json +280 -0
  19. data/lib/stemmers/stopwords/cs.json +425 -0
  20. data/lib/stemmers/stopwords/da.json +172 -0
  21. data/lib/stemmers/stopwords/de.json +622 -0
  22. data/lib/stemmers/stopwords/el.json +849 -0
  23. data/lib/stemmers/stopwords/en.json +1300 -0
  24. data/lib/stemmers/stopwords/eo.json +175 -0
  25. data/lib/stemmers/stopwords/es.json +734 -0
  26. data/lib/stemmers/stopwords/et.json +37 -0
  27. data/lib/stemmers/stopwords/eu.json +100 -0
  28. data/lib/stemmers/stopwords/fa.json +801 -0
  29. data/lib/stemmers/stopwords/fi.json +849 -0
  30. data/lib/stemmers/stopwords/fr.json +693 -0
  31. data/lib/stemmers/stopwords/ga.json +111 -0
  32. data/lib/stemmers/stopwords/gl.json +162 -0
  33. data/lib/stemmers/stopwords/gu.json +226 -0
  34. data/lib/stemmers/stopwords/ha.json +41 -0
  35. data/lib/stemmers/stopwords/he.json +196 -0
  36. data/lib/stemmers/stopwords/hi.json +227 -0
  37. data/lib/stemmers/stopwords/hr.json +181 -0
  38. data/lib/stemmers/stopwords/hu.json +791 -0
  39. data/lib/stemmers/stopwords/hy.json +47 -0
  40. data/lib/stemmers/stopwords/id.json +760 -0
  41. data/lib/stemmers/stopwords/it.json +634 -0
  42. data/lib/stemmers/stopwords/ja.json +136 -0
  43. data/lib/stemmers/stopwords/ko.json +681 -0
  44. data/lib/stemmers/stopwords/ku.json +64 -0
  45. data/lib/stemmers/stopwords/la.json +51 -0
  46. data/lib/stemmers/stopwords/lt.json +476 -0
  47. data/lib/stemmers/stopwords/lv.json +163 -0
  48. data/lib/stemmers/stopwords/mr.json +101 -0
  49. data/lib/stemmers/stopwords/ms.json +477 -0
  50. data/lib/stemmers/stopwords/nl.json +415 -0
  51. data/lib/stemmers/stopwords/no.json +223 -0
  52. data/lib/stemmers/stopwords/pl.json +331 -0
  53. data/lib/stemmers/stopwords/pt.json +562 -0
  54. data/lib/stemmers/stopwords/ro.json +436 -0
  55. data/lib/stemmers/stopwords/ru.json +561 -0
  56. data/lib/stemmers/stopwords/sk.json +420 -0
  57. data/lib/stemmers/stopwords/sl.json +448 -0
  58. data/lib/stemmers/stopwords/so.json +32 -0
  59. data/lib/stemmers/stopwords/st.json +33 -0
  60. data/lib/stemmers/stopwords/sv.json +420 -0
  61. data/lib/stemmers/stopwords/sw.json +76 -0
  62. data/lib/stemmers/stopwords/th.json +118 -0
  63. data/lib/stemmers/stopwords/tl.json +149 -0
  64. data/lib/stemmers/stopwords/tr.json +506 -0
  65. data/lib/stemmers/stopwords/uk.json +75 -0
  66. data/lib/stemmers/stopwords/ur.json +519 -0
  67. data/lib/stemmers/stopwords/vi.json +647 -0
  68. data/lib/stemmers/stopwords/yo.json +62 -0
  69. data/lib/stemmers/stopwords/zh.json +796 -0
  70. data/lib/stemmers/stopwords/zu.json +31 -0
  71. data/lib/stemmers/version.rb +5 -0
  72. data/lib/stemmers.rb +91 -0
  73. data/sig/stemmers.rbs +4 -0
  74. metadata +131 -0
@@ -0,0 +1,562 @@
1
+ [
2
+ "a",
3
+ "acerca",
4
+ "adeus",
5
+ "agora",
6
+ "ainda",
7
+ "alem",
8
+ "algmas",
9
+ "algo",
10
+ "algumas",
11
+ "alguns",
12
+ "ali",
13
+ "além",
14
+ "ambas",
15
+ "ambos",
16
+ "ano",
17
+ "anos",
18
+ "antes",
19
+ "ao",
20
+ "aonde",
21
+ "aos",
22
+ "apenas",
23
+ "apoio",
24
+ "apontar",
25
+ "apos",
26
+ "após",
27
+ "aquela",
28
+ "aquelas",
29
+ "aquele",
30
+ "aqueles",
31
+ "aqui",
32
+ "aquilo",
33
+ "as",
34
+ "assim",
35
+ "através",
36
+ "atrás",
37
+ "até",
38
+ "aí",
39
+ "baixo",
40
+ "bastante",
41
+ "bem",
42
+ "boa",
43
+ "boas",
44
+ "bom",
45
+ "bons",
46
+ "breve",
47
+ "cada",
48
+ "caminho",
49
+ "catorze",
50
+ "cedo",
51
+ "cento",
52
+ "certamente",
53
+ "certeza",
54
+ "cima",
55
+ "cinco",
56
+ "coisa",
57
+ "com",
58
+ "como",
59
+ "comprido",
60
+ "conhecido",
61
+ "conselho",
62
+ "contra",
63
+ "contudo",
64
+ "corrente",
65
+ "cuja",
66
+ "cujas",
67
+ "cujo",
68
+ "cujos",
69
+ "custa",
70
+ "cá",
71
+ "da",
72
+ "daquela",
73
+ "daquelas",
74
+ "daquele",
75
+ "daqueles",
76
+ "dar",
77
+ "das",
78
+ "de",
79
+ "debaixo",
80
+ "dela",
81
+ "delas",
82
+ "dele",
83
+ "deles",
84
+ "demais",
85
+ "dentro",
86
+ "depois",
87
+ "desde",
88
+ "desligado",
89
+ "dessa",
90
+ "dessas",
91
+ "desse",
92
+ "desses",
93
+ "desta",
94
+ "destas",
95
+ "deste",
96
+ "destes",
97
+ "deve",
98
+ "devem",
99
+ "deverá",
100
+ "dez",
101
+ "dezanove",
102
+ "dezasseis",
103
+ "dezassete",
104
+ "dezoito",
105
+ "dia",
106
+ "diante",
107
+ "direita",
108
+ "dispoe",
109
+ "dispoem",
110
+ "diversa",
111
+ "diversas",
112
+ "diversos",
113
+ "diz",
114
+ "dizem",
115
+ "dizer",
116
+ "do",
117
+ "dois",
118
+ "dos",
119
+ "doze",
120
+ "duas",
121
+ "durante",
122
+ "dá",
123
+ "dão",
124
+ "dúvida",
125
+ "e",
126
+ "ela",
127
+ "elas",
128
+ "ele",
129
+ "eles",
130
+ "em",
131
+ "embora",
132
+ "enquanto",
133
+ "entao",
134
+ "entre",
135
+ "então",
136
+ "era",
137
+ "eram",
138
+ "essa",
139
+ "essas",
140
+ "esse",
141
+ "esses",
142
+ "esta",
143
+ "estado",
144
+ "estamos",
145
+ "estar",
146
+ "estará",
147
+ "estas",
148
+ "estava",
149
+ "estavam",
150
+ "este",
151
+ "esteja",
152
+ "estejam",
153
+ "estejamos",
154
+ "estes",
155
+ "esteve",
156
+ "estive",
157
+ "estivemos",
158
+ "estiver",
159
+ "estivera",
160
+ "estiveram",
161
+ "estiverem",
162
+ "estivermos",
163
+ "estivesse",
164
+ "estivessem",
165
+ "estiveste",
166
+ "estivestes",
167
+ "estivéramos",
168
+ "estivéssemos",
169
+ "estou",
170
+ "está",
171
+ "estás",
172
+ "estávamos",
173
+ "estão",
174
+ "eu",
175
+ "exemplo",
176
+ "falta",
177
+ "fará",
178
+ "favor",
179
+ "faz",
180
+ "fazeis",
181
+ "fazem",
182
+ "fazemos",
183
+ "fazer",
184
+ "fazes",
185
+ "fazia",
186
+ "faço",
187
+ "fez",
188
+ "fim",
189
+ "final",
190
+ "foi",
191
+ "fomos",
192
+ "for",
193
+ "fora",
194
+ "foram",
195
+ "forem",
196
+ "forma",
197
+ "formos",
198
+ "fosse",
199
+ "fossem",
200
+ "foste",
201
+ "fostes",
202
+ "fui",
203
+ "fôramos",
204
+ "fôssemos",
205
+ "geral",
206
+ "grande",
207
+ "grandes",
208
+ "grupo",
209
+ "ha",
210
+ "haja",
211
+ "hajam",
212
+ "hajamos",
213
+ "havemos",
214
+ "havia",
215
+ "hei",
216
+ "hoje",
217
+ "hora",
218
+ "horas",
219
+ "houve",
220
+ "houvemos",
221
+ "houver",
222
+ "houvera",
223
+ "houveram",
224
+ "houverei",
225
+ "houverem",
226
+ "houveremos",
227
+ "houveria",
228
+ "houveriam",
229
+ "houvermos",
230
+ "houverá",
231
+ "houverão",
232
+ "houveríamos",
233
+ "houvesse",
234
+ "houvessem",
235
+ "houvéramos",
236
+ "houvéssemos",
237
+ "há",
238
+ "hão",
239
+ "iniciar",
240
+ "inicio",
241
+ "ir",
242
+ "irá",
243
+ "isso",
244
+ "ista",
245
+ "iste",
246
+ "isto",
247
+ "já",
248
+ "lado",
249
+ "lhe",
250
+ "lhes",
251
+ "ligado",
252
+ "local",
253
+ "logo",
254
+ "longe",
255
+ "lugar",
256
+ "lá",
257
+ "maior",
258
+ "maioria",
259
+ "maiorias",
260
+ "mais",
261
+ "mal",
262
+ "mas",
263
+ "me",
264
+ "mediante",
265
+ "meio",
266
+ "menor",
267
+ "menos",
268
+ "meses",
269
+ "mesma",
270
+ "mesmas",
271
+ "mesmo",
272
+ "mesmos",
273
+ "meu",
274
+ "meus",
275
+ "mil",
276
+ "minha",
277
+ "minhas",
278
+ "momento",
279
+ "muito",
280
+ "muitos",
281
+ "máximo",
282
+ "mês",
283
+ "na",
284
+ "nada",
285
+ "nao",
286
+ "naquela",
287
+ "naquelas",
288
+ "naquele",
289
+ "naqueles",
290
+ "nas",
291
+ "nem",
292
+ "nenhuma",
293
+ "nessa",
294
+ "nessas",
295
+ "nesse",
296
+ "nesses",
297
+ "nesta",
298
+ "nestas",
299
+ "neste",
300
+ "nestes",
301
+ "no",
302
+ "noite",
303
+ "nome",
304
+ "nos",
305
+ "nossa",
306
+ "nossas",
307
+ "nosso",
308
+ "nossos",
309
+ "nova",
310
+ "novas",
311
+ "nove",
312
+ "novo",
313
+ "novos",
314
+ "num",
315
+ "numa",
316
+ "numas",
317
+ "nunca",
318
+ "nuns",
319
+ "não",
320
+ "nível",
321
+ "nós",
322
+ "número",
323
+ "o",
324
+ "obra",
325
+ "obrigada",
326
+ "obrigado",
327
+ "oitava",
328
+ "oitavo",
329
+ "oito",
330
+ "onde",
331
+ "ontem",
332
+ "onze",
333
+ "os",
334
+ "ou",
335
+ "outra",
336
+ "outras",
337
+ "outro",
338
+ "outros",
339
+ "para",
340
+ "parece",
341
+ "parte",
342
+ "partir",
343
+ "paucas",
344
+ "pegar",
345
+ "pela",
346
+ "pelas",
347
+ "pelo",
348
+ "pelos",
349
+ "perante",
350
+ "perto",
351
+ "pessoas",
352
+ "pode",
353
+ "podem",
354
+ "poder",
355
+ "poderá",
356
+ "podia",
357
+ "pois",
358
+ "ponto",
359
+ "pontos",
360
+ "por",
361
+ "porque",
362
+ "porquê",
363
+ "portanto",
364
+ "posição",
365
+ "possivelmente",
366
+ "posso",
367
+ "possível",
368
+ "pouca",
369
+ "pouco",
370
+ "poucos",
371
+ "povo",
372
+ "primeira",
373
+ "primeiras",
374
+ "primeiro",
375
+ "primeiros",
376
+ "promeiro",
377
+ "propios",
378
+ "proprio",
379
+ "própria",
380
+ "próprias",
381
+ "próprio",
382
+ "próprios",
383
+ "próxima",
384
+ "próximas",
385
+ "próximo",
386
+ "próximos",
387
+ "puderam",
388
+ "pôde",
389
+ "põe",
390
+ "põem",
391
+ "quais",
392
+ "qual",
393
+ "qualquer",
394
+ "quando",
395
+ "quanto",
396
+ "quarta",
397
+ "quarto",
398
+ "quatro",
399
+ "que",
400
+ "quem",
401
+ "quer",
402
+ "quereis",
403
+ "querem",
404
+ "queremas",
405
+ "queres",
406
+ "quero",
407
+ "questão",
408
+ "quieto",
409
+ "quinta",
410
+ "quinto",
411
+ "quinze",
412
+ "quáis",
413
+ "quê",
414
+ "relação",
415
+ "sabe",
416
+ "sabem",
417
+ "saber",
418
+ "se",
419
+ "segunda",
420
+ "segundo",
421
+ "sei",
422
+ "seis",
423
+ "seja",
424
+ "sejam",
425
+ "sejamos",
426
+ "sem",
427
+ "sempre",
428
+ "sendo",
429
+ "ser",
430
+ "serei",
431
+ "seremos",
432
+ "seria",
433
+ "seriam",
434
+ "será",
435
+ "serão",
436
+ "seríamos",
437
+ "sete",
438
+ "seu",
439
+ "seus",
440
+ "sexta",
441
+ "sexto",
442
+ "sim",
443
+ "sistema",
444
+ "sob",
445
+ "sobre",
446
+ "sois",
447
+ "somente",
448
+ "somos",
449
+ "sou",
450
+ "sua",
451
+ "suas",
452
+ "são",
453
+ "sétima",
454
+ "sétimo",
455
+ "só",
456
+ "tal",
457
+ "talvez",
458
+ "tambem",
459
+ "também",
460
+ "tanta",
461
+ "tantas",
462
+ "tanto",
463
+ "tarde",
464
+ "te",
465
+ "tem",
466
+ "temos",
467
+ "tempo",
468
+ "tendes",
469
+ "tenha",
470
+ "tenham",
471
+ "tenhamos",
472
+ "tenho",
473
+ "tens",
474
+ "tentar",
475
+ "tentaram",
476
+ "tente",
477
+ "tentei",
478
+ "ter",
479
+ "terceira",
480
+ "terceiro",
481
+ "terei",
482
+ "teremos",
483
+ "teria",
484
+ "teriam",
485
+ "terá",
486
+ "terão",
487
+ "teríamos",
488
+ "teu",
489
+ "teus",
490
+ "teve",
491
+ "tinha",
492
+ "tinham",
493
+ "tipo",
494
+ "tive",
495
+ "tivemos",
496
+ "tiver",
497
+ "tivera",
498
+ "tiveram",
499
+ "tiverem",
500
+ "tivermos",
501
+ "tivesse",
502
+ "tivessem",
503
+ "tiveste",
504
+ "tivestes",
505
+ "tivéramos",
506
+ "tivéssemos",
507
+ "toda",
508
+ "todas",
509
+ "todo",
510
+ "todos",
511
+ "trabalhar",
512
+ "trabalho",
513
+ "treze",
514
+ "três",
515
+ "tu",
516
+ "tua",
517
+ "tuas",
518
+ "tudo",
519
+ "tão",
520
+ "tém",
521
+ "têm",
522
+ "tínhamos",
523
+ "um",
524
+ "uma",
525
+ "umas",
526
+ "uns",
527
+ "usa",
528
+ "usar",
529
+ "vai",
530
+ "vais",
531
+ "valor",
532
+ "veja",
533
+ "vem",
534
+ "vens",
535
+ "ver",
536
+ "verdade",
537
+ "verdadeiro",
538
+ "vez",
539
+ "vezes",
540
+ "viagem",
541
+ "vindo",
542
+ "vinte",
543
+ "você",
544
+ "vocês",
545
+ "vos",
546
+ "vossa",
547
+ "vossas",
548
+ "vosso",
549
+ "vossos",
550
+ "vários",
551
+ "vão",
552
+ "vêm",
553
+ "vós",
554
+ "zero",
555
+ "à",
556
+ "às",
557
+ "área",
558
+ "é",
559
+ "éramos",
560
+ "és",
561
+ "último"
562
+ ]