xapian-fu 1.7.0 → 1.8.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (92) hide show
  1. checksums.yaml +4 -4
  2. data/README.rdoc +2 -1
  3. data/lib/xapian_fu/stopper_factory.rb +1 -4
  4. data/lib/xapian_fu/stopwords/af.txt +51 -0
  5. data/lib/xapian_fu/stopwords/ar.txt +480 -0
  6. data/lib/xapian_fu/stopwords/bg.txt +259 -0
  7. data/lib/xapian_fu/stopwords/bn.txt +398 -0
  8. data/lib/xapian_fu/stopwords/br.txt +1203 -0
  9. data/lib/xapian_fu/stopwords/ca.txt +278 -0
  10. data/lib/xapian_fu/stopwords/cs.txt +423 -0
  11. data/lib/xapian_fu/stopwords/da.txt +170 -0
  12. data/lib/xapian_fu/stopwords/danish.txt +1 -0
  13. data/lib/xapian_fu/stopwords/de.txt +620 -0
  14. data/lib/xapian_fu/stopwords/dutch.txt +1 -0
  15. data/lib/xapian_fu/stopwords/el.txt +847 -0
  16. data/lib/xapian_fu/stopwords/en.txt +1298 -0
  17. data/lib/xapian_fu/stopwords/english.txt +1 -0
  18. data/lib/xapian_fu/stopwords/eo.txt +173 -0
  19. data/lib/xapian_fu/stopwords/es.txt +732 -0
  20. data/lib/xapian_fu/stopwords/et.txt +35 -0
  21. data/lib/xapian_fu/stopwords/eu.txt +98 -0
  22. data/lib/xapian_fu/stopwords/fa.txt +799 -0
  23. data/lib/xapian_fu/stopwords/fi.txt +847 -0
  24. data/lib/xapian_fu/stopwords/finnish.txt +1 -0
  25. data/lib/xapian_fu/stopwords/fr.txt +691 -0
  26. data/lib/xapian_fu/stopwords/french.txt +1 -0
  27. data/lib/xapian_fu/stopwords/ga.txt +109 -0
  28. data/lib/xapian_fu/stopwords/german.txt +1 -0
  29. data/lib/xapian_fu/stopwords/gl.txt +160 -0
  30. data/lib/xapian_fu/stopwords/gu.txt +224 -0
  31. data/lib/xapian_fu/stopwords/ha.txt +39 -0
  32. data/lib/xapian_fu/stopwords/he.txt +194 -0
  33. data/lib/xapian_fu/stopwords/hi.txt +225 -0
  34. data/lib/xapian_fu/stopwords/hr.txt +179 -0
  35. data/lib/xapian_fu/stopwords/hu.txt +789 -0
  36. data/lib/xapian_fu/stopwords/hungarian.txt +1 -0
  37. data/lib/xapian_fu/stopwords/hy.txt +45 -0
  38. data/lib/xapian_fu/stopwords/id.txt +758 -0
  39. data/lib/xapian_fu/stopwords/it.txt +632 -0
  40. data/lib/xapian_fu/stopwords/italian.txt +1 -0
  41. data/lib/xapian_fu/stopwords/ja.txt +134 -0
  42. data/lib/xapian_fu/stopwords/ko.txt +679 -0
  43. data/lib/xapian_fu/stopwords/ku.txt +62 -0
  44. data/lib/xapian_fu/stopwords/la.txt +49 -0
  45. data/lib/xapian_fu/stopwords/lt.txt +474 -0
  46. data/lib/xapian_fu/stopwords/lv.txt +161 -0
  47. data/lib/xapian_fu/stopwords/mr.txt +99 -0
  48. data/lib/xapian_fu/stopwords/ms.txt +475 -0
  49. data/lib/xapian_fu/stopwords/nl.txt +413 -0
  50. data/lib/xapian_fu/stopwords/no.txt +221 -0
  51. data/lib/xapian_fu/stopwords/norwegian.txt +1 -0
  52. data/lib/xapian_fu/stopwords/pl.txt +329 -0
  53. data/lib/xapian_fu/stopwords/portuguese.txt +1 -0
  54. data/lib/xapian_fu/stopwords/pt.txt +560 -0
  55. data/lib/xapian_fu/stopwords/ro.txt +434 -0
  56. data/lib/xapian_fu/stopwords/ru.txt +559 -0
  57. data/lib/xapian_fu/stopwords/russian.txt +1 -0
  58. data/lib/xapian_fu/stopwords/sk.txt +418 -0
  59. data/lib/xapian_fu/stopwords/sl.txt +446 -0
  60. data/lib/xapian_fu/stopwords/so.txt +30 -0
  61. data/lib/xapian_fu/stopwords/spanish.txt +1 -0
  62. data/lib/xapian_fu/stopwords/st.txt +31 -0
  63. data/lib/xapian_fu/stopwords/sv.txt +418 -0
  64. data/lib/xapian_fu/stopwords/sw.txt +74 -0
  65. data/lib/xapian_fu/stopwords/swedish.txt +1 -0
  66. data/lib/xapian_fu/stopwords/th.txt +116 -0
  67. data/lib/xapian_fu/stopwords/tl.txt +147 -0
  68. data/lib/xapian_fu/stopwords/tr.txt +504 -0
  69. data/lib/xapian_fu/stopwords/uk.txt +73 -0
  70. data/lib/xapian_fu/stopwords/update.rb +10 -3
  71. data/lib/xapian_fu/stopwords/ur.txt +517 -0
  72. data/lib/xapian_fu/stopwords/vi.txt +645 -0
  73. data/lib/xapian_fu/stopwords/yo.txt +60 -0
  74. data/lib/xapian_fu/stopwords/zh.txt +794 -0
  75. data/lib/xapian_fu/stopwords/zu.txt +29 -0
  76. data/lib/xapian_fu/version.rb +1 -1
  77. data/lib/xapian_fu/xapian_db.rb +3 -0
  78. data/spec/xapian_doc_spec.rb +1 -1
  79. metadata +109 -51
  80. data/lib/xapian_fu/stopwords/danish.txt +0 -102
  81. data/lib/xapian_fu/stopwords/dutch.txt +0 -113
  82. data/lib/xapian_fu/stopwords/english.txt +0 -312
  83. data/lib/xapian_fu/stopwords/finnish.txt +0 -89
  84. data/lib/xapian_fu/stopwords/french.txt +0 -168
  85. data/lib/xapian_fu/stopwords/german.txt +0 -286
  86. data/lib/xapian_fu/stopwords/hungarian.txt +0 -203
  87. data/lib/xapian_fu/stopwords/italian.txt +0 -295
  88. data/lib/xapian_fu/stopwords/norwegian.txt +0 -186
  89. data/lib/xapian_fu/stopwords/portuguese.txt +0 -245
  90. data/lib/xapian_fu/stopwords/russian.txt +0 -236
  91. data/lib/xapian_fu/stopwords/spanish.txt +0 -348
  92. data/lib/xapian_fu/stopwords/swedish.txt +0 -125
@@ -0,0 +1,278 @@
1
+ a
2
+ abans
3
+ ací
4
+ ah
5
+ així
6
+ això
7
+ al
8
+ aleshores
9
+ algun
10
+ alguna
11
+ algunes
12
+ alguns
13
+ alhora
14
+ allà
15
+ allí
16
+ allò
17
+ als
18
+ altra
19
+ altre
20
+ altres
21
+ amb
22
+ ambdues
23
+ ambdós
24
+ anar
25
+ ans
26
+ apa
27
+ aquell
28
+ aquella
29
+ aquelles
30
+ aquells
31
+ aquest
32
+ aquesta
33
+ aquestes
34
+ aquests
35
+ aquí
36
+ baix
37
+ bastant
38
+
39
+ cada
40
+ cadascuna
41
+ cadascunes
42
+ cadascuns
43
+ cadascú
44
+ com
45
+ consegueixo
46
+ conseguim
47
+ conseguir
48
+ consigueix
49
+ consigueixen
50
+ consigueixes
51
+ contra
52
+ d'un
53
+ d'una
54
+ d'unes
55
+ d'uns
56
+ dalt
57
+ de
58
+ del
59
+ dels
60
+ des
61
+ des de
62
+ després
63
+ dins
64
+ dintre
65
+ donat
66
+ doncs
67
+ durant
68
+ e
69
+ eh
70
+ el
71
+ elles
72
+ ells
73
+ els
74
+ em
75
+ en
76
+ encara
77
+ ens
78
+ entre
79
+ era
80
+ erem
81
+ eren
82
+ eres
83
+ es
84
+ esta
85
+ estan
86
+ estat
87
+ estava
88
+ estaven
89
+ estem
90
+ esteu
91
+ estic
92
+ està
93
+ estàvem
94
+ estàveu
95
+ et
96
+ etc
97
+ ets
98
+ fa
99
+ faig
100
+ fan
101
+ fas
102
+ fem
103
+ fer
104
+ feu
105
+ fi
106
+ fins
107
+ fora
108
+ gairebé
109
+ ha
110
+ han
111
+ has
112
+ haver
113
+ havia
114
+ he
115
+ hem
116
+ heu
117
+ hi
118
+ ho
119
+ i
120
+ igual
121
+ iguals
122
+ inclòs
123
+ ja
124
+ jo
125
+ l'hi
126
+ la
127
+ les
128
+ li
129
+ li'n
130
+ llarg
131
+ llavors
132
+ m'he
133
+ ma
134
+ mal
135
+ malgrat
136
+ mateix
137
+ mateixa
138
+ mateixes
139
+ mateixos
140
+ me
141
+ mentre
142
+ meu
143
+ meus
144
+ meva
145
+ meves
146
+ mode
147
+ molt
148
+ molta
149
+ moltes
150
+ molts
151
+ mon
152
+ mons
153
+ més
154
+ n'he
155
+ n'hi
156
+ ne
157
+ ni
158
+ no
159
+ nogensmenys
160
+ només
161
+ nosaltres
162
+ nostra
163
+ nostre
164
+ nostres
165
+ o
166
+ oh
167
+ oi
168
+ on
169
+ pas
170
+ pel
171
+ pels
172
+ per
173
+ per que
174
+ perquè
175
+ però
176
+ poc
177
+ poca
178
+ pocs
179
+ podem
180
+ poden
181
+ poder
182
+ podeu
183
+ poques
184
+ potser
185
+ primer
186
+ propi
187
+ puc
188
+ qual
189
+ quals
190
+ quan
191
+ quant
192
+ que
193
+ quelcom
194
+ qui
195
+ quin
196
+ quina
197
+ quines
198
+ quins
199
+ què
200
+ s'ha
201
+ s'han
202
+ sa
203
+ sabem
204
+ saben
205
+ saber
206
+ sabeu
207
+ sap
208
+ saps
209
+ semblant
210
+ semblants
211
+ sense
212
+ ser
213
+ ses
214
+ seu
215
+ seus
216
+ seva
217
+ seves
218
+ si
219
+ sobre
220
+ sobretot
221
+ soc
222
+ solament
223
+ sols
224
+ som
225
+ son
226
+ sons
227
+ sota
228
+ sou
229
+ sóc
230
+ són
231
+ t'ha
232
+ t'han
233
+ t'he
234
+ ta
235
+ tal
236
+ també
237
+ tampoc
238
+ tan
239
+ tant
240
+ tanta
241
+ tantes
242
+ te
243
+ tene
244
+ tenim
245
+ tenir
246
+ teniu
247
+ teu
248
+ teus
249
+ teva
250
+ teves
251
+ tinc
252
+ ton
253
+ tons
254
+ tot
255
+ tota
256
+ totes
257
+ tots
258
+ un
259
+ una
260
+ unes
261
+ uns
262
+ us
263
+ va
264
+ vaig
265
+ vam
266
+ van
267
+ vas
268
+ veu
269
+ vosaltres
270
+ vostra
271
+ vostre
272
+ vostres
273
+ érem
274
+ éreu
275
+ és
276
+ éssent
277
+ últim
278
+ ús
@@ -0,0 +1,423 @@
1
+ a
2
+ aby
3
+ ahoj
4
+ aj
5
+ ale
6
+ anebo
7
+ ani
8
+ aniž
9
+ ano
10
+ asi
11
+ aspoň
12
+ atd
13
+ atp
14
+ az
15
+ ačkoli
16
+
17
+ bez
18
+ beze
19
+ blízko
20
+ bohužel
21
+ brzo
22
+ bude
23
+ budem
24
+ budeme
25
+ budes
26
+ budete
27
+ budeš
28
+ budou
29
+ budu
30
+ by
31
+ byl
32
+ byla
33
+ byli
34
+ bylo
35
+ byly
36
+ bys
37
+ byt
38
+ být
39
+ během
40
+ chce
41
+ chceme
42
+ chcete
43
+ chceš
44
+ chci
45
+ chtít
46
+ chtějí
47
+ chut'
48
+ chuti
49
+ ci
50
+ clanek
51
+ clanku
52
+ clanky
53
+ co
54
+ coz
55
+ což
56
+ cz
57
+ daleko
58
+ dalsi
59
+ další
60
+ den
61
+ deset
62
+ design
63
+ devatenáct
64
+ devět
65
+ dnes
66
+ do
67
+ dobrý
68
+ docela
69
+ dva
70
+ dvacet
71
+ dvanáct
72
+ dvě
73
+ dál
74
+ dále
75
+ děkovat
76
+ děkujeme
77
+ děkuji
78
+ email
79
+ ho
80
+ hodně
81
+ i
82
+ jak
83
+ jakmile
84
+ jako
85
+ jakož
86
+ jde
87
+ je
88
+ jeden
89
+ jedenáct
90
+ jedna
91
+ jedno
92
+ jednou
93
+ jedou
94
+ jeho
95
+ jehož
96
+ jej
97
+ jeji
98
+ jejich
99
+ její
100
+ jelikož
101
+ jemu
102
+ jen
103
+ jenom
104
+ jenž
105
+ jeste
106
+ jestli
107
+ jestliže
108
+ ještě
109
+ jež
110
+ ji
111
+ jich
112
+ jimi
113
+ jinak
114
+ jine
115
+ jiné
116
+ jiz
117
+ již
118
+ jsem
119
+ jses
120
+ jseš
121
+ jsi
122
+ jsme
123
+ jsou
124
+ jste
125
+
126
+
127
+ jím
128
+ jíž
129
+ jšte
130
+ k
131
+ kam
132
+ každý
133
+ kde
134
+ kdo
135
+ kdy
136
+ kdyz
137
+ když
138
+ ke
139
+ kolik
140
+ kromě
141
+ ktera
142
+ ktere
143
+ kteri
144
+ kterou
145
+ ktery
146
+ která
147
+ které
148
+ který
149
+ kteři
150
+ kteří
151
+ ku
152
+ kvůli
153
+ ma
154
+ mají
155
+ mate
156
+ me
157
+ mezi
158
+ mi
159
+ mit
160
+ mne
161
+ mnou
162
+ mně
163
+ moc
164
+ mohl
165
+ mohou
166
+ moje
167
+ moji
168
+ možná
169
+ muj
170
+ musí
171
+ muze
172
+ my
173
+
174
+ málo
175
+ mám
176
+ máme
177
+ máte
178
+ máš
179
+
180
+
181
+ mít
182
+
183
+ můj
184
+ může
185
+ na
186
+ nad
187
+ nade
188
+ nam
189
+ napiste
190
+ napište
191
+ naproti
192
+ nas
193
+ nasi
194
+ načež
195
+ naše
196
+ naši
197
+ ne
198
+ nebo
199
+ nebyl
200
+ nebyla
201
+ nebyli
202
+ nebyly
203
+ nechť
204
+ nedělají
205
+ nedělá
206
+ nedělám
207
+ neděláme
208
+ neděláte
209
+ neděláš
210
+ neg
211
+ nejsi
212
+ nejsou
213
+ nemají
214
+ nemáme
215
+ nemáte
216
+ neměl
217
+ neni
218
+ není
219
+ nestačí
220
+ nevadí
221
+ nez
222
+ než
223
+ nic
224
+ nich
225
+ nimi
226
+ nove
227
+ novy
228
+ nové
229
+ nový
230
+ nula
231
+
232
+ nám
233
+ námi
234
+ nás
235
+ náš
236
+
237
+ ním
238
+
239
+ něco
240
+ nějak
241
+ někde
242
+ někdo
243
+ němu
244
+ němuž
245
+ o
246
+ od
247
+ ode
248
+ on
249
+ ona
250
+ oni
251
+ ono
252
+ ony
253
+ osm
254
+ osmnáct
255
+ pak
256
+ patnáct
257
+ po
258
+ pod
259
+ podle
260
+ pokud
261
+ potom
262
+ pouze
263
+ pozdě
264
+ pořád
265
+ prave
266
+ pravé
267
+ pred
268
+ pres
269
+ pri
270
+ pro
271
+ proc
272
+ prostě
273
+ prosím
274
+ proti
275
+ proto
276
+ protoze
277
+ protože
278
+ proč
279
+ prvni
280
+ první
281
+ práve
282
+ pta
283
+ pět
284
+ před
285
+ přede
286
+ přes
287
+ přese
288
+ při
289
+ přičemž
290
+ re
291
+ rovně
292
+ s
293
+ se
294
+ sedm
295
+ sedmnáct
296
+ si
297
+ sice
298
+ skoro
299
+ smí
300
+ smějí
301
+ snad
302
+ spolu
303
+ sta
304
+ sto
305
+ strana
306
+ sté
307
+ sve
308
+ svych
309
+ svym
310
+ svymi
311
+ své
312
+ svých
313
+ svým
314
+ svými
315
+ svůj
316
+ ta
317
+ tady
318
+ tak
319
+ take
320
+ takhle
321
+ taky
322
+ takze
323
+ také
324
+ takže
325
+ tam
326
+ tamhle
327
+ tamhleto
328
+ tamto
329
+ tato
330
+ te
331
+ tebe
332
+ tebou
333
+ ted'
334
+ tedy
335
+ tema
336
+ ten
337
+ tento
338
+ teto
339
+ ti
340
+ tim
341
+ timto
342
+ tipy
343
+ tisíc
344
+ tisíce
345
+ to
346
+ tobě
347
+ tohle
348
+ toho
349
+ tohoto
350
+ tom
351
+ tomto
352
+ tomu
353
+ tomuto
354
+ toto
355
+ trošku
356
+ tu
357
+ tuto
358
+ tvoje
359
+ tvá
360
+ tvé
361
+ tvůj
362
+ ty
363
+ tyto
364
+ téma
365
+ této
366
+ tím
367
+ tímto
368
+
369
+ těm
370
+ těma
371
+ těmu
372
+ třeba
373
+ tři
374
+ třináct
375
+ u
376
+ určitě
377
+ uz
378
+
379
+ v
380
+ vam
381
+ vas
382
+ vase
383
+ vaše
384
+ vaši
385
+ ve
386
+ vedle
387
+ večer
388
+ vice
389
+ vlastně
390
+ vsak
391
+ vy
392
+ vám
393
+ vámi
394
+ vás
395
+ váš
396
+ více
397
+ však
398
+ všechen
399
+ všechno
400
+ všichni
401
+ vůbec
402
+ vždy
403
+ z
404
+ za
405
+ zatímco
406
+ zač
407
+ zda
408
+ zde
409
+ ze
410
+ zpet
411
+ zpravy
412
+ zprávy
413
+ zpět
414
+ čau
415
+ či
416
+ článek
417
+ článku
418
+ články
419
+ čtrnáct
420
+ čtyři
421
+ šest
422
+ šestnáct
423
+ že