scylla 1.0.0 → 1.0.7

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (40) hide show
  1. data/lib/scylla/classifier.rb +3 -2
  2. data/lib/scylla/generator.rb +11 -4
  3. data/lib/scylla/lms/arabic.lm +398 -398
  4. data/lib/scylla/lms/bulgarian.lm +268 -268
  5. data/lib/scylla/lms/catalan.lm +400 -400
  6. data/lib/scylla/lms/chinese.lm +345 -345
  7. data/lib/scylla/lms/czech.lm +382 -382
  8. data/lib/scylla/lms/danish.lm +354 -354
  9. data/lib/scylla/lms/dutch.lm +380 -380
  10. data/lib/scylla/lms/english.lm +327 -327
  11. data/lib/scylla/lms/finnish.lm +297 -297
  12. data/lib/scylla/lms/french.lm +348 -348
  13. data/lib/scylla/lms/german.lm +386 -386
  14. data/lib/scylla/lms/greek.lm +352 -352
  15. data/lib/scylla/lms/hebrew.lm +385 -385
  16. data/lib/scylla/lms/hindi.lm +400 -400
  17. data/lib/scylla/lms/icelandic.lm +195 -195
  18. data/lib/scylla/lms/indonesian.lm +374 -374
  19. data/lib/scylla/lms/italian.lm +365 -365
  20. data/lib/scylla/lms/japanese.lm +368 -368
  21. data/lib/scylla/lms/kannada.lm +299 -299
  22. data/lib/scylla/lms/korean.lm +335 -335
  23. data/lib/scylla/lms/marathi.lm +240 -240
  24. data/lib/scylla/lms/norwegian.lm +348 -348
  25. data/lib/scylla/lms/persian.lm +337 -337
  26. data/lib/scylla/lms/polish.lm +399 -399
  27. data/lib/scylla/lms/portuguese.lm +386 -386
  28. data/lib/scylla/lms/romanian.lm +255 -255
  29. data/lib/scylla/lms/russian.lm +400 -400
  30. data/lib/scylla/lms/slovak.lm +267 -267
  31. data/lib/scylla/lms/slovenian.lm +243 -243
  32. data/lib/scylla/lms/spanish.lm +371 -371
  33. data/lib/scylla/lms/swedish.lm +236 -236
  34. data/lib/scylla/lms/tagalog.lm +287 -287
  35. data/lib/scylla/lms/thai.lm +369 -369
  36. data/lib/scylla/lms/turkish.lm +341 -341
  37. data/lib/scylla/lms/vietnamese.lm +392 -392
  38. data/lib/scylla/lms/welsh.lm +275 -275
  39. data/lib/scylla/loader.rb +1 -1
  40. metadata +2 -2
@@ -1,400 +1,400 @@
1
- _ 20180
2
- a 5778
3
- e 5540
4
- o 5022
5
- s 3817
6
- i 3527
7
- r 3350
8
- d 2736
9
- n 2416
10
- t 2304
11
- o_ 2303
12
- m 2139
13
- s_ 1812
14
- a_ 1803
15
- e_ 1737
16
- c 1601
17
- u 1599
18
- l 1572
19
- p 1504
20
- _d 1370
21
- _e 1177
22
- de 1049
23
- _a 1020
24
- _p 982
25
- ra 911
26
- as 859
27
- es 777
28
- do 769
29
- m_ 751
30
- _de 745
31
- de_ 706
32
- b 674
33
- os 661
34
- _c 654
35
- _o 644
36
- en 586
37
- v 583
38
- g 581
39
- _s 573
40
- do_ 572
41
- te 570
42
- os_ 554
43
- er 552
44
- nt 551
45
- co 546
46
- or 540
47
- as_ 517
48
- da 510
49
- re 488
50
- em 474
51
- ad 460
52
- f 454
53
- ri 450
54
- _m 447
55
- ta 434
56
- _a_ 431
57
- ma 422
58
- l_ 421
59
- ar 420
60
- _e_ 407
61
- an 400
62
- _o_ 386
63
- to 386
64
- _n 386
65
- _co 386
66
- si 365
67
- em_ 365
68
- il 362
69
- st 360
70
- na 357
71
- po 351
72
- al 350
73
- se 349
74
- in 346
75
- is 345
76
- r_ 345
77
- _b 344
78
- es_ 342
79
- ia 340
80
- _t 338
81
- ro 337
82
- ã 336
83
- ão 334
84
- pa 334
85
- ent 333
86
- ão_ 332
87
- om 327
88
- ca 326
89
- ti 323
90
- io 321
91
- no 318
92
- me 317
93
- on 314
94
- br 314
95
- nd 312
96
- _do 306
97
- ras 298
98
- ic 290
99
- h 290
100
- _em 289
101
- ç 285
102
- da_ 284
103
- ci 283
104
- _f 273
105
- tr 271
106
- í 271
107
- _r 267
108
- bra 262
109
- nte 260
110
- _br 259
111
- am 258
112
- it 257
113
- _pa 255
114
- _i 253
115
- qu 249
116
- q 249
117
- _po 245
118
- com 245
119
- é 243
120
- sil 243
121
- ei 241
122
- asi 240
123
- ra_ 234
124
- pr 231
125
- te_ 227
126
- ir 224
127
- ai 222
128
- _se 220
129
- _u 218
130
- pe 216
131
- le 216
132
- ue 215
133
- id 213
134
- at 211
135
- um 210
136
- el 209
137
- di 202
138
- li 202
139
- _re 199
140
- ado 196
141
- _da 192
142
- to_ 192
143
- mo 192
144
- _ma 191
145
- la 191
146
- _q 188
147
- _qu 188
148
- _pr 183
149
- ve 181
150
- _no 181
151
- ss 177
152
- al_ 176
153
- il_ 176
154
- _um 175
155
- no_ 169
156
- im 168
157
- or_ 166
158
- çã 162
159
- ção 162
160
- ica 162
161
- ia_ 161
162
- rt 161
163
- ce 160
164
- eir 159
165
- va 159
166
- que 158
167
- á 158
1
+ _ 17944
2
+ a 5167
3
+ e 5048
4
+ o 4499
5
+ s 3480
6
+ i 3129
7
+ r 2979
8
+ d 2458
9
+ n 2197
10
+ t 2068
11
+ o_ 2018
12
+ m 1983
13
+ s_ 1729
14
+ a_ 1617
15
+ e_ 1608
16
+ c 1500
17
+ u 1477
18
+ l 1384
19
+ p 1287
20
+ _d 1237
21
+ _e 1096
22
+ de 979
23
+ _a 928
24
+ _p 825
25
+ ra 803
26
+ as 775
27
+ m_ 716
28
+ es 711
29
+ do 704
30
+ _de 685
31
+ de_ 649
32
+ os 626
33
+ _o 616
34
+ _c 603
35
+ b 553
36
+ en 550
37
+ te 541
38
+ os_ 541
39
+ _s 528
40
+ co 515
41
+ g 510
42
+ do_ 508
43
+ nt 506
44
+ v 503
45
+ er 498
46
+ or 488
47
+ as_ 486
48
+ da 468
49
+ em 442
50
+ re 432
51
+ _m 417
52
+ ad 407
53
+ _a_ 406
54
+ ri 400
55
+ _e_ 397
56
+ f 393
57
+ ta 391
58
+ ma 385
59
+ ar 373
60
+ _co 369
61
+ _o_ 369
62
+ _n 368
63
+ l_ 358
64
+ an 347
65
+ se 342
66
+ em_ 338
67
+ po 333
68
+ si 328
69
+ in 327
70
+ to 324
71
+ r_ 322
72
+ es_ 321
73
+ na 320
74
+ _t 318
75
+ ent 314
76
+ st 313
77
+ ca 312
78
+ al 311
79
+ nd 308
80
+ om 306
81
+ is 305
82
+ il 301
83
+ ã 301
84
+ me 300
85
+ pa 299
86
+ ão 299
87
+ no 298
88
+ ão_ 297
89
+ ro 292
90
+ ia 282
91
+ ic 278
92
+ ti 277
93
+ _do 276
94
+ io 273
95
+ ç 269
96
+ _em 263
97
+ ci 263
98
+ tr 259
99
+ br 259
100
+ on 259
101
+ _b 259
102
+ da_ 253
103
+ ras 250
104
+ í 249
105
+ am 249
106
+ nte 245
107
+ _f 241
108
+ com 238
109
+ é 234
110
+ _po 233
111
+ _pa 232
112
+ _r 229
113
+ _se 221
114
+ qu 220
115
+ q 220
116
+ ai 218
117
+ bra 217
118
+ pr 215
119
+ h 215
120
+ _i 214
121
+ it 214
122
+ te_ 212
123
+ _br 209
124
+ ei 204
125
+ pe 201
126
+ ra_ 200
127
+ asi 199
128
+ sil 199
129
+ _u 196
130
+ ir 195
131
+ um 192
132
+ at 192
133
+ el 191
134
+ id 191
135
+ le 190
136
+ ue 190
137
+ la 188
138
+ _ma 181
139
+ li 181
140
+ _no 174
141
+ ado 172
142
+ _re 172
143
+ _da 172
144
+ _pr 170
145
+ _q 169
146
+ _qu 169
147
+ di 164
148
+ or_ 162
149
+ ica 160
150
+ rt 158
151
+ _um 158
152
+ to_ 157
168
153
  men 157
169
- un 156
170
- mi 150
171
- is_ 150
172
- _l 148
173
- con 146
174
- ua 146
175
- ni 146
176
- 145
177
- _g 145
178
- u_ 144
179
- lo 143
180
- res 143
181
- tu 142
182
- _es 141
183
- ou 140
184
- ec 140
185
- fo 139
186
- por 139
187
- dos 139
188
- z 138
189
- ol 138
190
- _in 138
191
- _v 137
192
- x 136
193
- iv 135
194
- ns 134
195
- nc 134
196
- ul 134
197
- est 134
198
- ada 134
199
- ue_ 134
200
- sa 133
201
- su 132
202
- _na 132
203
- par 130
204
- ma_ 128
205
- ndo 127
206
- ara 127
207
- ed 127
208
- ro_ 127
209
- io_ 126
210
- ais 126
211
- _pe 125
212
- vi 123
213
- eg 123
214
- mai 121
215
- é_ 119
216
- so 118
217
- _fo 118
218
- ca_ 117
219
- ur 117
220
- des 117
221
- _te 115
222
- sta 114
223
- ter 114
224
- ant 114
225
- om_ 113
226
- _  113
227
- et 113
228
-   113
229
- na_ 112
230
- ria 110
231
- ac 110
232
- i_ 109
233
- j 109
234
- õe 108
235
- õ 108
236
- am_ 107
237
- p_ 105
238
- _ _ 105
239
-  _ 105
240
- mp 105
241
- gu 104
242
- açã 104
243
- ões 104
244
- od 102
245
- _en 102
246
- uma 102
247
- era 101
248
- _os 101
249
- _é 100
250
- ut 100
251
- _as 99
252
- ui 99
253
- lei 98
254
- and 97
255
- mo_ 97
256
- ís 97
257
- tra 96
258
- das 96
259
- ita 96
260
- fi 95
261
- nto 95
154
+ ve 156
155
+ al_ 153
156
+ çã 152
157
+ im 152
158
+ mo 152
159
+ ção 152
160
+ no_ 151
161
+ ss 151
162
+ un 151
163
+ u_ 150
164
+ is_ 148
165
+ que 145
166
+ il_ 142
167
+ va 142
168
+ ou 141
169
+ ni 140
170
+ dos 140
171
+ res 139
172
+ _in 139
173
+ x 138
174
+ tu 136
175
+ _g 136
176
+ con 136
177
+ mi 136
178
+ por 134
179
+ 133
180
+ ec 132
181
+ eir 132
182
+ ua 131
183
+ ul 130
184
+ fo 130
185
+ _es 129
186
+ _na 129
187
+ ce 129
188
+ ns 129
189
+ ol 127
190
+ á 126
191
+ nc 126
192
+ mai 125
193
+ est 125
194
+ ais 125
195
+ ndo 125
196
+ par 124
197
+ lo 123
198
+ ue_ 123
199
+ su 122
200
+ ada 122
201
+ ia_ 120
202
+ ara 120
203
+ des 119
204
+ _pe 118
205
+ _fo 117
206
+ z 115
207
+ iv 115
208
+ _l 113
209
+ vi 112
210
+ _v 112
211
+ eg 112
212
+ ca_ 112
213
+ om_ 111
214
+ ma_ 110
215
+ _te 109
216
+ ter 108
217
+ am_ 108
218
+ ur 107
219
+ na_ 107
220
+ é_ 104
221
+ sa 104
222
+ sta 104
223
+ ro_ 103
224
+ so 102
225
+ ant 101
226
+ gu 100
227
+ _os 99
228
+ era 98
229
+ et 97
230
+ õe 96
231
+ õ 96
262
232
  cia 95
263
- 94
264
- gi 94
265
- _h 94
266
- ida 94
267
- rio 93
268
- ne 93
269
- _su 92
270
- _é_ 92
271
- ist 92
233
+ ís 94
234
+ ria 94
235
+ io_ 94
236
+ mo_ 94
237
+ açã 94
238
+ od 94
239
+ 94
240
+ se_ 93
241
+ ões 93
242
+ i_ 93
243
+ and 93
244
+ ut 93
245
+ ui 93
246
+ aí 91
272
247
  dad 91
273
- se_ 90
274
- ex 90
275
- mu 89
276
- aís 89
277
- paí 89
278
- 88
279
- são 88
280
- um_ 88
281
- ess 88
248
+ mp 90
249
+ _en 90
250
+ ac 89
251
+ uma 89
252
+ ida 89
253
+ das 89
254
+ mu 88
255
+ ex 88
282
256
  gr 88
283
- ort 88
284
- ga 87
285
- ó 87
286
- _ca 87
287
- ge 87
288
- iro 86
289
- rn 86
290
- _ex 85
291
- _di 84
292
- nde 83
293
- ou_ 83
294
- tes 82
295
- vo 81
296
- ira 81
297
- ar_ 81
298
- ha 80
257
+ _su 88
258
+ _as 88
259
+ _é_ 87
260
+ lei 86
261
+ ou_ 86
262
+ aís 86
263
+ paí 86
264
+ ort 86
265
+ tra 85
266
+ nto 85
267
+ ed 85
268
+ um_ 84
269
+ _ex 84
270
+ nde 84
271
+ j 83
272
+ gi 81
273
+ cu 80
274
+ ita 80
299
275
  ade 80
276
+ fi 79
277
+ tes 79
300
278
  ran 79
301
- lh 79
302
- pro 78
303
- tad 77
304
- omo 76
305
- tiv 76
306
- rr 75
307
- op 75
308
- ta_ 75
279
+ ar_ 78
280
+ rn 78
281
+ ó 78
282
+ rio 77
283
+ ist 77
284
+ ior 76
309
285
  nci 75
310
- ram 75
311
- _j 74
312
- ile 74
313
- au 74
314
- rc 74
315
- der 73
316
- _p_ 73
317
- nta 72
318
- for 72
319
- ati 72
320
- oi 72
321
- ior 71
322
- rm 71
323
- ito 71
324
- ame 70
325
- ev 70
326
- _mu 70
327
- ís_ 70
328
- mb 70
329
- fe 69
330
- cu 69
331
- go 69
332
- us 69
333
- ov 69
334
- er_ 69
335
- pre 69
336
- ntr 68
337
- ial 68
338
- ap 68
339
- tem 67
340
- tor 67
341
- ime 67
342
- ú 67
343
- aio 66
344
- und 66
345
- iz 65
346
- tic 65
347
- _s_ 65
348
- ver 65
349
- ê 64
350
- _sã 64
351
- ab 64
352
- _me 64
353
- pri 64
354
- end 63
355
- lo_ 63
286
+ omo 74
287
+ ha 73
288
+ ram 73
289
+ ga 72
290
+ iro 72
291
+ _ca 72
292
+ ta_ 72
293
+ op 71
294
+ ú 71
295
+ pro 71
296
+ oi 70
297
+ ge 70
298
+ rc 70
299
+ rr 70
300
+ vo 70
301
+ tiv 70
302
+ ne 70
303
+ rm 69
304
+ aio 68
305
+ ís_ 68
306
+ ind 68
307
+ _mu 68
308
+ ame 67
309
+ ira 67
310
+ ntr 67
311
+ fe 66
312
+ for 66
313
+ mb 66
314
+ _di 65
315
+ ati 65
316
+ pre 65
317
+ end 65
318
+ tem 65
319
+ und 64
320
+ ov 64
321
+ _h 64
322
+ ile 64
323
+ tad 64
324
+ ess 64
325
+ der 64
326
+ _s_ 63
327
+ ap 63
328
+ 63
356
329
  gra 63
357
- ura 63
358
- ind 63
359
- _mi 63
330
+ ab 63
331
+ pri 63
332
+ são 63
333
+ nta 62
334
+ iz 62
360
335
  _to 62
361
- tro 62
362
- ont 62
363
- _at 61
364
- tan 61
365
- _tr 61
366
- ona 61
367
- lu 61
368
- ros 60
336
+ ial 61
337
+ ê 61
338
+ lh 60
339
+ tic 60
369
340
  pel 60
370
- sp 60
371
- ho 60
372
- pos 59
341
+ eu 60
342
+ ime 60
343
+ _me 59
373
344
  ste 59
374
- qua 59
375
- ico 59
376
- ion 58
377
- fa 58
378
- ár 58
379
- cio 58
380
- du 58
345
+ tro 58
346
+ ito 58
347
+ _mi 58
381
348
  bi 58
382
- ern 58
383
- sc 57
384
- nal 57
385
- re_ 57
386
- nh 57
387
- ig 56
388
- ela 56
349
+ _tr 58
350
+ go 58
351
+ ros 57
352
+ _at 57
353
+ ura 57
354
+ ver 57
355
+ _ou 56
389
356
  rte 56
390
- mun 56
391
- ob 55
392
- eu 55
393
- sti 55
394
- err 55
357
+ ela 56
358
+ ido 55
359
+ art 55
360
+ mun 55
395
361
  cr 55
396
- egi 54
397
- ons 54
398
- ao 54
399
- n_ 54
400
- mas 53
362
+ pos 55
363
+ ico 54
364
+ ev 54
365
+ sp 53
366
+ 52
367
+ tan 52
368
+ oi_ 52
369
+ mas 52
370
+ _gr 52
371
+ foi 52
372
+ _j 52
373
+ za 51
374
+ ern 51
375
+ tor 51
376
+ ça 51
377
+ ob 51
378
+ sc 51
379
+ _al 51
380
+ err 50
381
+ ont 50
382
+ ele 50
383
+ qua 50
384
+ er_ 50
385
+ uni 50
386
+ du 50
387
+ sen 50
388
+ sti 50
389
+ ao 49
390
+ lo_ 49
391
+ ons 49
392
+ str 49
393
+ inc 49
394
+ nos 49
395
+ erc 49
396
+ nas 48
397
+ ina 48
398
+ _ta 48
399
+ ig 48
400
+ _ao 48