scylla 1.0.0 → 1.0.7

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (40) hide show
  1. data/lib/scylla/classifier.rb +3 -2
  2. data/lib/scylla/generator.rb +11 -4
  3. data/lib/scylla/lms/arabic.lm +398 -398
  4. data/lib/scylla/lms/bulgarian.lm +268 -268
  5. data/lib/scylla/lms/catalan.lm +400 -400
  6. data/lib/scylla/lms/chinese.lm +345 -345
  7. data/lib/scylla/lms/czech.lm +382 -382
  8. data/lib/scylla/lms/danish.lm +354 -354
  9. data/lib/scylla/lms/dutch.lm +380 -380
  10. data/lib/scylla/lms/english.lm +327 -327
  11. data/lib/scylla/lms/finnish.lm +297 -297
  12. data/lib/scylla/lms/french.lm +348 -348
  13. data/lib/scylla/lms/german.lm +386 -386
  14. data/lib/scylla/lms/greek.lm +352 -352
  15. data/lib/scylla/lms/hebrew.lm +385 -385
  16. data/lib/scylla/lms/hindi.lm +400 -400
  17. data/lib/scylla/lms/icelandic.lm +195 -195
  18. data/lib/scylla/lms/indonesian.lm +374 -374
  19. data/lib/scylla/lms/italian.lm +365 -365
  20. data/lib/scylla/lms/japanese.lm +368 -368
  21. data/lib/scylla/lms/kannada.lm +299 -299
  22. data/lib/scylla/lms/korean.lm +335 -335
  23. data/lib/scylla/lms/marathi.lm +240 -240
  24. data/lib/scylla/lms/norwegian.lm +348 -348
  25. data/lib/scylla/lms/persian.lm +337 -337
  26. data/lib/scylla/lms/polish.lm +399 -399
  27. data/lib/scylla/lms/portuguese.lm +386 -386
  28. data/lib/scylla/lms/romanian.lm +255 -255
  29. data/lib/scylla/lms/russian.lm +400 -400
  30. data/lib/scylla/lms/slovak.lm +267 -267
  31. data/lib/scylla/lms/slovenian.lm +243 -243
  32. data/lib/scylla/lms/spanish.lm +371 -371
  33. data/lib/scylla/lms/swedish.lm +236 -236
  34. data/lib/scylla/lms/tagalog.lm +287 -287
  35. data/lib/scylla/lms/thai.lm +369 -369
  36. data/lib/scylla/lms/turkish.lm +341 -341
  37. data/lib/scylla/lms/vietnamese.lm +392 -392
  38. data/lib/scylla/lms/welsh.lm +275 -275
  39. data/lib/scylla/loader.rb +1 -1
  40. metadata +2 -2
@@ -1,400 +1,400 @@
1
- _ 28586
2
- e 10327
3
- s 5870
4
- a 5422
5
- n 5335
6
- t 5043
7
- i 4889
8
- r 4631
9
- l 4323
10
- e_ 3992
11
- u 3708
12
- o 3568
13
- s_ 3244
14
- d 2939
15
- p 2738
16
- _d 2283
17
- c 2226
18
- _l 2164
19
- es 2030
20
- m 1956
21
- t_ 1929
22
- é 1766
23
- es_ 1606
24
- de 1536
25
- _p 1456
26
- le 1453
27
- en 1414
28
- _e 1403
29
- _de 1317
30
- on 1231
31
- nt 1188
32
- an 1085
33
- n_ 1067
34
- re 986
35
- la 933
36
- f 927
37
- de_ 914
38
- _s 853
39
- a_ 848
40
- _le 827
41
- ti 825
42
- _c 818
43
- _a 806
44
- is 800
45
- _la 764
46
- la_ 741
47
- le_ 731
48
- ra 729
49
- nt_ 726
50
- g 724
51
- 679
52
- v 679
53
- ent 667
54
- et 650
55
- _f 637
56
- ar 615
57
- ce 600
58
- u_ 597
59
- pa 590
60
- te 587
61
- q 582
62
- et_ 575
63
- r_ 569
64
- it 569
65
- qu 568
66
- me 567
67
- _m 566
68
- ai 556
69
- in 553
70
- ns 549
71
- ur 545
72
- _et 544
73
- se 541
74
- ne 522
75
- les 497
76
- er 493
77
- st 490
78
- au 487
1
+ _ 28636
2
+ e 10430
3
+ s 5914
4
+ a 5472
5
+ n 5393
6
+ t 5099
7
+ i 4932
8
+ r 4670
9
+ l 4370
10
+ e_ 4092
11
+ u 3743
12
+ o 3605
13
+ s_ 3324
14
+ d 2983
15
+ p 2365
16
+ _d 2316
17
+ c 2240
18
+ _l 2186
19
+ es 2042
20
+ m 1966
21
+ t_ 1954
22
+ é 1786
23
+ es_ 1643
24
+ de 1560
25
+ le 1460
26
+ en 1426
27
+ _e 1411
28
+ _p 1353
29
+ _de 1337
30
+ on 1239
31
+ nt 1203
32
+ an 1102
33
+ n_ 1076
34
+ re 992
35
+ la 939
36
+ f 939
37
+ de_ 933
38
+ _s 865
39
+ a_ 853
40
+ _le 833
41
+ ti 828
42
+ _c 820
43
+ _a 809
44
+ is 802
45
+ _la 770
46
+ la_ 745
47
+ nt_ 741
48
+ le_ 740
49
+ g 739
50
+ ra 735
51
+ v 685
52
+ 682
53
+ ent 672
54
+ et 657
55
+ _f 646
56
+ ar 619
57
+ te 606
58
+ u_ 605
59
+ ce 602
60
+ pa 592
61
+ r_ 586
62
+ et_ 580
63
+ q 579
64
+ it 576
65
+ me 569
66
+ _m 569
67
+ qu 565
68
+ in 561
69
+ ai 560
70
+ ur 555
71
+ ns 553
72
+ _et 550
73
+ se 548
74
+ ne 530
75
+ les 500
76
+ er 498
77
+ au 492
78
+ st 491
79
79
  ue 487
80
- b 479
81
- io 472
80
+ b 485
81
+ io 476
82
+ co 475
82
83
  _pa 471
83
- co 471
84
- _en 469
85
- ion 452
86
- nc 448
84
+ _en 470
85
+ ion 456
86
+ nc 453
87
87
  tr 445
88
- ran 441
89
- ri 441
90
- at 437
91
- ou 431
92
- ie 430
93
- _r 424
94
- re_ 417
95
- eu 405
96
- par 404
97
- on_ 403
98
- des 400
88
+ ran 444
89
+ ri 443
90
+ at 443
91
+ ou 438
92
+ ie 435
93
+ _r 430
94
+ re_ 427
95
+ eu 413
96
+ on_ 408
97
+ des 406
98
+ par 406
99
99
  en_ 399
100
- fr 390
101
- li 387
102
- ta 386
103
- al 386
104
- ns_ 385
105
- po 385
106
- l’ 375
107
- _l373
108
- _t 373
109
- em 373
110
- ce_ 371
111
- pr 371
112
- ro 370
113
- un 369
114
- _fr 367
115
- h 362
116
- tio 356
117
- _co 356
118
- que 349
119
- fra 349
120
- or 347
121
- ne_ 344
122
- so 337
123
- rt 333
124
- oi 328
125
- à_ 326
126
- à 326
127
- du 318
128
- 317
129
- nce 315
130
- is_ 315
131
- 313
132
- _ 313
133
- anc 309
134
- x 308
135
- est 299
136
- si 299
137
- _au 298
138
- _n 298
139
- el 291
140
- us 290
141
- om 288
142
- _u 286
143
- p_ 285
144
- pl 284
145
- ll 284
146
- ue_ 284
147
- nd 282
148
- é_ 281
149
- ma 281
150
- ui 280
151
- è 275
152
- _pr 269
153
- _un 268
154
- ée 264
100
+ li 397
101
+ ta 393
102
+ fr 392
103
+ ns_ 389
104
+ al 389
105
+ po 389
106
+ ce_ 378
107
+ l377
108
+ _l’ 375
109
+ _t 375
110
+ em 375
111
+ ro 375
112
+ un 373
113
+ h 372
114
+ pr 372
115
+ _fr 368
116
+ _co 358
117
+ tio 357
118
+ ne_ 356
119
+ fra 351
120
+ or 350
121
+ que 346
122
+ so 341
123
+ rt 334
124
+ oi 333
125
+ à_ 330
126
+ à 330
127
+ du 322
128
+ 319
129
+ nce 318
130
+ is_ 317
131
+ _ 316
132
+ 316
133
+ anc 312
134
+ x 311
135
+ si 303
136
+ est 300
137
+ el 298
138
+ _n 297
139
+ _au 296
140
+ us 293
141
+ _u 291
142
+ ll 291
143
+ om 290
144
+ ue_ 289
145
+ é_ 289
146
+ nd 287
147
+ pl 286
148
+ ma 283
149
+ ui 278
150
+ è 278
151
+ _pr 273
152
+ _un 272
153
+ ée 267
154
+ ati 264
155
+ men 263
155
156
  ir 263
156
- ati 262
157
- men 261
158
- lu 259
159
- _du 259
160
- _so 258
157
+ _du 263
158
+ _so 262
159
+ lu 262
160
+ du_ 259
161
161
  ont 257
162
- du_ 254
163
- st_ 250
164
- ve 249
162
+ ve 252
165
163
  mi 249
166
- rs 246
167
- _q 244
168
- _qu 244
169
- és 240
170
- ci 239
171
- i_ 239
172
- 236
164
+ st_ 249
165
+ rs 247
166
+ _qu 245
167
+ _q 245
168
+ i_ 243
169
+ és 241
170
+ ci 241
171
+ té 237
172
+ ut 235
173
173
  di 235
174
- ut 232
175
- _es 230
176
- mo 229
177
- ss 229
178
- _o 227
179
- ant 223
180
- 220
181
- pe 218
182
- eur 217
183
- ais 214
184
- au_ 212
185
- con 211
186
- lle 210
174
+ mo 232
175
+ _o 231
176
+ ant 230
177
+ _es 229
178
+ ss 228
179
+ 226
180
+ eur 223
181
+ pe 220
182
+ ais 215
183
+ l_ 215
184
+ au_ 213
185
+ lle 212
186
+ con 212
187
+ _po 211
187
188
  res 209
188
- _po 208
189
- l_ 205
189
+ te_ 209
190
+ na 205
190
191
  ct 204
191
- il 201
192
- iqu 200
193
- iq 200
194
- na 199
195
- te_ 198
196
- ep 198
197
- ux 197
198
- _pl 197
199
- d’ 197
200
- son 197
201
- nn 196
202
- da 195
203
- y 195
204
- ol 195
205
- rs_ 194
206
- x_ 192
207
- _d’ 192
208
- ar_ 191
209
- ons 191
192
+ il 203
193
+ da 203
194
+ ux 200
195
+ x_ 199
196
+ iqu 199
197
+ iq 199
198
+ nn 199
199
+ son 198
200
+ _pl 198
201
+ y 198
202
+ d’ 198
203
+ rs_ 197
204
+ ol 197
205
+ ons 194
206
+ _d’ 193
207
+ me_ 193
208
+ _se 192
209
+ ur_ 192
210
+ ar_ 192
210
211
  lo 191
211
- _i 190
212
- me_ 189
213
- _se 187
212
+ _i 189
214
213
  to 187
215
214
  no 186
216
- ur_ 185
217
- ch 182
218
- eme 180
219
- ec 178
220
- tre 178
221
- ux_ 177
222
- _re 176
223
- us_ 175
224
- vi 175
225
- ans 174
226
- _mo 172
227
- pp 172
215
+ ch 185
216
+ ux_ 184
217
+ eme 182
218
+ _re 179
219
+ ec 179
220
+ tre 177
221
+ us_ 177
222
+ vi 176
223
+ ans 175
224
+ _mo 173
225
+ ic 173
228
226
  pu 172
229
- ic 172
227
+ 171
230
228
  mp 171
231
- 170
232
- lus 170
229
+ lus 171
233
230
  art 170
234
- _ma 167
231
+ _ma 168
232
+ un_ 168
233
+ plu 166
235
234
  ire 166
236
- un_ 166
237
- ale 166
235
+ une 166
238
236
  _v 165
239
- plu 165
240
- une 164
241
- op 162
242
- ét 161
237
+ ale 165
238
+ se_ 164
239
+ ét 164
240
+ op 164
241
+ dan 161
243
242
  gr 161
244
- _g 159
245
- _ce 158
246
- dan 158
247
- se_ 157
248
- ul 157
249
- ac 154
250
- sa 154
251
- j 153
243
+ _g 160
244
+ ul 159
245
+ _ce 157
246
+ j 154
247
+ tu 153
248
+ ac 153
249
+ sa 153
252
250
  mm 153
251
+ né 153
252
+ ts 152
253
+ fi 151
254
+ ts_ 151
253
255
  ’a 151
254
- tu 151
255
- 151
256
- fi 149
257
- im 148
258
- ts 147
259
- és_ 143
260
- as 143
261
- ts_ 142
262
- sp 142
263
- _dé 141
264
- it_ 141
265
- _da 138
266
- su 138
267
- rti 137
268
- té_ 136
269
- bl 136
270
- er_ 135
271
- ge 135
272
- ell 134
273
- ise 134
274
- _ré 134
275
- ér 133
276
- our 133
277
- ç 133
278
- ia 133
256
+ im 150
257
+ és_ 150
258
+ it_ 146
259
+ er_ 144
260
+ _dé 142
261
+ _da 142
262
+ as 141
263
+ su 139
264
+ ep 139
265
+ té_ 138
266
+ bl 138
267
+ ge 138
268
+ our 137
269
+ _ré 136
270
+ ell 136
271
+ ise 136
272
+ rti 135
273
+ ç 134
274
+ ér 134
275
+ ag 132
276
+ ia 132
279
277
  _no 131
280
- ag 130
281
- ntr 128
282
- ien 127
283
- 127
284
- ée_ 125
285
- nça 124
286
- ça 124
287
- ’e 124
288
- anç 123
289
- ni 122
290
- pp_ 122
291
- iv 122
292
- çai 121
293
- ort 121
294
- com 119
278
+ ée_ 131
279
+ ien 128
280
+ 128
281
+ ntr 127
282
+ ’e 125
283
+ nça 125
284
+ ça 125
285
+ anç 124
286
+ ni 124
287
+ iv 123
288
+ çai 122
289
+ ort 122
290
+ com 121
291
+ ond 119
292
+ aux 119
295
293
  rr 117
296
- aux 116
297
- ond 116
298
- ui_ 115
294
+ ui_ 116
295
+ ’_ 115
299
296
  ins 113
300
297
  tra 112
301
298
  _tr 112
299
+ _pe 111
302
300
  ain 111
303
- _pe 110
304
- ’_ 110
301
+ 110
305
302
  ées 109
306
- 108
307
- ie_ 108
308
- qui 108
309
- ses 107
303
+ ie_ 109
304
+ ca 109
305
+ mb 108
306
+ d_ 108
307
+ ig 108
308
+ ine 108
310
309
  _su 107
311
- ca 107
312
- mb 107
313
- ine 106
314
- _b 105
310
+ ses 107
311
+ qui 107
315
312
  do 105
313
+ _b 105
314
+ éc 105
315
+ br 105
316
316
  _di 104
317
- éc 104
318
- ig 104
319
- d_ 104
320
- br 104
321
- fa 103
322
- mme 103
317
+ nne 104
318
+ fo 104
323
319
  ect 103
324
- nne 102
325
- uv 101
326
- ap 101
327
- ot 101
320
+ mme 103
321
+ fa 103
322
+ ot 103
328
323
  sé 101
324
+ ap 101
325
+ uv 100
329
326
  rés 100
330
- ép 100
331
- fo 100
332
- cu 99
333
- uis 99
334
- mai 98
327
+ _te 99
335
328
  _j 98
336
- lit 98
337
- _te 97
338
- ter 96
339
- urs 96
329
+ ter 98
330
+ mai 98
331
+ cu 98
332
+ urs 97
333
+ ill 97
334
+ lit 97
335
+ l’_ 97
336
+ oc 96
337
+ id 96
338
+ ép 96
339
+ tan 96
340
+ uis 96
340
341
  ris 96
341
- id 95
342
- ill 95
343
- oc 95
344
- cti 94
342
+ gi 96
343
+ bre 94
344
+ ité 94
345
345
  air 94
346
- ité 93
347
- bre 93
346
+ ier 94
347
+ cti 94
348
348
  ues 93
349
- ier 93
350
- gi 93
351
- l’_ 92
352
- iti 92
353
- por 91
354
- nte 90
355
- mon 90
356
- pro 90
357
- tan 90
358
- hi 90
349
+ nte 93
350
+ pro 92
351
+ por 92
352
+ hi 92
353
+ iti 91
354
+ mon 91
355
+ sp 91
359
356
  _in 90
360
- vo 89
361
- oir 89
362
- ouv 89
357
+ _si 90
358
+ va 89
363
359
  av 89
364
- va 88
365
- nom 88
366
- _si 88
360
+ vo 88
361
+ oir 88
367
362
  pré 88
368
- ist 87
369
- tie 87
363
+ nom 88
364
+ tie 88
365
+ ouv 88
366
+ onn 87
370
367
  _do 87
368
+ ist 87
369
+ nts 86
371
370
  ys 86
372
- onn 85
371
+ ois 86
373
372
  _an 85
373
+ ég 85
374
+ ure 84
375
+ rop 84
374
376
  mé 84
375
- ois 84
377
+ nde 84
378
+ in_ 84
376
379
  _fa 84
377
380
  ers 84
378
- ure 84
379
- ég 83
380
- rop 83
381
- nts 83
381
+ pou 83
382
+ ay 83
382
383
  ga 83
383
384
  tes 83
384
- in_ 82
385
- nde 82
386
- and 81
385
+ èr 82
386
+ ère 82
387
+ and 82
388
+ _ou 82
389
+ mbr 82
390
+ rm 81
391
+ _fo 81
392
+ pri 81
387
393
  omm 81
388
- _to 81
389
- ay 81
390
394
  tat 81
391
- mbr 81
392
- pri 81
393
- rm 80
394
- pui 80
395
- pou 80
396
- _ou 80
397
- eux 79
398
- ial 79
395
+ _to 81
399
396
  gra 79
400
- ass 79
397
+ _h 79
398
+ ha 79
399
+ nes 79
400
+ eux 79