scylla 1.0.0 → 1.0.7

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (40) hide show
  1. data/lib/scylla/classifier.rb +3 -2
  2. data/lib/scylla/generator.rb +11 -4
  3. data/lib/scylla/lms/arabic.lm +398 -398
  4. data/lib/scylla/lms/bulgarian.lm +268 -268
  5. data/lib/scylla/lms/catalan.lm +400 -400
  6. data/lib/scylla/lms/chinese.lm +345 -345
  7. data/lib/scylla/lms/czech.lm +382 -382
  8. data/lib/scylla/lms/danish.lm +354 -354
  9. data/lib/scylla/lms/dutch.lm +380 -380
  10. data/lib/scylla/lms/english.lm +327 -327
  11. data/lib/scylla/lms/finnish.lm +297 -297
  12. data/lib/scylla/lms/french.lm +348 -348
  13. data/lib/scylla/lms/german.lm +386 -386
  14. data/lib/scylla/lms/greek.lm +352 -352
  15. data/lib/scylla/lms/hebrew.lm +385 -385
  16. data/lib/scylla/lms/hindi.lm +400 -400
  17. data/lib/scylla/lms/icelandic.lm +195 -195
  18. data/lib/scylla/lms/indonesian.lm +374 -374
  19. data/lib/scylla/lms/italian.lm +365 -365
  20. data/lib/scylla/lms/japanese.lm +368 -368
  21. data/lib/scylla/lms/kannada.lm +299 -299
  22. data/lib/scylla/lms/korean.lm +335 -335
  23. data/lib/scylla/lms/marathi.lm +240 -240
  24. data/lib/scylla/lms/norwegian.lm +348 -348
  25. data/lib/scylla/lms/persian.lm +337 -337
  26. data/lib/scylla/lms/polish.lm +399 -399
  27. data/lib/scylla/lms/portuguese.lm +386 -386
  28. data/lib/scylla/lms/romanian.lm +255 -255
  29. data/lib/scylla/lms/russian.lm +400 -400
  30. data/lib/scylla/lms/slovak.lm +267 -267
  31. data/lib/scylla/lms/slovenian.lm +243 -243
  32. data/lib/scylla/lms/spanish.lm +371 -371
  33. data/lib/scylla/lms/swedish.lm +236 -236
  34. data/lib/scylla/lms/tagalog.lm +287 -287
  35. data/lib/scylla/lms/thai.lm +369 -369
  36. data/lib/scylla/lms/turkish.lm +341 -341
  37. data/lib/scylla/lms/vietnamese.lm +392 -392
  38. data/lib/scylla/lms/welsh.lm +275 -275
  39. data/lib/scylla/loader.rb +1 -1
  40. metadata +2 -2
@@ -1,400 +1,400 @@
1
- _ 19026
2
- e 5658
3
- t 4138
4
- n 3839
5
- a 3693
6
- i 3421
7
- o 3229
8
- s 2963
9
- r 2878
10
- h 2469
11
- e_ 2091
12
- d 1994
13
- l 1971
14
- _t 1697
15
- th 1590
16
- c 1418
17
- s_ 1392
18
- he 1376
1
+ _ 19390
2
+ e 5754
3
+ t 4202
4
+ n 3921
5
+ a 3788
6
+ i 3488
7
+ o 3276
8
+ s 3003
9
+ r 2925
10
+ h 2480
11
+ e_ 2120
12
+ d 2039
13
+ l 2023
14
+ _t 1702
15
+ th 1595
16
+ c 1442
17
+ s_ 1398
18
+ he 1379
19
19
  _th 1342
20
- _a 1278
21
- d_ 1264
22
- the 1260
23
- u 1163
24
- he_ 1078
25
- g 1067
26
- in 1053
27
- m 1032
28
- f 978
29
- an 974
30
- n_ 894
31
- p 830
20
+ _a 1292
21
+ d_ 1277
22
+ the 1262
23
+ u 1194
24
+ g 1111
25
+ he_ 1080
26
+ m 1067
27
+ in 1067
28
+ an 992
29
+ f 987
30
+ n_ 913
31
+ p 894
32
32
  _i 809
33
- nd 776
34
- w 738
35
- re 710
36
- _o 653
37
- nd_ 645
38
- y 643
39
- er 640
40
- t_ 638
41
- en 628
42
- and 620
43
- on 605
44
- b 605
45
- _s 601
46
- ng 589
47
- y_ 535
48
- _w 519
49
- ar 518
50
- es 508
51
- ed 502
52
- is 496
53
- _an 482
54
- _in 480
55
- _c 478
56
- ed_ 475
57
- _e 464
33
+ nd 781
34
+ w 741
35
+ re 722
36
+ y 666
37
+ _o 656
38
+ nd_ 651
39
+ t_ 649
40
+ er 648
41
+ en 640
42
+ on 629
43
+ and 626
44
+ b 611
45
+ ng 602
46
+ _s 602
47
+ y_ 545
48
+ ar 530
49
+ _w 521
50
+ es 517
51
+ ed 506
52
+ is 501
53
+ _c 496
54
+ _an 487
55
+ _in 481
56
+ ed_ 479
57
+ _e 475
58
+ ti 465
58
59
  or 459
59
- ti 449
60
- st 443
61
- it 440
62
- of 429
63
- la 425
60
+ it 455
61
+ st 453
62
+ la 441
63
+ of 430
64
64
  f_ 425
65
- _of 422
66
- h_ 421
67
- te 418
65
+ te 425
66
+ _of 423
67
+ h_ 422
68
68
  as 416
69
- _b 410
70
- of_ 409
71
- nt 407
72
- v 398
73
- r_ 392
74
- at 391
75
- ri 382
76
- _f 375
77
- al 368
78
- in_ 368
79
- _p 358
80
- ro 326
81
- ing 310
82
- as_ 307
83
- re_ 301
84
- to 296
85
- _m 288
86
- co 287
87
- de 283
88
- o_ 282
89
- g_ 282
69
+ _b 412
70
+ at 410
71
+ nt 409
72
+ of_ 407
73
+ r_ 406
74
+ v 403
75
+ ri 386
76
+ _p 379
77
+ al 379
78
+ _f 377
79
+ in_ 372
80
+ ro 332
81
+ ing 311
82
+ as_ 306
83
+ re_ 302
84
+ to 298
85
+ _m 296
86
+ de 295
87
+ co 289
88
+ g_ 284
89
+ o_ 283
90
+ io 278
90
91
  ng_ 277
91
- io 267
92
- l_ 266
93
- es_ 263
94
- le 263
95
- om 262
96
- ou 258
97
- li 255
98
- _l 253
99
- se 251
100
- _r 251
101
- ve 248
102
- me 244
103
- _h 244
104
- ea 242
105
- _en 242
92
+ l_ 275
93
+ le 270
94
+ _l 269
95
+ om 268
96
+ es_ 265
97
+ _r 263
98
+ li 260
99
+ ou 259
100
+ ea 257
101
+ on_ 256
102
+ se 254
103
+ ve 252
104
+ me 250
105
+ _h 249
106
+ _en 245
106
107
  ch 242
107
- on_ 241
108
- ur 234
109
- ion 230
108
+ ion 241
109
+ a_ 239
110
+ ur 239
110
111
  is_ 229
111
- a_ 229
112
- ce 223
113
- gl 221
114
- ic 221
115
- lan 220
116
- _co 217
117
- ent 217
118
- er_ 217
119
- ngl 217
120
- eng 215
112
+ ce 225
113
+ lan 224
114
+ er_ 224
115
+ gl 224
116
+ ic 222
117
+ ngl 220
118
+ _co 220
119
+ ent 219
120
+ _d 219
121
+ eng 218
121
122
  _to 213
122
- _d 207
123
- to_ 206
124
- hi 203
125
- st_ 202
126
- _ar 199
123
+ k 208
124
+ to_ 208
125
+ st_ 208
126
+ ra 207
127
+ hi 204
128
+ _ar 203
129
+ si 202
127
130
  ha 198
128
- ra 197
129
- si 197
130
- k 195
131
131
  _is 193
132
- un 193
133
- al_ 183
134
- nc 181
135
- m_ 180
136
- _n 174
137
- _a_ 174
138
- ns 174
132
+ un 192
133
+ al_ 191
134
+ m_ 188
135
+ _n 184
136
+ nc 182
137
+ ns 180
138
+ _a_ 177
139
139
  fo 173
140
- tr 169
140
+ tr 171
141
+ ma 169
142
+ pe 167
143
+ _re 166
141
144
  wa 162
142
- _re 162
143
- pe 161
144
- ma 159
145
- ll 159
145
+ ll 162
146
+ ne 160
147
+ po 160
148
+ tio 159
149
+ ly 158
150
+ na 158
146
151
  _fo 158
147
- ne 155
152
+ ly_ 156
153
+ are 155
148
154
  th_ 154
149
- ly 154
150
- her 153
151
- rt 153
152
- ly_ 152
153
- po 151
154
- are 151
155
- el 151
156
- tio 150
155
+ ca 154
156
+ ge 153
157
+ el 152
158
+ her 152
159
+ rt 151
157
160
  be 150
158
- na 150
159
- ca 147
160
- gla 147
161
+ ni 148
162
+ gla 148
163
+ sh 148
161
164
  ec 147
162
- ge 144
163
- _as 144
164
- ho 144
165
- sh 144
166
- ol 144
167
- mo 143
165
+ no 147
166
+ ol 145
167
+ _as 145
168
+ mo 145
169
+ _u 144
168
170
  ere 143
169
- no 142
170
- ie 141
171
+ ho 143
172
+ ie 140
171
173
  _wa 140
172
- ni 140
173
- _u 137
174
- ch_ 136
175
- lo 134
176
- ta 133
177
- we 132
178
- est 131
174
+ lo 139
175
+ ta 138
176
+ est 136
177
+ ch_ 134
178
+ we 133
179
+ op 130
179
180
  il 129
180
- _be 128
181
- ts 126
182
- ted 125
183
- om_ 125
184
- wh 124
181
+ om_ 127
182
+ ts 127
183
+ ati 127
184
+ di 127
185
+ _be 127
186
+ ted 126
187
+ ate 126
188
+ tu 125
185
189
  pr 124
186
- tu 123
187
- di 122
190
+ pa 123
191
+ ct 123
188
192
  ot 122
189
- pa 122
190
- ct 121
191
- ate 120
192
- os 119
193
- ati 119
194
- ts_ 119
195
- op 119
193
+ wi 121
194
+ wh 121
195
+ os 120
196
+ _g 120
197
+ ts_ 120
196
198
  rs 119
197
- rom 118
198
- _wh 117
199
- wi 117
200
- fr 116
199
+ rom 119
200
+ fr 117
201
+ us 116
202
+ for 116
203
+ am 115
201
204
  _ha 115
202
- ai 115
203
205
  an_ 115
204
- for 115
206
+ ai 115
205
207
  or_ 114
206
- _fr 113
207
- am 113
208
+ su 114
209
+ _wh 114
210
+ _fr 114
211
+ nt_ 112
212
+ ish 112
213
+ ia 112
208
214
  ter 112
209
- us 111
210
- ia 111
211
- nt_ 110
212
- su 110
213
- ry 110
214
- ish 109
215
+ ry 109
215
216
  ow 109
216
- _mo 107
217
+ _wi 108
218
+ _la 107
217
219
  _pr 107
218
- _by 105
219
- by_ 105
220
- _s_ 105
221
- by 105
222
- iv 104
223
- _wi 104
224
- ry_ 104
225
- con 102
220
+ _mo 107
221
+ by 106
222
+ _by 106
223
+ iv 106
224
+ ul 106
225
+ by_ 106
226
+ et 103
227
+ con 103
228
+ _s_ 103
229
+ ad 103
230
+ ry_ 103
231
+ em 103
232
+ ut 102
226
233
  so 102
227
- _la 101
228
- em 100
229
- le_ 100
230
- _g 100
231
- was 99
232
- ut 99
233
- ad 99
234
- et 98
235
- _it 97
234
+ le_ 101
235
+ mi 100
236
+ me_ 99
237
+ was 98
236
238
  cl 97
237
239
  ns_ 96
238
- ul 96
239
- me_ 95
240
- mi 95
241
- wo 95
242
- ac 95
240
+ sh_ 96
241
+ _ma 96
242
+ ac 96
243
243
  ee 95
244
- inc 94
245
- ig 94
246
- do 94
244
+ _it 95
245
+ ig 95
246
+ wo 94
247
247
  ons 94
248
- oun 94
248
+ do 94
249
+ ver 94
250
+ ci 94
251
+ inc 94
249
252
  ir 93
250
- sh_ 93
251
- ci 93
252
- ver 93
253
- tur 92
253
+ fro 93
254
+ tur 93
255
+ oun 92
254
256
  uc 92
255
- fro 92
256
- _ma 91
257
- ce_ 90
257
+ _de 91
258
+ ith 90
259
+ _pa 90
258
260
  ies 90
259
- _pa 89
260
- ith 87
261
- _on 87
261
+ ce_ 89
262
+ _on 89
263
+ lis 88
264
+ wit 88
265
+ _we 87
262
266
  du 86
263
- _we 86
264
- wit 85
265
- lis 85
266
- tin 84
267
+ _k 85
268
+ iti 85
267
269
  rl 84
268
- iti 84
269
- nce 84
270
- at_ 84
271
- _de 84
272
- mp 83
270
+ all 84
273
271
  en_ 83
274
- ev 82
272
+ tin 83
273
+ ev 83
274
+ _no 83
275
+ ld 83
276
+ nce 83
277
+ mp 83
278
+ at_ 83
275
279
  id 82
276
- ld 82
277
- all 82
278
- lu 82
279
- _k 82
280
+ te_ 82
281
+ im 81
282
+ lu 81
280
283
  _su 80
281
284
  pl 80
282
- fi 79
283
- sp 78
285
+ rea 80
286
+ fi 80
287
+ gi 79
284
288
  _se 78
289
+ ov 77
285
290
  par 77
286
- _no 77
291
+ sp 77
292
+ ag 76
287
293
  rs_ 76
288
- im 76
289
- ov 76
290
- rea 76
291
- te_ 76
294
+ _un 76
295
+ ss 76
292
296
  gh 75
297
+ x 75
293
298
  vi 75
294
- _un 75
295
- ss 75
296
- man 74
297
- x 74
298
299
  art 74
299
- ite 73
300
- gi 72
301
- rit 71
302
- ain 71
303
- od 71
304
- it_ 71
305
- ag 71
306
- und 70
307
- whi 70
308
- br 70
300
+ ite 74
301
+ man 74
302
+ _po 73
303
+ ain 72
304
+ rit 72
305
+ od 72
306
+ lat 71
307
+ br 71
308
+ und 69
309
309
  ve_ 69
310
310
  res 69
311
- ntr 68
312
- rn 68
311
+ it_ 69
312
+ gli 69
313
313
  ist 68
314
- gli 67
315
- _wo 65
314
+ cen 68
315
+ whi 68
316
+ der 68
317
+ ty 67
318
+ rn 67
319
+ ntr 67
320
+ ive 66
321
+ eg 65
316
322
  _st 65
317
- cen 65
323
+ ba 64
318
324
  _so 64
319
- der 64
320
- ive 64
321
- ba 63
322
- int 63
323
- lar 63
325
+ lar 64
326
+ _wo 64
327
+ int 64
328
+ ost 64
329
+ ki 63
330
+ _ce 63
331
+ ove 63
324
332
  _si 63
325
- ost 63
326
- _po 63
327
- eg 62
328
- ki 62
329
- ud 62
330
- ty 62
331
- ove 62
332
333
  men 62
334
+ _pe 62
335
+ ud 62
333
336
  nti 62
337
+ _le 61
338
+ ame 61
339
+ ld_ 61
334
340
  ers 61
335
- _ce 61
336
- cou 61
337
- pro 60
338
- ld_ 60
339
- rin 60
341
+ _br 61
340
342
  has 60
341
- _br 60
343
+ cou 60
344
+ rin 60
345
+ ear 60
346
+ pro 60
342
347
  rm 60
343
- rd 59
344
- ame 59
348
+ gr 60
349
+ rou 59
350
+ _lo 59
345
351
  ern 59
352
+ rd 59
346
353
  _al 59
347
- ort 59
348
- lat 58
349
- gr 58
350
- _pe 58
351
- bo 58
352
354
  ug 58
353
355
  ine 58
356
+ bo 58
357
+ nal 57
358
+ kin 57
359
+ ort 57
360
+ ue 57
354
361
  ica 57
355
- wor 57
356
- rou 57
362
+ sc 56
363
+ wor 56
357
364
  ect 56
358
- uri 56
359
- kin 56
365
+ c_ 56
360
366
  clu 56
361
- sc 56
362
- oth 56
363
- ue 56
364
- av 55
365
- _le 55
366
- _lo 55
367
+ uri 56
367
368
  uch 55
368
- eve 54
369
- se_ 54
370
- bri 54
371
- cal 54
372
- com 53
373
- rie 53
374
- uni 53
375
- ex 53
369
+ av 55
370
+ cal 55
371
+ eve 55
372
+ bri 55
373
+ se_ 55
374
+ oth 55
375
+ p_ 54
376
+ uni 54
377
+ com 54
378
+ eat 53
379
+ ona 53
380
+ ls 53
376
381
  wer 53
382
+ pu 53
383
+ cr 53
384
+ rie 53
377
385
  his 53
378
- ear 53
379
- eat 53
380
- cr 52
381
- c_ 52
386
+ ula 53
387
+ de_ 53
388
+ _ca 52
382
389
  ori 52
390
+ rc 52
391
+ ex 52
392
+ ide 51
393
+ _ki 51
394
+ rg 51
395
+ lon 51
383
396
  _at 51
384
- ona 51
385
- nal 51
386
- tra 51
387
- sed 51
388
- ls 51
389
- rc 51
397
+ ty_ 51
390
398
  ncl 51
391
- ide 51
392
- rg 50
393
- hic 50
394
- ga 50
395
- lud 50
396
- unt 50
397
- bl 50
398
- suc 50
399
- _ki 50
400
- de_ 49
399
+ _ch 51
400
+ tra 51