scylla 0.8.0 → 0.8.29

Sign up to get free protection for your applications and to get access to all the features.
Files changed (93) hide show
  1. data/Gemfile +4 -0
  2. data/Gemfile.lock +9 -1
  3. data/lib/scylla/generator.rb +46 -13
  4. data/lib/scylla/lms/afrikaans.lm +400 -400
  5. data/lib/scylla/lms/arabic.lm +400 -400
  6. data/lib/scylla/lms/bulgarian.lm +400 -400
  7. data/lib/scylla/lms/catalan.lm +399 -399
  8. data/lib/scylla/lms/chinese.lm +400 -400
  9. data/lib/scylla/lms/czech.lm +400 -0
  10. data/lib/scylla/lms/danish.lm +396 -396
  11. data/lib/scylla/lms/dutch.lm +400 -0
  12. data/lib/scylla/lms/english.lm +400 -400
  13. data/lib/scylla/lms/finnish.lm +400 -400
  14. data/lib/scylla/lms/french.lm +398 -398
  15. data/lib/scylla/lms/german.lm +400 -400
  16. data/lib/scylla/lms/greek.lm +400 -400
  17. data/lib/scylla/lms/hebrew.lm +399 -399
  18. data/lib/scylla/lms/hindi.lm +400 -400
  19. data/lib/scylla/lms/icelandic.lm +399 -399
  20. data/lib/scylla/lms/indonesian.lm +400 -400
  21. data/lib/scylla/lms/italian.lm +400 -400
  22. data/lib/scylla/lms/japanese.lm +399 -399
  23. data/lib/scylla/lms/kannada.lm +400 -0
  24. data/lib/scylla/lms/korean.lm +400 -400
  25. data/lib/scylla/lms/marathi.lm +400 -0
  26. data/lib/scylla/lms/norwegian.lm +400 -400
  27. data/lib/scylla/lms/persian.lm +400 -0
  28. data/lib/scylla/lms/polish.lm +400 -400
  29. data/lib/scylla/lms/portuguese.lm +400 -400
  30. data/lib/scylla/lms/romanian.lm +400 -400
  31. data/lib/scylla/lms/russian.lm +400 -400
  32. data/lib/scylla/lms/slovak.lm +400 -400
  33. data/lib/scylla/lms/slovenian.lm +387 -387
  34. data/lib/scylla/lms/spanish.lm +400 -400
  35. data/lib/scylla/lms/swedish.lm +399 -399
  36. data/lib/scylla/lms/tagalog.lm +400 -400
  37. data/lib/scylla/lms/thai.lm +400 -400
  38. data/lib/scylla/lms/turkish.lm +400 -400
  39. data/lib/scylla/lms/vietnamese.lm +400 -400
  40. data/lib/scylla/lms/welsh.lm +398 -398
  41. data/lib/scylla/resources.rb +43 -33
  42. data/lib/scylla/string.rb +2 -2
  43. data/lib/scylla.rb +0 -4
  44. data/pkg/scylla-0.5.0.gem +0 -0
  45. data/scylla.gemspec +1 -1
  46. data/source_texts/afrikaans.txt +330 -81
  47. data/source_texts/arabic.txt +590 -448
  48. data/source_texts/bulgarian.txt +588 -821
  49. data/source_texts/catalan.txt +435 -413
  50. data/source_texts/chinese.txt +526 -100
  51. data/source_texts/czech.txt +237 -0
  52. data/source_texts/danish.txt +233 -184
  53. data/source_texts/dutch.txt +503 -0
  54. data/source_texts/english.txt +673 -70
  55. data/source_texts/finnish.txt +939 -71
  56. data/source_texts/french.txt +879 -465
  57. data/source_texts/german.txt +1236 -137
  58. data/source_texts/greek.txt +488 -139
  59. data/source_texts/hebrew.txt +539 -100
  60. data/source_texts/hindi.txt +254 -100
  61. data/source_texts/icelandic.txt +301 -90
  62. data/source_texts/indonesian.txt +509 -93
  63. data/source_texts/italian.txt +1066 -120
  64. data/source_texts/japanese.txt +1217 -450
  65. data/source_texts/kannada.txt +340 -0
  66. data/source_texts/korean.txt +343 -219
  67. data/source_texts/marathi.txt +237 -0
  68. data/source_texts/norwegian.txt +555 -190
  69. data/source_texts/persian.txt +886 -0
  70. data/source_texts/polish.txt +1013 -90
  71. data/source_texts/portuguese.txt +690 -88
  72. data/source_texts/romanian.txt +436 -103
  73. data/source_texts/russian.txt +1029 -100
  74. data/source_texts/slovak.txt +575 -102
  75. data/source_texts/slovenian.txt +353 -99
  76. data/source_texts/spanish.txt +858 -675
  77. data/source_texts/swedish.txt +558 -488
  78. data/source_texts/tagalog.txt +391 -100
  79. data/source_texts/thai.txt +286 -60
  80. data/source_texts/turkish.txt +635 -87
  81. data/source_texts/vietnamese.txt +300 -92
  82. data/source_texts/welsh.txt +288 -104
  83. data/test/fixtures/lms/danish.lm +314 -314
  84. data/test/fixtures/lms/english.lm +301 -301
  85. data/test/fixtures/lms/french.lm +326 -326
  86. data/test/fixtures/lms/german.lm +331 -331
  87. data/test/fixtures/lms/hindi.lm +191 -191
  88. data/test/fixtures/lms/italian.lm +299 -299
  89. data/test/fixtures/lms/japanese.lm +103 -103
  90. data/test/fixtures/lms/norwegian.lm +309 -309
  91. data/test/fixtures/lms/spanish.lm +331 -331
  92. data/test/generator_test.rb +2 -2
  93. metadata +14 -3
@@ -1,400 +1,400 @@
1
- _ 14386
2
- a 4010
3
- e 3751
4
- l 2647
5
- s 2301
6
- i 2270
7
- n 2179
8
- t 2145
9
- r 1821
10
- o 1472
11
- c 1470
12
- a_ 1256
13
- s_ 1211
14
- 1190
15
- d 1181
16
- u 1070
17
- m 828
18
- _d 784
19
- en 755
20
- es 750
21
- _l 706
22
- p 696
23
- l_ 691
24
- _e 677
25
- al 671
26
- e_ 648
27
- de 629
28
- ta 553
29
- _de 551
30
- _a 510
31
- g 496
32
- ,_ 483
33
- , 483
34
- _c 473
35
- la 464
36
- at 457
37
- el 447
38
- le 443
39
- es_ 442
40
- ca 424
41
- t_ 415
42
- _p 403
43
- er 400
44
- ci 396
45
- . 391
46
- an 380
47
- ._ 377
48
- nt 376
49
- 360
50
- à 360
51
- n_ 359
52
- re 356
53
- st 351
54
- b 341
55
- _de_ 340
56
- de_ 340
57
- ar 339
58
- ra 315
59
- f 301
60
- _i 300
61
- el_ 296
62
- on 294
63
- la_ 277
64
- v 265
65
- i_ 264
66
- ll 263
67
- ic 254
68
- _la 254
69
- ue 248
70
- or 245
71
- _la_ 245
72
- q 243
73
- qu 239
74
- _m 238
75
- _ca 236
76
- in 234
77
- te 233
78
- _s 232
79
- tal 231
80
- it 227
81
- ia 225
82
- ti 215
83
- co 212
84
- en_ 211
85
- om 211
86
- na 210
87
- ent 209
88
- que 208
89
- r_ 204
90
- _el 201
91
- ri 198
92
- i� 197
93
- un 196
94
- _es 193
95
- se 193
96
- ata 192
97
- x 191
98
- ns 191
99
- _ 190
100
- à_ 190
101
- _i_ 188
102
- _a_ 187
103
- atal 186
104
- E 185
105
- ng 183
106
- len 181
107
- _en 179
108
- 178
109
- ó 178
110
- _co 177
111
- A 177
112
- nc 175
113
- ci175
114
- 173
115
- _. 173
116
- é 173
117
- gu 173
118
- l� 172
119
- _o 170
120
- di 170
121
- pe 167
122
- _._ 167
123
- C 162
124
- _t 162
125
- ac 160
126
- li 158
127
- al_ 157
128
- _del 153
129
- _l_ 153
130
- del 153
131
- lle 151
132
- _el_ 151
133
- í 150
134
- cat 150
135
- 150
136
- me 150
137
- tr 148
138
- pa 145
139
- _ll 145
140
- ts 145
141
- ls 143
142
- 143
143
- est 142
144
- _f 142
145
- nt_ 141
146
- ua 141
147
- ts_ 137
148
- ne 136
149
- cata 136
150
- catal 136
151
- pr 136
152
- _cat 134
153
- _cata 134
154
- d_ 133
155
- 133
156
- ro 133
157
- _en_ 133
158
- ls_ 131
159
- h 130
160
- ó_ 129
161
- _E 129
162
- �_ 129
163
- _C 128
164
- _q 128
165
- ma 128
166
- oc 128
167
- _del_ 127
168
- del_ 127
169
- _qu 126
170
- sta 126
171
- _lle 122
172
- am 122
173
- L 122
174
- nci 121
175
- _A 121
176
- ica 121
177
- _v 120
178
- ció 120
179
- no 119
180
- ió_ 118
181
- et 118
182
- �s 117
183
- ni 117
184
- là_ 117
185
- és 117
186
- _, 116
187
- _,_ 116
188
- ale 115
189
- leng 115
190
- al� 115
191
- eng 115
192
- o_ 114
193
- �s_ 114
194
- at_ 114
195
- _pe 114
196
- és_ 114
197
- atal� 113
198
- alà 113
199
- tal� 113
200
- talà 113
201
- y 113
202
- les 112
203
- fi 111
204
- llen 111
205
- _h 111
206
- na_ 110
207
- per 109
208
- _que 109
209
- aci 109
210
- tat 109
211
- _al 109
212
- as 109
213
- _llen 108
214
- va 108
215
- lleng 108
216
- _pr 108
217
- les_ 107
218
- po 106
219
- ad 106
220
- tu 106
221
- ue_ 105
222
- ció_ 105
223
- _que_ 105
224
- que_ 105
225
- _u 104
226
- _� 104
227
- m� 102
228
- g� 102
229
- ant 102
230
- _r 102
231
- ia_ 102
232
- com 101
233
- t� 101
234
- da 100
235
- è 100
236
- � 100
237
- _com 99
238
- cia 98
239
- ec 98
240
- ny 97
241
- ues 97
242
- alà_ 97
243
- _se 95
244
- a, 95
245
- ngu 95
246
- ns_ 95
247
- is 95
248
- a,_ 95
249
- ca_ 94
250
- mi 93
251
- sti 93
252
- ix 93
253
- _d_ 92
254
- er_ 92
255
- gua 90
256
- os 89
257
- to 89
258
- aci� 89
259
- ació 89
260
- ques 89
261
- em 89
262
- enc 89
263
- _per 88
264
- men 87
265
- � 87
266
- ct 87
267
- r� 87
268
- ü 87
269
- mb 87
270
- rt 86
271
- j 86
272
- _n 86
273
- engu 85
274
- engua 85
275
- ngua 85
276
- lengu 85
277
- _L 84
278
- ol 84
279
- P 84
280
- ent_ 83
281
- tre 83
282
- _le 83
283
- ons 82
284
- res 82
285
- _P 82
286
- I 82
287
- gü 82
288
- io 82
289
- ica_ 82
290
- � 82
291
- _un 81
292
- si 81
293
- ei 81
1
+ _ 12996
2
+ a 3889
3
+ e 3745
4
+ l 2385
5
+ s 2307
6
+ i 2249
7
+ t 2164
8
+ n 2052
9
+ r 1861
10
+ a_ 1424
11
+ c 1346
12
+ s_ 1331
13
+ o 1317
14
+ d 1272
15
+ u 1118
16
+ _d 927
17
+ m 831
18
+ _e 803
19
+ 795
20
+ es 793
21
+ l_ 782
22
+ de 776
23
+ p 759
24
+ _l 712
25
+ _de 687
26
+ e_ 663
27
+ el 636
28
+ _a 630
29
+ al 605
30
+ ta 594
31
+ _c 583
32
+ en 561
33
+ la 505
34
+ es_ 475
35
+ er 449
36
+ at 448
37
+ t_ 435
38
+ de_ 431
39
+ _p 410
40
+ el_ 405
41
+ n_ 394
42
+ nt 389
43
+ i_ 384
44
+ ca 383
45
+ g 377
46
+ an 375
47
+ _i 371
48
+ la_ 366
49
+ _el 360
50
+ re 355
51
+ ci 351
52
+ _la 348
53
+ b 347
54
+ un 329
55
+ ra 327
56
+ v 320
57
+ on 312
58
+ st 308
59
+ _s 305
60
+ it 295
61
+ _i_ 278
62
+ co 270
63
+ ar 264
64
+ or 261
65
+ ri 248
66
+ _ca 247
67
+ na 245
68
+ _co 244
69
+ te 242
70
+ _t 241
71
+ _m 233
72
+ r_ 232
73
+ le 228
74
+ ls 224
75
+ ls_ 220
76
+ qu 218
77
+ q 218
78
+ ent 215
79
+ tal 215
80
+ f 214
81
+ in 210
82
+ se 202
83
+ en_ 197
84
+ y 196
85
+ ns 195
86
+ 194
87
+ ó 194
88
+ me 192
89
+ cat 190
90
+ ue 190
91
+ ic 188
92
+ ny 187
93
+ _es 186
94
+ tr 184
95
+ al_ 184
96
+ ata 183
97
+ nt_ 181
98
+ ac 179
99
+ 177
100
+ é 177
101
+ _a_ 175
102
+ del 170
103
+ pe 168
104
+ om 167
105
+ ia 165
106
+ _en 165
107
+ est 163
108
+ d_ 161
109
+ _l_ 161
110
+ ti 161
111
+ x 159
112
+ que 159
113
+ 158
114
+ am 156
115
+ lu 154
116
+ à 150
117
+ _u 150
118
+ nya 149
119
+ ya 149
120
+ ó_ 146
121
+ �_ 146
122
+ ya_ 144
123
+ pr 143
124
+ i� 143
125
+ tat 142
126
+ ts_ 142
127
+ ts 142
128
+ les 140
129
+ _qu 138
130
+ _se 138
131
+ _q 138
132
+ li 137
133
+ ni 137
134
+ ne 137
135
+ mb 136
136
+ 136
137
+ _un 136
138
+ és 135
139
+ �s 135
140
+ to 135
141
+ na_ 135
142
+ �s_ 134
143
+ els 134
144
+ at_ 133
145
+ po 133
146
+ pa 132
147
+ lun 132
148
+ uny 130
149
+ alu 129
150
+ tu 129
151
+ ns_ 127
152
+ res 126
153
+ di 125
154
+ _le 125
155
+ va 124
156
+ h 123
157
+ _d_ 123
158
+ ad 122
159
+ _f 121
160
+ _r 120
161
+ io 117
162
+ sta 116
163
+ men 115
164
+ _al 115
165
+ is 115
166
+ _v 113
167
+ aci 113
168
+ per 112
169
+ _g 111
170
+ _pr 110
171
+ _h 110
172
+ ma 110
173
+ com 109
174
+ _pe 108
175
+ nc 107
176
+ ci� 107
177
+ amb 107
178
+ er_ 106
179
+ ro 105
180
+ ita 104
181
+ ia_ 103
182
+ con 103
183
+ si 102
184
+ _re 101
185
+ ant 100
186
+ _ 99
187
+ rr 99
188
+ da 98
189
+ os 98
190
+ ol 96
191
+ ve 96
192
+ ter 96
193
+ _o 96
194
+ ue_ 95
195
+ ion 95
196
+ ons 94
197
+ no 94
198
+ _n 94
199
+ rt 93
200
+ 92
201
+ í 92
202
+ ur 91
203
+ ll 90
204
+ ona 90
205
+ ua 90
206
+ ei 89
207
+ ix 87
208
+ mi 87
209
+ des 87
210
+ b_ 86
211
+ eg 86
212
+ _am 85
213
+ tre 84
214
+ fi 83
215
+ ec 82
216
+ ce 80
217
+ ra_ 79
294
218
  ut 79
295
- so 78
296
- _di 78
297
- par 78
298
- _re 78
299
- ng78
300
- _g 77
301
- esta 77
302
- ur 77
303
- _pa 77
304
- ngü 77
305
- s 76
306
- ís 76
307
- bl 76
308
- _po 75
309
- _est 75
310
- eg 75
311
- _les_ 74
312
- _les 74
313
- ran 73
314
- ha 73
315
- con 73
316
- mp 72
317
- mo 72
318
- ua_ 72
319
- ar_ 72
320
- m_ 72
321
- _ha 71
322
- tic 70
323
- lu 70
324
- ta_ 69
325
- re_ 69
326
- Ca 69
327
- els 68
328
- T 68
329
- els_ 68
330
- _b 68
331
- ra_ 68
332
- fic 68
333
- _Ca 68
334
- rs 67
335
- amb 67
336
- ie 67
337
- gua_ 67
338
- enci 67
339
- ngua_ 67
340
- ot 66
341
- rd 65
342
- _no 65
343
- ial 65
344
- ter 64
345
- nta 64
346
- des 64
347
- 64
348
- eix 63
349
- ment 63
350
- vi 62
351
- àn 61
352
- lenc 61
353
- V 61
354
- �n 61
355
- do 61
356
- if 61
357
- _va 60
358
- lenci 60
359
- _mo 60
360
- _con 60
361
- alen 60
362
- nd 60
363
- alenc 60
364
- M 60
365
- 59
366
- ing 59
367
- us 59
368
- ell 59
369
- fe 59
370
- �st 58
371
- �sti 58
372
- íst 58
373
- ísti 58
374
- als 58
375
- ce 57
376
- 57
377
- ita 57
378
- _M 57
379
- 57
380
- lo 57
381
- _és 57
382
- D 56
383
- _� 56
384
- _ma 56
385
- sp 56
386
- _és_ 56
387
- ya 56
388
- cià 55
389
- 55
390
- om_ 55
391
- S 54
392
- ul 54
393
- ret 54
394
- era 54
395
- lt 54
396
- ncia 54
397
- ion 53
398
- tat_ 53
399
- s, 53
400
- _par 53
219
+ m_ 79
220
+ ge 79
221
+ mb_ 78
222
+ ta_ 78
223
+ m77
224
+ r� 77
225
+ im 77
226
+ _te 76
227
+ als 76
228
+ l� 75
229
+ 75
230
+ ò 74
231
+ ran 74
232
+ err 74
233
+ ral 74
234
+ sp 74
235
+ era 73
236
+ t� 73
237
+ _po 73
238
+ cio 72
239
+ vi 71
240
+ lt 71
241
+ pi 71
242
+ ir 71
243
+ à_ 70
244
+ 70
245
+ �_ 70
246
+ ba 69
247
+ ot 69
248
+ va_ 69
249
+ lo 69
250
+ ct 68
251
+ tor 66
252
+ ar_ 65
253
+ nci 65
254
+ ca_ 65
255
+ lit 64
256
+ _in 64
257
+ ica 64
258
+ da_ 64
259
+ esp 64
260
+ gu 63
261
+ cia 63
262
+ iv 63
263
+ _b 63
264
+ ici 62
265
+ _m� 62
266
+ eix 62
267
+ eu 62
268
+ re_ 61
269
+ tan 61
270
+ ist 60
271
+ ues 60
272
+ _di 59
273
+ _pa 58
274
+ ie 58
275
+ rc 58
276
+ _va 58
277
+ sti 58
278
+ un_ 57
279
+ us 56
280
+ _no 56
281
+ 56
282
+ una 55
283
+ ori 55
284
+ gr 54
285
+ il 54
286
+ mp 54
287
+ so 54
288
+ om_ 54
289
+ rs 54
290
+ ada 53
291
+ tra 53
292
+ j 53
293
+ et 52
294
+ ov 52
295
+ em 51
296
+ ha 51
297
+ op 51
298
+ any 51
299
+ s� 50
300
+ ala 50
301
+ ntr 49
302
+ pre 49
303
+ u_ 48
304
+ as 48
305
+ itu 48
306
+ _ha 48
307
+ nts 48
308
+ o_ 48
309
+ _ac 48
310
+ sa 48
311
+ an_ 48
312
+ _tr 47
313
+ _ta 47
314
+ id 47
315
+ ats 47
316
+ ito 46
317
+ ali 46
318
+ go 46
319
+ alt 46
320
+ 46
321
+ hi 46
322
+ _to 46
323
+ _ba 46
324
+ oc 46
325
+ è 46
326
+ _ma 46
327
+ ga 46
328
+ _s� 45
329
+ ss 45
330
+ lan 45
331
+ mu 45
332
+ _hi 45
333
+ fe 45
334
+ ura 44
335
+ por 44
336
+ ort 44
337
+ su 44
338
+ ial 43
339
+ bl 43
340
+ uni 43
341
+ x_ 43
342
+ au 43
343
+ ip 43
344
+ tur 42
345
+ ob 42
346
+ rit 42
347
+ ix_ 41
348
+ pri 41
349
+ nal 41
350
+ tes 41
351
+ ual 41
352
+ par 41
353
+ ans 41
354
+ ón 41
355
+ c_ 41
356
+ �n_ 41
357
+ os_ 41
358
+ �n 41
359
+ n� 41
360
+ rm 41
361
+ str 41
362
+ _ge 41
363
+ nom 41
364
+ tit 40
365
+ pro 40
366
+ ser 40
367
+ _ll 40
368
+ xe 40
369
+ ui 40
370
+ �_ 39
371
+ nta 39
372
+ iu 39
373
+ fo 39
374
+ _ar 39
375
+ nd 39
376
+ é_ 39
377
+ ria 39
378
+ us_ 38
379
+ nte 38
380
+ ig 38
381
+ do 38
382
+ lle 38
383
+ ul 38
384
+ ste 38
385
+ rin 38
386
+ gi 37
387
+ só 37
388
+ ev 37
389
+ ver 37
390
+ � 37
391
+ mun 37
392
+ seg 37
393
+ _su 37
394
+ ame 37
395
+ tic 36
396
+ tot 36
397
+ ap 36
398
+ rra 36
399
+ pl 36
400
+ cu 36