scylla 0.8.0 → 0.8.29

Sign up to get free protection for your applications and to get access to all the features.
Files changed (93) hide show
  1. data/Gemfile +4 -0
  2. data/Gemfile.lock +9 -1
  3. data/lib/scylla/generator.rb +46 -13
  4. data/lib/scylla/lms/afrikaans.lm +400 -400
  5. data/lib/scylla/lms/arabic.lm +400 -400
  6. data/lib/scylla/lms/bulgarian.lm +400 -400
  7. data/lib/scylla/lms/catalan.lm +399 -399
  8. data/lib/scylla/lms/chinese.lm +400 -400
  9. data/lib/scylla/lms/czech.lm +400 -0
  10. data/lib/scylla/lms/danish.lm +396 -396
  11. data/lib/scylla/lms/dutch.lm +400 -0
  12. data/lib/scylla/lms/english.lm +400 -400
  13. data/lib/scylla/lms/finnish.lm +400 -400
  14. data/lib/scylla/lms/french.lm +398 -398
  15. data/lib/scylla/lms/german.lm +400 -400
  16. data/lib/scylla/lms/greek.lm +400 -400
  17. data/lib/scylla/lms/hebrew.lm +399 -399
  18. data/lib/scylla/lms/hindi.lm +400 -400
  19. data/lib/scylla/lms/icelandic.lm +399 -399
  20. data/lib/scylla/lms/indonesian.lm +400 -400
  21. data/lib/scylla/lms/italian.lm +400 -400
  22. data/lib/scylla/lms/japanese.lm +399 -399
  23. data/lib/scylla/lms/kannada.lm +400 -0
  24. data/lib/scylla/lms/korean.lm +400 -400
  25. data/lib/scylla/lms/marathi.lm +400 -0
  26. data/lib/scylla/lms/norwegian.lm +400 -400
  27. data/lib/scylla/lms/persian.lm +400 -0
  28. data/lib/scylla/lms/polish.lm +400 -400
  29. data/lib/scylla/lms/portuguese.lm +400 -400
  30. data/lib/scylla/lms/romanian.lm +400 -400
  31. data/lib/scylla/lms/russian.lm +400 -400
  32. data/lib/scylla/lms/slovak.lm +400 -400
  33. data/lib/scylla/lms/slovenian.lm +387 -387
  34. data/lib/scylla/lms/spanish.lm +400 -400
  35. data/lib/scylla/lms/swedish.lm +399 -399
  36. data/lib/scylla/lms/tagalog.lm +400 -400
  37. data/lib/scylla/lms/thai.lm +400 -400
  38. data/lib/scylla/lms/turkish.lm +400 -400
  39. data/lib/scylla/lms/vietnamese.lm +400 -400
  40. data/lib/scylla/lms/welsh.lm +398 -398
  41. data/lib/scylla/resources.rb +43 -33
  42. data/lib/scylla/string.rb +2 -2
  43. data/lib/scylla.rb +0 -4
  44. data/pkg/scylla-0.5.0.gem +0 -0
  45. data/scylla.gemspec +1 -1
  46. data/source_texts/afrikaans.txt +330 -81
  47. data/source_texts/arabic.txt +590 -448
  48. data/source_texts/bulgarian.txt +588 -821
  49. data/source_texts/catalan.txt +435 -413
  50. data/source_texts/chinese.txt +526 -100
  51. data/source_texts/czech.txt +237 -0
  52. data/source_texts/danish.txt +233 -184
  53. data/source_texts/dutch.txt +503 -0
  54. data/source_texts/english.txt +673 -70
  55. data/source_texts/finnish.txt +939 -71
  56. data/source_texts/french.txt +879 -465
  57. data/source_texts/german.txt +1236 -137
  58. data/source_texts/greek.txt +488 -139
  59. data/source_texts/hebrew.txt +539 -100
  60. data/source_texts/hindi.txt +254 -100
  61. data/source_texts/icelandic.txt +301 -90
  62. data/source_texts/indonesian.txt +509 -93
  63. data/source_texts/italian.txt +1066 -120
  64. data/source_texts/japanese.txt +1217 -450
  65. data/source_texts/kannada.txt +340 -0
  66. data/source_texts/korean.txt +343 -219
  67. data/source_texts/marathi.txt +237 -0
  68. data/source_texts/norwegian.txt +555 -190
  69. data/source_texts/persian.txt +886 -0
  70. data/source_texts/polish.txt +1013 -90
  71. data/source_texts/portuguese.txt +690 -88
  72. data/source_texts/romanian.txt +436 -103
  73. data/source_texts/russian.txt +1029 -100
  74. data/source_texts/slovak.txt +575 -102
  75. data/source_texts/slovenian.txt +353 -99
  76. data/source_texts/spanish.txt +858 -675
  77. data/source_texts/swedish.txt +558 -488
  78. data/source_texts/tagalog.txt +391 -100
  79. data/source_texts/thai.txt +286 -60
  80. data/source_texts/turkish.txt +635 -87
  81. data/source_texts/vietnamese.txt +300 -92
  82. data/source_texts/welsh.txt +288 -104
  83. data/test/fixtures/lms/danish.lm +314 -314
  84. data/test/fixtures/lms/english.lm +301 -301
  85. data/test/fixtures/lms/french.lm +326 -326
  86. data/test/fixtures/lms/german.lm +331 -331
  87. data/test/fixtures/lms/hindi.lm +191 -191
  88. data/test/fixtures/lms/italian.lm +299 -299
  89. data/test/fixtures/lms/japanese.lm +103 -103
  90. data/test/fixtures/lms/norwegian.lm +309 -309
  91. data/test/fixtures/lms/spanish.lm +331 -331
  92. data/test/generator_test.rb +2 -2
  93. metadata +14 -3
@@ -1,400 +1,400 @@
1
- _ 15574
2
- e 4682
3
- r 4185
4
- a 4010
5
- n 3825
6
- t 3529
7
- i 2832
8
- s 2764
9
- l 2337
10
- 2073
11
- d 2021
12
- o 1814
13
- g 1572
14
- k 1402
15
- m 1359
16
- v 1194
17
- er 1164
18
- r_ 1035
19
- en 976
20
- 888
21
- ä 888
22
- n_ 884
23
- t_ 848
24
- de 841
25
- a_ 799
26
- f 745
27
- ar 732
28
- u 729
29
- an 718
30
- p 716
31
- h 695
32
- _s 665
33
- st 647
34
- in 614
35
- e_ 611
36
- ö 597
37
- 597
38
- nd 582
39
- en_ 546
40
- ri 540
41
- c 527
42
- et 526
43
- 523
44
- å 523
45
- ge 519
46
- ra 512
47
- . 509
48
- ._ 503
49
- te 497
50
- ti 471
51
- ig 467
52
- _i 467
53
- la 437
54
- s_ 436
55
- b 412
56
- ta 403
57
- S 401
58
- re 400
59
- ve 397
60
- _S 397
61
- _a 396
62
- _o 395
63
- _f 390
64
- _m 386
65
- oc 379
66
- , 376
67
- ll 375
68
- ,_ 374
69
- _d 369
70
- er_ 362
71
- ng 362
72
- _� 355
73
- and 345
74
- sk 343
75
- na 342
76
- om 341
77
- at 339
78
- al 337
79
- ka 334
80
- i_ 322
81
- or 315
82
- �r 311
83
- _e 311
84
- är 311
85
- ns 303
86
- _t 303
87
- tt 298
88
- ar_ 292
89
- _oc 289
90
- el 288
91
- ch 287
92
- d_ 283
93
- ige 282
94
- eri 281
95
- ver 277
96
- h_ 274
97
- �r 272
98
- ör 272
99
- ed 271
100
- ch_ 270
101
- och 269
102
- _och 269
103
- _i_ 268
104
- _och_ 268
105
- och_ 268
106
- y 266
107
- li 260
108
- _Sv 257
109
- Sv 257
110
- ing 257
111
- Sve 256
112
- _Sve 256
113
- on 254
114
- rig 254
115
- me 253
116
- le 252
117
- _v 251
118
- et_ 250
119
- _de 249
120
- m_ 249
121
- j 245
122
- is 245
123
- _k 244
124
- es 243
125
- _h 242
126
- rige 238
127
- nde 237
128
- _p 235
129
- _l 233
130
- g_ 230
131
- ni 229
132
- il 228
133
- erig 226
134
- verig 226
135
- erige 226
136
- veri 226
137
- f� 226
138
- Sveri 224
139
- _Sver 224
140
- Sver 224
141
- de_ 223
142
- ter 217
143
- av 217
144
- v_ 214
145
- va 212
146
- _r 209
147
- da 209
148
- nt 205
149
- ne 205
150
- _b 204
151
- ga 204
152
- ik 199
153
- lan 198
154
- r� 196
155
- fö 195
156
- l_ 194
157
- om_ 192
158
- rn 190
159
- ha 187
160
- _av 187
161
- se 187
162
- av_ 187
163
- �n 184
164
- än 184
165
- _me 180
166
- ad 179
167
- _ä 178
1
+ _ 12268
2
+ e 3780
3
+ r 3229
4
+ a 3063
5
+ n 2901
6
+ t 2760
7
+ s 2287
8
+ i 2141
9
+ l 1753
10
+ d 1620
11
+ 1529
12
+ o 1405
13
+ g 1168
14
+ m 1045
15
+ r_ 1031
16
+ k 1026
17
+ v 982
18
+ er 919
19
+ _s 844
20
+ t_ 803
21
+ en 798
22
+ de 777
23
+ n_ 772
24
+ ä 647
25
+ 647
26
+ a_ 646
27
+ f 607
28
+ e_ 600
29
+ h 600
30
+ u 577
31
+ ar 573
32
+ p 550
33
+ an 511
34
+ en_ 504
35
+ st 489
36
+ c 475
37
+ å 457
38
+ 457
39
+ _i 455
40
+ in 455
41
+ nd 438
42
+ et 432
43
+ ri 432
44
+ 420
45
+ ö 420
46
+ _a 397
47
+ ge 392
48
+ _d 389
49
+ ra 386
50
+ er_ 384
51
+ te 380
52
+ _o 373
53
+ ti 372
54
+ _f 355
55
+ ig 349
56
+ _m 348
57
+ oc 335
58
+ _e 331
59
+ s_ 330
60
+ ve 325
61
+ b 318
62
+ ta 318
63
+ _� 311
64
+ re 304
65
+ ll 303
66
+ i_ 301
67
+ om 294
68
+ la 291
69
+ at 282
70
+ _de 281
71
+ na 281
72
+ ar_ 277
73
+ _t 274
74
+ sv 273
75
+ _oc 269
76
+ �r 261
77
+ är 261
78
+ ch 257
79
+ _i_ 256
80
+ h_ 252
81
+ et_ 251
82
+ ch_ 250
83
+ sk 249
84
+ och 248
85
+ al 246
86
+ ka 243
87
+ ng 241
88
+ _h 240
89
+ sve 238
90
+ _sv 238
91
+ d_ 236
92
+ eri 234
93
+ de_ 231
94
+ or 231
95
+ and 230
96
+ ver 230
97
+ m_ 228
98
+ tt 227
99
+ _v 224
100
+ ns 222
101
+ me 220
102
+ el 220
103
+ _p 216
104
+ nde 213
105
+ li 206
106
+ �r 203
107
+ ör 203
108
+ rig 203
109
+ le 200
110
+ ed 199
111
+ v_ 197
112
+ av 197
113
+ ige 197
114
+ _k 194
115
+ _b 194
116
+ y 190
117
+ es 188
118
+ f� 188
119
+ _l 187
120
+ il 185
121
+ _r 185
122
+ _av 182
123
+ om_ 181
124
+ _u 179
125
+ da 179
126
+ l_ 178
127
+ on 177
168
128
  _in 177
169
- ska 176
170
- _av_ 175
171
- för 172
172
- land 172
173
- so 172
174
- ol 171
175
- _u 168
176
- it 167
177
- sta 166
178
- �r_ 164
179
- _ha 164
180
- är_ 164
181
- to 163
182
- kt 163
183
- ra_ 162
184
- _f� 161
185
- der 161
186
- v� 160
187
- un 160
188
- ma 160
189
- l� 159
190
- tr 158
191
- rs 156
192
- _en 153
193
- ka_ 152
194
- ag 152
195
- _st 151
196
- am 151
197
- era 148
198
- io 147
199
- ro 146
200
- å_ 146
201
- �_ 146
202
- ge_ 145
203
- tt_ 144
204
- ån 143
205
- �n 143
206
- sa 142
207
- ts 142
208
- _fö 142
209
- _ti 142
210
- den 141
211
- _är 139
212
- ut 138
213
- _är_ 137
214
- ng_ 137
215
- ill 136
216
- ion 136
217
- med 136
218
- _so 133
219
- ige_ 133
220
- rige_ 132
221
- gen 131
222
- ning 129
223
- som 129
224
- _n 129
225
- nin 129
226
- rd 128
227
- rna 127
228
- be 127
229
- es_ 126
230
- vi 126
231
- gs 126
232
- ko 125
233
- t� 123
234
- di 123
235
- 123
236
- an_ 123
237
- ens 123
238
- _g 122
239
- _för 122
240
- til 122
241
- _med 122
242
- rt 122
243
- 122
244
- _l� 121
245
- har 121
246
- rk 121
247
- som_ 121
248
- _en_ 120
249
- ll_ 120
250
- till 119
251
- as 119
252
- na_ 118
253
- k_ 118
254
- _har 118
255
- ck 118
256
- har_ 118
257
- _som 118
258
- ande 117
259
- ska_ 117
260
- _har_ 116
261
- dr 115
262
- _re 115
263
- ade 114
264
- ds 114
265
- ke 114
266
- _som_ 114
267
- no 114
268
- ing_ 113
269
- pe 113
270
- nn 113
271
- _til 112
272
- del 112
273
- _till 112
274
- lt 112
275
- fr 109
276
- pr 107
277
- mi 107
278
- D 106
279
- re_ 104
280
- var 104
281
- den_ 103
282
- em 103
283
- gr 103
284
- ent 103
285
- _D 103
286
- si 102
287
- nsk 102
288
- att 101
289
- _lä 101
290
- ger 101
291
- m� 101
292
- län 100
293
- ste 100
294
- tio 100
295
- s� 100
296
- ern 99
297
- ta_ 98
298
- ed_ 98
299
- det 97
300
- tal 97
301
- _va 97
302
- ill_ 96
303
- kr 96
304
- ten 96
305
- tion 96
306
- isk 95
307
- id 94
308
- ks 93
309
- ot 93
310
- ven 92
311
- ur 92
312
- sv 92
313
- ss 92
314
- till_ 91
315
- are 91
316
- med_ 90
317
- _fr 89
318
- ell 89
319
- ati 89
320
- _län 88
321
- ld 88
322
- 88
323
- lla 88
324
- lig 88
325
- ru 87
326
- der_ 87
327
- _med_ 86
328
- �r 86
329
- år 86
330
- pp 86
331
- nd_ 86
332
- gar 85
333
- he 83
334
- N 83
335
- ns_ 82
336
- ls 82
337
- p82
338
- nder 82
339
- rl 82
340
- up 81
341
- one 81
342
- st� 80
343
- 80
344
- rna_ 80
345
- rin 80
346
- ft 80
347
- _på 79
348
- t. 79
349
- _p79
350
- ner 78
351
- t._ 78
352
- erna 78
353
- E 77
354
- �t 77
355
- eg 77
356
- _vi 77
357
- pa 77
358
- nte 77
359
- _den 77
360
- j� 77
361
- ät 77
362
- det_ 76
363
- _. 76
364
- r, 76
365
- på_ 76
366
- r,_ 76
367
- nde_ 76
368
- _ut 76
369
- and_ 76
370
- ter_ 76
371
- ie 76
372
- tor 75
373
- rg 75
374
- _på_ 75
375
- h� 75
376
- und 75
377
- _._ 75
378
- n. 75
379
- n._ 75
380
- gen_ 74
381
- ning_ 74
382
- _E 74
383
- land_ 74
384
- F 74
385
- �l 73
386
- _F 73
387
- ensk 73
388
- 73
389
- ring 73
390
- äl 73
391
- ges 73
392
- ist 73
393
- dra 73
394
- ett 72
395
- r._ 72
396
- _,_ 72
397
- _, 72
398
- sta_ 72
399
- r. 72
400
- ms 71
129
+ va 176
130
+ 176
131
+ av_ 176
132
+ nt 173
133
+ _me 172
134
+ j 172
135
+ ha 168
136
+ 167
137
+ g_ 167
138
+ ter 166
139
+ ga 163
140
+ r_ 160
141
+ se 159
142
+ is 159
143
+ _n 156
144
+ _ha 155
145
+ ing 154
146
+ ad 152
147
+ so 151
148
+ r� 151
149
+ ge_ 150
150
+ _st 149
151
+ un 147
152
+ _en 146
153
+ ik 144
154
+ rn 143
155
+ ne 140
156
+ sta 138
157
+ _f� 136
158
+ it 136
159
+ ni 134
160
+ der 134
161
+ den 133
162
+ v� 132
163
+ _ti 131
164
+ tt_ 127
165
+ _so 125
166
+ å_ 124
167
+ �_ 124
168
+ ska 123
169
+ ut 122
170
+ rs 122
171
+ som 122
172
+ ån 121
173
+ �n 121
174
+ ag 119
175
+ ka_ 119
176
+ ol 118
177
+ med 118
178
+ _g 117
179
+ kt 116
180
+ gen 115
181
+ har 114
182
+ ill 114
183
+ tr 113
184
+ na_ 113
185
+ ra_ 113
186
+ ts 113
187
+ an_ 112
188
+ no 112
189
+ det 112
190
+ sa 111
191
+ lan 111
192
+ �n 111
193
+ än 111
194
+ ro 110
195
+ io 110
196
+ ma 110
197
+ til 109
198
+ to 109
199
+ ade 108
200
+ be 108
201
+ rna 108
202
+ am 105
203
+ ll_ 104
204
+ re_ 103
205
+ k_ 102
206
+ ion 102
207
+ t� 101
208
+ pe 101
209
+ era 100
210
+ fr 99
211
+ es_ 99
212
+ vi 98
213
+ l� 98
214
+ ko 97
215
+ 97
216
+ lt 96
217
+ dr 95
218
+ gs 95
219
+ s� 95
220
+ _va 93
221
+ var 92
222
+ �r 92
223
+ år 92
224
+ ng_ 90
225
+ ens 90
226
+ pr 90
227
+ ed_ 89
228
+ nn 89
229
+ as 89
230
+ rt 87
231
+ ent 86
232
+ ck 86
233
+ _fr 86
234
+ ke 85
235
+ _re 85
236
+ tio 85
237
+ und 85
238
+ ta_ 83
239
+ mi 83
240
+ del 83
241
+ ell 83
242
+ att 83
243
+ gr 81
244
+ 81
245
+ ern 79
246
+ are 79
247
+ 77
248
+ nsk 77
249
+ ks 76
250
+ �r_ 75
251
+ ati 75
252
+ rk 75
253
+ p� 75
254
+ 74
255
+ em 74
256
+ _p� 74
257
+ di 74
258
+ nte 73
259
+ tal 73
260
+ id 73
261
+ lig 72
262
+ st� 72
263
+ _l� 72
264
+ ven 72
265
+ ru 71
266
+ ld 71
267
+ nin 71
268
+ _se 71
269
+ _an 70
270
+ _ut 70
271
+ ten 69
272
+ m� 69
273
+ 69
274
+ rd 68
275
+ he 67
276
+ ot 66
277
+ _un 66
278
+ dra 66
279
+ kr 66
280
+ ett 65
281
+ _be 65
282
+ eg 65
283
+ si 65
284
+ _vi 65
285
+ rin 64
286
+ lla 64
287
+ gar 63
288
+ one 63
289
+ rad 63
290
+ ur 63
291
+ ss 62
292
+ �r_ 62
293
+ ce 62
294
+ ns_ 62
295
+ fr� 62
296
+ h� 62
297
+ n62
298
+ rik 62
299
+ ste 61
300
+ nd_ 61
301
+ ie 61
302
+ ner 60
303
+ _v� 59
304
+ isk 59
305
+ sam 59
306
+ pp 59
307
+ ndr 58
308
+ fo 58
309
+ j57
310
+ nga 57
311
+ _la 57
312
+ ler 57
313
+ �t 56
314
+ nor 56
315
+ �rs 56
316
+ tor 56
317
+ ät 56
318
+ te_ 56
319
+ ale 56
320
+ _sa 56
321
+ st_ 56
322
+ ger 56
323
+ ef 55
324
+ des 55
325
+ gt 55
326
+ iga 55
327
+ po 55
328
+ lt_ 55
329
+ ga_ 54
330
+ nv 54
331
+ 54
332
+ sto 54
333
+ ku 54
334
+ up 54
335
+ 53
336
+ rl 53
337
+ �n_ 53
338
+ per 52
339
+ ete 51
340
+ _j 51
341
+ fi 51
342
+ ls 51
343
+ �l 51
344
+ _om 51
345
+ _et 51
346
+ 51
347
+ äl 51
348
+ all 51
349
+ gt_ 51
350
+ ft 51
351
+ lit 50
352
+ lk 50
353
+ at_ 50
354
+ �nd 50
355
+ sl 50
356
+ _no 49
357
+ int 49
358
+ fa 49
359
+ dan 49
360
+ _mi 49
361
+ pa 49
362
+ reg 49
363
+ upp 49
364
+ tu 49
365
+ yg 49
366
+ _pr 49
367
+ la_ 48
368
+ sen 48
369
+ sp 48
370
+ så 47
371
+ _s� 47
372
+ tan 47
373
+ lag 47
374
+ _n� 47
375
+ ist 47
376
+ ds 47
377
+ _at 47
378
+ cen 47
379
+ do 47
380
+ het 46
381
+ ges 46
382
+ _h� 46
383
+ nar 46
384
+ _ri 46
385
+ nk 46
386
+ oli 46
387
+ iti 46
388
+ tä 46
389
+ min 46
390
+ nge 45
391
+ ul 45
392
+ ans 45
393
+ nt_ 45
394
+ let 45
395
+ ock 45
396
+ mo 45
397
+ age 45
398
+ eda 45
399
+ sd 44
400
+ iv 44