scylla 0.8.0 → 0.8.29

Sign up to get free protection for your applications and to get access to all the features.
Files changed (93) hide show
  1. data/Gemfile +4 -0
  2. data/Gemfile.lock +9 -1
  3. data/lib/scylla/generator.rb +46 -13
  4. data/lib/scylla/lms/afrikaans.lm +400 -400
  5. data/lib/scylla/lms/arabic.lm +400 -400
  6. data/lib/scylla/lms/bulgarian.lm +400 -400
  7. data/lib/scylla/lms/catalan.lm +399 -399
  8. data/lib/scylla/lms/chinese.lm +400 -400
  9. data/lib/scylla/lms/czech.lm +400 -0
  10. data/lib/scylla/lms/danish.lm +396 -396
  11. data/lib/scylla/lms/dutch.lm +400 -0
  12. data/lib/scylla/lms/english.lm +400 -400
  13. data/lib/scylla/lms/finnish.lm +400 -400
  14. data/lib/scylla/lms/french.lm +398 -398
  15. data/lib/scylla/lms/german.lm +400 -400
  16. data/lib/scylla/lms/greek.lm +400 -400
  17. data/lib/scylla/lms/hebrew.lm +399 -399
  18. data/lib/scylla/lms/hindi.lm +400 -400
  19. data/lib/scylla/lms/icelandic.lm +399 -399
  20. data/lib/scylla/lms/indonesian.lm +400 -400
  21. data/lib/scylla/lms/italian.lm +400 -400
  22. data/lib/scylla/lms/japanese.lm +399 -399
  23. data/lib/scylla/lms/kannada.lm +400 -0
  24. data/lib/scylla/lms/korean.lm +400 -400
  25. data/lib/scylla/lms/marathi.lm +400 -0
  26. data/lib/scylla/lms/norwegian.lm +400 -400
  27. data/lib/scylla/lms/persian.lm +400 -0
  28. data/lib/scylla/lms/polish.lm +400 -400
  29. data/lib/scylla/lms/portuguese.lm +400 -400
  30. data/lib/scylla/lms/romanian.lm +400 -400
  31. data/lib/scylla/lms/russian.lm +400 -400
  32. data/lib/scylla/lms/slovak.lm +400 -400
  33. data/lib/scylla/lms/slovenian.lm +387 -387
  34. data/lib/scylla/lms/spanish.lm +400 -400
  35. data/lib/scylla/lms/swedish.lm +399 -399
  36. data/lib/scylla/lms/tagalog.lm +400 -400
  37. data/lib/scylla/lms/thai.lm +400 -400
  38. data/lib/scylla/lms/turkish.lm +400 -400
  39. data/lib/scylla/lms/vietnamese.lm +400 -400
  40. data/lib/scylla/lms/welsh.lm +398 -398
  41. data/lib/scylla/resources.rb +43 -33
  42. data/lib/scylla/string.rb +2 -2
  43. data/lib/scylla.rb +0 -4
  44. data/pkg/scylla-0.5.0.gem +0 -0
  45. data/scylla.gemspec +1 -1
  46. data/source_texts/afrikaans.txt +330 -81
  47. data/source_texts/arabic.txt +590 -448
  48. data/source_texts/bulgarian.txt +588 -821
  49. data/source_texts/catalan.txt +435 -413
  50. data/source_texts/chinese.txt +526 -100
  51. data/source_texts/czech.txt +237 -0
  52. data/source_texts/danish.txt +233 -184
  53. data/source_texts/dutch.txt +503 -0
  54. data/source_texts/english.txt +673 -70
  55. data/source_texts/finnish.txt +939 -71
  56. data/source_texts/french.txt +879 -465
  57. data/source_texts/german.txt +1236 -137
  58. data/source_texts/greek.txt +488 -139
  59. data/source_texts/hebrew.txt +539 -100
  60. data/source_texts/hindi.txt +254 -100
  61. data/source_texts/icelandic.txt +301 -90
  62. data/source_texts/indonesian.txt +509 -93
  63. data/source_texts/italian.txt +1066 -120
  64. data/source_texts/japanese.txt +1217 -450
  65. data/source_texts/kannada.txt +340 -0
  66. data/source_texts/korean.txt +343 -219
  67. data/source_texts/marathi.txt +237 -0
  68. data/source_texts/norwegian.txt +555 -190
  69. data/source_texts/persian.txt +886 -0
  70. data/source_texts/polish.txt +1013 -90
  71. data/source_texts/portuguese.txt +690 -88
  72. data/source_texts/romanian.txt +436 -103
  73. data/source_texts/russian.txt +1029 -100
  74. data/source_texts/slovak.txt +575 -102
  75. data/source_texts/slovenian.txt +353 -99
  76. data/source_texts/spanish.txt +858 -675
  77. data/source_texts/swedish.txt +558 -488
  78. data/source_texts/tagalog.txt +391 -100
  79. data/source_texts/thai.txt +286 -60
  80. data/source_texts/turkish.txt +635 -87
  81. data/source_texts/vietnamese.txt +300 -92
  82. data/source_texts/welsh.txt +288 -104
  83. data/test/fixtures/lms/danish.lm +314 -314
  84. data/test/fixtures/lms/english.lm +301 -301
  85. data/test/fixtures/lms/french.lm +326 -326
  86. data/test/fixtures/lms/german.lm +331 -331
  87. data/test/fixtures/lms/hindi.lm +191 -191
  88. data/test/fixtures/lms/italian.lm +299 -299
  89. data/test/fixtures/lms/japanese.lm +103 -103
  90. data/test/fixtures/lms/norwegian.lm +309 -309
  91. data/test/fixtures/lms/spanish.lm +331 -331
  92. data/test/generator_test.rb +2 -2
  93. metadata +14 -3
@@ -1,400 +1,400 @@
1
- _ 5012
2
- e 1600
3
- r 1018
4
- n 1012
5
- t 924
6
- a 857
7
- s 711
8
- i 662
9
- o 640
10
- l 548
11
- g 500
12
- k 479
13
- d 416
14
- m 398
15
- r_ 323
16
- 323
17
- e_ 321
18
- t_ 306
19
- n_ 292
20
- er 290
21
- en 287
22
- v 284
23
- _s 225
24
- et 214
25
- g_ 214
26
- an 213
27
- or 203
28
- 194
29
- å 194
30
- de 191
31
- f 188
32
- u 188
33
- er_ 175
34
- h 172
35
- en_ 169
36
- p 166
37
- te 162
38
- . 161
39
- re 159
40
- _o 158
41
- ._ 152
42
- _e 151
43
- _h 148
44
- ar 145
45
- st 143
46
- et_ 142
47
- _d 140
48
- , 134
49
- ,_ 134
50
- in 130
51
- sk 129
52
- i_ 126
53
- _i 121
54
- ng 117
55
- ke 117
56
- ne 116
57
- _f 113
58
- le 110
59
- ti 110
60
- om 109
61
- og 108
62
- _m 105
63
- me 105
64
- j 104
65
- og_ 103
66
- _og 103
67
- b 103
68
- _og_ 101
69
- la 99
70
- m_ 98
71
- _a 97
72
- _de 97
73
- _t 96
74
- ha 94
75
- ei 93
76
- å_ 93
77
- �_ 93
78
- ø 92
79
- 92
80
- a_ 89
81
- se 88
82
- _ha 87
83
- _v 87
84
- el 84
85
- ge 84
86
- eg 84
87
- ri 84
88
- nd 83
89
- tt 83
90
- _n 81
91
- is 80
92
- nn 80
93
- _i_ 80
94
- y 79
95
- ta 79
96
- _k 78
97
- av 78
98
- om_ 77
99
- al 75
100
- _. 75
101
- il 74
102
- rs 74
103
- l_ 73
104
- no 72
105
- d_ 71
106
- _b 71
107
- on 71
108
- v_ 71
109
- _._ 70
110
- _me 69
111
- ar_ 69
112
- rt 69
113
- ve 67
114
- _, 66
115
- _,_ 66
116
- va 65
117
- ing 63
118
- _g 61
119
- _p 61
120
- at 59
121
- det 59
122
- ke_ 59
123
- an_ 59
124
- k_ 58
125
- av_ 58
126
- fo 58
127
- ll 58
128
- _er 57
129
- un 57
130
- _av 57
131
- _er_ 56
132
- ik 55
133
- N 54
134
- _l 54
135
- so 53
136
- _N 53
137
- li 53
138
- je 52
139
- nor 52
140
- am 52
141
- eg_ 51
142
- lan 51
143
- ne_ 51
144
- ors 50
145
- ed 50
146
- r� 50
147
- ns 50
148
- _ti 50
149
- es 49
150
- ter 49
151
- rsk 48
152
- _av_ 48
153
- D 48
154
- for 48
155
- _D 48
156
- til 48
157
- te_ 47
158
- _r 47
159
- and 47
160
- H 46
161
- _H 46
162
- ka 46
163
- it 46
164
- ra 46
165
- nde 46
166
- ske 45
167
- _til 45
168
- _no 44
169
- det_ 44
170
- ga 44
171
- _� 44
172
- orsk 44
173
- _No 43
174
- na 43
175
- ko 43
176
- _fo 43
177
- _so 43
178
- som 43
179
- No 43
180
- S 43
181
- ste 42
182
- nge 42
183
- _Nor 42
184
- Nor 42
185
- som_ 42
186
- il_ 42
187
- _som 41
188
- _S 41
189
- _som_ 41
190
- 40
191
- tte 40
192
- p� 40
193
- ett 39
194
- nt 39
195
- _u 38
196
- 38
197
- da 38
198
- kk 38
199
- _ei 38
200
- ig 38
201
- em 38
202
- ma 38
203
- ør 37
204
- _De 37
205
- �r 37
206
- _p� 37
207
- _på 37
208
- rd 37
209
- _han 37
210
- ed_ 37
211
- han 37
212
- sa 37
213
- De 37
214
- ten 37
215
- vi 36
216
- gj 36
217
- re_ 36
218
- _for 36
219
- til_ 36
220
- nors 36
221
- norsk 36
222
- på_ 36
223
- _på_ 36
224
- den 35
225
- reg 35
226
- kt 35
227
- _til_ 35
228
- ske_ 35
229
- _nor 34
230
- rt_ 34
231
- _va 34
232
- _se 34
233
- med 34
234
- _det 33
235
- de_ 33
236
- or_ 33
237
- ore 33
238
- lle 33
239
- var 33
240
- m� 32
241
- s_ 32
242
- _st 32
243
- sp 31
244
- den_ 31
245
- land 31
246
- _med 31
247
- sk_ 31
248
- to 31
249
- pe 31
250
- kr 31
251
- ag 31
252
- tr 31
253
- ol 30
254
- ell 30
255
- med_ 30
256
- 29
257
- fr 29
258
- _har_ 29
259
- ak 29
260
- pr 29
261
- ni 29
262
- har_ 29
263
- _har 29
264
- le_ 29
265
- har 29
266
- _han_ 28
267
- rk 28
268
- mi 28
269
- han_ 28
270
- _ko 28
271
- _med_ 28
272
- ss 28
273
- ek 28
274
- _den 28
275
- si 28
276
- der 28
277
- _la 28
278
- ng_ 27
279
- æ 27
280
- _den_ 27
281
- ie 27
282
- _ve 27
283
- 27
284
- �l 27
285
- år 27
286
- _re 27
287
- _fr 27
288
- �r 27
289
- as 27
290
- ks 27
291
- ål 27
292
- ei_ 27
293
- ut 26
294
- ande 26
295
- men 26
296
- ans 26
297
- _var 26
298
- tin 26
299
- nne 26
300
- enn 26
301
- eri 25
302
- _det_ 25
303
- ter_ 25
304
- mål 25
305
- ru 25
306
- Noreg 25
307
- gje 25
308
- ver 25
309
- oreg 25
310
- ette 25
311
- _Nore 25
312
- 25
313
- ord 25
314
- Nore 25
315
- tt_ 24
316
- ere 24
317
- sj 24
318
- ten_ 24
319
- A 24
320
- gen 24
321
- E 24
322
- kke 23
323
- ting 23
324
- _Ha 23
325
- ts 23
326
- nga 23
327
- lo 23
328
- _E 23
329
- _A 23
330
- Ha 23
331
- he 23
332
- bl 23
333
- isk 22
334
- ds 22
335
- _om 22
336
- s� 22
337
- sta 22
338
- kon 22
339
- for_ 22
340
- ene 22
341
- ong 22
342
- kri 21
343
- �y 21
344
- �r 21
345
- ær 21
346
- øy 21
347
- ir 21
348
- us 21
349
- ok 21
350
- rm 21
351
- ane 21
352
- orsk_ 20
353
- _en 20
354
- rsk_ 20
355
- _nors 20
356
- gr 20
357
- ad 20
358
- ld 20
359
- ist 20
360
- _lan 20
361
- _bl 20
362
- ndet 20
363
- sl 20
364
- art 20
365
- ale 19
366
- lt 19
367
- hu 19
368
- _s� 19
369
- ert 19
370
- inga 19
371
- _seg 19
372
- fa 19
373
- jo 19
374
- oreg_ 19
375
- f� 19
376
- rske 19
377
- ort 19
378
- orske 19
379
- ret 19
380
- sam 19
381
- andet 19
382
- id 19
383
- seg 19
384
- _ut 19
385
- _ka 19
386
- un_ 19
387
- _sk 19
388
- reg_ 19
389
- _sa 19
390
- _in 18
391
- _seg_ 18
392
- sm 18
393
- mn 18
394
- ro 18
395
- _om_ 18
396
- elle 18
397
- ang 18
398
- _vi 18
399
- ge_ 18
400
- seg_ 18
1
+ _ 9148
2
+ e 3670
3
+ r 2132
4
+ n 2126
5
+ t 1990
6
+ s 1549
7
+ i 1425
8
+ o 1352
9
+ a 1308
10
+ l 1212
11
+ d 1054
12
+ g 1038
13
+ e_ 889
14
+ k 833
15
+ m 728
16
+ en 726
17
+ er 705
18
+ t_ 677
19
+ r_ 659
20
+ v 594
21
+ de 566
22
+ 540
23
+ n_ 522
24
+ _s 486
25
+ f 439
26
+ et 435
27
+ te 422
28
+ er_ 411
29
+ p 400
30
+ or 392
31
+ en_ 389
32
+ g_ 376
33
+ re 354
34
+ _o 352
35
+ st 351
36
+ _e 342
37
+ _d 341
38
+ u 339
39
+ _i 337
40
+ å 304
41
+ 304
42
+ et_ 303
43
+ _a 298
44
+ _f 292
45
+ ge 281
46
+ b 278
47
+ _n 277
48
+ h 277
49
+ ne 276
50
+ le 265
51
+ i_ 262
52
+ _de 260
53
+ an 259
54
+ og 253
55
+ in 251
56
+ _og 242
57
+ _i_ 242
58
+ ke 233
59
+ no 232
60
+ _t 225
61
+ nd 223
62
+ om 222
63
+ og_ 221
64
+ me 220
65
+ sk 208
66
+ el 207
67
+ _m 206
68
+ _b 205
69
+ li 200
70
+ _no 198
71
+ nor 197
72
+ ng 195
73
+ ti 193
74
+ ri 191
75
+ _h 190
76
+ av 189
77
+ ig 183
78
+ al 182
79
+ se 182
80
+ ar 178
81
+ 177
82
+ ø 177
83
+ _p 176
84
+ m_ 176
85
+ j 174
86
+ ve 168
87
+ v_ 167
88
+ tt 163
89
+ is 160
90
+ es 158
91
+ nn 158
92
+ _av 156
93
+ s_ 156
94
+ ed 153
95
+ av_ 149
96
+ _k 148
97
+ _v 147
98
+ fo 147
99
+ �_ 147
100
+ å_ 147
101
+ y 146
102
+ il 145
103
+ om_ 144
104
+ te_ 140
105
+ so 140
106
+ d_ 139
107
+ ta 138
108
+ det 138
109
+ den 137
110
+ la 135
111
+ l_ 131
112
+ _r 131
113
+ de_ 130
114
+ at 130
115
+ _me 129
116
+ on 129
117
+ ne_ 129
118
+ rs 128
119
+ ra 127
120
+ _l 125
121
+ nt 122
122
+ nde 120
123
+ ste 120
124
+ _so 119
125
+ som 118
126
+ ll 117
127
+ re_ 117
128
+ ge_ 116
129
+ ter 115
130
+ un 115
131
+ ar_ 114
132
+ ing 113
133
+ rg 112
134
+ ha 110
135
+ and 109
136
+ ke_ 108
137
+ rt 108
138
+ ol 106
139
+ _er 106
140
+ _ti 106
141
+ org 106
142
+ ns 106
143
+ _st 104
144
+ ik 104
145
+ _fo 104
146
+ k_ 103
147
+ _en 102
148
+ ene 101
149
+ for 101
150
+ _ha 100
151
+ lig 100
152
+ ni 100
153
+ nge 97
154
+ til 97
155
+ lan 92
156
+ tte 91
157
+ p� 90
158
+ 90
159
+ _p� 90
160
+ eg 89
161
+ rge 89
162
+ ske 89
163
+ _u 88
164
+ em 85
165
+ sa 83
166
+ _� 82
167
+ ere 82
168
+ tr 82
169
+ pr 82
170
+ a_ 81
171
+ je 79
172
+ ett 79
173
+ _g 79
174
+ bl 79
175
+ der 78
176
+ va 78
177
+ il_ 77
178
+ be 77
179
+ si 77
180
+ id 77
181
+ ko 74
182
+ _bl 74
183
+ lle 74
184
+ le_ 73
185
+ med 73
186
+ _et 70
187
+ ut 70
188
+ gen 70
189
+ ten 70
190
+ _la 69
191
+ har 69
192
+ ts 69
193
+ fr 68
194
+ rsk 68
195
+ _fr 68
196
+ ors 68
197
+ ng_ 68
198
+ ver 67
199
+ ent 67
200
+ ed_ 67
201
+ inn 66
202
+ it 66
203
+ est 65
204
+ r� 65
205
+ kr 64
206
+ men 63
207
+ kk 63
208
+ jo 63
209
+ am 63
210
+ rig 62
211
+ dr 62
212
+ _in 62
213
+ del 62
214
+ lt 61
215
+ to 61
216
+ �r 60
217
+ ør 60
218
+ na 59
219
+ rd 59
220
+ ro 59
221
+ as 58
222
+ kt 58
223
+ vi 58
224
+ ru 58
225
+ sen 57
226
+ _be 57
227
+ mm 57
228
+ år 56
229
+ nt_ 56
230
+ 56
231
+ �r 56
232
+ tal 56
233
+ mi 56
234
+ _ko 55
235
+ es_ 55
236
+ nin 55
237
+ ls 54
238
+ pe 53
239
+ sj 52
240
+ ens 52
241
+ di 52
242
+ ma 52
243
+ gs 52
244
+ tt_ 52
245
+ _al 52
246
+ or_ 51
247
+ 51
248
+ _ri 51
249
+ æ 51
250
+ ble 50
251
+ sta 50
252
+ �r 50
253
+ ær 50
254
+ all 49
255
+ rt_ 49
256
+ 49
257
+ nne 49
258
+ ner 48
259
+ ak 48
260
+ sp 48
261
+ _ut 48
262
+ s� 48
263
+ mme 48
264
+ lk 47
265
+ _re 47
266
+ ek 47
267
+ fra 47
268
+ ler 46
269
+ jon 46
270
+ ov 46
271
+ sl 46
272
+ gn 46
273
+ sjo 46
274
+ ss 46
275
+ gj 46
276
+ ikk 46
277
+ _sk 46
278
+ ist 46
279
+ und 46
280
+ ra_ 46
281
+ _ve 45
282
+ gr 45
283
+ ali 45
284
+ _va 45
285
+ var 45
286
+ gh 45
287
+ ger 45
288
+ rk 44
289
+ igh 44
290
+ fi 44
291
+ ev 43
292
+ kri 43
293
+ ren 43
294
+ op 43
295
+ kon 43
296
+ _si 43
297
+ _se 43
298
+ sam 43
299
+ os 43
300
+ fol 42
301
+ ds 42
302
+ f� 42
303
+ ka 42
304
+ mer 42
305
+ ld 41
306
+ tat 41
307
+ ell 41
308
+ lo 41
309
+ end 41
310
+ ert 41
311
+ nte 40
312
+ ks 40
313
+ ige 40
314
+ ign 40
315
+ one 40
316
+ ad 40
317
+ ie 40
318
+ ht 39
319
+ gn_ 39
320
+ ht_ 39
321
+ ord 39
322
+ olk 39
323
+ ser 39
324
+ ght 39
325
+ enn 39
326
+ pp 39
327
+ ret 38
328
+ ndr 38
329
+ he 38
330
+ po 38
331
+ dre 38
332
+ ty 37
333
+ lit 37
334
+ isk 37
335
+ dl 37
336
+ _sa 37
337
+ tet 36
338
+ _pr 36
339
+ kke 36
340
+ gi 36
341
+ lt_ 36
342
+ ei 36
343
+ els 36
344
+ sk_ 35
345
+ st_ 35
346
+ _an 35
347
+ t� 35
348
+ fa 35
349
+ gg 34
350
+ ku 34
351
+ _ta 34
352
+ ede 34
353
+ _om 34
354
+ 34
355
+ ur 34
356
+ _tr 34
357
+ ang 33
358
+ nn_ 33
359
+ rin 33
360
+ ide 33
361
+ ef 33
362
+ rte 33
363
+ let 33
364
+ jen 33
365
+ _f� 33
366
+ ag 32
367
+ ga 32
368
+ da 32
369
+ ove 32
370
+ _un 32
371
+ us 32
372
+ ig_ 32
373
+ asj 32
374
+ eri 31
375
+ ong 31
376
+ v� 31
377
+ iv 31
378
+ sto 31
379
+ reg 31
380
+ ho 30
381
+ rm 30
382
+ att 30
383
+ len 30
384
+ ns_ 30
385
+ gje 29
386
+ tre 29
387
+ spr 29
388
+ o_ 29
389
+ �d 29
390
+ åd 29
391
+ _da 29
392
+ �k 28
393
+ ul 28
394
+ åk 28
395
+ ale 28
396
+ tid 28
397
+ ros 28
398
+ ket 28
399
+ opp 28
400
+ str 28