scylla 0.7.0 → 0.7.5

Sign up to get free protection for your applications and to get access to all the features.
Files changed (38) hide show
  1. data/lib/scylla/classifier.rb +3 -4
  2. data/lib/scylla/generator.rb +4 -7
  3. data/lib/scylla/lms/afrikaans.lm +280 -280
  4. data/lib/scylla/lms/arabic.lm +225 -225
  5. data/lib/scylla/lms/bulgarian.lm +208 -208
  6. data/lib/scylla/lms/catalan.lm +212 -212
  7. data/lib/scylla/lms/chinese.lm +201 -201
  8. data/lib/scylla/lms/danish.lm +155 -155
  9. data/lib/scylla/lms/english.lm +207 -207
  10. data/lib/scylla/lms/finnish.lm +259 -259
  11. data/lib/scylla/lms/french.lm +203 -203
  12. data/lib/scylla/lms/german.lm +280 -280
  13. data/lib/scylla/lms/greek.lm +276 -276
  14. data/lib/scylla/lms/hebrew.lm +170 -170
  15. data/lib/scylla/lms/hindi.lm +241 -241
  16. data/lib/scylla/lms/icelandic.lm +264 -264
  17. data/lib/scylla/lms/indonesian.lm +272 -272
  18. data/lib/scylla/lms/italian.lm +283 -283
  19. data/lib/scylla/lms/japanese.lm +105 -105
  20. data/lib/scylla/lms/korean.lm +400 -400
  21. data/lib/scylla/lms/norwegian.lm +235 -235
  22. data/lib/scylla/lms/polish.lm +264 -264
  23. data/lib/scylla/lms/portuguese.lm +269 -269
  24. data/lib/scylla/lms/romanian.lm +278 -278
  25. data/lib/scylla/lms/russian.lm +127 -127
  26. data/lib/scylla/lms/slovak.lm +281 -281
  27. data/lib/scylla/lms/slovenian.lm +276 -276
  28. data/lib/scylla/lms/spanish.lm +190 -190
  29. data/lib/scylla/lms/swedish.lm +195 -195
  30. data/lib/scylla/lms/tagalog.lm +282 -282
  31. data/lib/scylla/lms/thai.lm +257 -257
  32. data/lib/scylla/lms/turkish.lm +300 -300
  33. data/lib/scylla/lms/vietnamese.lm +277 -277
  34. data/lib/scylla/lms/welsh.lm +271 -271
  35. data/scylla.gemspec +3 -22
  36. data/source_texts/korean.txt +219 -134
  37. metadata +15 -14
  38. data/scylla-0.6.0.gem +0 -0
@@ -1,4 +1,4 @@
1
- _ 14596
1
+ _ 14386
2
2
  a 4010
3
3
  e 3751
4
4
  l 2647
@@ -9,76 +9,76 @@ t 2145
9
9
  r 1821
10
10
  o 1472
11
11
  c 1470
12
+ a_ 1256
13
+ s_ 1211
12
14
  � 1190
13
15
  d 1181
14
- a_ 1172
15
- s_ 1146
16
16
  u 1070
17
- __ 872
18
17
  m 828
19
- _d 769
18
+ _d 784
20
19
  en 755
21
20
  es 750
21
+ _l 706
22
22
  p 696
23
- _l 682
24
- al 674
25
- de 638
26
- e_ 617
27
- _e 615
28
- ta 555
29
- _de 552
30
- l_ 517
23
+ l_ 691
24
+ _e 677
25
+ al 671
26
+ e_ 648
27
+ de 629
28
+ ta 553
29
+ _de 551
30
+ _a 510
31
31
  g 496
32
- la 486
32
+ ,_ 483
33
33
  , 483
34
- ,_ 477
35
- le 475
36
- _c 459
37
- at 458
38
- el 448
39
- _a 443
40
- es_ 427
34
+ _c 473
35
+ la 464
36
+ at 457
37
+ el 447
38
+ le 443
39
+ es_ 442
41
40
  ca 424
41
+ t_ 415
42
+ _p 403
42
43
  er 400
43
- ci 398
44
- _p 396
44
+ ci 396
45
45
  . 391
46
- t_ 390
47
46
  an 380
47
+ ._ 377
48
48
  nt 376
49
49
  � 360
50
50
  à 360
51
+ n_ 359
51
52
  re 356
52
53
  st 351
53
- n_ 347
54
54
  b 341
55
+ _de_ 340
56
+ de_ 340
55
57
  ar 339
56
- de_ 335
57
- _de_ 331
58
58
  ra 315
59
59
  f 301
60
+ _i 300
61
+ el_ 296
60
62
  on 294
61
- el_ 293
62
- la_ 272
63
- _la 270
63
+ la_ 277
64
64
  v 265
65
- ll 264
66
- _i 264
67
- ._ 259
65
+ i_ 264
66
+ ll 263
68
67
  ic 254
69
- i_ 253
68
+ _la 254
70
69
  ue 248
71
70
  or 245
71
+ _la_ 245
72
72
  q 243
73
- _la_ 239
74
73
  qu 239
74
+ _m 238
75
75
  _ca 236
76
76
  in 234
77
77
  te 233
78
+ _s 232
78
79
  tal 231
79
80
  it 227
80
81
  ia 225
81
- _s 223
82
82
  ti 215
83
83
  co 212
84
84
  en_ 211
@@ -86,315 +86,315 @@ om 211
86
86
  na 210
87
87
  ent 209
88
88
  que 208
89
- _m 206
89
+ r_ 204
90
90
  _el 201
91
- se 199
92
91
  ri 198
93
92
  i� 197
94
93
  un 196
95
- ata 194
94
+ _es 193
95
+ se 193
96
+ ata 192
96
97
  x 191
97
98
  ns 191
99
+ �_ 190
100
+ à_ 190
101
+ _i_ 188
102
+ _a_ 187
98
103
  atal 186
99
104
  E 185
100
- l� 185
101
- len 184
102
105
  ng 183
103
- r_ 182
104
- _a_ 180
105
- _i_ 180
106
+ len 181
107
+ _en 179
106
108
  � 178
107
109
  ó 178
110
+ _co 177
108
111
  A 177
109
- di 177
110
- �_ 175
111
- ci� 175
112
- à_ 175
113
112
  nc 175
113
+ ci� 175
114
+ � 173
115
+ _. 173
114
116
  é 173
115
117
  gu 173
116
- 173
117
- _co 171
118
- _en 170
119
- li 168
118
+ l172
119
+ _o 170
120
+ di 170
120
121
  pe 167
122
+ _._ 167
121
123
  C 162
122
- ac 162
123
- _t 157
124
- _es 155
124
+ _t 162
125
+ ac 160
126
+ li 158
127
+ al_ 157
128
+ _del 153
129
+ _l_ 153
125
130
  del 153
126
- _del 152
127
131
  lle 151
128
- 150
132
+ _el_ 151
133
+ í 150
129
134
  cat 150
135
+ � 150
130
136
  me 150
131
- í 150
132
- _el_ 149
133
- - 148
134
137
  tr 148
135
- al_ 145
136
138
  pa 145
139
+ _ll 145
137
140
  ts 145
138
- 145
139
- ls 144
141
+ ls 143
142
+ 143
140
143
  est 142
141
- _ll 142
144
+ _f 142
145
+ nt_ 141
142
146
  ua 141
143
- _f 141
147
+ ts_ 137
144
148
  ne 136
145
149
  cata 136
146
150
  catal 136
147
151
  pr 136
148
- les 135
149
152
  _cat 134
150
153
  _cata 134
151
- _en_ 133
154
+ d_ 133
152
155
  ió 133
153
156
  ro 133
154
- ts_ 132
155
- nt_ 131
157
+ _en_ 133
158
+ ls_ 131
156
159
  h 130
157
- oc 129
158
- _. 129
159
- _o 129
160
+ ó_ 129
161
+ _E 129
162
+ �_ 129
163
+ _C 128
164
+ _q 128
160
165
  ma 128
161
- _q 127
162
- da 126
163
- _del_ 126
166
+ oc 128
167
+ _del_ 127
168
+ del_ 127
169
+ _qu 126
164
170
  sta 126
165
- del_ 126
166
- ls_ 125
167
- _qu 125
168
- �_ 124
169
- ó_ 124
170
- L 122
171
+ _lle 122
171
172
  am 122
172
- nci 122
173
+ L 122
174
+ nci 121
175
+ _A 121
173
176
  ica 121
174
- _lle 120
177
+ _v 120
175
178
  ció 120
176
- et 119
177
179
  no 119
178
- _._ 119
180
+ _ 118
181
+ et 118
179
182
  �s 117
180
- _v 117
181
- és 117
182
183
  ni 117
183
- ale 117
184
+ là_ 117
185
+ és 117
186
+ _, 116
187
+ _,_ 116
188
+ ale 115
184
189
  leng 115
185
190
  al� 115
186
191
  eng 115
192
+ o_ 114
187
193
  �s_ 114
194
+ at_ 114
195
+ _pe 114
188
196
  és_ 114
189
- ió_ 114
197
+ atal� 113
198
+ alà 113
190
199
  tal� 113
191
200
  talà 113
192
- atal� 113
193
201
  y 113
194
- alà 113
195
- _pe 113
196
- _le 112
202
+ les 112
197
203
  fi 111
198
204
  llen 111
199
- as 111
205
+ _h 111
206
+ na_ 110
200
207
  per 109
201
- tat 109
202
208
  _que 109
203
209
  aci 109
204
- at_ 109
205
- là_ 108
206
- lleng 108
207
- ad 108
210
+ tat 109
211
+ _al 109
212
+ as 109
213
+ _llen 108
208
214
  va 108
209
- _llen 107
210
- tu 106
215
+ lleng 108
216
+ _pr 108
217
+ les_ 107
211
218
  po 106
212
- o_ 106
213
- _C 106
214
- les_ 105
215
- _pr 105
216
- na_ 104
219
+ ad 106
220
+ tu 106
221
+ ue_ 105
222
+ ció_ 105
223
+ _que_ 105
224
+ que_ 105
225
+ _u 104
226
+ _� 104
227
+ m� 102
217
228
  g� 102
218
229
  ant 102
219
- m� 102
220
- t� 101
221
- ció_ 101
222
- ec 101
230
+ _r 102
231
+ ia_ 102
223
232
  com 101
233
+ t� 101
234
+ da 100
224
235
  è 100
225
- que_ 100
226
- _que_ 100
227
236
  � 100
228
- ue_ 100
229
- a, 100
230
- a,_ 99
231
- _r 99
237
+ _com 99
232
238
  cia 98
239
+ ec 98
233
240
  ny 97
234
- _com 97
235
241
  ues 97
236
- _se 97
242
+ alà_ 97
243
+ _se 95
244
+ a, 95
237
245
  ngu 95
238
- _h 95
246
+ ns_ 95
239
247
  is 95
240
- ia_ 95
241
- _les 95
242
- _al 94
243
- ns_ 94
248
+ a,_ 95
249
+ ca_ 94
244
250
  mi 93
245
- ix 93
246
251
  sti 93
247
- _u 91
252
+ ix 93
253
+ _d_ 92
254
+ er_ 92
248
255
  gua 90
249
- enc 89
250
- to 89
251
256
  os 89
252
- alà_ 89
257
+ to 89
253
258
  aci� 89
254
259
  ació 89
255
- em 89
256
260
  ques 89
257
- er_ 88
261
+ em 89
262
+ enc 89
263
+ _per 88
264
+ men 87
258
265
  � 87
259
- _per 87
260
- mb 87
266
+ ct 87
261
267
  r� 87
262
268
  ü 87
263
- men 87
264
- ct 87
269
+ mb 87
265
270
  rt 86
266
271
  j 86
267
- engua 85
268
- lengu 85
269
- ol 85
272
+ _n 86
270
273
  engu 85
274
+ engua 85
271
275
  ngua 85
276
+ lengu 85
277
+ _L 84
278
+ ol 84
272
279
  P 84
273
- _di 84
280
+ ent_ 83
274
281
  tre 83
275
- io 82
276
- 82
282
+ _le 83
283
+ ons 82
284
+ res 82
285
+ _P 82
277
286
  I 82
278
287
  gü 82
279
- res 82
280
- ons 82
281
- si 82
282
- lo 81
288
+ io 82
289
+ ica_ 82
290
+ 82
291
+ _un 81
292
+ si 81
283
293
  ei 81
284
- _� 80
285
- _n 79
286
294
  ut 79
287
- so 79
288
- ng� 78
295
+ so 78
296
+ _di 78
289
297
  par 78
290
- ent_ 78
298
+ _re 78
299
+ ng� 78
300
+ _g 77
291
301
  esta 77
292
- ngü 77
293
302
  ur 77
303
+ _pa 77
304
+ ngü 77
294
305
  �s 76
295
- bl 76
296
306
  ís 76
307
+ bl 76
308
+ _po 75
309
+ _est 75
297
310
  eg 75
298
- _pa 75
299
- _re 75
300
- _g 74
301
311
  _les_ 74
302
- _po 74
303
- _un 74
312
+ _les 74
304
313
  ran 73
305
- con 73
306
314
  ha 73
307
- mp 73
315
+ con 73
316
+ mp 72
308
317
  mo 72
309
- lu 71
318
+ ua_ 72
319
+ ar_ 72
320
+ m_ 72
321
+ _ha 71
310
322
  tic 70
311
- ua_ 69
323
+ lu 70
324
+ ta_ 69
325
+ re_ 69
312
326
  Ca 69
313
- des 69
314
- fic 68
315
- enci 68
327
+ els 68
316
328
  T 68
317
329
  els_ 68
318
- els 68
330
+ _b 68
331
+ ra_ 68
332
+ fic 68
333
+ _Ca 68
319
334
  rs 67
320
335
  amb 67
321
336
  ie 67
322
- m_ 67
337
+ gua_ 67
338
+ enci 67
339
+ ngua_ 67
323
340
  ot 66
324
- ta_ 66
325
- _P 66
326
341
  rd 65
327
- re_ 65
342
+ _no 65
328
343
  ial 65
329
- do 64
330
344
  ter 64
331
- _, 64
332
- _no 64
333
- ngua_ 64
334
- ià 64
335
345
  nta 64
336
- gua_ 64
337
- ment 63
346
+ des 64
347
+ 64
338
348
  eix 63
339
- _b 63
340
- _,_ 63
341
- ra_ 63
349
+ ment 63
342
350
  vi 62
343
- _ha 62
351
+ àn 61
352
+ lenc 61
344
353
  V 61
345
- ar_ 61
346
354
  �n 61
347
- lenc 61
348
- àn 61
355
+ do 61
349
356
  if 61
350
- alen 60
357
+ _va 60
351
358
  lenci 60
352
- _E 60
353
- alenc 60
359
+ _mo 60
360
+ _con 60
361
+ alen 60
354
362
  nd 60
363
+ alenc 60
355
364
  M 60
356
- ell 59
357
- lan 59
358
- fe 59
359
- als 59
360
365
  � 59
361
- _va 59
362
- s. 59
363
366
  ing 59
364
367
  us 59
365
- sp 58
366
- ísti 58
368
+ ell 59
369
+ fe 59
370
+ �st 58
367
371
  �sti 58
368
372
  íst 58
369
- _A 58
370
- �st 58
373
+ ísti 58
374
+ als 58
371
375
  ce 57
372
- _con 57
373
376
  � 57
374
377
  ita 57
375
- _� 56
376
- _Ca 56
377
- _és 56
378
- ya 56
378
+ _M 57
379
+ 57
380
+ lo 57
381
+ _és 57
379
382
  D 56
383
+ _� 56
380
384
  _ma 56
381
- _- 56
382
- _é 56
383
- 55
384
- _és_ 55
385
- sa 55
385
+ sp 56
386
+ s_ 56
387
+ ya 56
386
388
  cià 55
389
+ � 55
387
390
  om_ 55
388
- lt 54
391
+ S 54
389
392
  ul 54
390
- ca_ 54
391
393
  ret 54
392
- S 54
393
394
  era 54
395
+ lt 54
394
396
  ncia 54
395
- il 53
396
397
  ion 53
397
- ste 53
398
- s,_ 53
399
- nya 53
398
+ tat_ 53
400
399
  s, 53
400
+ _par 53