scylla 0.7.0 → 0.7.5

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (38) hide show
  1. data/lib/scylla/classifier.rb +3 -4
  2. data/lib/scylla/generator.rb +4 -7
  3. data/lib/scylla/lms/afrikaans.lm +280 -280
  4. data/lib/scylla/lms/arabic.lm +225 -225
  5. data/lib/scylla/lms/bulgarian.lm +208 -208
  6. data/lib/scylla/lms/catalan.lm +212 -212
  7. data/lib/scylla/lms/chinese.lm +201 -201
  8. data/lib/scylla/lms/danish.lm +155 -155
  9. data/lib/scylla/lms/english.lm +207 -207
  10. data/lib/scylla/lms/finnish.lm +259 -259
  11. data/lib/scylla/lms/french.lm +203 -203
  12. data/lib/scylla/lms/german.lm +280 -280
  13. data/lib/scylla/lms/greek.lm +276 -276
  14. data/lib/scylla/lms/hebrew.lm +170 -170
  15. data/lib/scylla/lms/hindi.lm +241 -241
  16. data/lib/scylla/lms/icelandic.lm +264 -264
  17. data/lib/scylla/lms/indonesian.lm +272 -272
  18. data/lib/scylla/lms/italian.lm +283 -283
  19. data/lib/scylla/lms/japanese.lm +105 -105
  20. data/lib/scylla/lms/korean.lm +400 -400
  21. data/lib/scylla/lms/norwegian.lm +235 -235
  22. data/lib/scylla/lms/polish.lm +264 -264
  23. data/lib/scylla/lms/portuguese.lm +269 -269
  24. data/lib/scylla/lms/romanian.lm +278 -278
  25. data/lib/scylla/lms/russian.lm +127 -127
  26. data/lib/scylla/lms/slovak.lm +281 -281
  27. data/lib/scylla/lms/slovenian.lm +276 -276
  28. data/lib/scylla/lms/spanish.lm +190 -190
  29. data/lib/scylla/lms/swedish.lm +195 -195
  30. data/lib/scylla/lms/tagalog.lm +282 -282
  31. data/lib/scylla/lms/thai.lm +257 -257
  32. data/lib/scylla/lms/turkish.lm +300 -300
  33. data/lib/scylla/lms/vietnamese.lm +277 -277
  34. data/lib/scylla/lms/welsh.lm +271 -271
  35. data/scylla.gemspec +3 -22
  36. data/source_texts/korean.txt +219 -134
  37. metadata +15 -14
  38. data/scylla-0.6.0.gem +0 -0
@@ -1,4 +1,4 @@
1
- _ 1548
1
+ _ 1798
2
2
  a 542
3
3
  e 410
4
4
  i 389
@@ -6,395 +6,395 @@ o 341
6
6
  l 278
7
7
  n 244
8
8
  r 243
9
+ a_ 206
9
10
  c 205
10
11
  s 200
11
- a_ 186
12
12
  t 176
13
13
  d 168
14
- e_ 146
14
+ e_ 165
15
15
  u 123
16
+ o_ 120
17
+ i_ 119
16
18
  v 115
17
- o_ 114
18
- i_ 104
19
19
  p 99
20
20
  m 98
21
- _c 85
22
- _d 84
23
- _s 79
21
+ _c 96
22
+ _d 91
23
+ _s 88
24
+ _a 79
24
25
  , 74
25
- la 73
26
- ,_ 69
27
- _a 63
26
+ ,_ 74
27
+ l_ 67
28
+ la 62
28
29
  g 60
29
- ar 60
30
+ ar 59
30
31
  er 59
31
- an 59
32
+ an 57
33
+ _p 56
32
34
  h 54
33
35
  ri 52
34
36
  co 52
35
- ll 52
36
- _p 51
37
+ ll 51
37
38
  re 49
39
+ _l 47
40
+ _i 47
38
41
  ch 46
39
42
  ra 46
40
- to 45
41
- _i 45
42
43
  el 45
43
- no 44
44
+ _m 45
44
45
  di 44
45
- se 44
46
- _m 44
46
+ to 44
47
+ no 44
48
+ la_ 44
49
+ _e 43
47
50
  b 43
51
+ n_ 43
48
52
  va 43
49
- _l 42
50
- l_ 42
51
53
  ia 42
52
- n_ 40
53
- la_ 40
54
- in 40
55
- av 39
54
+ se 41
55
+ _di 40
56
+ in 39
56
57
  f 39
57
- _di 37
58
+ av 38
59
+ _n 37
60
+ _co 37
58
61
  do 37
62
+ _v 36
59
63
  on 36
60
- al 36
61
- ta 35
62
- ca 34
63
- na 34
64
+ al 34
65
+ re_ 34
66
+ ta 34
64
67
  en 34
65
- _e 34
66
68
  li 34
67
- da 33
68
- re_ 33
69
- lla 33
69
+ na 34
70
+ ca 34
70
71
  or 33
71
- le 32
72
72
  si 32
73
- _n 32
74
- _co 32
75
73
  to_ 31
74
+ da 30
76
75
  ol 30
77
76
  de 30
78
- as 30
77
+ le 30
78
+ lla 30
79
+ va_ 29
79
80
  pe 29
80
81
  cc 29
81
- ma 28
82
- il 28
83
82
  ve 28
83
+ ma 28
84
+ as 28
85
+ il 27
86
+ ._ 27
84
87
  o, 27
85
- _v 27
86
- . 27
87
- va_ 27
88
88
  io 27
89
+ . 27
90
+ o,_ 27
91
+ _e_ 26
92
+ ne 26
89
93
  nd 26
94
+ _u 26
90
95
  tt 26
91
- ne 26
92
- st 25
96
+ _f 26
97
+ _il 25
98
+ _ch 25
99
+ nt 25
93
100
  gli 25
94
101
  gl 25
95
- nt 25
96
- he 24
97
- ell 24
98
- o,_ 24
99
- che 24
102
+ il_ 25
103
+ lla_ 25
104
+ _il_ 25
105
+ st 25
100
106
  sa 24
101
- ti 24
102
- _se 24
103
- _il 24
104
- _de 23
105
- om 23
107
+ ell 24
108
+ _de 24
109
+ che 23
110
+ _b 23
106
111
  at 23
107
- _f 23
112
+ om 23
113
+ he 23
108
114
  me 23
109
- _b 22
110
- il_ 22
111
- _ch 22
112
- q 22
115
+ _ca 23
116
+ ti 23
113
117
  a, 22
114
- _qu 22
115
118
  qu 22
116
- _la 22
119
+ q 22
117
120
  _q 22
121
+ _qu 22
122
+ che_ 22
123
+ ra_ 22
124
+ _che 22
125
+ _che_ 22
126
+ a,_ 22
127
+ _pe 22
128
+ _di_ 22
129
+ _se 22
118
130
  ci 22
119
- te 21
131
+ he_ 22
132
+ di_ 22
120
133
  vi 21
121
- lla_ 21
122
- a,_ 21
123
- _ca 21
134
+ _un 21
124
135
  un 21
125
- _pe 21
126
- _il_ 21
127
- _che 20
128
- ava 20
129
- che_ 20
130
- _e_ 20
136
+ te 21
137
+ pa 20
138
+ si_ 20
131
139
  del 20
132
140
  z 20
133
- _di_ 20
134
- he_ 20
135
- di_ 20
136
- pa 20
137
- ra_ 20
141
+ ava 20
142
+ _del 20
143
+ ia_ 19
138
144
  ss 19
139
- _u 19
145
+ r_ 19
146
+ se_ 19
140
147
  no_ 19
141
- lo 19
142
- es 19
143
- ev 19
144
- ._ 19
145
- _del 19
148
+ _ma 19
149
+ _g 19
150
+ _si 19
151
+ le_ 19
146
152
  et 18
153
+ ev 18
154
+ is 18
155
+ es 18
147
156
  vo 18
157
+ lo 18
148
158
  and 18
149
- is 18
150
- _ma 18
151
- ic 18
152
- _che_ 18
153
- _un 17
154
- si_ 17
159
+ _la 18
155
160
  hi 17
156
- le_ 17
157
161
  na_ 17
158
- ia_ 17
159
- os 17
160
162
  era 17
161
- sc 16
162
- per 16
163
- ano 16
164
- ua 16
163
+ chi 16
164
+ _a_ 16
165
165
  io_ 16
166
+ el_ 16
167
+ os 16
168
+ _in 16
169
+ _per 16
170
+ ua 16
171
+ li_ 16
166
172
  ie 16
173
+ sc 16
174
+ per 16
167
175
  po 16
168
- chi 16
169
- _g 16
170
- _in 15
171
- _per 15
172
- ad 15
176
+ _no 15
177
+ it 15
178
+ ic 15
179
+ ava_ 15
173
180
  tr 15
174
- com 15
175
181
  tto 15
182
+ su 15
176
183
  eva 15
184
+ com 15
185
+ _vi 15
186
+ _com 15
187
+ _su 15
177
188
  are 15
178
- it 15
179
- se_ 15
180
- ac 15
181
- su 15
182
- _si 15
183
- ava_ 15
184
- fa 14
185
- _su 14
186
- li_ 14
187
- _r 14
188
- _da 14
189
- ari 14
189
+ _r 15
190
190
  e,_ 14
191
- _a_ 14
192
- _la_ 14
191
+ ac 14
193
192
  e, 14
194
- ro 14
193
+ fa 14
194
+ _la_ 14
195
+ ad 14
196
+ er_ 14
197
+ gli_ 14
198
+ are_ 14
195
199
  mo 14
200
+ ano 14
196
201
  ndo 14
197
- are_ 14
198
- oc 14
199
- on_ 13
200
- in_ 13
201
- id 13
202
+ ro 14
203
+ on_ 14
204
+ _si_ 13
205
+ ella 13
202
206
  _in_ 13
203
- un_ 13
204
- gli_ 13
205
- all 13
206
207
  mp 13
207
- el_ 13
208
- ella 13
209
- ce 13
210
- so 13
208
+ _un_ 13
209
+ oc 13
210
+ era_ 13
211
+ _do 13
212
+ ari 13
213
+ _av 13
211
214
  ur 13
212
- uo 12
213
- ni 12
214
- ta_ 12
215
- ig 12
216
- era_ 12
217
- col 12
218
- qua 12
219
- ave 12
215
+ so 13
216
+ un_ 13
217
+ in_ 13
218
+ all 13
220
219
  tto_ 12
220
+ _gli_ 12
221
+ _per_ 12
222
+ ce 12
223
+ ella_ 12
224
+ a. 12
225
+ _gl 12
226
+ col 12
221
227
  be 12
222
- ut 12
223
- ue 12
224
- sse 12
225
- mi 12
228
+ uo 12
229
+ qua 12
226
230
  � 12
227
- r_ 12
231
+ a._ 12
232
+ �_ 12
233
+ mi 12
234
+ sse 12
235
+ ue 12
236
+ _l_ 12
237
+ me_ 12
238
+ ni 12
239
+ id 12
228
240
  pr 12
241
+ ut 12
242
+ sa_ 12
243
+ _gli 12
244
+ per_ 12
245
+ _al 12
246
+ _er 12
229
247
  _qua 12
230
- a. 12
231
- _gl 11
232
- _t 11
233
- ne_ 11
234
- asa 11
235
- _vi 11
236
- cch 11
237
- _al 11
238
- _col 11
239
- _no 11
240
- _com 11
241
- iv 11
242
- cas 11
243
- �_ 11
248
+ pi 11
249
+ ta_ 11
250
+ ti_ 11
251
+ gn 11
244
252
  ano_ 11
245
- _cas 11
246
- ome 11
247
- me_ 11
248
253
  acc 11
249
- _le 11
250
- _gli 11
251
- pi 11
252
- dd 11
253
- _un_ 11
254
+ _fa 11
255
+ _col 11
256
+ _t 11
257
+ eva_ 11
258
+ _ri 11
259
+ _cas 11
260
+ da_ 11
261
+ _era 11
254
262
  ul 11
255
- gn 11
263
+ ne_ 11
264
+ dd 11
265
+ _da 11
266
+ _ave 11
267
+ do_ 11
268
+ ave 11
269
+ ome 11
270
+ _ne 11
271
+ cas 11
272
+ cch 11
273
+ ig 11
274
+ _st 10
275
+ _casa 10
276
+ am 10
277
+ zi 10
278
+ man 10
279
+ ato 10
280
+ og 10
256
281
  cchi 10
257
- dell 10
258
- da_ 10
282
+ _era_ 10
283
+ que 10
284
+ _que 10
285
+ _non 10
259
286
  rr 10
260
- _ri 10
261
287
  ent 10
262
- _dell 10
263
- zi 10
264
- ato 10
265
- van 10
266
- _casa 10
267
- _ne 10
268
- _av 10
269
- ti_ 10
288
+ ale 10
270
289
  casa 10
290
+ dell 10
271
291
  non 10
272
- ale 10
273
- ser 10
274
- _do 10
275
- _fa 10
276
- man 10
277
- am 10
278
- _que 10
279
- og 10
280
- _gli_ 10
281
- que 10
282
- eva_ 9
283
- ome_ 9
284
- fi 9
285
- _mo 9
286
- par 9
287
- ando 9
288
- uri 9
289
- er_ 9
290
- anda 9
291
- bi 9
292
+ ome_ 10
293
+ asa 10
294
+ _dell 10
295
+ come_ 9
296
+ iv 9
297
+ _ve 9
298
+ _come 9
292
299
  sta 9
300
+ ndo_ 9
301
+ �_ 9
302
+ anda 9
293
303
  del_ 9
294
- far 9
295
- vano 9
296
- ella_ 9
297
- ess 9
304
+ _non_ 9
305
+ 9
306
+ nda 9
307
+ par 9
298
308
  rid 9
299
- alla 9
309
+ fi 9
310
+ lo_ 9
300
311
  _be 9
312
+ _mo 9
313
+ _le 9
301
314
  oi 9
315
+ _o 9
316
+ ot 9
317
+ non_ 9
318
+ bi 9
302
319
  _an 9
303
- nda 9
304
320
  _me 9
305
- ot 9
306
- 9
321
+ _del_ 9
322
+ van 9
323
+ ando 9
324
+ far 9
325
+ ess 9
307
326
  come 9
308
- �_ 9
309
- i, 8
310
- ridd 8
311
- come_ 8
312
- non_ 8
327
+ _pa 9
328
+ uri 9
313
329
  ina 8
314
- cco 8
315
- uel 8
316
- llo 8
330
+ _pr 8
331
+ _T 8
332
+ _S 8
333
+ L 8
317
334
  ato_ 8
335
+ ser 8
318
336
  nz 8
319
- do_ 8
320
- _come 8
321
- con 8
322
- _all 8
323
- ed 8
324
- Tu 8
325
- occ 8
337
+ una_ 8
338
+ vano 8
339
+ i, 8
326
340
  idd 8
327
- lo_ 8
328
- sa_ 8
329
- S 8
330
- ant 8
331
- _del_ 8
341
+ _vo 8
342
+ _una_ 8
343
+ _le_ 8
344
+ cco 8
332
345
  ba 8
333
- una 8
334
- L 8
335
- _st 8
336
- ene 8
346
+ sse_ 8
347
+ i,_ 8
348
+ uel 8
337
349
  ir 8
338
- _ave 8
339
350
  della 8
340
- una_ 8
351
+ te_ 8
352
+ una 8
353
+ Tu 8
354
+ _all 8
355
+ ant 8
356
+ ridd 8
357
+ S 8
358
+ _Tu 8
359
+ asa_ 8
360
+ _una 8
361
+ _pi 8
362
+ casa_ 8
363
+ con 8
364
+ occ 8
365
+ ene 8
366
+ _L 8
341
367
  T 8
342
- quel 7
343
- oll 7
344
- ere 7
345
- ola 7
346
- nto 7
347
- rc 7
348
- per_ 7
349
- rv 7
350
- gi 7
351
- _era 7
352
- dav 7
353
- cia 7
354
- ett 7
355
- ec 7
368
+ tra 7
356
369
  Tur 7
357
- _le_ 7
358
- utt 7
359
- hi_ 7
360
- coll 7
370
+ ett 7
371
+ sp 7
372
+ rc 7
361
373
  _quel 7
362
- dava 7
363
- pre 7
364
- tra 7
365
- _ad 7
366
- vano_ 7
367
- _pr 7
368
- ai 7
374
+ coll 7
375
+ gi 7
376
+ nto 7
377
+ ere 7
378
+ _ar 7
379
+ mpa 7
380
+ za 7
369
381
  ap 7
370
- lav 7
371
382
  _coll 7
372
- i,_ 7
373
- _si_ 7
383
+ vano_ 7
384
+ oll 7
385
+ quel 7
386
+ _con 7
387
+ ando_ 7
374
388
  zia 7
375
- _er 7
376
- ino 7
389
+ rv 7
390
+ dav 7
391
+ ola 7
392
+ oi_ 7
393
+ cia 7
394
+ llo 7
377
395
  ogl 7
378
- _vo 7
379
- _pa 7
380
- mpa 7
381
- ogli 7
382
- sp 7
383
- za 7
384
- sse_ 7
396
+ _far 7
385
397
  Turi 7
386
- _pi 7
387
- _non 7
388
- ndo_ 7
389
- Sa 6
390
- veva 6
391
- _sc 6
392
- P 6
393
- nu 6
394
- uridd 6
395
- rm 6
396
- _con 6
397
- h�_ 6
398
- esse 6
399
- i� 6
400
- _ve 6
398
+ alla 7
399
+ ogli 7
400
+ utt 7