scylla 0.5.0 → 0.6.0

Sign up to get free protection for your applications and to get access to all the features.
Files changed (58) hide show
  1. data/Gemfile +4 -2
  2. data/Gemfile.lock +16 -1
  3. data/lib/scylla/classifier.rb +1 -1
  4. data/lib/scylla/generator.rb +16 -4
  5. data/lib/scylla/lms/afrikaans.lm +232 -232
  6. data/lib/scylla/lms/arabic.lm +175 -175
  7. data/lib/scylla/lms/bulgarian.lm +225 -225
  8. data/lib/scylla/lms/catalan.lm +309 -309
  9. data/lib/scylla/lms/danish.lm +167 -167
  10. data/lib/scylla/lms/english.lm +398 -398
  11. data/lib/scylla/lms/finnish.lm +237 -237
  12. data/lib/scylla/lms/french.lm +148 -148
  13. data/lib/scylla/lms/german.lm +258 -258
  14. data/lib/scylla/lms/greek.lm +236 -236
  15. data/lib/scylla/lms/hebrew.lm +154 -154
  16. data/lib/scylla/lms/hindi.lm +139 -139
  17. data/lib/scylla/lms/icelandic.lm +239 -239
  18. data/lib/scylla/lms/indonesian.lm +244 -244
  19. data/lib/scylla/lms/italian.lm +248 -248
  20. data/lib/scylla/lms/japanese.lm +90 -90
  21. data/lib/scylla/lms/korean.lm +306 -306
  22. data/lib/scylla/lms/norwegian.lm +193 -193
  23. data/lib/scylla/lms/polish.lm +241 -241
  24. data/lib/scylla/lms/portuguese.lm +232 -232
  25. data/lib/scylla/lms/romanian.lm +246 -246
  26. data/lib/scylla/lms/slovak.lm +242 -242
  27. data/lib/scylla/lms/slovenian.lm +229 -229
  28. data/lib/scylla/lms/spanish.lm +164 -164
  29. data/lib/scylla/lms/swedish.lm +157 -157
  30. data/lib/scylla/lms/tagalog.lm +247 -247
  31. data/lib/scylla/lms/thai.lm +252 -252
  32. data/lib/scylla/lms/turkish.lm +285 -285
  33. data/lib/scylla/lms/vietnamese.lm +250 -250
  34. data/lib/scylla/lms/welsh.lm +248 -248
  35. data/lib/scylla/resources.rb +1 -9
  36. data/lib/scylla.rb +4 -0
  37. data/scylla.gemspec +2 -120
  38. data/source_texts/english.txt +62 -27
  39. data/test/classifier_test.rb +1 -3
  40. data/test/fixtures/lms/danish.lm +173 -173
  41. data/test/fixtures/lms/english.lm +220 -220
  42. data/test/fixtures/lms/french.lm +175 -175
  43. data/test/fixtures/lms/german.lm +254 -254
  44. data/test/fixtures/lms/hindi.lm +139 -139
  45. data/test/fixtures/lms/italian.lm +236 -236
  46. data/test/fixtures/lms/japanese.lm +88 -88
  47. data/test/fixtures/lms/norwegian.lm +182 -182
  48. data/test/fixtures/lms/spanish.lm +164 -164
  49. data/test/fixtures/test_languages/spanish +0 -1
  50. data/test/generator_test.rb +13 -0
  51. data/test/helper.rb +2 -0
  52. metadata +18 -25
  53. data/.document +0 -5
  54. data/lib/scylla/lms/13375P33K.lm +0 -400
  55. data/scylla-0.1.0.gem +0 -0
  56. data/source_texts/13375P33K.txt +0 -199
  57. data/test/fixtures/lms/13375p33k.lm +0 -400
  58. data/test/fixtures/source_texts/13375P33K.txt +0 -199
@@ -6,364 +6,364 @@ _ 9054
6
6
  � 5427
7
7
  _� 4527
8
8
  _� 4495
9
- �� 2729
10
9
  ा 2729
11
10
  � 2729
12
- 2281
11
+ �� 2729
13
12
  ् 2281
13
+ � 2281
14
14
  �� 2281
15
+ ��� 2265
15
16
  �� 2265
16
17
  ्� 2265
17
- ��� 2265
18
18
  �� 2251
19
- ��� 2251
20
19
  ्� 2251
20
+ ��� 2251
21
21
  �� 2023
22
22
  ा� 2023
23
23
  ��� 2023
24
- र 2005
25
24
  �� 2005
25
+ र 2005
26
26
  � 2005
27
- �� 1970
28
- ा� 1970
29
27
  ��� 1970
30
- �� 1764
28
+ ा� 1970
29
+ �� 1970
31
30
  ि 1764
32
31
  � 1764
32
+ �� 1764
33
+ �� 1706
33
34
  र� 1706
34
35
  ��� 1706
35
- �� 1706
36
+ 1665
36
37
  �� 1665
37
38
  क 1665
38
- � 1665
39
39
  �� 1596
40
40
  त 1596
41
- �� 1516
42
- ��� 1516
43
- �� 1516
44
- ि� 1516
45
41
  ��� 1516
42
+ �� 1516
46
43
  ि� 1516
44
+ ��� 1516
45
+ ि� 1516
46
+ �� 1516
47
47
  � 1391
48
- ��� 1390
49
48
  �� 1390
49
+ ��� 1390
50
50
  क� 1390
51
- �� 1381
52
51
  न 1381
53
- �� 1345
54
- स 1345
52
+ �� 1381
55
53
  � 1345
56
- ��� 1264
57
- �� 1264
54
+ 1345
55
+ �� 1345
58
56
  स� 1264
57
+ �� 1264
58
+ ��� 1264
59
59
  �� 1226
60
60
  त� 1200
61
61
  ��� 1200
62
62
  � 1181
63
63
  े 1172
64
64
  �� 1172
65
- � 1144
66
65
  व 1144
66
+ � 1144
67
67
  �� 1144
68
- व� 1083
69
- �� 1083
70
68
  ��� 1083
69
+ �� 1083
70
+ व� 1083
71
71
  �� 1075
72
- ��� 1065
73
72
  न� 1065
73
+ ��� 1065
74
74
  �� 963
75
75
  ��� 963
76
76
  र� 963
77
77
  �� 920
78
- व� 908
79
78
  ��� 908
80
79
  �� 908
80
+ व� 908
81
81
  ��� 894
82
82
  त� 894
83
- म 858
84
- �� 858
85
83
  � 858
84
+ �� 858
85
+ म 858
86
86
  � 853
87
- य 836
88
- �� 836
89
87
  � 836
90
- �� 829
88
+ �� 836
89
+ य 836
91
90
  प 829
91
+ �� 829
92
92
  �� 809
93
93
  �� 792
94
- म� 792
95
94
  ��� 792
96
- ��� 786
95
+ म� 792
97
96
  स� 786
98
97
  �� 786
98
+ ��� 786
99
99
  प� 785
100
100
  ��� 785
101
- �� 752
102
- क� 752
103
101
  ��� 752
102
+ क� 752
103
+ �� 752
104
104
  र� 743
105
105
  ��� 743
106
106
  �� 743
107
+ ��_ 706
107
108
  �_ 706
108
109
  ा_ 706
109
- ��_ 706
110
110
  � 705
111
- �� 683
112
111
  द 683
112
+ �� 683
113
113
  �� 671
114
- ��� 663
115
114
  द� 663
115
+ ��� 663
116
+ ु 655
116
117
  � 655
117
- ु� 655
118
- ु� 655
119
- �� 655
118
+ ��� 655
120
119
  �� 655
120
+ ु� 655
121
+ ु� 655
121
122
  ��� 655
122
- ु 655
123
- ��� 655
124
123
  �� 655
125
- �� 638
124
+ �� 655
125
+ �� 649
126
+ े� 640
127
+ ��� 640
126
128
  क� 638
129
+ �� 638
127
130
  ��� 638
128
131
  _स 634
129
132
  _स� 634
130
- �� 627
131
- य� 621
133
+ �� 626
132
134
  �� 621
133
135
  ��� 621
134
- ��� 618
135
- े� 618
136
- ��� 613
136
+ य� 621
137
+ ��� 617
138
+ े� 617
137
139
  �� 613
140
+ ��� 613
138
141
  न� 613
139
- �� 604
140
- े� 595
141
- ��� 595
142
142
  �� 568
143
- � 568
144
143
  ह 568
145
- �� 538
144
+ 568
146
145
  म� 538
147
146
  ��� 538
147
+ �� 538
148
148
  े_ 532
149
- ��_ 532
150
149
  �_ 532
151
- �� 527
150
+ ��_ 532
152
151
  ल 527
152
+ �� 527
153
153
  � 527
154
154
  _व� 526
155
155
  _व 526
156
+ ��� 524
156
157
  �� 524
157
158
  ह� 524
158
- ��� 524
159
159
  �_ 522
160
160
  � 485
161
+ ��� 478
161
162
  �� 478
162
163
  स� 478
163
- ��� 478
164
- �् 477
165
- ��् 477
166
164
  �्� 477
165
+ ��् 477
166
+ �् 477
167
167
  �� 473
168
168
  �र 472
169
169
  ��र 472
170
- �� 462
171
170
  �� 462
172
- _प 461
171
+ �� 462
173
172
  _प� 461
174
- �� 454
173
+ _प 461
174
+ � 454
175
+ ��� 454
175
176
  श 454
176
177
  �� 454
177
- 454
178
+ �� 454
178
179
  य� 454
179
- ��� 454
180
+ 453
180
181
  �� 453
181
182
  � 453
182
- ी 453
183
- �ि� 452
184
- �ि 452
185
183
  न� 452
186
- ��ि 452
187
184
  ��� 452
185
+ �ि� 452
186
+ ��ि 452
187
+ �ि 452
188
188
  ब 442
189
- �� 442
189
+ 442
190
190
  ब� 442
191
+ �� 442
191
192
  ��� 442
192
- � 442
193
193
  �� 442
194
- �� 435
195
194
  � 435
195
+ �� 435
196
196
  ो 435
197
197
  �� 432
198
- ल� 432
199
198
  ��� 432
199
+ ल� 432
200
200
  ��य 427
201
201
  �य 427
202
202
  �र� 424
203
- �� 424
204
203
  ं 424
204
+ �� 424
205
205
  ��ा 413
206
206
  �ा 413
207
- ं� 412
208
- ज 412
209
- �� 412
210
207
  � 412
208
+ �� 412
209
+ ं� 412
211
210
  ��� 412
211
+ ज 412
212
212
  �� 407
213
213
  �� 402
214
- ��� 401
215
214
  ं� 401
216
- ��र 399
215
+ ��� 401
217
216
  �र 399
218
- ��� 397
217
+ ��र 399
219
218
  प� 397
219
+ ��� 397
220
220
  ��_ 396
221
221
  त_ 396
222
- ��� 388
223
222
  प� 388
223
+ ��� 388
224
224
  _क� 382
225
225
  _क 382
226
- ज� 377
227
226
  ��� 377
228
227
  �� 377
228
+ ज� 377
229
+ द� 371
229
230
  �� 371
230
231
  ��� 371
231
- द� 371
232
- �क 362
233
232
  ��क 362
234
- 361
235
- ष 361
233
+ �क 362
236
234
  �� 361
237
- ��� 354
235
+ 361
236
+ � 361
238
237
  �� 354
239
238
  श� 354
239
+ ��� 354
240
240
  �र� 349
241
+ �� 348
241
242
  ��� 348
242
243
  ब� 348
243
- �� 348
244
244
  ��� 344
245
- �� 344
246
245
  ो� 344
246
+ �� 344
247
247
  �य� 343
248
248
  �� 336
249
- ध 336
250
249
  � 336
250
+ ध 336
251
251
  �ा_ 323
252
252
  �� 322
253
253
  ��� 322
254
254
  ो� 322
255
255
  ��_ 316
256
- न_ 316
257
256
  �_ 316
257
+ न_ 316
258
258
  �� 315
259
259
  ग 315
260
260
  � 315
261
261
  ल� 313
262
262
  �� 313
263
263
  ��� 313
264
- �� 306
265
264
  ��� 306
266
265
  त� 306
266
+ �� 306
267
267
  �� 300
268
- �_ 299
269
268
  ��_ 299
270
269
  र_ 299
271
- �� 298
270
+ �_ 299
272
271
  � 298
272
+ �� 298
273
273
  ष� 296
274
- �� 296
275
274
  ��� 296
276
- ��न 294
275
+ �� 296
277
276
  �न 294
277
+ ��न 294
278
278
  द� 292
279
279
  ��� 292
280
- ह� 287
281
- �� 287
282
280
  ��� 287
283
- _ब 286
281
+ �� 287
282
+ ह� 287
284
283
  _ब� 286
284
+ _ब 286
285
+ भ� 283
285
286
  �� 283
286
287
  ��� 283
287
- भ� 283
288
288
  भ 283
289
- अ� 281
290
289
  �� 281
291
- ��� 281
292
- अ� 281
293
- �� 281
294
290
  �� 281
295
- 281
291
+ अ� 281
296
292
  � 281
293
+ अ� 281
297
294
  ��� 281
298
- ध� 277
295
+ ��� 281
296
+ अ 281
297
+ �� 281
299
298
  ��� 277
300
299
  �� 277
300
+ ध� 277
301
301
  क_ 275
302
302
  �_ 275
303
303
  ��_ 275
304
- ��र 274
305
304
  �र 274
305
+ ��र 274
306
306
  �त 267
307
307
  ��त 267
308
+ ज� 266
308
309
  �� 266
309
- ी� 266
310
310
  �� 266
311
- ��� 266
312
311
  ी� 266
313
312
  ��� 266
314
- ज� 266
315
313
  �� 266
314
+ ��� 266
316
315
  ��� 266
317
- ��� 263
316
+ ी� 266
317
+ _अ� 263
318
318
  ष� 263
319
+ ��� 263
319
320
  �� 263
320
321
  _अ 263
321
- _अ� 263
322
- ��् 261
323
322
  �्� 261
324
323
  �् 261
324
+ ��् 261
325
325
  �्� 256
326
- ��् 256
327
326
  �् 256
327
+ ��् 256
328
+ � 255
328
329
  �� 255
329
330
  च 255
330
- � 255
331
- ग� 254
332
- �� 254
333
331
  ��� 254
334
- म� 254
332
+ ग� 254
335
333
  �� 254
334
+ म� 254
335
+ �� 254
336
336
  ��� 254
337
- �_ 248
338
337
  ि_ 248
338
+ �_ 248
339
339
  ��_ 248
340
- �ा 246
341
340
  ��ा 246
341
+ �ा 246
342
+ ��� 245
342
343
  च� 245
343
344
  �� 245
344
- ��� 245
345
+ ह� 237
345
346
  ��� 237
346
- ��त 237
347
347
  �� 237
348
- ह� 237
349
348
  �त 237
350
- �� 233
351
- �र� 233
349
+ ��त 237
352
350
  ��� 233
353
351
  श� 233
352
+ �र� 233
353
+ �� 233
354
354
  ण 230
355
355
  �� 230
356
356
  � 230
357
357
  ��ा 225
358
358
  �ा 225
359
359
  �ा� 225
360
- �ा 220
360
+ �् 220
361
361
  ��् 220
362
+ �ा 220
362
363
  ��ा 220
363
- �् 220
364
364
  �् 219
365
- ��् 219
366
365
  �्� 219
366
+ ��् 219
367
367
  �_ 215
368
368
  ��_ 215
369
369
  य_ 215
@@ -372,29 +372,29 @@ _अ
372
372
  ��ा 206
373
373
  �्� 206
374
374
  ग� 205
375
- �� 205
376
375
  ��� 205
377
- �क� 204
378
- भ� 204
379
- ��� 204
380
- �� 204
381
- ��ि 204
376
+ �� 205
382
377
  _म 204
383
378
  � 204
379
+ ��� 204
380
+ �� 204
384
381
  �ि 204
382
+ भ� 204
383
+ �क� 204
384
+ ��ि 204
385
385
  ए 204
386
386
  _म� 204
387
- �े 200
388
387
  ��े 200
388
+ �े 200
389
389
  �त� 199
390
- ��� 198
391
- �� 198
392
390
  च� 198
391
+ �� 198
392
+ ��� 198
393
393
  �त_ 195
394
+ ��� 194
394
395
  �� 194
395
396
  �� 194
397
+ आ� 194
396
398
  आ� 194
397
- �� 194
398
399
  � 194
399
- 194
400
- ��� 194
400
+ �� 194