scylla 1.0.0 → 1.0.7

Sign up to get free protection for your applications and to get access to all the features.
Files changed (40) hide show
  1. data/lib/scylla/classifier.rb +3 -2
  2. data/lib/scylla/generator.rb +11 -4
  3. data/lib/scylla/lms/arabic.lm +398 -398
  4. data/lib/scylla/lms/bulgarian.lm +268 -268
  5. data/lib/scylla/lms/catalan.lm +400 -400
  6. data/lib/scylla/lms/chinese.lm +345 -345
  7. data/lib/scylla/lms/czech.lm +382 -382
  8. data/lib/scylla/lms/danish.lm +354 -354
  9. data/lib/scylla/lms/dutch.lm +380 -380
  10. data/lib/scylla/lms/english.lm +327 -327
  11. data/lib/scylla/lms/finnish.lm +297 -297
  12. data/lib/scylla/lms/french.lm +348 -348
  13. data/lib/scylla/lms/german.lm +386 -386
  14. data/lib/scylla/lms/greek.lm +352 -352
  15. data/lib/scylla/lms/hebrew.lm +385 -385
  16. data/lib/scylla/lms/hindi.lm +400 -400
  17. data/lib/scylla/lms/icelandic.lm +195 -195
  18. data/lib/scylla/lms/indonesian.lm +374 -374
  19. data/lib/scylla/lms/italian.lm +365 -365
  20. data/lib/scylla/lms/japanese.lm +368 -368
  21. data/lib/scylla/lms/kannada.lm +299 -299
  22. data/lib/scylla/lms/korean.lm +335 -335
  23. data/lib/scylla/lms/marathi.lm +240 -240
  24. data/lib/scylla/lms/norwegian.lm +348 -348
  25. data/lib/scylla/lms/persian.lm +337 -337
  26. data/lib/scylla/lms/polish.lm +399 -399
  27. data/lib/scylla/lms/portuguese.lm +386 -386
  28. data/lib/scylla/lms/romanian.lm +255 -255
  29. data/lib/scylla/lms/russian.lm +400 -400
  30. data/lib/scylla/lms/slovak.lm +267 -267
  31. data/lib/scylla/lms/slovenian.lm +243 -243
  32. data/lib/scylla/lms/spanish.lm +371 -371
  33. data/lib/scylla/lms/swedish.lm +236 -236
  34. data/lib/scylla/lms/tagalog.lm +287 -287
  35. data/lib/scylla/lms/thai.lm +369 -369
  36. data/lib/scylla/lms/turkish.lm +341 -341
  37. data/lib/scylla/lms/vietnamese.lm +392 -392
  38. data/lib/scylla/lms/welsh.lm +275 -275
  39. data/lib/scylla/loader.rb +1 -1
  40. metadata +2 -2
@@ -1,400 +1,400 @@
1
- _ 4316
2
- 185
3
- 179
4
- 다_ 165
5
- 160
6
- 147
7
- 144
8
- 134
9
- 129
10
- 로_ 129
11
- 126
12
- 는_ 122
13
- 119
14
- _ 109
15
- _ 109
16
- _ 99
17
- 99
18
- 97
19
- 96
20
- 92
21
- 92
22
- 를_ 92
23
- 90
24
- 을_ 90
25
- 88
26
- _이 87
27
- 80
28
- 80
29
- 73
30
- _한 67
1
+ _ 4200
2
+ 180
3
+ 176
4
+ 다_ 159
5
+ 152
6
+ 150
7
+ 142
8
+ 139
9
+ 129
10
+ 로_ 126
11
+ _ 125
12
+ 123
13
+ 113
14
+ _ 105
15
+ _ 103
16
+ 97
17
+ _ 97
18
+ 95
19
+ 94
20
+ 94
21
+ _ 94
22
+ 91
23
+ _ 87
24
+ 87
25
+ 87
26
+ _이 86
27
+ 78
28
+ 77
29
+ 70
30
+ _한 69
31
31
  구 64
32
- 62
33
- 이_ 60
34
- 하였 60
35
- 으로 59
36
- 고_ 57
37
- 57
38
- 56
39
- _에 56
40
- 56
41
- 55
42
- 도_ 55
43
- 으로_ 53
44
- 하였다 53
45
- 주 53
32
+ 63
33
+ 하였 61
34
+ 으로 58
35
+ 57
36
+ 고_ 56
37
+ 55
38
+ 55
39
+ 55
40
+ 이_ 55
41
+ _에 55
46
42
  였다_ 53
43
+ 하였다 53
47
44
  였다 53
48
- 52
49
- 52
50
- 49
51
- 48
52
- 시_ 47
45
+ 으로_ 51
46
+ 도_ 51
47
+ 50
48
+ 49
49
+ 48
50
+ 인 48
51
+ 부 48
52
+ 되 47
53
53
  와 47
54
- 47
55
- 46
56
- 한_ 45
57
- _은_ 44
58
- _은 44
59
- 일 44
54
+ 한_ 47
55
+ 시_ 47
56
+ 47
60
57
  와_ 44
58
+ 일 43
59
+ _은_ 43
61
60
  해 43
62
- 42
63
- 42
64
- 41
65
- 과_ 41
66
- 41
67
- _에_ 40
68
- 지역 40
69
- 40
70
- _지 39
71
- 에서 39
72
- 39
73
- _ 38
74
- _일 38
75
- 38
76
- _대 37
77
- _ 37
78
- 직 36
79
- 제 36
80
- 었 36
81
- 한국 36
61
+ _은 43
62
+ 42
63
+ 40
64
+ 39
65
+ _에_ 39
66
+ 39
67
+ 여_ 39
68
+ 에서 38
69
+ 38
70
+ _의 38
71
+ 지역 38
72
+ _ 38
73
+ 37
74
+ 서_ 37
75
+ 37
76
+ _ 37
82
77
  특 36
83
- _ 35
84
- 35
85
- _ 35
86
- 35
87
- 가_ 35
88
- 있 35
78
+ _ 36
79
+ 36
80
+ _ 36
81
+ 36
82
+ 35
89
83
  개 35
90
- 33
91
- 33
92
- 하여 32
93
- 하여_ 32
84
+ 한국 35
85
+ 34
86
+ _고 34
87
+ 하여 33
88
+ 선 33
89
+ 하여_ 33
90
+ _있 32
91
+ 가_ 32
92
+ 남 32
93
+ 있 32
94
94
  성 31
95
- _한국 31
96
- 31
97
- 31
98
- _의 31
99
- 29
95
+ 31
96
+ 30
97
+ _한국 30
98
+ 30
99
+ 29
100
+ 계 29
100
101
  _개 29
101
- _동 29
102
- 직할 28
103
- 할시 28
104
102
  직할시 28
105
- 27
106
- 27
107
- _ 27
108
- 27
109
- 27
110
- 27
111
- 26
112
- 26
113
- 26
114
- _를 26
115
- 26
116
- _를_ 26
103
+ 할시 28
104
+ 직할 28
105
+ _ 28
106
+ _를 27
107
+ _를_ 27
108
+ _의_ 27
109
+ 에는_ 26
110
+ 26
111
+ 26
112
+ 26
113
+ 26
114
+ 에는 26
115
+ 며_ 26
116
+ 북 26
117
117
  에서_ 25
118
- 되었 25
119
- 명 25
120
118
  민 25
121
- _로 25
122
- _년 25
123
- _남 25
124
- _조 24
125
- 경 24
119
+ 25
120
+ 되었 24
121
+ 24
126
122
  었다_ 24
127
- 에는_ 24
128
- 에는 24
123
+ 24
124
+ _로 24
129
125
  었다 24
126
+ 단 23
127
+ 경 23
130
128
  역_ 23
131
- _로_ 23
132
- 려 23
133
- 조선 23
134
- 신 23
135
- _이_ 22
129
+ _ 23
136
130
  등 22
137
- _만 22
138
- _ 22
131
+ 22
132
+ _로_ 22
139
133
  _세 22
140
- 21
141
- 21
134
+ _년 22
135
+ _남 22
136
+ 신 21
142
137
  _특 21
143
- 21
144
- _의_ 21
145
- _지역 21
146
- 치 21
147
- 반 21
148
- _등 21
149
- 분 21
138
+ 조선 21
139
+ _ 21
150
140
  만_ 21
151
- _ 20
141
+ _ 21
142
+ 별 21
143
+ _등 21
144
+ _도 21
145
+ 산 21
146
+ 후 20
147
+ 인_ 20
148
+ 어_ 20
152
149
  _을_ 20
150
+ 하고 20
151
+ _문 20
153
152
  _을 20
154
- _ 20
153
+ _이_ 20
155
154
  특별 20
156
- _ 20
157
- _ 20
158
- _ 20
159
- _신 20
155
+ _ 20
156
+ _ 19
157
+ _ 19
158
+ 19
159
+ 된 19
160
+ 편 19
161
+ 해_ 19
162
+ 원 19
160
163
  _전 19
161
- _중 19
162
- _ 19
164
+ 19
165
+ 하고_ 19
163
166
  행 19
164
167
  행정 19
165
- 19
166
- _ 19
167
- 면 19
168
- 된 19
169
- 중 19
170
- 원 19
171
- _명 18
172
- 국_ 18
173
- 편 18
174
- _행정 18
175
- _북 18
176
- _주 18
168
+ _지역 19
169
+ _ 19
177
170
  _부 18
171
+ 면 18
172
+ 국_ 18
178
173
  _행 18
179
- 하고_ 18
180
- 하고 18
181
- 18
182
- 18
183
- 이다 18
184
- _영 17
174
+ 18
175
+ 18
176
+ _행정 18
177
+ _중 18
178
+ 18
185
179
  통 17
180
+ 설 17
186
181
  _경 17
187
- 이다_ 17
182
+ 이다 17
188
183
  되었다 17
189
- _ 17
190
- 용 17
191
- 그 17
184
+ _ 17
192
185
  _직 16
186
+ 장 16
187
+ 이다_ 16
188
+ _명 16
189
+ 체 16
193
190
  지역_ 16
194
191
  라_ 16
195
- 16
196
- 있다 16
197
- _ 16
198
- 16
199
- 상 16
200
- _있다 16
201
- 어_ 16
202
- 최 15
203
- _사 15
204
- 공 15
205
- 유 15
206
- _시 15
207
- _조선 15
208
- 기_ 15
209
- 체 15
210
- _제 15
192
+ _주 16
193
+ _제 16
194
+ _있다 15
195
+ _다 15
211
196
  문화 15
212
- _과_ 15
213
- 있다_ 15
214
- _최 15
215
- 발 15
197
+ 15
198
+ · 15
216
199
  _와 15
217
- _과 15
218
- _ 14
219
- _분 14
220
- _ 14
221
- 14
200
+ 15
201
+ _ 15
202
+ 있다 15
203
+ _ 14
204
+ 14
205
+ 분 14
206
+ 최 14
207
+ 유 14
208
+ 진 14
209
+ 그 14
210
+ 영 14
222
211
  _문화 14
223
- _ 14
212
+ _ 14
224
213
  _정 14
214
+ _최 14
215
+ 천 14
216
+ 상 14
225
217
  나라 14
226
- 14
227
- _고려 14
228
- _되 14
229
- 진 14
230
- _라 14
218
+ _발 14
231
219
  승 14
232
- 년_ 14
233
- 고려 14
234
- 국에 13
235
- 할시_ 13
236
- _특별 13
237
220
  아 13
221
+ 글 13
222
+ _북 13
223
+ 고려 13
224
+ 서는_ 13
225
+ 서는 13
226
+ 수 13
238
227
  _에서 13
239
- 반도 13
240
- _ 13
241
- 13
228
+ 국에 13
229
+ 있다_ 13
230
+ _시 13
231
+ 시로_ 13
232
+ _라 13
233
+ 시로 13
234
+ _합 13
235
+ 나_ 13
236
+ _사용 13
237
+ 대한 13
238
+ 사용 13
239
+ _대한 13
242
240
  _와_ 13
243
- _ 13
241
+ 할시_ 13
244
242
  단지 13
245
- _만_ 13
246
- 정구 13
247
- 시로 13
248
243
  행정구 13
249
- _ 13
250
- _년_ 13
251
- 시로_ 13
252
- 13
253
- 게_ 12
254
- _한반 12
255
- _ 12
256
- 단지역 12
257
- 12
258
- 12
244
+ _ 13
245
+ _ 13
246
+ _고려 13
247
+ _과 13
248
+ 정구 13
249
+ _과_ 13
250
+ _특별 13
251
+ _조선 13
252
+ _영 12
253
+ 구역 12
254
+ 세기 12
259
255
  급 12
260
- _으로 12
261
- 별자 12
262
- 한반 12
263
- 특별자 12
264
- 한반도 12
265
- 광 12
266
- 또 12
267
256
  _승 12
268
- _ 12
269
- 12
270
- 된_ 12
271
- _으 12
272
- 세기 12
273
- _대한 12
274
- 지_ 12
275
- 구역 12
276
- 대한 12
277
- 했 12
278
- 서는_ 12
279
- 서는 12
280
- _또 12
257
+ _ 12
258
+ 특별자 12
281
259
  기에 12
282
- 11
283
- 11
284
- 11
285
- _ 11
286
- _사용 11
287
- 정구역 11
288
- 그_ 11
289
- 사용 11
290
- 11
291
- 시를_ 11
260
+ 12
261
+ 별자 12
262
+ 12
263
+ _ 12
264
+ 12
265
+ 년_ 12
266
+ 12
267
+ 단지역 12
268
+ 12
269
+ _ 12
270
+ 강 12
271
+ 격 11
272
+ 족 11
273
+ _만_ 11
292
274
  시를 11
293
- 11
294
- 11
295
- 11
275
+ 시를_ 11
276
+ 반도 11
277
+ _나 11
278
+ 에서는 11
279
+ 한다_ 11
280
+ _해 11
281
+ 한민 11
282
+ 한다 11
283
+ _도_ 11
284
+ 음 11
296
285
  _수 11
297
- _ 11
298
- _그_ 11
299
- 국의_ 11
300
- 국의 11
301
- 11
302
- 리_ 11
303
- _후 11
286
+ _ 11
287
+ 11
288
+ _년_ 11
289
+ 하는 11
290
+ 11
291
+ 정구역 11
292
+ 11
293
+ 된_ 11
294
+ 후_ 11
295
+ _현 11
304
296
  _세기 11
305
- 11
306
- _ 11
307
- 시와 10
308
- 한다_ 10
309
- 한다 10
310
- _ 10
311
- 10
312
- 시와_ 10
313
- _군 10
314
- _같 10
315
- 으나_ 10
316
- _단 10
317
- 으며 10
318
- _및 10
319
- 음 10
320
- 으나 10
321
- 되어 10
322
- 후_ 10
323
- _및_ 10
324
- 및 10
325
- 형 10
326
- 되어_ 10
327
- _나 10
328
- 및_ 10
297
+ 11
298
+ _ 11
299
+ _서 11
300
+ 하는_ 11
301
+ 기도 11
302
+ _ 10
303
+ 10
329
304
  격하 10
305
+ 재 10
330
306
  승격하 10
331
307
  승격 10
332
- 면_ 10
333
- 에서는 10
334
- 보 10
335
308
  _승격 10
336
- 10
337
- 10
338
- __ 10
339
- 기도 10
340
- _되었 10
341
- 위 10
342
- 입 10
343
- 으며_ 10
344
- _개성 10
309
+ 10
310
+ _또 10
311
+ __ 10
312
+ 그_ 10
345
313
  바 10
346
- _ 10
314
+ _ 10
315
+ 소 10
316
+ 국의_ 10
317
+ 국의 10
318
+ 안 10
319
+ 도에 10
320
+ _광 10
321
+ 기도_ 10
322
+ 되어 10
323
+ _편 10
324
+ 또 10
347
325
  청 10
348
- _ 10
326
+ _으로 10
327
+ 당 10
328
+ 명_ 10
329
+ 한반도 10
330
+ 한반 10
331
+ _한반 10
332
+ 쳐 10
333
+ _으 10
334
+ 되어_ 10
335
+ _개성 10
336
+ 시와_ 10
337
+ 시와 10
349
338
  개성 10
339
+ _일부 10
350
340
  신설 10
351
- 9
352
- 9
353
- 특급 9
354
- _직할 9
341
+ 일부 10
342
+ _되었 10
343
+ 10
344
+ 10
345
+ _바 10
346
+ 인구 9
347
+ 리_ 9
348
+ _구 9
355
349
  라는 9
350
+ 으며_ 9
351
+ 으며 9
356
352
  라는_ 9
357
- _ 9
358
- _해 9
359
- 특급시 9
360
- _ 9
361
- 급시 9
362
- 명_ 9
363
- 하는 9
364
- 기도_ 9
365
- 또한_ 9
366
- _신설 9
367
- 소 9
368
- 하는_ 9
369
- 또한 9
370
- _또한 9
371
- _건 9
372
- 도에 9
373
- 제_ 9
353
+ _ 9
354
+ 9
355
+ _형 9
356
+ _ 9
357
+ 면_ 9
358
+ 9
374
359
  국에서 9
360
+ 추 9
361
+ _자 9
362
+ _직할 9
363
+ 특급 9
375
364
  삼 9
376
- 합쳐_ 9
365
+ _ 9
366
+ 같 9
367
+ 특급시 9
368
+ 급시 9
369
+ 입 9
370
+ _체 9
371
+ 이라 9
377
372
  북도 9
378
- _합쳐 9
373
+ _신설 9
374
+ 으나_ 9
375
+ 으나 9
379
376
  세력 9
380
- 9
381
- 일부 9
382
- _일부 9
383
- 9
384
- 자_ 9
385
- _체 9
386
- _ 9
387
- _ 9
388
- 합쳐 9
389
- 8
390
- 역은_ 8
391
- 역은 8
392
- 한민 8
393
- 역시 8
394
- 8
395
- _함 8
396
- 8
397
- 8
398
- · 8
399
- 8
400
- _ 8
377
+ _및 9
378
+ _및_ 9
379
+ 9
380
+ 및_ 9
381
+ 한민국 8
382
+ 8
383
+ _ 8
384
+ _건국 8
385
+ 건국 8
386
+ 구려 8
387
+ 고구려 8
388
+ 제_ 8
389
+ 8
390
+ _신라 8
391
+ 라고 8
392
+ 신라 8
393
+ 고구 8
394
+ _발전 8
395
+ 년에 8
396
+ _고구 8
397
+ 합쳐_ 8
398
+ 도에_ 8
399
+ 제주 8
400
+ 합쳐 8