scylla 0.9.3 → 1.0.0
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- data/lib/scylla/lms/arabic.lm +399 -399
- data/lib/scylla/lms/bulgarian.lm +400 -400
- data/lib/scylla/lms/catalan.lm +323 -323
- data/lib/scylla/lms/chinese.lm +389 -389
- data/lib/scylla/lms/czech.lm +377 -377
- data/lib/scylla/lms/danish.lm +383 -383
- data/lib/scylla/lms/dutch.lm +398 -398
- data/lib/scylla/lms/english.lm +355 -355
- data/lib/scylla/lms/finnish.lm +381 -381
- data/lib/scylla/lms/french.lm +379 -379
- data/lib/scylla/lms/german.lm +382 -382
- data/lib/scylla/lms/greek.lm +400 -400
- data/lib/scylla/lms/hebrew.lm +400 -400
- data/lib/scylla/lms/hindi.lm +400 -400
- data/lib/scylla/lms/icelandic.lm +219 -219
- data/lib/scylla/lms/indonesian.lm +364 -364
- data/lib/scylla/lms/italian.lm +381 -381
- data/lib/scylla/lms/japanese.lm +400 -400
- data/lib/scylla/lms/kannada.lm +392 -392
- data/lib/scylla/lms/korean.lm +389 -389
- data/lib/scylla/lms/marathi.lm +364 -364
- data/lib/scylla/lms/norwegian.lm +325 -325
- data/lib/scylla/lms/persian.lm +397 -397
- data/lib/scylla/lms/polish.lm +380 -380
- data/lib/scylla/lms/portuguese.lm +375 -375
- data/lib/scylla/lms/romanian.lm +318 -318
- data/lib/scylla/lms/russian.lm +398 -398
- data/lib/scylla/lms/slovak.lm +358 -358
- data/lib/scylla/lms/slovenian.lm +256 -256
- data/lib/scylla/lms/spanish.lm +353 -353
- data/lib/scylla/lms/swedish.lm +400 -400
- data/lib/scylla/lms/tagalog.lm +245 -245
- data/lib/scylla/lms/thai.lm +400 -400
- data/lib/scylla/lms/turkish.lm +379 -379
- data/lib/scylla/lms/vietnamese.lm +373 -373
- data/lib/scylla/lms/welsh.lm +293 -293
- data/test/classifier_test.rb +5 -3
- data/test/fixtures/lms/arabic.lm +400 -0
- data/test/fixtures/lms/bulgarian.lm +400 -0
- data/test/fixtures/lms/catalan.lm +400 -0
- data/test/fixtures/lms/chinese.lm +400 -0
- data/test/fixtures/lms/czech.lm +400 -0
- data/test/fixtures/lms/danish.lm +399 -399
- data/test/fixtures/lms/dutch.lm +400 -0
- data/test/fixtures/lms/english.lm +400 -400
- data/test/fixtures/lms/finnish.lm +400 -0
- data/test/fixtures/lms/french.lm +397 -397
- data/test/fixtures/lms/german.lm +400 -400
- data/test/fixtures/lms/greek.lm +400 -0
- data/test/fixtures/lms/hebrew.lm +400 -0
- data/test/fixtures/lms/hindi.lm +400 -400
- data/test/fixtures/lms/icelandic.lm +400 -0
- data/test/fixtures/lms/indonesian.lm +400 -0
- data/test/fixtures/lms/italian.lm +400 -400
- data/test/fixtures/lms/japanese.lm +400 -400
- data/test/fixtures/lms/kannada.lm +400 -0
- data/test/fixtures/lms/korean.lm +400 -0
- data/test/fixtures/lms/marathi.lm +400 -0
- data/test/fixtures/lms/norwegian.lm +399 -399
- data/test/fixtures/lms/persian.lm +400 -0
- data/test/fixtures/lms/polish.lm +400 -0
- data/test/fixtures/lms/portuguese.lm +400 -0
- data/test/fixtures/lms/romanian.lm +400 -0
- data/test/fixtures/lms/russian.lm +400 -0
- data/test/fixtures/lms/slovak.lm +400 -0
- data/test/fixtures/lms/slovenian.lm +400 -0
- data/test/fixtures/lms/spanish.lm +400 -400
- data/test/fixtures/lms/swedish.lm +400 -0
- data/test/fixtures/lms/tagalog.lm +400 -0
- data/test/fixtures/lms/thai.lm +400 -0
- data/test/fixtures/lms/turkish.lm +400 -0
- data/test/fixtures/lms/vietnamese.lm +400 -0
- data/test/fixtures/lms/welsh.lm +400 -0
- data/test/fixtures/test_languages/japanese +149 -67
- data/test/generator_test.rb +1 -43
- data/test/language_test.rb +5 -1
- data/test/loader_test.rb +1 -1
- data/test/scylla_test.rb +4 -4
- metadata +105 -63
@@ -0,0 +1,400 @@
|
|
1
|
+
_ 17794
|
2
|
+
a 8212
|
3
|
+
i 7011
|
4
|
+
t 5906
|
5
|
+
s 5775
|
6
|
+
n 5574
|
7
|
+
e 5070
|
8
|
+
u 4250
|
9
|
+
l 4246
|
10
|
+
o 3954
|
11
|
+
k 3187
|
12
|
+
n_ 2826
|
13
|
+
a_ 2652
|
14
|
+
m 2465
|
15
|
+
ä 2237
|
16
|
+
v 1765
|
17
|
+
r 1465
|
18
|
+
en 1456
|
19
|
+
j 1420
|
20
|
+
is 1368
|
21
|
+
ta 1233
|
22
|
+
in 1154
|
23
|
+
_s 1143
|
24
|
+
st 1103
|
25
|
+
y 1051
|
26
|
+
en_ 1004
|
27
|
+
p 998
|
28
|
+
h 956
|
29
|
+
al 934
|
30
|
+
_k 907
|
31
|
+
i_ 880
|
32
|
+
an 874
|
33
|
+
si 871
|
34
|
+
li 849
|
35
|
+
_j 847
|
36
|
+
uo 829
|
37
|
+
ll 794
|
38
|
+
sa 773
|
39
|
+
ja 766
|
40
|
+
se 753
|
41
|
+
aa 748
|
42
|
+
va 745
|
43
|
+
_m 730
|
44
|
+
_v 708
|
45
|
+
ä_ 704
|
46
|
+
t_ 702
|
47
|
+
tt 690
|
48
|
+
ma 686
|
49
|
+
it 683
|
50
|
+
ai 682
|
51
|
+
la 675
|
52
|
+
su 672
|
53
|
+
_o 666
|
54
|
+
ti 647
|
55
|
+
on 641
|
56
|
+
ka 640
|
57
|
+
te 640
|
58
|
+
ja_ 598
|
59
|
+
ta_ 590
|
60
|
+
in_ 590
|
61
|
+
tu 575
|
62
|
+
_t 575
|
63
|
+
_l 560
|
64
|
+
el 544
|
65
|
+
_su 536
|
66
|
+
_ja 535
|
67
|
+
d 533
|
68
|
+
om 531
|
69
|
+
es 530
|
70
|
+
oi 521
|
71
|
+
at 502
|
72
|
+
_a 494
|
73
|
+
me 489
|
74
|
+
et 480
|
75
|
+
ss 474
|
76
|
+
as 473
|
77
|
+
ist 470
|
78
|
+
ku 469
|
79
|
+
uu 464
|
80
|
+
ko 460
|
81
|
+
mi 454
|
82
|
+
lu 451
|
83
|
+
suo 440
|
84
|
+
an_ 440
|
85
|
+
_p 438
|
86
|
+
uom 426
|
87
|
+
nt 421
|
88
|
+
tä 418
|
89
|
+
un 418
|
90
|
+
il 418
|
91
|
+
ii 409
|
92
|
+
on_ 408
|
93
|
+
us 402
|
94
|
+
sta 402
|
95
|
+
ik 399
|
96
|
+
ut 397
|
97
|
+
ki 395
|
98
|
+
sa_ 392
|
99
|
+
_e 390
|
100
|
+
ne 390
|
101
|
+
to 389
|
102
|
+
ks 386
|
103
|
+
ke 374
|
104
|
+
os 370
|
105
|
+
ol 370
|
106
|
+
le 369
|
107
|
+
ssa 365
|
108
|
+
nn 361
|
109
|
+
ei 352
|
110
|
+
na 346
|
111
|
+
ee 345
|
112
|
+
ri 339
|
113
|
+
jo 323
|
114
|
+
ul 320
|
115
|
+
_va 315
|
116
|
+
ise 314
|
117
|
+
ö 314
|
118
|
+
er 313
|
119
|
+
vu 303
|
120
|
+
_n 298
|
121
|
+
_on 295
|
122
|
+
ty 295
|
123
|
+
im 292
|
124
|
+
lli 289
|
125
|
+
ia 288
|
126
|
+
de 285
|
127
|
+
lis 283
|
128
|
+
s_ 274
|
129
|
+
ome 271
|
130
|
+
at_ 271
|
131
|
+
ää 264
|
132
|
+
ak 263
|
133
|
+
_h 263
|
134
|
+
lä 261
|
135
|
+
mu 257
|
136
|
+
ot 254
|
137
|
+
la_ 249
|
138
|
+
lla 248
|
139
|
+
aan 246
|
140
|
+
sä 245
|
141
|
+
ie 241
|
142
|
+
_ka 238
|
143
|
+
e_ 236
|
144
|
+
sen 235
|
145
|
+
vi 235
|
146
|
+
all 234
|
147
|
+
ais 230
|
148
|
+
_al 226
|
149
|
+
ni 225
|
150
|
+
ur 224
|
151
|
+
_ma 221
|
152
|
+
maa 220
|
153
|
+
uv 220
|
154
|
+
ksi 217
|
155
|
+
lt 215
|
156
|
+
_ku 214
|
157
|
+
si_ 213
|
158
|
+
est 212
|
159
|
+
_jo 209
|
160
|
+
tä_ 208
|
161
|
+
pi 203
|
162
|
+
än 202
|
163
|
+
vä 201
|
164
|
+
sk 201
|
165
|
+
vat 201
|
166
|
+
ra 199
|
167
|
+
_mu 198
|
168
|
+
uk 198
|
169
|
+
_r 196
|
170
|
+
tta 196
|
171
|
+
ns 195
|
172
|
+
een 195
|
173
|
+
pa 194
|
174
|
+
ok 193
|
175
|
+
ht 191
|
176
|
+
men 189
|
177
|
+
ui 189
|
178
|
+
ar 188
|
179
|
+
ia_ 185
|
180
|
+
itt 184
|
181
|
+
val 183
|
182
|
+
lo 182
|
183
|
+
au 181
|
184
|
+
ti_ 179
|
185
|
+
aa_ 179
|
186
|
+
_y 178
|
187
|
+
mm 177
|
188
|
+
kk 176
|
189
|
+
ha 175
|
190
|
+
no 175
|
191
|
+
tti 175
|
192
|
+
isi 173
|
193
|
+
ala 171
|
194
|
+
ill 171
|
195
|
+
iin 170
|
196
|
+
suu 168
|
197
|
+
o_ 164
|
198
|
+
am 163
|
199
|
+
kä 163
|
200
|
+
lai 162
|
201
|
+
_ko 161
|
202
|
+
_sa 160
|
203
|
+
na_ 160
|
204
|
+
av 159
|
205
|
+
den 159
|
206
|
+
oli 158
|
207
|
+
mä 156
|
208
|
+
g 156
|
209
|
+
pu 156
|
210
|
+
nen 154
|
211
|
+
vuo 153
|
212
|
+
ine 152
|
213
|
+
_ta 150
|
214
|
+
iv 150
|
215
|
+
et_ 149
|
216
|
+
sti 148
|
217
|
+
ell 148
|
218
|
+
ts 147
|
219
|
+
nk 147
|
220
|
+
_lu 146
|
221
|
+
_tu 145
|
222
|
+
aj 145
|
223
|
+
so 145
|
224
|
+
_vu 144
|
225
|
+
ast 144
|
226
|
+
lk 144
|
227
|
+
he 143
|
228
|
+
eu 142
|
229
|
+
ess 142
|
230
|
+
_se 141
|
231
|
+
oma 140
|
232
|
+
kan 137
|
233
|
+
ste 137
|
234
|
+
rk 137
|
235
|
+
ro 136
|
236
|
+
un_ 136
|
237
|
+
io 135
|
238
|
+
ve 134
|
239
|
+
_ol 134
|
240
|
+
lle 134
|
241
|
+
nna 132
|
242
|
+
jä 132
|
243
|
+
_ke 132
|
244
|
+
äl 131
|
245
|
+
eis 130
|
246
|
+
stä 129
|
247
|
+
ois 129
|
248
|
+
ät 129
|
249
|
+
alu 128
|
250
|
+
yö 127
|
251
|
+
ek 127
|
252
|
+
ain 126
|
253
|
+
ten 126
|
254
|
+
ou 126
|
255
|
+
lm 126
|
256
|
+
u_ 125
|
257
|
+
ett 124
|
258
|
+
vo 124
|
259
|
+
or 123
|
260
|
+
utt 123
|
261
|
+
ru 122
|
262
|
+
ir 122
|
263
|
+
taa 122
|
264
|
+
ent 122
|
265
|
+
äi 121
|
266
|
+
kun 121
|
267
|
+
mis 119
|
268
|
+
ue 118
|
269
|
+
_ 118
|
270
|
+
118
|
271
|
+
tel 117
|
272
|
+
_i 117
|
273
|
+
op 117
|
274
|
+
em 117
|
275
|
+
yt 116
|
276
|
+
sin 115
|
277
|
+
kse 115
|
278
|
+
le_ 115
|
279
|
+
oh 114
|
280
|
+
än_ 114
|
281
|
+
od 114
|
282
|
+
_me 112
|
283
|
+
ust 111
|
284
|
+
oit 111
|
285
|
+
li_ 111
|
286
|
+
aik 111
|
287
|
+
_u 110
|
288
|
+
lue 110
|
289
|
+
nta 110
|
290
|
+
uot 110
|
291
|
+
po 109
|
292
|
+
lin 107
|
293
|
+
mal 106
|
294
|
+
id 106
|
295
|
+
ov 106
|
296
|
+
nä 105
|
297
|
+
hi 105
|
298
|
+
_si 105
|
299
|
+
yh 105
|
300
|
+
alt 105
|
301
|
+
sto 105
|
302
|
+
ses 105
|
303
|
+
_ha 104
|
304
|
+
lii 104
|
305
|
+
ali 104
|
306
|
+
luv 104
|
307
|
+
ien 103
|
308
|
+
oll 103
|
309
|
+
yk 102
|
310
|
+
_la 102
|
311
|
+
je 102
|
312
|
+
mat 101
|
313
|
+
lta 101
|
314
|
+
iss 101
|
315
|
+
är 101
|
316
|
+
ans 100
|
317
|
+
omi 100
|
318
|
+
ka_ 99
|
319
|
+
int 98
|
320
|
+
ud 98
|
321
|
+
lä_ 97
|
322
|
+
kuu 97
|
323
|
+
ttä 96
|
324
|
+
ap 96
|
325
|
+
pe 96
|
326
|
+
sä_ 96
|
327
|
+
ita 96
|
328
|
+
f 96
|
329
|
+
uvu 95
|
330
|
+
toi 95
|
331
|
+
unn 95
|
332
|
+
uks 95
|
333
|
+
äm 94
|
334
|
+
ttu 93
|
335
|
+
uur 93
|
336
|
+
ost 93
|
337
|
+
kaa 92
|
338
|
+
nsa 92
|
339
|
+
tii 91
|
340
|
+
eh 91
|
341
|
+
tai 91
|
342
|
+
ova 90
|
343
|
+
_to 90
|
344
|
+
tet 90
|
345
|
+
ass 90
|
346
|
+
mes 90
|
347
|
+
_ _ 89
|
348
|
+
_ 89
|
349
|
+
ika 89
|
350
|
+
_li 89
|
351
|
+
min 88
|
352
|
+
ava 88
|
353
|
+
my 88
|
354
|
+
joi 88
|
355
|
+
utu 87
|
356
|
+
tei 87
|
357
|
+
stu 87
|
358
|
+
kes 86
|
359
|
+
uri 86
|
360
|
+
_ov 85
|
361
|
+
ään 85
|
362
|
+
_vä 85
|
363
|
+
re 84
|
364
|
+
yl 84
|
365
|
+
oin 84
|
366
|
+
eli 83
|
367
|
+
pä 83
|
368
|
+
mi_ 83
|
369
|
+
uon 83
|
370
|
+
sii 83
|
371
|
+
uus 83
|
372
|
+
ös 82
|
373
|
+
mp 82
|
374
|
+
ull 81
|
375
|
+
äh 81
|
376
|
+
ij 81
|
377
|
+
ide 81
|
378
|
+
tal 81
|
379
|
+
llä 81
|
380
|
+
uva 80
|
381
|
+
äk 80
|
382
|
+
osi 80
|
383
|
+
_my 80
|
384
|
+
nu 80
|
385
|
+
imm 80
|
386
|
+
ude 79
|
387
|
+
tav 79
|
388
|
+
saa 78
|
389
|
+
sia 78
|
390
|
+
_po 78
|
391
|
+
us_ 78
|
392
|
+
ikk 78
|
393
|
+
ih 78
|
394
|
+
kau 78
|
395
|
+
myö 77
|
396
|
+
ssä 77
|
397
|
+
voi 77
|
398
|
+
ama 77
|
399
|
+
onn 77
|
400
|
+
ys 77
|
data/test/fixtures/lms/french.lm
CHANGED
@@ -1,400 +1,400 @@
|
|
1
|
-
_
|
2
|
-
e
|
3
|
-
s
|
4
|
-
a
|
5
|
-
|
6
|
-
|
7
|
-
|
8
|
-
r
|
9
|
-
l
|
10
|
-
e_
|
11
|
-
u
|
12
|
-
o
|
13
|
-
s_
|
14
|
-
d
|
15
|
-
|
16
|
-
|
17
|
-
|
18
|
-
|
19
|
-
|
20
|
-
|
21
|
-
|
22
|
-
é
|
23
|
-
|
24
|
-
|
25
|
-
|
26
|
-
le
|
27
|
-
|
28
|
-
|
29
|
-
|
30
|
-
on
|
31
|
-
|
32
|
-
|
33
|
-
|
34
|
-
|
35
|
-
|
36
|
-
|
37
|
-
|
38
|
-
|
39
|
-
|
40
|
-
|
41
|
-
|
42
|
-
|
43
|
-
|
44
|
-
|
45
|
-
|
46
|
-
|
47
|
-
|
48
|
-
|
49
|
-
|
50
|
-
|
51
|
-
|
52
|
-
|
53
|
-
|
54
|
-
|
55
|
-
|
56
|
-
|
57
|
-
|
58
|
-
|
59
|
-
|
60
|
-
|
61
|
-
q
|
62
|
-
|
63
|
-
|
64
|
-
|
65
|
-
|
66
|
-
|
67
|
-
_m
|
68
|
-
|
69
|
-
|
70
|
-
|
71
|
-
|
72
|
-
|
73
|
-
|
74
|
-
|
75
|
-
|
76
|
-
|
77
|
-
|
78
|
-
|
79
|
-
|
80
|
-
|
81
|
-
|
82
|
-
|
83
|
-
|
84
|
-
|
85
|
-
|
86
|
-
|
87
|
-
|
88
|
-
|
89
|
-
|
90
|
-
|
91
|
-
|
92
|
-
|
93
|
-
|
94
|
-
|
95
|
-
|
96
|
-
|
97
|
-
|
98
|
-
|
99
|
-
|
100
|
-
|
101
|
-
|
102
|
-
|
103
|
-
|
104
|
-
|
105
|
-
|
106
|
-
|
107
|
-
|
108
|
-
|
109
|
-
|
110
|
-
|
111
|
-
|
112
|
-
|
113
|
-
|
114
|
-
|
115
|
-
|
116
|
-
|
117
|
-
|
118
|
-
|
119
|
-
|
120
|
-
|
121
|
-
|
122
|
-
|
123
|
-
|
124
|
-
|
125
|
-
|
126
|
-
|
127
|
-
|
128
|
-
|
129
|
-
|
130
|
-
|
131
|
-
|
132
|
-
|
133
|
-
|
134
|
-
|
135
|
-
|
136
|
-
|
137
|
-
|
138
|
-
|
139
|
-
|
140
|
-
|
141
|
-
|
142
|
-
|
143
|
-
|
144
|
-
anc 375
|
145
|
-
des_ 367
|
146
|
-
nce 366
|
147
|
-
ue_ 363
|
148
|
-
is_ 359
|
149
|
-
� 359
|
150
|
-
è 359
|
151
|
-
ma 358
|
152
|
-
ir 355
|
153
|
-
l� 354
|
154
|
-
_l� 354
|
155
|
-
l� 354
|
156
|
-
_l� 354
|
157
|
-
l’ 354
|
158
|
-
_des 351
|
159
|
-
_en_ 349
|
160
|
-
du 345
|
161
|
-
_les 342
|
162
|
-
ion_ 340
|
163
|
-
el 339
|
164
|
-
_par 336
|
165
|
-
é_ 333
|
166
|
-
�_ 333
|
167
|
-
i_ 331
|
168
|
-
us 326
|
169
|
-
_n 326
|
170
|
-
ui 325
|
171
|
-
n� 322
|
172
|
-
ati 321
|
173
|
-
nd 320
|
174
|
-
nce_ 320
|
175
|
-
ve 316
|
176
|
-
que_ 315
|
177
|
-
so 314
|
178
|
-
t� 313
|
179
|
-
_u 312
|
180
|
-
ance 311
|
181
|
-
om 310
|
182
|
-
iq 296
|
183
|
-
iqu 296
|
184
|
-
il 295
|
185
|
-
�e 294
|
186
|
-
_pr 294
|
187
|
-
ée 294
|
188
|
-
mi 293
|
189
|
-
men 291
|
190
|
-
_un 291
|
191
|
-
_au 289
|
192
|
-
__ 288
|
193
|
-
�_ 288
|
194
|
-
est 286
|
195
|
-
na 286
|
196
|
-
ique 286
|
1
|
+
_ 28586
|
2
|
+
e 10327
|
3
|
+
s 5870
|
4
|
+
a 5422
|
5
|
+
n 5335
|
6
|
+
t 5043
|
7
|
+
i 4889
|
8
|
+
r 4631
|
9
|
+
l 4323
|
10
|
+
e_ 3992
|
11
|
+
u 3708
|
12
|
+
o 3568
|
13
|
+
s_ 3244
|
14
|
+
d 2939
|
15
|
+
p 2738
|
16
|
+
_d 2283
|
17
|
+
c 2226
|
18
|
+
_l 2164
|
19
|
+
es 2030
|
20
|
+
m 1956
|
21
|
+
t_ 1929
|
22
|
+
é 1766
|
23
|
+
es_ 1606
|
24
|
+
de 1536
|
25
|
+
_p 1456
|
26
|
+
le 1453
|
27
|
+
en 1414
|
28
|
+
_e 1403
|
29
|
+
_de 1317
|
30
|
+
on 1231
|
31
|
+
nt 1188
|
32
|
+
an 1085
|
33
|
+
n_ 1067
|
34
|
+
re 986
|
35
|
+
la 933
|
36
|
+
f 927
|
37
|
+
de_ 914
|
38
|
+
_s 853
|
39
|
+
a_ 848
|
40
|
+
_le 827
|
41
|
+
ti 825
|
42
|
+
_c 818
|
43
|
+
_a 806
|
44
|
+
is 800
|
45
|
+
_la 764
|
46
|
+
la_ 741
|
47
|
+
le_ 731
|
48
|
+
ra 729
|
49
|
+
nt_ 726
|
50
|
+
g 724
|
51
|
+
’ 679
|
52
|
+
v 679
|
53
|
+
ent 667
|
54
|
+
et 650
|
55
|
+
_f 637
|
56
|
+
ar 615
|
57
|
+
ce 600
|
58
|
+
u_ 597
|
59
|
+
pa 590
|
60
|
+
te 587
|
61
|
+
q 582
|
62
|
+
et_ 575
|
63
|
+
r_ 569
|
64
|
+
it 569
|
65
|
+
qu 568
|
66
|
+
me 567
|
67
|
+
_m 566
|
68
|
+
ai 556
|
69
|
+
in 553
|
70
|
+
ns 549
|
71
|
+
ur 545
|
72
|
+
_et 544
|
73
|
+
se 541
|
74
|
+
ne 522
|
75
|
+
les 497
|
76
|
+
er 493
|
77
|
+
st 490
|
78
|
+
au 487
|
79
|
+
ue 487
|
80
|
+
b 479
|
81
|
+
io 472
|
82
|
+
_pa 471
|
83
|
+
co 471
|
84
|
+
_en 469
|
85
|
+
ion 452
|
86
|
+
nc 448
|
87
|
+
tr 445
|
88
|
+
ran 441
|
89
|
+
ri 441
|
90
|
+
at 437
|
91
|
+
ou 431
|
92
|
+
ie 430
|
93
|
+
_r 424
|
94
|
+
re_ 417
|
95
|
+
eu 405
|
96
|
+
par 404
|
97
|
+
on_ 403
|
98
|
+
des 400
|
99
|
+
en_ 399
|
100
|
+
fr 390
|
101
|
+
li 387
|
102
|
+
ta 386
|
103
|
+
al 386
|
104
|
+
ns_ 385
|
105
|
+
po 385
|
106
|
+
l’ 375
|
107
|
+
_l’ 373
|
108
|
+
_t 373
|
109
|
+
em 373
|
110
|
+
ce_ 371
|
111
|
+
pr 371
|
112
|
+
ro 370
|
113
|
+
un 369
|
114
|
+
_fr 367
|
115
|
+
h 362
|
116
|
+
tio 356
|
117
|
+
_co 356
|
118
|
+
que 349
|
119
|
+
fra 349
|
120
|
+
or 347
|
121
|
+
ne_ 344
|
122
|
+
so 337
|
123
|
+
rt 333
|
124
|
+
oi 328
|
125
|
+
à_ 326
|
126
|
+
à 326
|
127
|
+
du 318
|
128
|
+
ré 317
|
129
|
+
nce 315
|
130
|
+
is_ 315
|
131
|
+
_à 313
|
132
|
+
_à_ 313
|
133
|
+
anc 309
|
134
|
+
x 308
|
135
|
+
est 299
|
136
|
+
si 299
|
137
|
+
_au 298
|
138
|
+
_n 298
|
139
|
+
el 291
|
140
|
+
us 290
|
141
|
+
om 288
|
142
|
+
_u 286
|
143
|
+
p_ 285
|
197
144
|
pl 284
|
198
|
-
|
199
|
-
|
200
|
-
|
201
|
-
|
202
|
-
|
203
|
-
|
204
|
-
|
205
|
-
|
206
|
-
|
207
|
-
|
208
|
-
|
209
|
-
|
210
|
-
|
211
|
-
lu
|
212
|
-
|
213
|
-
|
214
|
-
|
215
|
-
|
216
|
-
|
217
|
-
|
218
|
-
|
219
|
-
|
220
|
-
|
221
|
-
|
222
|
-
|
223
|
-
|
224
|
-
|
225
|
-
|
226
|
-
|
227
|
-
|
228
|
-
|
229
|
-
|
230
|
-
|
231
|
-
|
232
|
-
|
233
|
-
|
234
|
-
|
235
|
-
|
236
|
-
|
237
|
-
|
238
|
-
|
239
|
-
|
240
|
-
|
241
|
-
|
242
|
-
|
243
|
-
|
244
|
-
|
245
|
-
|
246
|
-
|
247
|
-
|
248
|
-
|
249
|
-
|
250
|
-
|
251
|
-
|
252
|
-
|
253
|
-
|
254
|
-
|
255
|
-
|
256
|
-
|
257
|
-
|
258
|
-
|
259
|
-
|
260
|
-
|
261
|
-
|
262
|
-
|
263
|
-
|
264
|
-
|
265
|
-
|
266
|
-
|
267
|
-
|
268
|
-
|
269
|
-
|
270
|
-
|
271
|
-
|
272
|
-
|
273
|
-
|
274
|
-
|
275
|
-
|
276
|
-
|
277
|
-
|
278
|
-
|
279
|
-
_mo
|
280
|
-
|
281
|
-
|
282
|
-
|
283
|
-
|
284
|
-
|
285
|
-
|
286
|
-
|
287
|
-
|
288
|
-
|
289
|
-
ac 182
|
290
|
-
_r� 182
|
291
|
-
rs_ 182
|
292
|
-
tu 181
|
293
|
-
ér 180
|
294
|
-
�r 180
|
295
|
-
rti 179
|
296
|
-
ts 179
|
297
|
-
ie_ 178
|
298
|
-
’a 177
|
299
|
-
�a 177
|
300
|
-
��a 177
|
301
|
-
gr 176
|
302
|
-
ise 174
|
303
|
-
_b 173
|
304
|
-
ans 173
|
305
|
-
une 172
|
306
|
-
us_ 172
|
307
|
-
_au_ 172
|
308
|
-
iè 172
|
309
|
-
� 170
|
310
|
-
ç 170
|
311
|
-
as 170
|
312
|
-
ia 170
|
313
|
-
ar_ 170
|
314
|
-
_ré 170
|
315
|
-
ts_ 168
|
316
|
-
son 168
|
317
|
-
cl 167
|
318
|
-
ont_ 167
|
319
|
-
an� 167
|
320
|
-
ran� 166
|
321
|
-
su 166
|
145
|
+
ll 284
|
146
|
+
ue_ 284
|
147
|
+
nd 282
|
148
|
+
é_ 281
|
149
|
+
ma 281
|
150
|
+
ui 280
|
151
|
+
è 275
|
152
|
+
_pr 269
|
153
|
+
_un 268
|
154
|
+
ée 264
|
155
|
+
ir 263
|
156
|
+
ati 262
|
157
|
+
men 261
|
158
|
+
lu 259
|
159
|
+
_du 259
|
160
|
+
_so 258
|
161
|
+
ont 257
|
162
|
+
du_ 254
|
163
|
+
st_ 250
|
164
|
+
ve 249
|
165
|
+
mi 249
|
166
|
+
rs 246
|
167
|
+
_q 244
|
168
|
+
_qu 244
|
169
|
+
és 240
|
170
|
+
ci 239
|
171
|
+
i_ 239
|
172
|
+
té 236
|
173
|
+
di 235
|
174
|
+
ut 232
|
175
|
+
_es 230
|
176
|
+
mo 229
|
177
|
+
ss 229
|
178
|
+
_o 227
|
179
|
+
ant 223
|
180
|
+
_é 220
|
181
|
+
pe 218
|
182
|
+
eur 217
|
183
|
+
ais 214
|
184
|
+
au_ 212
|
185
|
+
con 211
|
186
|
+
lle 210
|
187
|
+
res 209
|
188
|
+
_po 208
|
189
|
+
l_ 205
|
190
|
+
ct 204
|
191
|
+
il 201
|
192
|
+
iqu 200
|
193
|
+
iq 200
|
194
|
+
na 199
|
195
|
+
te_ 198
|
196
|
+
ep 198
|
197
|
+
ux 197
|
198
|
+
_pl 197
|
199
|
+
d’ 197
|
200
|
+
son 197
|
201
|
+
nn 196
|
202
|
+
da 195
|
203
|
+
y 195
|
204
|
+
ol 195
|
205
|
+
rs_ 194
|
206
|
+
x_ 192
|
207
|
+
_d’ 192
|
208
|
+
ar_ 191
|
209
|
+
ons 191
|
210
|
+
lo 191
|
211
|
+
_i 190
|
212
|
+
me_ 189
|
213
|
+
_se 187
|
214
|
+
to 187
|
215
|
+
no 186
|
216
|
+
ur_ 185
|
217
|
+
ch 182
|
218
|
+
eme 180
|
219
|
+
ec 178
|
220
|
+
tre 178
|
221
|
+
ux_ 177
|
222
|
+
_re 176
|
223
|
+
us_ 175
|
224
|
+
vi 175
|
225
|
+
ans 174
|
226
|
+
_mo 172
|
227
|
+
pp 172
|
228
|
+
pu 172
|
229
|
+
ic 172
|
230
|
+
mp 171
|
231
|
+
dé 170
|
232
|
+
lus 170
|
233
|
+
art 170
|
234
|
+
_ma 167
|
235
|
+
ire 166
|
322
236
|
un_ 166
|
323
|
-
|
324
|
-
|
325
|
-
|
326
|
-
|
327
|
-
|
328
|
-
|
329
|
-
|
330
|
-
|
331
|
-
|
332
|
-
|
333
|
-
|
334
|
-
|
335
|
-
|
336
|
-
|
337
|
-
|
338
|
-
�a 156
|
339
|
-
ça 156
|
340
|
-
nça 156
|
341
|
-
fi 156
|
342
|
-
_ce 156
|
343
|
-
er_ 156
|
344
|
-
arti 155
|
345
|
-
ans_ 155
|
346
|
-
elle 154
|
347
|
-
j 154
|
348
|
-
plus 154
|
349
|
-
né 154
|
237
|
+
ale 166
|
238
|
+
_v 165
|
239
|
+
plu 165
|
240
|
+
une 164
|
241
|
+
op 162
|
242
|
+
ét 161
|
243
|
+
gr 161
|
244
|
+
_g 159
|
245
|
+
_ce 158
|
246
|
+
dan 158
|
247
|
+
se_ 157
|
248
|
+
ul 157
|
249
|
+
ac 154
|
250
|
+
sa 154
|
251
|
+
j 153
|
350
252
|
mm 153
|
351
|
-
|
352
|
-
|
353
|
-
|
354
|
-
|
355
|
-
|
356
|
-
|
357
|
-
|
358
|
-
|
359
|
-
|
360
|
-
|
361
|
-
|
362
|
-
it_
|
363
|
-
|
364
|
-
|
365
|
-
|
366
|
-
|
367
|
-
|
368
|
-
|
369
|
-
|
370
|
-
|
371
|
-
|
372
|
-
|
373
|
-
|
374
|
-
|
375
|
-
|
376
|
-
|
377
|
-
|
378
|
-
|
379
|
-
|
380
|
-
|
381
|
-
|
382
|
-
|
383
|
-
|
384
|
-
|
385
|
-
|
386
|
-
|
387
|
-
|
388
|
-
|
389
|
-
|
390
|
-
|
391
|
-
|
392
|
-
|
393
|
-
|
394
|
-
|
395
|
-
|
396
|
-
|
397
|
-
|
398
|
-
|
399
|
-
|
400
|
-
|
253
|
+
’a 151
|
254
|
+
tu 151
|
255
|
+
né 151
|
256
|
+
fi 149
|
257
|
+
im 148
|
258
|
+
ts 147
|
259
|
+
és_ 143
|
260
|
+
as 143
|
261
|
+
ts_ 142
|
262
|
+
sp 142
|
263
|
+
_dé 141
|
264
|
+
it_ 141
|
265
|
+
_da 138
|
266
|
+
su 138
|
267
|
+
rti 137
|
268
|
+
té_ 136
|
269
|
+
bl 136
|
270
|
+
er_ 135
|
271
|
+
ge 135
|
272
|
+
ell 134
|
273
|
+
ise 134
|
274
|
+
_ré 134
|
275
|
+
ér 133
|
276
|
+
our 133
|
277
|
+
ç 133
|
278
|
+
ia 133
|
279
|
+
_no 131
|
280
|
+
ag 130
|
281
|
+
ntr 128
|
282
|
+
ien 127
|
283
|
+
nç 127
|
284
|
+
ée_ 125
|
285
|
+
nça 124
|
286
|
+
ça 124
|
287
|
+
’e 124
|
288
|
+
anç 123
|
289
|
+
ni 122
|
290
|
+
pp_ 122
|
291
|
+
iv 122
|
292
|
+
çai 121
|
293
|
+
ort 121
|
294
|
+
com 119
|
295
|
+
rr 117
|
296
|
+
aux 116
|
297
|
+
ond 116
|
298
|
+
ui_ 115
|
299
|
+
ins 113
|
300
|
+
tra 112
|
301
|
+
_tr 112
|
302
|
+
ain 111
|
303
|
+
_pe 110
|
304
|
+
’_ 110
|
305
|
+
ées 109
|
306
|
+
iè 108
|
307
|
+
ie_ 108
|
308
|
+
qui 108
|
309
|
+
ses 107
|
310
|
+
_su 107
|
311
|
+
ca 107
|
312
|
+
mb 107
|
313
|
+
ine 106
|
314
|
+
_b 105
|
315
|
+
do 105
|
316
|
+
_di 104
|
317
|
+
éc 104
|
318
|
+
ig 104
|
319
|
+
d_ 104
|
320
|
+
br 104
|
321
|
+
fa 103
|
322
|
+
mme 103
|
323
|
+
ect 103
|
324
|
+
nne 102
|
325
|
+
uv 101
|
326
|
+
ap 101
|
327
|
+
ot 101
|
328
|
+
sé 101
|
329
|
+
rés 100
|
330
|
+
ép 100
|
331
|
+
fo 100
|
332
|
+
cu 99
|
333
|
+
uis 99
|
334
|
+
mai 98
|
335
|
+
_j 98
|
336
|
+
lit 98
|
337
|
+
_te 97
|
338
|
+
ter 96
|
339
|
+
urs 96
|
340
|
+
ris 96
|
341
|
+
id 95
|
342
|
+
ill 95
|
343
|
+
oc 95
|
344
|
+
cti 94
|
345
|
+
air 94
|
346
|
+
ité 93
|
347
|
+
bre 93
|
348
|
+
ues 93
|
349
|
+
ier 93
|
350
|
+
gi 93
|
351
|
+
l’_ 92
|
352
|
+
iti 92
|
353
|
+
por 91
|
354
|
+
nte 90
|
355
|
+
mon 90
|
356
|
+
pro 90
|
357
|
+
tan 90
|
358
|
+
hi 90
|
359
|
+
_in 90
|
360
|
+
vo 89
|
361
|
+
oir 89
|
362
|
+
ouv 89
|
363
|
+
av 89
|
364
|
+
va 88
|
365
|
+
nom 88
|
366
|
+
_si 88
|
367
|
+
pré 88
|
368
|
+
ist 87
|
369
|
+
tie 87
|
370
|
+
_do 87
|
371
|
+
ys 86
|
372
|
+
onn 85
|
373
|
+
_an 85
|
374
|
+
mé 84
|
375
|
+
ois 84
|
376
|
+
_fa 84
|
377
|
+
ers 84
|
378
|
+
ure 84
|
379
|
+
ég 83
|
380
|
+
rop 83
|
381
|
+
nts 83
|
382
|
+
ga 83
|
383
|
+
tes 83
|
384
|
+
in_ 82
|
385
|
+
nde 82
|
386
|
+
and 81
|
387
|
+
omm 81
|
388
|
+
_to 81
|
389
|
+
ay 81
|
390
|
+
tat 81
|
391
|
+
mbr 81
|
392
|
+
pri 81
|
393
|
+
rm 80
|
394
|
+
pui 80
|
395
|
+
pou 80
|
396
|
+
_ou 80
|
397
|
+
eux 79
|
398
|
+
ial 79
|
399
|
+
gra 79
|
400
|
+
ass 79
|