scylla 0.4.3 → 0.5.0

Sign up to get free protection for your applications and to get access to all the features.
Files changed (94) hide show
  1. data/Gemfile +1 -0
  2. data/Gemfile.lock +10 -0
  3. data/VERSION +1 -1
  4. data/lib/scylla/generator.rb +1 -1
  5. data/lib/scylla/lms/13375P33K.lm +156 -156
  6. data/lib/scylla/lms/arabic.lm +133 -133
  7. data/lib/scylla/lms/bulgarian.lm +122 -122
  8. data/lib/scylla/lms/catalan.lm +151 -151
  9. data/lib/scylla/lms/danish.lm +137 -137
  10. data/lib/scylla/lms/english.lm +207 -207
  11. data/lib/scylla/lms/french.lm +400 -400
  12. data/lib/scylla/lms/japanese.lm +400 -400
  13. data/lib/scylla/lms/korean.lm +233 -233
  14. data/lib/scylla/lms/norwegian.lm +398 -398
  15. data/lib/scylla/lms/spanish.lm +98 -98
  16. data/lib/scylla/lms/swedish.lm +123 -123
  17. data/lib/scylla/lms/tagalog.lm +223 -223
  18. data/lib/scylla/lms/welsh.lm +234 -234
  19. data/lib/scylla/resources.rb +10 -10
  20. data/scylla.gemspec +17 -40
  21. data/source_texts/catalan.txt +28 -28
  22. data/source_texts/danish.txt +62 -62
  23. data/source_texts/english.txt +10 -10
  24. data/source_texts/french.txt +470 -77
  25. data/source_texts/japanese.txt +453 -199
  26. data/source_texts/norwegian.txt +96 -63
  27. data/source_texts/spanish.txt +269 -269
  28. data/test/classifier_test.rb +2 -2
  29. data/test/fixtures/lms/13375p33k.lm +156 -156
  30. data/test/fixtures/lms/danish.lm +137 -137
  31. data/test/fixtures/lms/english.lm +207 -207
  32. data/test/fixtures/lms/french.lm +400 -400
  33. data/test/fixtures/lms/hindi.lm +400 -0
  34. data/test/fixtures/lms/italian.lm +400 -0
  35. data/test/fixtures/lms/japanese.lm +400 -400
  36. data/test/fixtures/lms/norwegian.lm +400 -0
  37. data/test/fixtures/lms/spanish.lm +98 -98
  38. data/test/fixtures/source_texts/danish.txt +62 -62
  39. data/test/fixtures/source_texts/english.txt +10 -10
  40. data/test/fixtures/source_texts/french.txt +470 -77
  41. data/test/fixtures/source_texts/hindi.txt +199 -0
  42. data/test/fixtures/source_texts/italian.txt +120 -0
  43. data/test/fixtures/source_texts/japanese.txt +453 -199
  44. data/test/fixtures/source_texts/norwegian.txt +190 -0
  45. data/test/fixtures/source_texts/spanish.txt +269 -269
  46. data/test/fixtures/test_languages/english +61 -0
  47. data/test/fixtures/test_languages/french +0 -0
  48. data/test/fixtures/test_languages/german +29 -0
  49. data/test/fixtures/test_languages/hindi +3 -0
  50. data/test/fixtures/test_languages/italian +6 -0
  51. data/test/fixtures/test_languages/japanese +79 -0
  52. data/test/fixtures/test_languages/norwegian +14 -0
  53. data/test/fixtures/test_languages/spanish +22 -0
  54. data/test/generator_test.rb +0 -1
  55. data/test/language_test.rb +28 -0
  56. metadata +20 -43
  57. data/lib/scylla/lms/esperanto.lm +0 -400
  58. data/lib/scylla/lms/hungarian.lm +0 -400
  59. data/lib/scylla/lms/irish.lm +0 -400
  60. data/lib/scylla/lms/kannada.lm +0 -400
  61. data/lib/scylla/lms/latin.lm +0 -400
  62. data/lib/scylla/lms/malay.lm +0 -400
  63. data/lib/scylla/lms/marathi.lm +0 -400
  64. data/lib/scylla/lms/mingo.lm +0 -400
  65. data/lib/scylla/lms/nepali.lm +0 -400
  66. data/lib/scylla/lms/quechua.lm +0 -400
  67. data/lib/scylla/lms/rumantsch.lm +0 -400
  68. data/lib/scylla/lms/sanskrit.lm +0 -400
  69. data/lib/scylla/lms/scots_gaelic.lm +0 -400
  70. data/lib/scylla/lms/serbian.lm +0 -400
  71. data/lib/scylla/lms/swahili.lm +0 -400
  72. data/lib/scylla/lms/tamil.lm +0 -400
  73. data/lib/scylla/lms/ukrainian.lm +0 -400
  74. data/lib/scylla/lms/yiddish.lm +0 -400
  75. data/source_texts/esperanto.txt +0 -199
  76. data/source_texts/hungarian.txt +0 -102
  77. data/source_texts/irish.txt +0 -209
  78. data/source_texts/kannada.txt +0 -283
  79. data/source_texts/latin.txt +0 -120
  80. data/source_texts/malay.txt +0 -108
  81. data/source_texts/marathi.txt +0 -100
  82. data/source_texts/mingo.txt +0 -146
  83. data/source_texts/nepali.txt +0 -131
  84. data/source_texts/quechua.txt +0 -108
  85. data/source_texts/rumantsch.txt +0 -110
  86. data/source_texts/sanskrit.txt +0 -135
  87. data/source_texts/scots_gaelic.txt +0 -93
  88. data/source_texts/serbian.txt +0 -121
  89. data/source_texts/swahili.txt +0 -120
  90. data/source_texts/tamil.txt +0 -167
  91. data/source_texts/ukrainian.txt +0 -214
  92. data/source_texts/yiddish-utf.txt +0 -83
  93. data/test/fixtures/lms/kannada.lm +0 -400
  94. data/test/fixtures/source_texts/kannada.txt +0 -283
@@ -1,102 +0,0 @@
1
-
2
- A hatodik pont teljes�t�se ut�n a BONUS illetve a HANGULAt pontokt�l f�gg�en vagy a rend�rs�g, vagy a
3
- Az a sok v�z azt�n sz�pen t�nkre is tette azt a sok szeg�ny �kori f�ldm�r�t �s egy�b n�ps�get.
4
- megt�r�t�s�t
5
-
6
- "Gyerekek, h�t mondj�tok, mert itt besz�l, morog mindenki, de Toldi Mikl�ssal nem �ll ki senki."
7
- S hogy lett este
8
- Ut�naj�rt a dolgoknak �s kider�tette, hogy a vas�t kil�nk�nt 50 frankot fizet. Ekkor t�madt az �tlete, hogy
9
-
10
-
11
- es�z�seket egy kiss� t�lm�retezte, ebb�l kifoly�lag a F�ldet egy hatalmas �rv�z mosta el.
12
- betegs�g miatt meghi�sult utaz�s k�lts�geit t�r�ti meg. Rep�l�vel t�rt�n� utaz�s eset�n az
13
-
14
-
15
- egyar�nt csal�dtagoknak �rzik magukat? �gy, hogy a Nagyobb Kegyelem Kereszt�ny Akad�mi�nak
16
- " A kopog� bogarak onnan kapt�k a nev�ket, hogz a h�mek p�rz�si id�szakban a falba verik a fej�ket. Ilyen
17
-
18
- A hord�hoz oda�r.
19
- E kellemes kis t�rt�net eljutott ide Sz�kesfeh�rv�rra is, �s egy j�hangulat� esti kiruccan�s alkalm�val
20
- teny�sz�llat �s l�biztos�t�s.
21
-
22
-
23
- A j�t�k szign�lja a k�vetkez� k�ppen n�zne ki:
24
-
25
- Valah�ny ifj�nak, v�nnek.
26
- Megd�rzs�li szem�t:
27
- A vegyes �letbiztos�t�soknak - az �gyfelek k�r�ben rendk�v�l n�pszer� - alapm�dozata.
28
- Ha a mozdony egy szikr�j�t�l meggyullad a b�r�nd, akkor mennyit fizet k�rt�r�t�sk�nt a vas�tt�rsas�g?
29
- A Sz�n�s-hegyeket a pannon fl�ra b�lcs�j�nek tartj�k, a kutat�k szerint a n�v�nyek
30
- H�rom �v m�lva lehet �rtej�nni.
31
- t�rzs: az �n dr�ga, �gynevezett n�pem maga.
32
-
33
-
34
-
35
- M�snap reggelre,
36
- Ha divath�zban akad n�ki dolga,
37
- visszafizet�s�vel.
38
- Febru�r: levizsg�zik geod�zi�b�l, �s megbukik matekb�l.
39
- Cseh K�zt�rsas�g, valamint Szlov�kia
40
- Budakeszi k�zel�ben vadasparkot hoztak l�tre, ahol a budai erd�kben is honos
41
-
42
-
43
- N�v�nybiztos�t�s, �rv�zk�rbiztos�t�s, j�gk�r, t�li fagyk�r, sz�l�gy�kereztet� iskol�k j�gk�ra, sz�l�
44
- kiv�gja.
45
- Nappali tagozat: 210 f� (h�rom �vfolyam, mindk�t l�tez� szak egy�tt)
46
-
47
- A szerz�d�s id�tartama lehet t�bb �v, de ha kell, ak�r egy nap is.
48
- kedvez� volt. A hord�nyi borban �ssze�lltak az eszenci�k, s a mi Urunk j�kedv�t igazoland� egy eddig
49
- a minket k�r�lvev� t�j sz�ps�ge mellett is.
50
- SZ�RAZ ERD�KR�L ESIK SZ�:
51
- Vagyonbiztos�t�saink
52
-
53
- volna, hogy Magyarorsz�g f�v�rosa Budapest. Vagy �ppen Debrecen, esetleg Pozsony vagy Sz�ul. Ne is
54
- n�v�nyeket. A budai m�szk� �s dolomit r�g�k m�r eljutottak mai f�ldrajzi
55
-
56
- Az emberek kedve
57
-
58
- vissza az �gyf�lnek.
59
- Sz�rcs�lni kezdi a zavaros l�t.
60
-
61
- H�t m�g egyszer k�p�tt.
62
-
63
- eml�s�k�n, madarakon k�v�l sz�mos egy�b �llattal tal�lkozhatnak a kir�ndul�k.
64
- Generali, m�r K�n�ban is
65
-
66
-
67
-
68
- ki�z�tt a paradicsomb�l, a puszta sivatagba v�rosokat emelt, l�trehozta az �kori kelet h�t csod�j�t, kital�lta az
69
-
70
- A veget�ci� jelenlegi k�pe a mintegy 10 ezer �ve v�get �rt j�gkorszak ut�n alakult ki,
71
- A falu v�nei nagyot n�ztek,
72
-
73
- Azt�n bet�rni este, ha s�t�t lesz
74
- A tanulm�nyi id� :
75
- a Merzse-mocs�r kisz�radna, vagy t�nkremenne Budapest egy �rdekes �s �rt�kes
76
- Szerencs�re az �vmilli�kkal kor�bban itt teny�sz� �sn�v�nyeknek m�g nem kellett az
77
-
78
- kritikus szakaszokon megengedhet� a haj��t 80 m�ter sz�less�gre val� sz�k�t�se. A haj��t
79
- t�bort�zekbe. Ilyenkor t�rsaik rendre fen�kbe billentett�k �ket, �s a mind n�pszer�bb� v�l� seritellel h�t�tt�k le
80
-
81
-
82
- (roppan�s), elemi csap�sok, sz�ll�t�eszk�zt �rt baleset, hidak vagy m�s �p�tm�nyek beoml�sa,
83
- A budai imola �s a feh�rvir�g� k�h�r a z�rtabb dolomit sziklagyepek n�v�nye.
84
- HELVETIA, a Magyarorsz�gi
85
- Az �vek folyam�n a Magyarorsz�gr�l sz�rmaz� Eur�pai utasbiztos�t� Ausztri�ban 100%-ban a Generali
86
- m�s iskol�kkal szervezett sportversenyek
87
- Mit tettetek?
88
-
89
-
90
- Egyik legn�pszer�bb m�dozatunk a jelenleg m�g kiskor� gyermek h�zass�gk�t�sekor
91
-
92
- t�bbs�g�ben ink�bb csak el�julnak.
93
- Amennyiben �rdekli az iskol�nk, rendelkez�s�re �llunk E-mailen, az al�bbi telefonsz�mokon:
94
-
95
- Ez a m�dozat nemcsak az orvosokra, hanem a gy�gyszer�szekre �s az eg�szs�g�gyi k�pes�t�ssel
96
- m�sztak el� a boroshord�kb�l, �s Isten r�j�tt, hogy most m�r nagyon gyorsan meg kellene teremtenie a Napot.
97
-
98
- gyakorl�it�l �tv�llalja az �ltaluk elk�vetett szakmai hib�k miatt bek�vetkezett k�rok
99
-
100
- Meg�rlelt�k a t�z� napsugarak.
101
- m�g most is sz�p sz�mban ny�lik. Gy�ny�rk�dj�nk benne, s ne t�pj�k le feleslegesen.
102
- figyelhet�nk meg, amely egy el�re be�ll�tott amplitud�val d�lnek jobbra, �s az oldalfalakr�l alfa illetve minusz
@@ -1,209 +0,0 @@
1
-
2
-
3
- ceann = one
4
-
5
-
6
-
7
- �it �igin in �irinn. Ag teacht abhaile �n s�ip�al L� Fh�ile P�draig di,
8
-
9
-
10
- go dt� Ti-Boy.
11
-
12
- an oiread acu = as many of them
13
-
14
-
15
-
16
-
17
-
18
- "Is f�idir, a bhean uasal," a d'freagair an portr�id�.
19
-
20
-
21
- "An-�asca, is � �osa mac Muire."
22
-
23
-
24
-
25
-
26
-
27
- Freagra�onn an bhean rialta eile:
28
- cloiseann s� paidreacha a mhic ar�s:
29
-
30
-
31
-
32
-
33
-
34
-
35
-
36
-
37
-
38
-
39
-
40
-
41
- bh� s� ina ch�d pr�obh�ideadh acu: "Ar mhaith leat an n�och�n a dh�anamh?"
42
-
43
- Chonaic s� foirgneamh ard, agus dhruid s� leis. Tharraing s� comhartha
44
-
45
- F�orsc�al �n Ollscoil anseo i nGaillimh:
46
- Ti-Boy: Chihuahua!?! T� t� ag tarraingt asam! Dheamhan seans ag mada
47
-
48
- T�ann an buachaill beag a lu� agus tig lena athair a phaidreacha a chloiste�il:
49
-
50
- Bh� cail�n beag san fholcad�n in �ineacht lena dearth�ir beag. Tar �is
51
-
52
-
53
-
54
- SEATAC, ait ar thuirling s� sl�n.
55
-
56
- T� iontas ar an mbean rialta, ceart go leor, ach �s rud � gurb eisean
57
-
58
-
59
-
60
-
61
- c�pla o�che � shinn ag �l c�pla pinta agus d'inis s� sc�al�n dhom faoi
62
-
63
- T� f�gra faighte agat...
64
-
65
- ar an rothar seo. L�im s� den rothar, 's bhain s� di a cuid �ada� uilig
66
-
67
- bh� s� ina ch�d pr�obh�ideadh acu: "Ar mhaith leat an n�och�n a dh�anamh?"
68
-
69
- chuile rud, istigh is amuigh. Mar is dual d� leith�id�, bh�odar ag bualadh
70
- isteach. Tar �is c�pla focal leis an mbartender, chuaigh an fear seo
71
- "Go raibh maith agat, a �osa, as an l� �lainn a bh� agam. Sl�n le Mr.
72
- An Aisling
73
- tr� wishes di. "Fan go bhfeice m� ...," a deir s�. "Is mian liom a bheith
74
- "Muc? Muc! N� muc � sin! Nach bhfuil s� soil�ir gur lacha at� inti?"
75
- agus h� br� c�n galradh a bhuail Se�n t� a fhios ag Dia go cheannaigh
76
- "Ach," a deir s�, "n�l teanga ar bith ann a bhfuil dearfach d�bailte
77
- ach n� fhaigheann siad ach gn�sacht mar fhreagra.
78
-
79
- Tamall ina dhiaidh sin, d'iompaigh s� chun an �st�ra ar�s:
80
- L� amh�in bh� s� ag iarraidh tobac a cheannacht sa siopa. "Old Holborn"
81
-
82
- t� ag dul?"
83
- "Ceart go leor," a deir an t-�st�ir.
84
- dearth�ir = brother
85
- gcathair, agus d�irt s� leis an �st�ir,
86
-
87
-
88
- "N�l, a chro�, ach m� fhaighim b�s, p�sfaidh m'fhear ar�s, t� m� cinnte.
89
-
90
- An Striapach agus an Tuath�nach
91
-
92
- Chonaic s� foirgneamh ard, agus dhruid s� leis. Tharraing s� comhartha
93
-
94
-
95
- mian liom a bheith �g agus �lainn." Bingo! Bh� s� �g agus �lainn. Chaith
96
- ar a raibh scr�ofa "C� bhfuil m�?" agus chroch amach ar an fhuinneog
97
-
98
-
99
-
100
-
101
-
102
-
103
- sh�il eile."
104
-
105
- "Musa", a deir P�id�n, "N� fait�as at� mo choinn�al imo shu� ach
106
- - T� m� cinnte. FAIGH F�IN AN PHLUID MHALLAITHE �D !!!
107
-
108
- "Maith go leor. Scaoil amach iad", arsa mo dhuine.
109
-
110
- "Tabharfaidh m� seans duit do chuid airgid a fh�il ar ais. Cuirfidh m�
111
-
112
-
113
- chuaigh s� s�os go dt� an tr� d� fh�in le lu� ar an ngainimh. Thit s�
114
- "Ceart go leor," a deir an t-�st�ir.
115
- - Earra ar cairde.
116
- Comhtharl�?
117
- "Musa", a deir P�id�n, "N� fait�as at� mo choinn�al imo shu� ach
118
-
119
-
120
-
121
- "Bhuel," a deir an p�as, "an bhfuil t� cinnte dearfa gur ar neamh a bheas
122
-
123
- isteach. Tar �is c�pla focal leis an mbartender, chuaigh an fear seo
124
- da bhr� sin t� m� ag us�id ainmeacha br�agach sa sc�al.
125
- Bh� m� Tigh Mh�irt�n N� sa Fhaiche Mh�r anseo i nGaillimh le m'athair
126
-
127
- amh�in n� d�irt an tAlbanach, ach th�g s� an chuileog as a phionta agus
128
-
129
- P�raic � Cual�in
130
-
131
-
132
- Ti-Boy agus na Madra�
133
-
134
- - T� go maith, a athair, m� t� t� cinnte nach s�r� m�ide a bheadh ann.
135
- Dia b�n, agus d�irt na gas�ir ghorma go bhuil Dia gorm.
136
-
137
- tada!"
138
-
139
-
140
-
141
-
142
- Bean rialta
143
-
144
- "N�or mhiste, a bhean uasal."
145
- s� ann, sa seomra f�iltithe, th�inig bean rialta amach as oifig an docht�ra.
146
- T� sc�in ar an bhfear bocht! N� th�ann s� ag obair ar maidin. Fanann
147
-
148
- Dolan!"
149
-
150
-
151
-
152
- - T� br�n orm ach n�l ach seomra amh�in f�gtha agam. Caithfidh t� � a
153
-
154
- �. Chonaic na daoine san fhoirgneamh an chomhartha, agus go gasta, scr�obh
155
- 1. ti (<- petit) = beag i bhFraincis Cajun
156
- cloiseann s� paidreacha a mhic ar�s:
157
-
158
-
159
- An Aisling
160
- Bh� l�n�in nuaph�sta ina gc�na� in �ras�n le balla� tana�, �it a gcloistear
161
-
162
- ph�sta.
163
-
164
- T�ann an buachaill beag a lu� agus tig lena athair a phaidreacha a chloiste�il:
165
-
166
- Bh� seanbhean ina su� ar bhinse i bp�irc i Mosc�, ag l�amh "Teach Yourself
167
-
168
-
169
- Bh� fear ag iarraidh gabh�il ar imirce chun na hAstr�ile. Chuaigh s�
170
-
171
- an fholctha, d�irt s� lena m�thair, "C�n f�th nach bhfuil p�p� agamsa
172
-
173
-
174
- "N�l a leithid agam", a d'feagair s�, "ach t� cuid ag teacht isteach
175
-
176
-
177
-
178
-
179
- go nd�anfaidh S� an Talamh a scriosadh faoi cheann tr� l�."
180
-
181
-
182
-
183
- agus greim a bhreith ar a sh�il eile.
184
-
185
-
186
-
187
-
188
-
189
-
190
-
191
-
192
-
193
-
194
- tighe.
195
-
196
-
197
-
198
- bh� s� ina ch�d pr�obh�ideadh acu: "Ar mhaith leat an n�och�n a dh�anamh?"
199
- Teanga na bhFlaitheas
200
- L� bre� gr�ini�l a bh� ann agus nuair a bh� brise l�n ag bean an t-siopa
201
-
202
- dt� anois, mura raibh sibh s�sta le ch�ile? [i dtir seachas �ire a bh�
203
-
204
-
205
- Clinton, Yeltsin agus Paisley
206
- saol m�r, le go mbeidh seans acu aithreachas a dh�anamh."
207
-
208
-
209
-