language_detector 0.1.0

Sign up to get free protection for your applications and to get access to all the features.
Files changed (172) hide show
  1. data/README.rdoc +24 -0
  2. data/Rakefile +18 -0
  3. data/VERSION +1 -0
  4. data/lib/language_detector.rb +232 -0
  5. data/lib/model-fm.yml +52504 -0
  6. data/lib/model-tc.yml +53985 -0
  7. data/lib/textcat_ngrams/afrikaans.lm +400 -0
  8. data/lib/textcat_ngrams/albanian.lm +400 -0
  9. data/lib/textcat_ngrams/amharic-utf.lm +400 -0
  10. data/lib/textcat_ngrams/arabic-iso8859_6.lm +400 -0
  11. data/lib/textcat_ngrams/arabic-windows1256.lm +400 -0
  12. data/lib/textcat_ngrams/armenian.lm +400 -0
  13. data/lib/textcat_ngrams/basque.lm +400 -0
  14. data/lib/textcat_ngrams/belarus-windows1251.lm +400 -0
  15. data/lib/textcat_ngrams/bosnian.lm +400 -0
  16. data/lib/textcat_ngrams/breton.lm +400 -0
  17. data/lib/textcat_ngrams/bulgarian-iso8859_5.lm +400 -0
  18. data/lib/textcat_ngrams/catalan.lm +400 -0
  19. data/lib/textcat_ngrams/chinese-big5.lm +400 -0
  20. data/lib/textcat_ngrams/chinese-gb2312.lm +400 -0
  21. data/lib/textcat_ngrams/croatian-ascii.lm +400 -0
  22. data/lib/textcat_ngrams/czech-iso8859_2.lm +400 -0
  23. data/lib/textcat_ngrams/danish.lm +400 -0
  24. data/lib/textcat_ngrams/dutch.lm +400 -0
  25. data/lib/textcat_ngrams/english.lm +400 -0
  26. data/lib/textcat_ngrams/esperanto.lm +400 -0
  27. data/lib/textcat_ngrams/estonian.lm +400 -0
  28. data/lib/textcat_ngrams/finnish.lm +400 -0
  29. data/lib/textcat_ngrams/french.lm +400 -0
  30. data/lib/textcat_ngrams/frisian.lm +400 -0
  31. data/lib/textcat_ngrams/georgian.lm +400 -0
  32. data/lib/textcat_ngrams/german.lm +400 -0
  33. data/lib/textcat_ngrams/greek-iso8859-7.lm +400 -0
  34. data/lib/textcat_ngrams/hebrew-iso8859_8.lm +400 -0
  35. data/lib/textcat_ngrams/hindi.lm +400 -0
  36. data/lib/textcat_ngrams/hungarian.lm +400 -0
  37. data/lib/textcat_ngrams/icelandic.lm +400 -0
  38. data/lib/textcat_ngrams/indonesian.lm +400 -0
  39. data/lib/textcat_ngrams/irish.lm +400 -0
  40. data/lib/textcat_ngrams/italian.lm +400 -0
  41. data/lib/textcat_ngrams/japanese-euc_jp.lm +400 -0
  42. data/lib/textcat_ngrams/japanese-shift_jis.lm +400 -0
  43. data/lib/textcat_ngrams/korean.lm +400 -0
  44. data/lib/textcat_ngrams/latin.lm +400 -0
  45. data/lib/textcat_ngrams/latvian.lm +400 -0
  46. data/lib/textcat_ngrams/lithuanian.lm +400 -0
  47. data/lib/textcat_ngrams/malay.lm +400 -0
  48. data/lib/textcat_ngrams/manx.lm +400 -0
  49. data/lib/textcat_ngrams/marathi.lm +400 -0
  50. data/lib/textcat_ngrams/mingo.lm +400 -0
  51. data/lib/textcat_ngrams/nepali.lm +400 -0
  52. data/lib/textcat_ngrams/norwegian.lm +400 -0
  53. data/lib/textcat_ngrams/persian.lm +400 -0
  54. data/lib/textcat_ngrams/polish.lm +400 -0
  55. data/lib/textcat_ngrams/portuguese.lm +400 -0
  56. data/lib/textcat_ngrams/quechua.lm +400 -0
  57. data/lib/textcat_ngrams/romanian.lm +400 -0
  58. data/lib/textcat_ngrams/rumantsch.lm +400 -0
  59. data/lib/textcat_ngrams/russian-iso8859_5.lm +400 -0
  60. data/lib/textcat_ngrams/russian-koi8_r.lm +400 -0
  61. data/lib/textcat_ngrams/russian-windows1251.lm +400 -0
  62. data/lib/textcat_ngrams/sanskrit.lm +400 -0
  63. data/lib/textcat_ngrams/scots.lm +400 -0
  64. data/lib/textcat_ngrams/scots_gaelic.lm +400 -0
  65. data/lib/textcat_ngrams/serbian-ascii.lm +400 -0
  66. data/lib/textcat_ngrams/slovak-ascii.lm +400 -0
  67. data/lib/textcat_ngrams/slovak-windows1250.lm +400 -0
  68. data/lib/textcat_ngrams/slovenian-ascii.lm +400 -0
  69. data/lib/textcat_ngrams/slovenian-iso8859_2.lm +400 -0
  70. data/lib/textcat_ngrams/spanish.lm +400 -0
  71. data/lib/textcat_ngrams/swahili.lm +400 -0
  72. data/lib/textcat_ngrams/swedish.lm +400 -0
  73. data/lib/textcat_ngrams/tagalog.lm +400 -0
  74. data/lib/textcat_ngrams/tamil.lm +400 -0
  75. data/lib/textcat_ngrams/thai.lm +400 -0
  76. data/lib/textcat_ngrams/turkish.lm +400 -0
  77. data/lib/textcat_ngrams/ukrainian-koi8_u.lm +400 -0
  78. data/lib/textcat_ngrams/vietnamese.lm +400 -0
  79. data/lib/textcat_ngrams/welsh.lm +400 -0
  80. data/lib/textcat_ngrams/yiddish-utf.lm +400 -0
  81. data/lib/training_data/ar-utf8.txt +54 -0
  82. data/lib/training_data/bg-utf8.txt +26 -0
  83. data/lib/training_data/cs-utf8.txt +48 -0
  84. data/lib/training_data/da-utf8.txt +159 -0
  85. data/lib/training_data/de-utf8.txt +569 -0
  86. data/lib/training_data/el-utf8.txt +48 -0
  87. data/lib/training_data/en-utf8.txt +81 -0
  88. data/lib/training_data/es-utf8.txt +185 -0
  89. data/lib/training_data/et-utf8.txt +50 -0
  90. data/lib/training_data/fa-utf8.txt +42 -0
  91. data/lib/training_data/fi-utf8.txt +83 -0
  92. data/lib/training_data/fr-utf8.txt +191 -0
  93. data/lib/training_data/fy-utf8.txt +22 -0
  94. data/lib/training_data/ga-utf8.txt +109 -0
  95. data/lib/training_data/he-utf8.txt +116 -0
  96. data/lib/training_data/hi-utf8.txt +49 -0
  97. data/lib/training_data/hr-utf8.txt +80 -0
  98. data/lib/training_data/hu-utf8.txt +87 -0
  99. data/lib/training_data/io-utf8.txt +41 -0
  100. data/lib/training_data/is-utf8.txt +94 -0
  101. data/lib/training_data/it-utf8.txt +228 -0
  102. data/lib/training_data/ja-utf8.txt +200 -0
  103. data/lib/training_data/ko-utf8.txt +147 -0
  104. data/lib/training_data/nl-utf8.txt +215 -0
  105. data/lib/training_data/no-utf8.txt +281 -0
  106. data/lib/training_data/pl-utf8.txt +120 -0
  107. data/lib/training_data/pt-utf8.txt +214 -0
  108. data/lib/training_data/ro-utf8.txt +66 -0
  109. data/lib/training_data/ru-utf8.txt +310 -0
  110. data/lib/training_data/sl-utf8.txt +263 -0
  111. data/lib/training_data/sv-utf8.txt +174 -0
  112. data/lib/training_data/th-utf8.txt +49 -0
  113. data/lib/training_data/tk-utf8.txt +101 -0
  114. data/lib/training_data/todo/af.txt +114 -0
  115. data/lib/training_data/todo/amharic-utf.txt +95 -0
  116. data/lib/training_data/todo/arabic-windows1256.txt +157 -0
  117. data/lib/training_data/todo/armenian.txt +86 -0
  118. data/lib/training_data/todo/basque.txt +136 -0
  119. data/lib/training_data/todo/belarus-windows1251.txt +97 -0
  120. data/lib/training_data/todo/bosnian.txt +97 -0
  121. data/lib/training_data/todo/breton.txt +159 -0
  122. data/lib/training_data/todo/bulgarian-iso8859_5.txt +115 -0
  123. data/lib/training_data/todo/catalan.txt +93 -0
  124. data/lib/training_data/todo/croatian-ascii.txt +104 -0
  125. data/lib/training_data/todo/esperanto.txt +95 -0
  126. data/lib/training_data/todo/estonian.txt +218 -0
  127. data/lib/training_data/todo/frisian.txt +99 -0
  128. data/lib/training_data/todo/georgian.txt +86 -0
  129. data/lib/training_data/todo/greek-iso8859-7.txt +139 -0
  130. data/lib/training_data/todo/hawaian.txt +108 -0
  131. data/lib/training_data/todo/hebrew-iso8859_8.txt +79 -0
  132. data/lib/training_data/todo/hindi.txt +77 -0
  133. data/lib/training_data/todo/hungarian.txt +102 -0
  134. data/lib/training_data/todo/icelandic.txt +131 -0
  135. data/lib/training_data/todo/indonesian.txt +93 -0
  136. data/lib/training_data/todo/irish.txt +209 -0
  137. data/lib/training_data/todo/latin.txt +120 -0
  138. data/lib/training_data/todo/latvian.txt +126 -0
  139. data/lib/training_data/todo/lithuanian.txt +99 -0
  140. data/lib/training_data/todo/malay.txt +108 -0
  141. data/lib/training_data/todo/manx.txt +78 -0
  142. data/lib/training_data/todo/marathi.txt +100 -0
  143. data/lib/training_data/todo/mf.txt +100 -0
  144. data/lib/training_data/todo/middle_frisian.txt +102 -0
  145. data/lib/training_data/todo/mingo.txt +146 -0
  146. data/lib/training_data/todo/nepali.txt +131 -0
  147. data/lib/training_data/todo/persian.txt +73 -0
  148. data/lib/training_data/todo/quechua.txt +108 -0
  149. data/lib/training_data/todo/romanian.txt +103 -0
  150. data/lib/training_data/todo/rumantsch.txt +110 -0
  151. data/lib/training_data/todo/sanskrit.txt +135 -0
  152. data/lib/training_data/todo/scots.txt +490 -0
  153. data/lib/training_data/todo/scots_gaelic.txt +93 -0
  154. data/lib/training_data/todo/serbian-ascii.txt +121 -0
  155. data/lib/training_data/todo/slovak-ascii.txt +102 -0
  156. data/lib/training_data/todo/slovak-windows1250.txt +115 -0
  157. data/lib/training_data/todo/slovenian-ascii.txt +100 -0
  158. data/lib/training_data/todo/slovenian-iso8859_2.txt +96 -0
  159. data/lib/training_data/todo/sq.txt +110 -0
  160. data/lib/training_data/todo/swahili.txt +120 -0
  161. data/lib/training_data/todo/tagalog.txt +135 -0
  162. data/lib/training_data/todo/tamil.txt +123 -0
  163. data/lib/training_data/todo/turkish.txt +117 -0
  164. data/lib/training_data/todo/ukrainian-koi8_r.txt +214 -0
  165. data/lib/training_data/todo/vietnamese.txt +92 -0
  166. data/lib/training_data/todo/welsh.txt +148 -0
  167. data/lib/training_data/todo/yiddish-utf.txt +83 -0
  168. data/lib/training_data/uk-utf8.txt +75 -0
  169. data/lib/training_data/vi-utf8.txt +47 -0
  170. data/lib/training_data/zh-utf8.txt +228 -0
  171. data/test/language_detector_test.rb +78 -0
  172. metadata +232 -0
@@ -0,0 +1,157 @@
1
+
2
+
3
+
4
+ �������� ������� ������� ������.
5
+ ����� ����� �� ����������
6
+ ������ - ����� - ����� ������
7
+ ����� �������� �����
8
+
9
+
10
+ ��� �� ��� ����� ���� ������� ����������...
11
+ ������ ����� �����...
12
+ ����� �� ����...���� ��������...���� ��������...
13
+ ���� . ����� ������ �� ���� ��� ���� ��� ����� .
14
+ ����� ���� ���� ��������...
15
+ � ����� ��� ������� ����� ������ ���� ��� �� ��� ������� ��� � �����
16
+ ���� ������� ���� - ��� �� �������-
17
+ ���� ����� �����...
18
+
19
+ ���� ����� ������� ������ ����:
20
+ �� � ����� ����� �� ��������� ���� �� ������� ������� .
21
+ ����� �������� ��� ����.
22
+
23
+
24
+ ����� �����
25
+ ����� ������...
26
+ �� ����� ������ �� ��������� ����� ��� ������� ���� ������� . ��� ���
27
+ ��� ���������� ������� ��� ��������� ������� � ������ ���� �� ������
28
+ � ����� ����� ����� : ����� ��� ������� ������� ������� ������ ���� ��
29
+ ������� ������� �� ���� ���� ������ ������ ��� ��� ���� ������ ������
30
+ - 17 -
31
+ ������ ��� ������.
32
+ ��� �� ��� ������ ������ ���� ��������
33
+ ��� ��� ������ ���ǡ
34
+ ��� ������ ���� ���� ������.
35
+ ������ - ����� - ����� ������
36
+ ���������...
37
+ ������ ���� �����
38
+
39
+ ������ ����� ��� ����� ������...
40
+
41
+ ���� ����� �� ��� ��� ���� ���� ���� ����� �� ���� ��� ���� ���� �����
42
+ ����� ������ ��������
43
+ ����� ��� ���� ��������...
44
+ (������ : ����� ����� ����� �����)
45
+ ����� ����� �����
46
+ ����� �����...
47
+ ���� �� ������ ������ �� ��� ������� ������ ��� ���� ���� � ��� ����
48
+ ������� �� ���� ������� �������� ����� � �� ��� �������� �� ������ �����
49
+
50
+ �������� ���������...
51
+
52
+ ����� ����� �� �� �����...
53
+ �������� .
54
+
55
+
56
+
57
+ ��� ����� ������� �� ����� ���� ����� ���� ����� ����� ����� ��� ��������
58
+ �� ������ ������ �� ��� ��� ������� ������ ��� ���� ���� �� ���� .
59
+ ����� ������� �� �������.
60
+
61
+ �� ����� ��� ���� ��� �� ����� ������ ������� ��� ���� �� ������ .
62
+ ����� ������...
63
+
64
+ ����� �� ������ ������.
65
+
66
+ ����� ���� �� ����������.
67
+
68
+
69
+ ����� ��� ��������
70
+ ���� ����� ��� ������� �� ��������� ����� �� ������ ��� ����� ��������
71
+ ����� �� ������� �� ���������
72
+
73
+ �� � ����� ����� �� ��������� ���� �� ������� ������� .
74
+ ������ ������� ����� ����� ��� �����. ���� ���� ��������� �� ������ ���
75
+ ������ ��� �������� ��� ������.
76
+
77
+
78
+
79
+
80
+ - 12 -
81
+ ������ ��� ��� ���� ������ ����� �� ���� ������ �� ���� �� ���� ����
82
+ �� ���� ����� ���� ���� ����� �� ������ �� �� ���� ����� �� ������� ����
83
+ ��� ������ ������... ��� ������ ������...
84
+ ����� ��������...�� ������� ���������...
85
+ ������ ���� ��� ��� ���� ���� � ������� ������� ��� ����� ������ ����
86
+
87
+ ����� ������ ��� ������� ���� �������.
88
+
89
+ ������� ��������� ���� ����� ��� ����� �� ������ ���� ����� ����� ������
90
+ �� �� ���� ������ ������ ������ ����� ��� ���� ����� ������ ���� �������
91
+ ������ ����� �����...
92
+
93
+ ������� �� ������ ��������...
94
+ ���� �� �� ����� ������ �� ���� ����� �� ����� � ����� ���� ��� ��� ����
95
+ �������� ���� ���� ��� ����� ����� ������� .
96
+
97
+ ��� ���� �� ����� ��������...
98
+ ���� ����� �������� ��� ����� �������...
99
+ ����� ��� ���� ��������...
100
+ ��� ������ ���� �������� ��� �����.
101
+ ����� �� �� ��� ��� ���� ������� ����� ����� ��� ��� ����� ���� ��� �����
102
+ ����� �� �� ��� ��� ���� ������� ����� ����� ��� ��� ����� ���� ��� �����
103
+ ����� �� ������� ���� ������
104
+ ������� ����� ��� ���� ����� � ����� �� ���� ����� ����� �������� � ���
105
+
106
+
107
+ ���� ����� ������� ������ ����:
108
+
109
+ ������ ��� �����.
110
+ ����� ������� �� �����.
111
+ ���� ��������...
112
+
113
+ ����� �� ����� ������ ���� �����
114
+
115
+ ������ - ��� ������ ���� ����� -
116
+ ���� ����� ��� ���������!!
117
+ ����� ������...
118
+ ������� ��� ������� ��� ����� ���������...
119
+ ����� ��� ���������...
120
+
121
+ ����� ��������...���� ��������...
122
+ ���� �������� ��� ������...
123
+ ���� ����� ��� ������� �� ��������� ����� �� ������ ��� ����� ��������
124
+ ������ ���� ����� ������ ������
125
+ ����� �� ������ ������.
126
+ ��� ��� ��� ����� ���� ����� �� ��� ��� ���� ���� ����� ��� ��� ���.
127
+ ���� ��������...
128
+ ���� ��� ������ ��� ��� ��� ���� ��� ����� ����� ����� ��� ������� ������
129
+
130
+
131
+ ����� ��� ��������
132
+ �������� ���� ���� ��� ����� ����� ������� .
133
+ �� ����� ������ �� ��������� ����� ��� ������� ���� ������� . ��� ���
134
+ ����� ������� �� �������.
135
+ ��� ����� ������
136
+
137
+ �������� �� ����� ������ ����� �������� ������ ��� ����� ����� . �������
138
+ ����� ������� �� �����.
139
+ ���� ����� ��� ����� ����� ����...
140
+ ������� ��� ���� ���� ����� ��� ���� ����� � ��� ���� ���� ������ �������
141
+ ��� ���� ������ ������ � ���� ���� ��� ����� ���� ���� ��� ����� ����
142
+ ��� ��� ���� ��� ���� �� ��� ��� ����� ��� �� ���� ��� ����� ��� ����
143
+
144
+
145
+ ����� ������ ��� �����...
146
+
147
+ ������ ������� ������ �����.
148
+ ���� �� ����� ����� �� ������ ���� ������ ����� �� ���� ������ �����
149
+ ������� ���� ����� ���...������ �� ������...
150
+
151
+
152
+ ������ - ����� - ����� ������
153
+ ��� ���� ������ �� �� �� ���� �� ������� ������ �� ������� �������� ����
154
+ ����� ���� ����� ����� ����� ����� ����� � �������� ��� ��� ����� ����
155
+ ����� ����� �����
156
+ ������� ������...
157
+ �� ����� ��� ���� ��� �� ����� ������ ������� ��� ���� �� ������ .
@@ -0,0 +1,86 @@
1
+ �� �� �� ������󑩁� ���큫��󑩁� ��������� ���� �
2
+ ������ ��끃�� ����������� �����󧫉��:
3
+ �� ݻ���� ����ݻ�:
4
+ - ����ѳϳ�������� ѳ�������� ѳٳ�: ��ϳ�� � �����, �� ٻ�
5
+ - ����� ������ �������� ��� ����� ����� г۳�����
6
+ �끣, ����󑩯� ����� ����� �� ������ �: ������ ��� ��
7
+ ���� �󫉕�� ����� 퉣������ ��� ��� �멁����, �ﯫ� ����
8
+ - ��� �� �DZ ѳݷ���� ų�ݷ�ϳ� ������������ݻ��:
9
+ �� �� ������ ����� �� ����� �󫉧
10
+
11
+ ϳ�ٳϻ���������ݻ���, ����� ݳ�� ���ݳϳ� �����ݻ���:
12
+ ��ϳ�� ѳ���, �� �� û �ٻ� �� ����������� ��� ���� ϳ� �����
13
+ �����> ��ٳ���, ����ݻ�� 㵻��: �ϳ�� ��� �� ���� ��ݳ�۳�
14
+ ����� �����󑩯�� ���� �: ��� ���� �� �� �����
15
+ �, û г۳���۳� �ϻջ��� �������� ϳ��� � ѳϳ���� �� ��ݻ� ٻ�
16
+
17
+ �ϻջ��ݻ� �� �������, ���� �ϳ, ��ѳݳ �� �᷻���ϳ� �ϳ:
18
+
19
+ ѳ�������, �� �ٳ�� �� ������, ���� �� ٻճ��� ��:
20
+ ѳٵ���ٳ� ����, �� ��� ��ݻ��� ѳݹ���` ��˳������� �� �: �廱��
21
+ ��˳���� ��ݳ� ѳٳ���ݻ�� ���ݳ���ٵ.
22
+ ���˳�� ������, �� �ϳ�� �� ѳ������: �����ѻ�� ������ݻ��
23
+ ��˳���� ϳ�����������: �� �� �ϳ г۳���, ����� ����������
24
+ ��� ��� ���, �� �������� ���������� �������󑩯�:
25
+ ѳ��ϳϳ� ��� ϳ�����ݻ�: ��� ѳ�� �, �� ٻ��` ѳۻ��, ������
26
+ �����󑩯� �����, ����镫 ��� ��: ���� �� ��� �� ����髯� ���
27
+ ��� ��� �������� �� ���� �סּ����� ��� ����: �竉 ����, ��
28
+ ��ϳ�� ���ɻ�, �� ��� ����� �ϳ: ���� ����� ���dzɳϳ�
29
+ �Ͻ���������, �����ó��� ������ݻ� �� ѻ���� (ٳ��� ������� �����
30
+ 300 ��� ��� ��������ٳ� ѳٳ� �� ������` ������� ѳ����
31
+
32
+
33
+ ��� � ���� в� ���Ⱥ��Ʋ��
34
+ ������� �����끛��� ቫ 񁫝���� ��鉗 ��灩�󑩁� ���
35
+ ѻ�� �۹ ����ݳѳ�����۳�, �۹ ���ݳ����ݳϳ� ٻ˳�ǽ�ݻ��
36
+ ���� �, ������󑩯󫫉� ��� ���� �󫉫, �� ����󑩯� �����
37
+ �ϳݹ�ݳ�۳� ����ݻ�� ׳ݳ���� �� ������ ����ϳ� ����ٳ�
38
+ �� ���ϳ۳ϳ� ��������۳� ��ٳ�ݻ���� ��˳�� ����� �� �����ݳ���:
39
+
40
+
41
+ ݳ˳����߳��۳� ����� ѳٻٳ����۳ٵ:
42
+ ����� ѻ� ѳ�������� ѳٳ�, �ųݹ�ϻ���, �����
43
+ ��� ��񳵻���� � �����ݳ�����۳� �׳�����ݳ����۳��, �� <�û
44
+ ������� ����� � ���� ������ ��ӳ���� ���ݻ��� ��׳���:
45
+ ���ね�に� ���:
46
+ ϳ����ϳ� ϳ�����ݻ�� ݻ�ϳ۳������ݻ�: ���㹻� ٻ� �ɳ�ݻ�� �߳�����
47
+
48
+ ϳ����, ���ٻ�ϳ� �� ѳٳ���˳� ٻ� ϳ�ٳϻ�����۳� ٳݹ����,
49
+ ��������� ������ ����� ���� ��� ���� ׷ݳų���. ���-�� ��
50
+ ٻ�, �����, ��� ��� ������, ������� �����: γ� ��� ϳ� ��� �����
51
+ <ѳ�� �ϳ>, ˳����� ��� ������ ������� ѻ�:
52
+
53
+
54
+ ��竁󑩯󫫉 �偝� �� ��������� ������� ����
55
+ ��� � ��������뉗, �� �� ���㫇�� �� ��� ���-�� �흁�����
56
+ û���� ��� ���ݹ��� �� �۹����� ѳ�ݻ� �� �dz�� �ճݻ��
57
+
58
+ ������ݻ��� ѻ�� ���� ���� ����������: γ�˳���߳���� ���, ��
59
+ - ��� ����, �� �� ቧ �����遫�� ��񕯫��� �����󑩯󫫉�
60
+ ��� �� ��� ������ ���󩑏, ��� ��������� ���: ������� ���
61
+ �� ���-� �������� �, �� �篣�󑩯� ��, ���駕�, ����� �:
62
+ �큟��, �� ��� �������� ��� ���� ��� ��, �火��� ��, ��
63
+ ��� � ϳٳ�-ϳٳ� ٳ����� ٻ� ������: ���� �������۳� ����� ٳ���
64
+ ��ﯣ �� ��灩�� ���� ������ �� ����񫯣��� ��
65
+ 95�. ��ٳݳ�����۳� <�ݹ��������> ѻ�� ���߻� ���ϻݹ�ݳ�ݻ�
66
+ ����ݳϳݳ�� óջ��� ��� ݻ�����ݻ�� �� ��ﳹ�ϳ� ������ ����
67
+ ����髯󑩯� �����, �������灝�, �� �� ��火� ���:
68
+ �������������� ������ �� ����� ��������: ��� ���� �` լ��
69
+ ��������� �� ���>,- ��� � ���镧 ���鉣����:
70
+ �߳�ٳ� �� �����ٳ� �ݳ��������, ѳ�������������� �� ��������� ��
71
+ - ����� �� ͻ� ������ ���ݳϳ� ѳ����:
72
+ ���� �� ���� �� ��� ��������� ����󧫉� ���뉫 �� ������,
73
+ ������󑩯��, ��� �������� ���� �: ����� ������,
74
+ ����끫���� ������ ��, �� ��������� ����� �� ��� ��
75
+ ����ӳϳ�� �ϳ ���� ���� ϳ� �������, �� ���ݳ���۳�� ��ӳٵ
76
+ �ݹ������ ���:
77
+ ������ �� ��� �篣�󑩯� �� ������󑩯�:
78
+ ����ٳ��, ��ɻ� ���� ��ݻݳ� ѻﳷ� �������������ݻ�� ѳٳ�:
79
+ ��ﳹ�����, ݳ������ ѳ��ݳϳ� ������ ����� ݻ����������: �
80
+ �����ݳ���� ���������۳� ٻ� ��ݻ� ��˳��������ݻ�� ѻ�, ���� ��
81
+
82
+ 靋����������` ���� ������ �������󑩁� ��큙����: ����, ��
83
+ �� �����۳��� ݻ�ϳ۳���� ٻճ������` �.���ѳ����۳�� �߻�, ��
84
+ ѻ�� � ��ݳ���� ���, ��� ���� ݳ˳�����۳��:
85
+ - ��灙�運��� ������� ���� ����, �� �����韛� ���񕁫, ��
86
+ ��陁��: ��������� �鉧, �� ��� ����� ����󑩁�� ቫ
@@ -0,0 +1,136 @@
1
+ perifrasietara mugatzen ez bagara. Adibidez:25
2
+
3
+ Cambridge University Press.
4
+
5
+ Euskalki guztietan, ezin elementuaz osatutako perifrasiak erabil
6
+
7
+ 3.2. EZIN IZAN
8
+ (14b) ulertu + behar duzu
9
+
10
+ Brunot ezin zen baliatu gaurko kontzeptu pragmatiko eta linguistikoez.
11
+ A.K.: Ofizialki ez. Aztertzaileek ohar bat idazten dute beren txosten
12
+
13
+ Badaude, alegia, 3.3.2 eta 3.3.3an aipatutako bi joerak berak. Euskara
14
+
15
+
16
+
17
+ zer gertatuko den derrigorrez), (2)an posibilitatea (mundu horretan zer gerta
18
+
19
+
20
+ A.K.: Asko. Mundu bat dago hor. Kontzeptu batzuk hizkuntzen irakaskuntzan
21
+ modaltasun epistemikoak hiztunaren sinesmenak adierazten ditu. Ondoko bi
22
+
23
+
24
+ ateratzen duen Euskaltzaindiko batzordeko partaide da aspaldiko partez.
25
+ A.K.: Ez dakit oraindik. Ez dut astirik izan ongi aztertzeko non komeni
26
+ daitezke.10 Hizkuntza desberdin askotan formalki agerian egoten diren
27
+ (43a) *esateko beharrik
28
+ azken urteotan egiten ari diren ikerketak interes haundikoak izan daitezke
29
+ 3.3. BEHAR IZAN
30
+ Herrian finkatu naiz, hasieran Donostian eta azken lau urteotan Zarautzen.
31
+ urruti samar dago nik ulertzen dudan kontzeptutik. Bestalde, G. Leech
32
+ batetatik, geruzapena delako kontzeptuaz ere balia gaitezke.13 Frantses
33
+
34
+
35
+
36
+
37
+
38
+ luzatzea, denbora minimoan egiteko apostu egin nuen. Eta hala egin nuen.
39
+ buruz beste bat hasita daukat. Eta berriena: miscellanea idiomatica delako
40
+ litzateke egokia eros(i) nezake (bizkaieraz neike) eta joan ninteke
41
+
42
+ Halere, azken urteotan nahaste bat gertatzen ari da zenbait hiztunengan,
43
+ *Euskal Herrian Euskaraz. Euskararen defentsarako herri mugimendua
44
+ Forma gramatikalizatuagoen esanahiak orokorragoak, zabalagoak eta
45
+
46
+ (E) Baliabide linguistikoen zerrenda ez da amaitzen hemen aditzezko
47
+
48
+ zenbait baliokide erabili ohi diren testuinguruetara larregi zabaltzea.
49
+
50
+
51
+
52
+ Euskaltzaindia (1987). Euskal gramatika: lehen urratsak, 2. tomoa. Bilbo: Euskaltzaindia.
53
+
54
+
55
+
56
+
57
+ epistemikoa adierazten baitu,18 adibidez:
58
+
59
+
60
+ gramatiketan aipatu ohi diren aditz modalen ezaugarri nagusiak2 -ezaugarri
61
+ 26. Wilbur-entzat (1981:172) ahal, behar eta nahi "root-modal particles"
62
+ Kategoria semantiko gisa, aldiz, modaltasun kontzeptua edozein
63
+
64
+
65
+ daukagu; hau egiazko aintzindaritzat emango nuke. Orain dela bi urte,
66
+ bihar edo) beharbada modaltasun epistemikoa adieraz dezakete.
67
+
68
+
69
+ eta J. Svartvik-en 1975eko A communicative grammar of English delakoa
70
+ moduan erabili duzula interesatzen zaizkizun puntu batzuk aztertzeko?
71
+
72
+ Behar bezala, nahi berez izena da, nahiz nahi-ren izenezko erabilera
73
+
74
+ derrigorrez sinonimotzat jotzen direnik, baizik eta hein batetako kidetasun
75
+ ideiari jarraituz idatzi zen lehenengo hizkuntz deskribapena; jakina,
76
+
77
+ Galdera: Ematen da notarik edo bestelako kalifikapenik?
78
+ A.K.: Badago, bai. Bistan dago Atalase Maila tresna "aplikatu" eta praktiko
79
+ Euskarazko gauza pare bat orrialde hauetan bertan osorik irakur daitezke:
80
+
81
+ zaidan kaleratzea, ezta nor egongo litzatekeen argitaratzeko prest ere.
82
+ acts kontzeptua dute iturri, baina kontzeptua geroztik oso landua izan
83
+ berriro--hots, (55) eta (56), (55) eta (57) erabiltzea baino hobe:
84
+
85
+
86
+
87
+
88
+
89
+ hau da, ea gramatika deskribapen "osorik" aurkitzen den munduan. Baina
90
+ haundia da, dedikazio gehiegi eskatuko luke, eta suposatzen duen ezagupen
91
+
92
+ hitza dakarkidala burura, asoziazioz edo). "Epaimahai" bezala, bi kanpoko
93
+
94
+ 7. Hegoaldeko euskaran; iparraldeko hizkeretan, berriz, (2)ko egiturak
95
+ gogoa eduki < nahi izan < �
96
+
97
+ Lhande, P. (1926). Dictionnaire basque-fran�ais. Paris: Gabriel Beauchesne.
98
+
99
+ gero eta presio gehiago egiten ari da Inglaterran tesiak lehenbailehen
100
+
101
+ kasua, non derrigorrezkoa baita ahal izan-en erabilpena (edo beste
102
+ erabilpena nahi-rena baino are murritzagoa dela dirudi.
103
+
104
+
105
+
106
+ dela inoiz egingo?
107
+
108
+
109
+ unibertsitateko tesi doktorala denez, inglesez dago noski. Luzeraz, 400
110
+ erabileran berean ez ezik, zuzentasunari buruzko kontzeptuetan ere. Konfusio
111
+ ditu, bereizketa zenbait arrazoi sintaktikotan oinarritzen dituelarik.
112
+ gerundiboa bezalatsu erabilirik).24
113
+ besteak beste, inoiz berezitzat hartu dituzte ikuspegi sintaktiko batetatik,
114
+ posibilitatea edo ez-segurtasuna
115
+ A.K.: Ez dut uste neronek bakarrik tamaina haundiko euskal gramatika
116
+ Eta 1993ko abenduan Londresko Unibertsitatean doktoratu egin zen linguistikan,
117
+
118
+ 12. King (1993:110).
119
+ probetxagarriak gramatika komunikatiboaren teoria lantzerakoan?
120
+
121
+
122
+ ahozko azterketa bat da, "viva voce" deitzen dena (edo laburturik, "viva"
123
+
124
+ Euskarazko Orrialdea
125
+
126
+ *IXA taldearen orria
127
+ (deskribapen morfosintaktikoa, alegia). Gramatika komunikatibo batean,
128
+
129
+ A.K.: Izugarrizkoa. Hitz gutxitan, pragmatikan aztertzen dira linguista
130
+
131
+
132
+
133
+
134
+
135
+
136
+ Wilbur, T.H. (1981). Basque syntax. Euskalarien nazioarteko jardunaldiak, pp. 169-186,
@@ -0,0 +1,97 @@
1
+
2
+ �i��-�������� ��i��i������ ���i���� ����i ������� ������ i
3
+ �����) � ��������� ������ ��� ������. ��� ��������� �� �i���
4
+ i���� ����� �����i����, ��� �� ���� ���������: ����, ���� i ����.
5
+ ��������� ��������i, ��������� I�i�.
6
+ �����. � �����i �������� ���������� �i� ������i� ����i��������
7
+ �i��� ������ �����i�����-������������ ��� �������i.
8
+ 1997) �� �����.
9
+ ������������ ������ ���i�i���. ��� �� ����i����� ����� ��
10
+ �������� ������������ �������� ������ ��������� ����� �i����� I��������.
11
+ ����� �� ��������. �� �� ����������� �������� �����������
12
+ ������i� (������i���� ����������), ����i���i ������i��i��� I����
13
+ �������� ������������ �������� ������ "��������
14
+ ��������� ���������� ������i��� ��������i��. � ������i � ������i�
15
+ �����������. ��������� ��� ���i������ �... ���� ������-�����������
16
+ �������i-�������������i � ����i i ����i��, � ���� �i ���� ���i� ��
17
+
18
+ � �������i �i�����i ����i�� ��������� ����i i ������,
19
+ ����� ����������� ������? �� �� ��� �i ����, ��� ����� ������i� i�
20
+ ���������� �i������ ����i���� ������ ������������i. � ���� ��� --
21
+
22
+ ����������. �� ������� ���������� ��� �� ���'������ �������, �
23
+ ������ �����������i� (�����).
24
+ ����i����� ����������. ������� ����� ����� i ��� ��������
25
+ �������i.
26
+ ������i, ���������i� ����i-������ I��� ������ ������� ���������� �
27
+ ���������", ������ �������, �i������ i ���������, � �������
28
+
29
+ ���������� ���� ������. ����������� �� ���i, ������ ����� ����
30
+ eve@nil.belpak.minsk.by
31
+ I�������. � ������i�� �� ������i � ��������.
32
+ ������i���� �������� ������� ������i��� � ����i� ����i i ��������
33
+
34
+ ���� ���� ��� ���, ��������i ������ ���������i�i ������ ����: ���
35
+
36
+
37
+ ��� �������� �����, i ����� ��� ������ ���� � �������i �����i� i,
38
+ �������� ������������ �������� ������ "�������� �����".
39
+
40
+
41
+ ����, ���� i ���� ��� ����� �� �����. ��� ����� �����i������ ����,
42
+ ����i��������. ������ ����, �� ������� ��� �'���� ���i ���������
43
+ ���������� -- �� ���� �� ��������.
44
+ ����� ������i�.
45
+ ����������� ��� � ���, ���, ��������� ����������� "�������", ��
46
+ ��i��-i������������i���. ����� �� �'����� ���� �����i�������� ����
47
+ 1997) ����� ����� � ����i�� (12.08.97)
48
+ ����� ������� i ����� ��� �������i�...
49
+
50
+ �������� "���������" ����� ���� ����������� ���'i ������������
51
+
52
+ ���� �� ��������, ��������� ��i��� (11.09.97)
53
+
54
+ ���������� "��������� ������" (10.09.97)
55
+
56
+ ���������� ����� �������� �� ����, ��� ���������� �� �����, ��
57
+
58
+
59
+ �����i������ � ������, ���� ��������� � ������� �i����.
60
+ �i���� � 900 (12.09.97)
61
+
62
+ � ����� ����������� �i��������� i �����.
63
+ ��������� ������. ��i� ����� ������� i ��������� �� 16 �� 18
64
+ �������� -- �� ��������, ��� ����������� �� ���'i ������� ������
65
+ ��������i ���������� i ���i ������� � ������i; ��i����
66
+ �������� ������������ �������� ������ ��������� ����� �i����� I��������.
67
+ -- � ��� ����� ������i�� �����i; �����i� �� ���i��� -- �������;
68
+ ���������� �i�������� � ��������i ���������� ������� �������i.
69
+ �����i������ � ������, ���� ��������� � ������� �i����.
70
+ �����������. ��������� ��� ���i������ �... ���� ������-�����������
71
+ ����������� "���i���" ������i�� ����� ����'������
72
+
73
+
74
+ �������� ������������ �������� ������ ��������� ����� �i����� I��������.
75
+ ��������i �������i ����� ����� � ��������� �������. ��� ��������i
76
+ �� ����� ������� ����� i ������� ��� ����� �������� ����� ������i�
77
+
78
+ ����i����� ����� �� ������i���� ���������i ��i��i�����
79
+
80
+ ��������� ����i, ����i��, �i�������, ���, �i�������, ������ii,
81
+ � ������ ������ ������i ����� �i����i�i ������i� �����i����� �
82
+
83
+ � ����i���i� ����� ��������, �i������� i �����i ������
84
+ �����) � ��������� ������ ��� ������. ��� ��������� �� �i���
85
+ �����������i ���� ����������� �������� �������, �����������
86
+ �����i������ � ������, ���� ��������� � ������� �i����.
87
+
88
+ �����i������ � ������, ���� ��������� � ������� �i����.
89
+
90
+ ������ ��i������ �����i ������i�i ������������� �����, ��� ����
91
+ ��������� ����i� ������� ��������i� ����������� ���������,
92
+ ������i��� � ������ "�i�����i ���'��" i i���� ���������� i
93
+ � ����� � ���i�� ���� "���� �������� ������". �� �i����
94
+ ��������i, ���i, �����i i ������i � ����� ������
95
+ � ���������� ����� �� �i�����i��� ����� ��i���� 3
96
+ � �������i �i�����i ����i�� ��������� ����i i ������,
97
+ �������� � ������ ���� �������� �����i�.