language_detector 0.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (172) hide show
  1. data/README.rdoc +24 -0
  2. data/Rakefile +18 -0
  3. data/VERSION +1 -0
  4. data/lib/language_detector.rb +232 -0
  5. data/lib/model-fm.yml +52504 -0
  6. data/lib/model-tc.yml +53985 -0
  7. data/lib/textcat_ngrams/afrikaans.lm +400 -0
  8. data/lib/textcat_ngrams/albanian.lm +400 -0
  9. data/lib/textcat_ngrams/amharic-utf.lm +400 -0
  10. data/lib/textcat_ngrams/arabic-iso8859_6.lm +400 -0
  11. data/lib/textcat_ngrams/arabic-windows1256.lm +400 -0
  12. data/lib/textcat_ngrams/armenian.lm +400 -0
  13. data/lib/textcat_ngrams/basque.lm +400 -0
  14. data/lib/textcat_ngrams/belarus-windows1251.lm +400 -0
  15. data/lib/textcat_ngrams/bosnian.lm +400 -0
  16. data/lib/textcat_ngrams/breton.lm +400 -0
  17. data/lib/textcat_ngrams/bulgarian-iso8859_5.lm +400 -0
  18. data/lib/textcat_ngrams/catalan.lm +400 -0
  19. data/lib/textcat_ngrams/chinese-big5.lm +400 -0
  20. data/lib/textcat_ngrams/chinese-gb2312.lm +400 -0
  21. data/lib/textcat_ngrams/croatian-ascii.lm +400 -0
  22. data/lib/textcat_ngrams/czech-iso8859_2.lm +400 -0
  23. data/lib/textcat_ngrams/danish.lm +400 -0
  24. data/lib/textcat_ngrams/dutch.lm +400 -0
  25. data/lib/textcat_ngrams/english.lm +400 -0
  26. data/lib/textcat_ngrams/esperanto.lm +400 -0
  27. data/lib/textcat_ngrams/estonian.lm +400 -0
  28. data/lib/textcat_ngrams/finnish.lm +400 -0
  29. data/lib/textcat_ngrams/french.lm +400 -0
  30. data/lib/textcat_ngrams/frisian.lm +400 -0
  31. data/lib/textcat_ngrams/georgian.lm +400 -0
  32. data/lib/textcat_ngrams/german.lm +400 -0
  33. data/lib/textcat_ngrams/greek-iso8859-7.lm +400 -0
  34. data/lib/textcat_ngrams/hebrew-iso8859_8.lm +400 -0
  35. data/lib/textcat_ngrams/hindi.lm +400 -0
  36. data/lib/textcat_ngrams/hungarian.lm +400 -0
  37. data/lib/textcat_ngrams/icelandic.lm +400 -0
  38. data/lib/textcat_ngrams/indonesian.lm +400 -0
  39. data/lib/textcat_ngrams/irish.lm +400 -0
  40. data/lib/textcat_ngrams/italian.lm +400 -0
  41. data/lib/textcat_ngrams/japanese-euc_jp.lm +400 -0
  42. data/lib/textcat_ngrams/japanese-shift_jis.lm +400 -0
  43. data/lib/textcat_ngrams/korean.lm +400 -0
  44. data/lib/textcat_ngrams/latin.lm +400 -0
  45. data/lib/textcat_ngrams/latvian.lm +400 -0
  46. data/lib/textcat_ngrams/lithuanian.lm +400 -0
  47. data/lib/textcat_ngrams/malay.lm +400 -0
  48. data/lib/textcat_ngrams/manx.lm +400 -0
  49. data/lib/textcat_ngrams/marathi.lm +400 -0
  50. data/lib/textcat_ngrams/mingo.lm +400 -0
  51. data/lib/textcat_ngrams/nepali.lm +400 -0
  52. data/lib/textcat_ngrams/norwegian.lm +400 -0
  53. data/lib/textcat_ngrams/persian.lm +400 -0
  54. data/lib/textcat_ngrams/polish.lm +400 -0
  55. data/lib/textcat_ngrams/portuguese.lm +400 -0
  56. data/lib/textcat_ngrams/quechua.lm +400 -0
  57. data/lib/textcat_ngrams/romanian.lm +400 -0
  58. data/lib/textcat_ngrams/rumantsch.lm +400 -0
  59. data/lib/textcat_ngrams/russian-iso8859_5.lm +400 -0
  60. data/lib/textcat_ngrams/russian-koi8_r.lm +400 -0
  61. data/lib/textcat_ngrams/russian-windows1251.lm +400 -0
  62. data/lib/textcat_ngrams/sanskrit.lm +400 -0
  63. data/lib/textcat_ngrams/scots.lm +400 -0
  64. data/lib/textcat_ngrams/scots_gaelic.lm +400 -0
  65. data/lib/textcat_ngrams/serbian-ascii.lm +400 -0
  66. data/lib/textcat_ngrams/slovak-ascii.lm +400 -0
  67. data/lib/textcat_ngrams/slovak-windows1250.lm +400 -0
  68. data/lib/textcat_ngrams/slovenian-ascii.lm +400 -0
  69. data/lib/textcat_ngrams/slovenian-iso8859_2.lm +400 -0
  70. data/lib/textcat_ngrams/spanish.lm +400 -0
  71. data/lib/textcat_ngrams/swahili.lm +400 -0
  72. data/lib/textcat_ngrams/swedish.lm +400 -0
  73. data/lib/textcat_ngrams/tagalog.lm +400 -0
  74. data/lib/textcat_ngrams/tamil.lm +400 -0
  75. data/lib/textcat_ngrams/thai.lm +400 -0
  76. data/lib/textcat_ngrams/turkish.lm +400 -0
  77. data/lib/textcat_ngrams/ukrainian-koi8_u.lm +400 -0
  78. data/lib/textcat_ngrams/vietnamese.lm +400 -0
  79. data/lib/textcat_ngrams/welsh.lm +400 -0
  80. data/lib/textcat_ngrams/yiddish-utf.lm +400 -0
  81. data/lib/training_data/ar-utf8.txt +54 -0
  82. data/lib/training_data/bg-utf8.txt +26 -0
  83. data/lib/training_data/cs-utf8.txt +48 -0
  84. data/lib/training_data/da-utf8.txt +159 -0
  85. data/lib/training_data/de-utf8.txt +569 -0
  86. data/lib/training_data/el-utf8.txt +48 -0
  87. data/lib/training_data/en-utf8.txt +81 -0
  88. data/lib/training_data/es-utf8.txt +185 -0
  89. data/lib/training_data/et-utf8.txt +50 -0
  90. data/lib/training_data/fa-utf8.txt +42 -0
  91. data/lib/training_data/fi-utf8.txt +83 -0
  92. data/lib/training_data/fr-utf8.txt +191 -0
  93. data/lib/training_data/fy-utf8.txt +22 -0
  94. data/lib/training_data/ga-utf8.txt +109 -0
  95. data/lib/training_data/he-utf8.txt +116 -0
  96. data/lib/training_data/hi-utf8.txt +49 -0
  97. data/lib/training_data/hr-utf8.txt +80 -0
  98. data/lib/training_data/hu-utf8.txt +87 -0
  99. data/lib/training_data/io-utf8.txt +41 -0
  100. data/lib/training_data/is-utf8.txt +94 -0
  101. data/lib/training_data/it-utf8.txt +228 -0
  102. data/lib/training_data/ja-utf8.txt +200 -0
  103. data/lib/training_data/ko-utf8.txt +147 -0
  104. data/lib/training_data/nl-utf8.txt +215 -0
  105. data/lib/training_data/no-utf8.txt +281 -0
  106. data/lib/training_data/pl-utf8.txt +120 -0
  107. data/lib/training_data/pt-utf8.txt +214 -0
  108. data/lib/training_data/ro-utf8.txt +66 -0
  109. data/lib/training_data/ru-utf8.txt +310 -0
  110. data/lib/training_data/sl-utf8.txt +263 -0
  111. data/lib/training_data/sv-utf8.txt +174 -0
  112. data/lib/training_data/th-utf8.txt +49 -0
  113. data/lib/training_data/tk-utf8.txt +101 -0
  114. data/lib/training_data/todo/af.txt +114 -0
  115. data/lib/training_data/todo/amharic-utf.txt +95 -0
  116. data/lib/training_data/todo/arabic-windows1256.txt +157 -0
  117. data/lib/training_data/todo/armenian.txt +86 -0
  118. data/lib/training_data/todo/basque.txt +136 -0
  119. data/lib/training_data/todo/belarus-windows1251.txt +97 -0
  120. data/lib/training_data/todo/bosnian.txt +97 -0
  121. data/lib/training_data/todo/breton.txt +159 -0
  122. data/lib/training_data/todo/bulgarian-iso8859_5.txt +115 -0
  123. data/lib/training_data/todo/catalan.txt +93 -0
  124. data/lib/training_data/todo/croatian-ascii.txt +104 -0
  125. data/lib/training_data/todo/esperanto.txt +95 -0
  126. data/lib/training_data/todo/estonian.txt +218 -0
  127. data/lib/training_data/todo/frisian.txt +99 -0
  128. data/lib/training_data/todo/georgian.txt +86 -0
  129. data/lib/training_data/todo/greek-iso8859-7.txt +139 -0
  130. data/lib/training_data/todo/hawaian.txt +108 -0
  131. data/lib/training_data/todo/hebrew-iso8859_8.txt +79 -0
  132. data/lib/training_data/todo/hindi.txt +77 -0
  133. data/lib/training_data/todo/hungarian.txt +102 -0
  134. data/lib/training_data/todo/icelandic.txt +131 -0
  135. data/lib/training_data/todo/indonesian.txt +93 -0
  136. data/lib/training_data/todo/irish.txt +209 -0
  137. data/lib/training_data/todo/latin.txt +120 -0
  138. data/lib/training_data/todo/latvian.txt +126 -0
  139. data/lib/training_data/todo/lithuanian.txt +99 -0
  140. data/lib/training_data/todo/malay.txt +108 -0
  141. data/lib/training_data/todo/manx.txt +78 -0
  142. data/lib/training_data/todo/marathi.txt +100 -0
  143. data/lib/training_data/todo/mf.txt +100 -0
  144. data/lib/training_data/todo/middle_frisian.txt +102 -0
  145. data/lib/training_data/todo/mingo.txt +146 -0
  146. data/lib/training_data/todo/nepali.txt +131 -0
  147. data/lib/training_data/todo/persian.txt +73 -0
  148. data/lib/training_data/todo/quechua.txt +108 -0
  149. data/lib/training_data/todo/romanian.txt +103 -0
  150. data/lib/training_data/todo/rumantsch.txt +110 -0
  151. data/lib/training_data/todo/sanskrit.txt +135 -0
  152. data/lib/training_data/todo/scots.txt +490 -0
  153. data/lib/training_data/todo/scots_gaelic.txt +93 -0
  154. data/lib/training_data/todo/serbian-ascii.txt +121 -0
  155. data/lib/training_data/todo/slovak-ascii.txt +102 -0
  156. data/lib/training_data/todo/slovak-windows1250.txt +115 -0
  157. data/lib/training_data/todo/slovenian-ascii.txt +100 -0
  158. data/lib/training_data/todo/slovenian-iso8859_2.txt +96 -0
  159. data/lib/training_data/todo/sq.txt +110 -0
  160. data/lib/training_data/todo/swahili.txt +120 -0
  161. data/lib/training_data/todo/tagalog.txt +135 -0
  162. data/lib/training_data/todo/tamil.txt +123 -0
  163. data/lib/training_data/todo/turkish.txt +117 -0
  164. data/lib/training_data/todo/ukrainian-koi8_r.txt +214 -0
  165. data/lib/training_data/todo/vietnamese.txt +92 -0
  166. data/lib/training_data/todo/welsh.txt +148 -0
  167. data/lib/training_data/todo/yiddish-utf.txt +83 -0
  168. data/lib/training_data/uk-utf8.txt +75 -0
  169. data/lib/training_data/vi-utf8.txt +47 -0
  170. data/lib/training_data/zh-utf8.txt +228 -0
  171. data/test/language_detector_test.rb +78 -0
  172. metadata +232 -0
@@ -0,0 +1,157 @@
1
+
2
+
3
+
4
+ �������� ������� ������� ������.
5
+ ����� ����� �� ����������
6
+ ������ - ����� - ����� ������
7
+ ����� �������� �����
8
+
9
+
10
+ ��� �� ��� ����� ���� ������� ����������...
11
+ ������ ����� �����...
12
+ ����� �� ����...���� ��������...���� ��������...
13
+ ���� . ����� ������ �� ���� ��� ���� ��� ����� .
14
+ ����� ���� ���� ��������...
15
+ � ����� ��� ������� ����� ������ ���� ��� �� ��� ������� ��� � �����
16
+ ���� ������� ���� - ��� �� �������-
17
+ ���� ����� �����...
18
+
19
+ ���� ����� ������� ������ ����:
20
+ �� � ����� ����� �� ��������� ���� �� ������� ������� .
21
+ ����� �������� ��� ����.
22
+
23
+
24
+ ����� �����
25
+ ����� ������...
26
+ �� ����� ������ �� ��������� ����� ��� ������� ���� ������� . ��� ���
27
+ ��� ���������� ������� ��� ��������� ������� � ������ ���� �� ������
28
+ � ����� ����� ����� : ����� ��� ������� ������� ������� ������ ���� ��
29
+ ������� ������� �� ���� ���� ������ ������ ��� ��� ���� ������ ������
30
+ - 17 -
31
+ ������ ��� ������.
32
+ ��� �� ��� ������ ������ ���� ��������
33
+ ��� ��� ������ ���ǡ
34
+ ��� ������ ���� ���� ������.
35
+ ������ - ����� - ����� ������
36
+ ���������...
37
+ ������ ���� �����
38
+
39
+ ������ ����� ��� ����� ������...
40
+
41
+ ���� ����� �� ��� ��� ���� ���� ���� ����� �� ���� ��� ���� ���� �����
42
+ ����� ������ ��������
43
+ ����� ��� ���� ��������...
44
+ (������ : ����� ����� ����� �����)
45
+ ����� ����� �����
46
+ ����� �����...
47
+ ���� �� ������ ������ �� ��� ������� ������ ��� ���� ���� � ��� ����
48
+ ������� �� ���� ������� �������� ����� � �� ��� �������� �� ������ �����
49
+
50
+ �������� ���������...
51
+
52
+ ����� ����� �� �� �����...
53
+ �������� .
54
+
55
+
56
+
57
+ ��� ����� ������� �� ����� ���� ����� ���� ����� ����� ����� ��� ��������
58
+ �� ������ ������ �� ��� ��� ������� ������ ��� ���� ���� �� ���� .
59
+ ����� ������� �� �������.
60
+
61
+ �� ����� ��� ���� ��� �� ����� ������ ������� ��� ���� �� ������ .
62
+ ����� ������...
63
+
64
+ ����� �� ������ ������.
65
+
66
+ ����� ���� �� ����������.
67
+
68
+
69
+ ����� ��� ��������
70
+ ���� ����� ��� ������� �� ��������� ����� �� ������ ��� ����� ��������
71
+ ����� �� ������� �� ���������
72
+
73
+ �� � ����� ����� �� ��������� ���� �� ������� ������� .
74
+ ������ ������� ����� ����� ��� �����. ���� ���� ��������� �� ������ ���
75
+ ������ ��� �������� ��� ������.
76
+
77
+
78
+
79
+
80
+ - 12 -
81
+ ������ ��� ��� ���� ������ ����� �� ���� ������ �� ���� �� ���� ����
82
+ �� ���� ����� ���� ���� ����� �� ������ �� �� ���� ����� �� ������� ����
83
+ ��� ������ ������... ��� ������ ������...
84
+ ����� ��������...�� ������� ���������...
85
+ ������ ���� ��� ��� ���� ���� � ������� ������� ��� ����� ������ ����
86
+
87
+ ����� ������ ��� ������� ���� �������.
88
+
89
+ ������� ��������� ���� ����� ��� ����� �� ������ ���� ����� ����� ������
90
+ �� �� ���� ������ ������ ������ ����� ��� ���� ����� ������ ���� �������
91
+ ������ ����� �����...
92
+
93
+ ������� �� ������ ��������...
94
+ ���� �� �� ����� ������ �� ���� ����� �� ����� � ����� ���� ��� ��� ����
95
+ �������� ���� ���� ��� ����� ����� ������� .
96
+
97
+ ��� ���� �� ����� ��������...
98
+ ���� ����� �������� ��� ����� �������...
99
+ ����� ��� ���� ��������...
100
+ ��� ������ ���� �������� ��� �����.
101
+ ����� �� �� ��� ��� ���� ������� ����� ����� ��� ��� ����� ���� ��� �����
102
+ ����� �� �� ��� ��� ���� ������� ����� ����� ��� ��� ����� ���� ��� �����
103
+ ����� �� ������� ���� ������
104
+ ������� ����� ��� ���� ����� � ����� �� ���� ����� ����� �������� � ���
105
+
106
+
107
+ ���� ����� ������� ������ ����:
108
+
109
+ ������ ��� �����.
110
+ ����� ������� �� �����.
111
+ ���� ��������...
112
+
113
+ ����� �� ����� ������ ���� �����
114
+
115
+ ������ - ��� ������ ���� ����� -
116
+ ���� ����� ��� ���������!!
117
+ ����� ������...
118
+ ������� ��� ������� ��� ����� ���������...
119
+ ����� ��� ���������...
120
+
121
+ ����� ��������...���� ��������...
122
+ ���� �������� ��� ������...
123
+ ���� ����� ��� ������� �� ��������� ����� �� ������ ��� ����� ��������
124
+ ������ ���� ����� ������ ������
125
+ ����� �� ������ ������.
126
+ ��� ��� ��� ����� ���� ����� �� ��� ��� ���� ���� ����� ��� ��� ���.
127
+ ���� ��������...
128
+ ���� ��� ������ ��� ��� ��� ���� ��� ����� ����� ����� ��� ������� ������
129
+
130
+
131
+ ����� ��� ��������
132
+ �������� ���� ���� ��� ����� ����� ������� .
133
+ �� ����� ������ �� ��������� ����� ��� ������� ���� ������� . ��� ���
134
+ ����� ������� �� �������.
135
+ ��� ����� ������
136
+
137
+ �������� �� ����� ������ ����� �������� ������ ��� ����� ����� . �������
138
+ ����� ������� �� �����.
139
+ ���� ����� ��� ����� ����� ����...
140
+ ������� ��� ���� ���� ����� ��� ���� ����� � ��� ���� ���� ������ �������
141
+ ��� ���� ������ ������ � ���� ���� ��� ����� ���� ���� ��� ����� ����
142
+ ��� ��� ���� ��� ���� �� ��� ��� ����� ��� �� ���� ��� ����� ��� ����
143
+
144
+
145
+ ����� ������ ��� �����...
146
+
147
+ ������ ������� ������ �����.
148
+ ���� �� ����� ����� �� ������ ���� ������ ����� �� ���� ������ �����
149
+ ������� ���� ����� ���...������ �� ������...
150
+
151
+
152
+ ������ - ����� - ����� ������
153
+ ��� ���� ������ �� �� �� ���� �� ������� ������ �� ������� �������� ����
154
+ ����� ���� ����� ����� ����� ����� ����� � �������� ��� ��� ����� ����
155
+ ����� ����� �����
156
+ ������� ������...
157
+ �� ����� ��� ���� ��� �� ����� ������ ������� ��� ���� �� ������ .
@@ -0,0 +1,86 @@
1
+ �� �� �� ������󑩁� ���큫��󑩁� ��������� ���� �
2
+ ������ ��끃�� ����������� �����󧫉��:
3
+ �� ݻ���� ����ݻ�:
4
+ - ����ѳϳ�������� ѳ�������� ѳٳ�: ��ϳ�� � �����, �� ٻ�
5
+ - ����� ������ �������� ��� ����� ����� г۳�����
6
+ �끣, ����󑩯� ����� ����� �� ������ �: ������ ��� ��
7
+ ���� �󫉕�� ����� 퉣������ ��� ��� �멁����, �ﯫ� ����
8
+ - ��� �� �DZ ѳݷ���� ų�ݷ�ϳ� ������������ݻ��:
9
+ �� �� ������ ����� �� ����� �󫉧
10
+
11
+ ϳ�ٳϻ���������ݻ���, ����� ݳ�� ���ݳϳ� �����ݻ���:
12
+ ��ϳ�� ѳ���, �� �� û �ٻ� �� ����������� ��� ���� ϳ� �����
13
+ �����> ��ٳ���, ����ݻ�� 㵻��: �ϳ�� ��� �� ���� ��ݳ�۳�
14
+ ����� �����󑩯�� ���� �: ��� ���� �� �� �����
15
+ �, û г۳���۳� �ϻջ��� �������� ϳ��� � ѳϳ���� �� ��ݻ� ٻ�
16
+
17
+ �ϻջ��ݻ� �� �������, ���� �ϳ, ��ѳݳ �� �᷻���ϳ� �ϳ:
18
+
19
+ ѳ�������, �� �ٳ�� �� ������, ���� �� ٻճ��� ��:
20
+ ѳٵ���ٳ� ����, �� ��� ��ݻ��� ѳݹ���` ��˳������� �� �: �廱��
21
+ ��˳���� ��ݳ� ѳٳ���ݻ�� ���ݳ���ٵ.
22
+ ���˳�� ������, �� �ϳ�� �� ѳ������: �����ѻ�� ������ݻ��
23
+ ��˳���� ϳ�����������: �� �� �ϳ г۳���, ����� ����������
24
+ ��� ��� ���, �� �������� ���������� �������󑩯�:
25
+ ѳ��ϳϳ� ��� ϳ�����ݻ�: ��� ѳ�� �, �� ٻ��` ѳۻ��, ������
26
+ �����󑩯� �����, ����镫 ��� ��: ���� �� ��� �� ����髯� ���
27
+ ��� ��� �������� �� ���� �סּ����� ��� ����: �竉 ����, ��
28
+ ��ϳ�� ���ɻ�, �� ��� ����� �ϳ: ���� ����� ���dzɳϳ�
29
+ �Ͻ���������, �����ó��� ������ݻ� �� ѻ���� (ٳ��� ������� �����
30
+ 300 ��� ��� ��������ٳ� ѳٳ� �� ������` ������� ѳ����
31
+
32
+
33
+ ��� � ���� в� ���Ⱥ��Ʋ��
34
+ ������� �����끛��� ቫ 񁫝���� ��鉗 ��灩�󑩁� ���
35
+ ѻ�� �۹ ����ݳѳ�����۳�, �۹ ���ݳ����ݳϳ� ٻ˳�ǽ�ݻ��
36
+ ���� �, ������󑩯󫫉� ��� ���� �󫉫, �� ����󑩯� �����
37
+ �ϳݹ�ݳ�۳� ����ݻ�� ׳ݳ���� �� ������ ����ϳ� ����ٳ�
38
+ �� ���ϳ۳ϳ� ��������۳� ��ٳ�ݻ���� ��˳�� ����� �� �����ݳ���:
39
+
40
+
41
+ ݳ˳����߳��۳� ����� ѳٻٳ����۳ٵ:
42
+ ����� ѻ� ѳ�������� ѳٳ�, �ųݹ�ϻ���, �����
43
+ ��� ��񳵻���� � �����ݳ�����۳� �׳�����ݳ����۳��, �� <�û
44
+ ������� ����� � ���� ������ ��ӳ���� ���ݻ��� ��׳���:
45
+ ���ね�に� ���:
46
+ ϳ����ϳ� ϳ�����ݻ�� ݻ�ϳ۳������ݻ�: ���㹻� ٻ� �ɳ�ݻ�� �߳�����
47
+
48
+ ϳ����, ���ٻ�ϳ� �� ѳٳ���˳� ٻ� ϳ�ٳϻ�����۳� ٳݹ����,
49
+ ��������� ������ ����� ���� ��� ���� ׷ݳų���. ���-�� ��
50
+ ٻ�, �����, ��� ��� ������, ������� �����: γ� ��� ϳ� ��� �����
51
+ <ѳ�� �ϳ>, ˳����� ��� ������ ������� ѻ�:
52
+
53
+
54
+ ��竁󑩯󫫉 �偝� �� ��������� ������� ����
55
+ ��� � ��������뉗, �� �� ���㫇�� �� ��� ���-�� �흁�����
56
+ û���� ��� ���ݹ��� �� �۹����� ѳ�ݻ� �� �dz�� �ճݻ��
57
+
58
+ ������ݻ��� ѻ�� ���� ���� ����������: γ�˳���߳���� ���, ��
59
+ - ��� ����, �� �� ቧ �����遫�� ��񕯫��� �����󑩯󫫉�
60
+ ��� �� ��� ������ ���󩑏, ��� ��������� ���: ������� ���
61
+ �� ���-� �������� �, �� �篣�󑩯� ��, ���駕�, ����� �:
62
+ �큟��, �� ��� �������� ��� ���� ��� ��, �火��� ��, ��
63
+ ��� � ϳٳ�-ϳٳ� ٳ����� ٻ� ������: ���� �������۳� ����� ٳ���
64
+ ��ﯣ �� ��灩�� ���� ������ �� ����񫯣��� ��
65
+ 95�. ��ٳݳ�����۳� <�ݹ��������> ѻ�� ���߻� ���ϻݹ�ݳ�ݻ�
66
+ ����ݳϳݳ�� óջ��� ��� ݻ�����ݻ�� �� ��ﳹ�ϳ� ������ ����
67
+ ����髯󑩯� �����, �������灝�, �� �� ��火� ���:
68
+ �������������� ������ �� ����� ��������: ��� ���� �` լ��
69
+ ��������� �� ���>,- ��� � ���镧 ���鉣����:
70
+ �߳�ٳ� �� �����ٳ� �ݳ��������, ѳ�������������� �� ��������� ��
71
+ - ����� �� ͻ� ������ ���ݳϳ� ѳ����:
72
+ ���� �� ���� �� ��� ��������� ����󧫉� ���뉫 �� ������,
73
+ ������󑩯��, ��� �������� ���� �: ����� ������,
74
+ ����끫���� ������ ��, �� ��������� ����� �� ��� ��
75
+ ����ӳϳ�� �ϳ ���� ���� ϳ� �������, �� ���ݳ���۳�� ��ӳٵ
76
+ �ݹ������ ���:
77
+ ������ �� ��� �篣�󑩯� �� ������󑩯�:
78
+ ����ٳ��, ��ɻ� ���� ��ݻݳ� ѻﳷ� �������������ݻ�� ѳٳ�:
79
+ ��ﳹ�����, ݳ������ ѳ��ݳϳ� ������ ����� ݻ����������: �
80
+ �����ݳ���� ���������۳� ٻ� ��ݻ� ��˳��������ݻ�� ѻ�, ���� ��
81
+
82
+ 靋����������` ���� ������ �������󑩁� ��큙����: ����, ��
83
+ �� �����۳��� ݻ�ϳ۳���� ٻճ������` �.���ѳ����۳�� �߻�, ��
84
+ ѻ�� � ��ݳ���� ���, ��� ���� ݳ˳�����۳��:
85
+ - ��灙�運��� ������� ���� ����, �� �����韛� ���񕁫, ��
86
+ ��陁��: ��������� �鉧, �� ��� ����� ����󑩁�� ቫ
@@ -0,0 +1,136 @@
1
+ perifrasietara mugatzen ez bagara. Adibidez:25
2
+
3
+ Cambridge University Press.
4
+
5
+ Euskalki guztietan, ezin elementuaz osatutako perifrasiak erabil
6
+
7
+ 3.2. EZIN IZAN
8
+ (14b) ulertu + behar duzu
9
+
10
+ Brunot ezin zen baliatu gaurko kontzeptu pragmatiko eta linguistikoez.
11
+ A.K.: Ofizialki ez. Aztertzaileek ohar bat idazten dute beren txosten
12
+
13
+ Badaude, alegia, 3.3.2 eta 3.3.3an aipatutako bi joerak berak. Euskara
14
+
15
+
16
+
17
+ zer gertatuko den derrigorrez), (2)an posibilitatea (mundu horretan zer gerta
18
+
19
+
20
+ A.K.: Asko. Mundu bat dago hor. Kontzeptu batzuk hizkuntzen irakaskuntzan
21
+ modaltasun epistemikoak hiztunaren sinesmenak adierazten ditu. Ondoko bi
22
+
23
+
24
+ ateratzen duen Euskaltzaindiko batzordeko partaide da aspaldiko partez.
25
+ A.K.: Ez dakit oraindik. Ez dut astirik izan ongi aztertzeko non komeni
26
+ daitezke.10 Hizkuntza desberdin askotan formalki agerian egoten diren
27
+ (43a) *esateko beharrik
28
+ azken urteotan egiten ari diren ikerketak interes haundikoak izan daitezke
29
+ 3.3. BEHAR IZAN
30
+ Herrian finkatu naiz, hasieran Donostian eta azken lau urteotan Zarautzen.
31
+ urruti samar dago nik ulertzen dudan kontzeptutik. Bestalde, G. Leech
32
+ batetatik, geruzapena delako kontzeptuaz ere balia gaitezke.13 Frantses
33
+
34
+
35
+
36
+
37
+
38
+ luzatzea, denbora minimoan egiteko apostu egin nuen. Eta hala egin nuen.
39
+ buruz beste bat hasita daukat. Eta berriena: miscellanea idiomatica delako
40
+ litzateke egokia eros(i) nezake (bizkaieraz neike) eta joan ninteke
41
+
42
+ Halere, azken urteotan nahaste bat gertatzen ari da zenbait hiztunengan,
43
+ *Euskal Herrian Euskaraz. Euskararen defentsarako herri mugimendua
44
+ Forma gramatikalizatuagoen esanahiak orokorragoak, zabalagoak eta
45
+
46
+ (E) Baliabide linguistikoen zerrenda ez da amaitzen hemen aditzezko
47
+
48
+ zenbait baliokide erabili ohi diren testuinguruetara larregi zabaltzea.
49
+
50
+
51
+
52
+ Euskaltzaindia (1987). Euskal gramatika: lehen urratsak, 2. tomoa. Bilbo: Euskaltzaindia.
53
+
54
+
55
+
56
+
57
+ epistemikoa adierazten baitu,18 adibidez:
58
+
59
+
60
+ gramatiketan aipatu ohi diren aditz modalen ezaugarri nagusiak2 -ezaugarri
61
+ 26. Wilbur-entzat (1981:172) ahal, behar eta nahi "root-modal particles"
62
+ Kategoria semantiko gisa, aldiz, modaltasun kontzeptua edozein
63
+
64
+
65
+ daukagu; hau egiazko aintzindaritzat emango nuke. Orain dela bi urte,
66
+ bihar edo) beharbada modaltasun epistemikoa adieraz dezakete.
67
+
68
+
69
+ eta J. Svartvik-en 1975eko A communicative grammar of English delakoa
70
+ moduan erabili duzula interesatzen zaizkizun puntu batzuk aztertzeko?
71
+
72
+ Behar bezala, nahi berez izena da, nahiz nahi-ren izenezko erabilera
73
+
74
+ derrigorrez sinonimotzat jotzen direnik, baizik eta hein batetako kidetasun
75
+ ideiari jarraituz idatzi zen lehenengo hizkuntz deskribapena; jakina,
76
+
77
+ Galdera: Ematen da notarik edo bestelako kalifikapenik?
78
+ A.K.: Badago, bai. Bistan dago Atalase Maila tresna "aplikatu" eta praktiko
79
+ Euskarazko gauza pare bat orrialde hauetan bertan osorik irakur daitezke:
80
+
81
+ zaidan kaleratzea, ezta nor egongo litzatekeen argitaratzeko prest ere.
82
+ acts kontzeptua dute iturri, baina kontzeptua geroztik oso landua izan
83
+ berriro--hots, (55) eta (56), (55) eta (57) erabiltzea baino hobe:
84
+
85
+
86
+
87
+
88
+
89
+ hau da, ea gramatika deskribapen "osorik" aurkitzen den munduan. Baina
90
+ haundia da, dedikazio gehiegi eskatuko luke, eta suposatzen duen ezagupen
91
+
92
+ hitza dakarkidala burura, asoziazioz edo). "Epaimahai" bezala, bi kanpoko
93
+
94
+ 7. Hegoaldeko euskaran; iparraldeko hizkeretan, berriz, (2)ko egiturak
95
+ gogoa eduki < nahi izan < �
96
+
97
+ Lhande, P. (1926). Dictionnaire basque-fran�ais. Paris: Gabriel Beauchesne.
98
+
99
+ gero eta presio gehiago egiten ari da Inglaterran tesiak lehenbailehen
100
+
101
+ kasua, non derrigorrezkoa baita ahal izan-en erabilpena (edo beste
102
+ erabilpena nahi-rena baino are murritzagoa dela dirudi.
103
+
104
+
105
+
106
+ dela inoiz egingo?
107
+
108
+
109
+ unibertsitateko tesi doktorala denez, inglesez dago noski. Luzeraz, 400
110
+ erabileran berean ez ezik, zuzentasunari buruzko kontzeptuetan ere. Konfusio
111
+ ditu, bereizketa zenbait arrazoi sintaktikotan oinarritzen dituelarik.
112
+ gerundiboa bezalatsu erabilirik).24
113
+ besteak beste, inoiz berezitzat hartu dituzte ikuspegi sintaktiko batetatik,
114
+ posibilitatea edo ez-segurtasuna
115
+ A.K.: Ez dut uste neronek bakarrik tamaina haundiko euskal gramatika
116
+ Eta 1993ko abenduan Londresko Unibertsitatean doktoratu egin zen linguistikan,
117
+
118
+ 12. King (1993:110).
119
+ probetxagarriak gramatika komunikatiboaren teoria lantzerakoan?
120
+
121
+
122
+ ahozko azterketa bat da, "viva voce" deitzen dena (edo laburturik, "viva"
123
+
124
+ Euskarazko Orrialdea
125
+
126
+ *IXA taldearen orria
127
+ (deskribapen morfosintaktikoa, alegia). Gramatika komunikatibo batean,
128
+
129
+ A.K.: Izugarrizkoa. Hitz gutxitan, pragmatikan aztertzen dira linguista
130
+
131
+
132
+
133
+
134
+
135
+
136
+ Wilbur, T.H. (1981). Basque syntax. Euskalarien nazioarteko jardunaldiak, pp. 169-186,
@@ -0,0 +1,97 @@
1
+
2
+ �i��-�������� ��i��i������ ���i���� ����i ������� ������ i
3
+ �����) � ��������� ������ ��� ������. ��� ��������� �� �i���
4
+ i���� ����� �����i����, ��� �� ���� ���������: ����, ���� i ����.
5
+ ��������� ��������i, ��������� I�i�.
6
+ �����. � �����i �������� ���������� �i� ������i� ����i��������
7
+ �i��� ������ �����i�����-������������ ��� �������i.
8
+ 1997) �� �����.
9
+ ������������ ������ ���i�i���. ��� �� ����i����� ����� ��
10
+ �������� ������������ �������� ������ ��������� ����� �i����� I��������.
11
+ ����� �� ��������. �� �� ����������� �������� �����������
12
+ ������i� (������i���� ����������), ����i���i ������i��i��� I����
13
+ �������� ������������ �������� ������ "��������
14
+ ��������� ���������� ������i��� ��������i��. � ������i � ������i�
15
+ �����������. ��������� ��� ���i������ �... ���� ������-�����������
16
+ �������i-�������������i � ����i i ����i��, � ���� �i ���� ���i� ��
17
+
18
+ � �������i �i�����i ����i�� ��������� ����i i ������,
19
+ ����� ����������� ������? �� �� ��� �i ����, ��� ����� ������i� i�
20
+ ���������� �i������ ����i���� ������ ������������i. � ���� ��� --
21
+
22
+ ����������. �� ������� ���������� ��� �� ���'������ �������, �
23
+ ������ �����������i� (�����).
24
+ ����i����� ����������. ������� ����� ����� i ��� ��������
25
+ �������i.
26
+ ������i, ���������i� ����i-������ I��� ������ ������� ���������� �
27
+ ���������", ������ �������, �i������ i ���������, � �������
28
+
29
+ ���������� ���� ������. ����������� �� ���i, ������ ����� ����
30
+ eve@nil.belpak.minsk.by
31
+ I�������. � ������i�� �� ������i � ��������.
32
+ ������i���� �������� ������� ������i��� � ����i� ����i i ��������
33
+
34
+ ���� ���� ��� ���, ��������i ������ ���������i�i ������ ����: ���
35
+
36
+
37
+ ��� �������� �����, i ����� ��� ������ ���� � �������i �����i� i,
38
+ �������� ������������ �������� ������ "�������� �����".
39
+
40
+
41
+ ����, ���� i ���� ��� ����� �� �����. ��� ����� �����i������ ����,
42
+ ����i��������. ������ ����, �� ������� ��� �'���� ���i ���������
43
+ ���������� -- �� ���� �� ��������.
44
+ ����� ������i�.
45
+ ����������� ��� � ���, ���, ��������� ����������� "�������", ��
46
+ ��i��-i������������i���. ����� �� �'����� ���� �����i�������� ����
47
+ 1997) ����� ����� � ����i�� (12.08.97)
48
+ ����� ������� i ����� ��� �������i�...
49
+
50
+ �������� "���������" ����� ���� ����������� ���'i ������������
51
+
52
+ ���� �� ��������, ��������� ��i��� (11.09.97)
53
+
54
+ ���������� "��������� ������" (10.09.97)
55
+
56
+ ���������� ����� �������� �� ����, ��� ���������� �� �����, ��
57
+
58
+
59
+ �����i������ � ������, ���� ��������� � ������� �i����.
60
+ �i���� � 900 (12.09.97)
61
+
62
+ � ����� ����������� �i��������� i �����.
63
+ ��������� ������. ��i� ����� ������� i ��������� �� 16 �� 18
64
+ �������� -- �� ��������, ��� ����������� �� ���'i ������� ������
65
+ ��������i ���������� i ���i ������� � ������i; ��i����
66
+ �������� ������������ �������� ������ ��������� ����� �i����� I��������.
67
+ -- � ��� ����� ������i�� �����i; �����i� �� ���i��� -- �������;
68
+ ���������� �i�������� � ��������i ���������� ������� �������i.
69
+ �����i������ � ������, ���� ��������� � ������� �i����.
70
+ �����������. ��������� ��� ���i������ �... ���� ������-�����������
71
+ ����������� "���i���" ������i�� ����� ����'������
72
+
73
+
74
+ �������� ������������ �������� ������ ��������� ����� �i����� I��������.
75
+ ��������i �������i ����� ����� � ��������� �������. ��� ��������i
76
+ �� ����� ������� ����� i ������� ��� ����� �������� ����� ������i�
77
+
78
+ ����i����� ����� �� ������i���� ���������i ��i��i�����
79
+
80
+ ��������� ����i, ����i��, �i�������, ���, �i�������, ������ii,
81
+ � ������ ������ ������i ����� �i����i�i ������i� �����i����� �
82
+
83
+ � ����i���i� ����� ��������, �i������� i �����i ������
84
+ �����) � ��������� ������ ��� ������. ��� ��������� �� �i���
85
+ �����������i ���� ����������� �������� �������, �����������
86
+ �����i������ � ������, ���� ��������� � ������� �i����.
87
+
88
+ �����i������ � ������, ���� ��������� � ������� �i����.
89
+
90
+ ������ ��i������ �����i ������i�i ������������� �����, ��� ����
91
+ ��������� ����i� ������� ��������i� ����������� ���������,
92
+ ������i��� � ������ "�i�����i ���'��" i i���� ���������� i
93
+ � ����� � ���i�� ���� "���� �������� ������". �� �i����
94
+ ��������i, ���i, �����i i ������i � ����� ������
95
+ � ���������� ����� �� �i�����i��� ����� ��i���� 3
96
+ � �������i �i�����i ����i�� ��������� ����i i ������,
97
+ �������� � ������ ���� �������� �����i�.