language_detector 0.1.0
Sign up to get free protection for your applications and to get access to all the features.
- data/README.rdoc +24 -0
- data/Rakefile +18 -0
- data/VERSION +1 -0
- data/lib/language_detector.rb +232 -0
- data/lib/model-fm.yml +52504 -0
- data/lib/model-tc.yml +53985 -0
- data/lib/textcat_ngrams/afrikaans.lm +400 -0
- data/lib/textcat_ngrams/albanian.lm +400 -0
- data/lib/textcat_ngrams/amharic-utf.lm +400 -0
- data/lib/textcat_ngrams/arabic-iso8859_6.lm +400 -0
- data/lib/textcat_ngrams/arabic-windows1256.lm +400 -0
- data/lib/textcat_ngrams/armenian.lm +400 -0
- data/lib/textcat_ngrams/basque.lm +400 -0
- data/lib/textcat_ngrams/belarus-windows1251.lm +400 -0
- data/lib/textcat_ngrams/bosnian.lm +400 -0
- data/lib/textcat_ngrams/breton.lm +400 -0
- data/lib/textcat_ngrams/bulgarian-iso8859_5.lm +400 -0
- data/lib/textcat_ngrams/catalan.lm +400 -0
- data/lib/textcat_ngrams/chinese-big5.lm +400 -0
- data/lib/textcat_ngrams/chinese-gb2312.lm +400 -0
- data/lib/textcat_ngrams/croatian-ascii.lm +400 -0
- data/lib/textcat_ngrams/czech-iso8859_2.lm +400 -0
- data/lib/textcat_ngrams/danish.lm +400 -0
- data/lib/textcat_ngrams/dutch.lm +400 -0
- data/lib/textcat_ngrams/english.lm +400 -0
- data/lib/textcat_ngrams/esperanto.lm +400 -0
- data/lib/textcat_ngrams/estonian.lm +400 -0
- data/lib/textcat_ngrams/finnish.lm +400 -0
- data/lib/textcat_ngrams/french.lm +400 -0
- data/lib/textcat_ngrams/frisian.lm +400 -0
- data/lib/textcat_ngrams/georgian.lm +400 -0
- data/lib/textcat_ngrams/german.lm +400 -0
- data/lib/textcat_ngrams/greek-iso8859-7.lm +400 -0
- data/lib/textcat_ngrams/hebrew-iso8859_8.lm +400 -0
- data/lib/textcat_ngrams/hindi.lm +400 -0
- data/lib/textcat_ngrams/hungarian.lm +400 -0
- data/lib/textcat_ngrams/icelandic.lm +400 -0
- data/lib/textcat_ngrams/indonesian.lm +400 -0
- data/lib/textcat_ngrams/irish.lm +400 -0
- data/lib/textcat_ngrams/italian.lm +400 -0
- data/lib/textcat_ngrams/japanese-euc_jp.lm +400 -0
- data/lib/textcat_ngrams/japanese-shift_jis.lm +400 -0
- data/lib/textcat_ngrams/korean.lm +400 -0
- data/lib/textcat_ngrams/latin.lm +400 -0
- data/lib/textcat_ngrams/latvian.lm +400 -0
- data/lib/textcat_ngrams/lithuanian.lm +400 -0
- data/lib/textcat_ngrams/malay.lm +400 -0
- data/lib/textcat_ngrams/manx.lm +400 -0
- data/lib/textcat_ngrams/marathi.lm +400 -0
- data/lib/textcat_ngrams/mingo.lm +400 -0
- data/lib/textcat_ngrams/nepali.lm +400 -0
- data/lib/textcat_ngrams/norwegian.lm +400 -0
- data/lib/textcat_ngrams/persian.lm +400 -0
- data/lib/textcat_ngrams/polish.lm +400 -0
- data/lib/textcat_ngrams/portuguese.lm +400 -0
- data/lib/textcat_ngrams/quechua.lm +400 -0
- data/lib/textcat_ngrams/romanian.lm +400 -0
- data/lib/textcat_ngrams/rumantsch.lm +400 -0
- data/lib/textcat_ngrams/russian-iso8859_5.lm +400 -0
- data/lib/textcat_ngrams/russian-koi8_r.lm +400 -0
- data/lib/textcat_ngrams/russian-windows1251.lm +400 -0
- data/lib/textcat_ngrams/sanskrit.lm +400 -0
- data/lib/textcat_ngrams/scots.lm +400 -0
- data/lib/textcat_ngrams/scots_gaelic.lm +400 -0
- data/lib/textcat_ngrams/serbian-ascii.lm +400 -0
- data/lib/textcat_ngrams/slovak-ascii.lm +400 -0
- data/lib/textcat_ngrams/slovak-windows1250.lm +400 -0
- data/lib/textcat_ngrams/slovenian-ascii.lm +400 -0
- data/lib/textcat_ngrams/slovenian-iso8859_2.lm +400 -0
- data/lib/textcat_ngrams/spanish.lm +400 -0
- data/lib/textcat_ngrams/swahili.lm +400 -0
- data/lib/textcat_ngrams/swedish.lm +400 -0
- data/lib/textcat_ngrams/tagalog.lm +400 -0
- data/lib/textcat_ngrams/tamil.lm +400 -0
- data/lib/textcat_ngrams/thai.lm +400 -0
- data/lib/textcat_ngrams/turkish.lm +400 -0
- data/lib/textcat_ngrams/ukrainian-koi8_u.lm +400 -0
- data/lib/textcat_ngrams/vietnamese.lm +400 -0
- data/lib/textcat_ngrams/welsh.lm +400 -0
- data/lib/textcat_ngrams/yiddish-utf.lm +400 -0
- data/lib/training_data/ar-utf8.txt +54 -0
- data/lib/training_data/bg-utf8.txt +26 -0
- data/lib/training_data/cs-utf8.txt +48 -0
- data/lib/training_data/da-utf8.txt +159 -0
- data/lib/training_data/de-utf8.txt +569 -0
- data/lib/training_data/el-utf8.txt +48 -0
- data/lib/training_data/en-utf8.txt +81 -0
- data/lib/training_data/es-utf8.txt +185 -0
- data/lib/training_data/et-utf8.txt +50 -0
- data/lib/training_data/fa-utf8.txt +42 -0
- data/lib/training_data/fi-utf8.txt +83 -0
- data/lib/training_data/fr-utf8.txt +191 -0
- data/lib/training_data/fy-utf8.txt +22 -0
- data/lib/training_data/ga-utf8.txt +109 -0
- data/lib/training_data/he-utf8.txt +116 -0
- data/lib/training_data/hi-utf8.txt +49 -0
- data/lib/training_data/hr-utf8.txt +80 -0
- data/lib/training_data/hu-utf8.txt +87 -0
- data/lib/training_data/io-utf8.txt +41 -0
- data/lib/training_data/is-utf8.txt +94 -0
- data/lib/training_data/it-utf8.txt +228 -0
- data/lib/training_data/ja-utf8.txt +200 -0
- data/lib/training_data/ko-utf8.txt +147 -0
- data/lib/training_data/nl-utf8.txt +215 -0
- data/lib/training_data/no-utf8.txt +281 -0
- data/lib/training_data/pl-utf8.txt +120 -0
- data/lib/training_data/pt-utf8.txt +214 -0
- data/lib/training_data/ro-utf8.txt +66 -0
- data/lib/training_data/ru-utf8.txt +310 -0
- data/lib/training_data/sl-utf8.txt +263 -0
- data/lib/training_data/sv-utf8.txt +174 -0
- data/lib/training_data/th-utf8.txt +49 -0
- data/lib/training_data/tk-utf8.txt +101 -0
- data/lib/training_data/todo/af.txt +114 -0
- data/lib/training_data/todo/amharic-utf.txt +95 -0
- data/lib/training_data/todo/arabic-windows1256.txt +157 -0
- data/lib/training_data/todo/armenian.txt +86 -0
- data/lib/training_data/todo/basque.txt +136 -0
- data/lib/training_data/todo/belarus-windows1251.txt +97 -0
- data/lib/training_data/todo/bosnian.txt +97 -0
- data/lib/training_data/todo/breton.txt +159 -0
- data/lib/training_data/todo/bulgarian-iso8859_5.txt +115 -0
- data/lib/training_data/todo/catalan.txt +93 -0
- data/lib/training_data/todo/croatian-ascii.txt +104 -0
- data/lib/training_data/todo/esperanto.txt +95 -0
- data/lib/training_data/todo/estonian.txt +218 -0
- data/lib/training_data/todo/frisian.txt +99 -0
- data/lib/training_data/todo/georgian.txt +86 -0
- data/lib/training_data/todo/greek-iso8859-7.txt +139 -0
- data/lib/training_data/todo/hawaian.txt +108 -0
- data/lib/training_data/todo/hebrew-iso8859_8.txt +79 -0
- data/lib/training_data/todo/hindi.txt +77 -0
- data/lib/training_data/todo/hungarian.txt +102 -0
- data/lib/training_data/todo/icelandic.txt +131 -0
- data/lib/training_data/todo/indonesian.txt +93 -0
- data/lib/training_data/todo/irish.txt +209 -0
- data/lib/training_data/todo/latin.txt +120 -0
- data/lib/training_data/todo/latvian.txt +126 -0
- data/lib/training_data/todo/lithuanian.txt +99 -0
- data/lib/training_data/todo/malay.txt +108 -0
- data/lib/training_data/todo/manx.txt +78 -0
- data/lib/training_data/todo/marathi.txt +100 -0
- data/lib/training_data/todo/mf.txt +100 -0
- data/lib/training_data/todo/middle_frisian.txt +102 -0
- data/lib/training_data/todo/mingo.txt +146 -0
- data/lib/training_data/todo/nepali.txt +131 -0
- data/lib/training_data/todo/persian.txt +73 -0
- data/lib/training_data/todo/quechua.txt +108 -0
- data/lib/training_data/todo/romanian.txt +103 -0
- data/lib/training_data/todo/rumantsch.txt +110 -0
- data/lib/training_data/todo/sanskrit.txt +135 -0
- data/lib/training_data/todo/scots.txt +490 -0
- data/lib/training_data/todo/scots_gaelic.txt +93 -0
- data/lib/training_data/todo/serbian-ascii.txt +121 -0
- data/lib/training_data/todo/slovak-ascii.txt +102 -0
- data/lib/training_data/todo/slovak-windows1250.txt +115 -0
- data/lib/training_data/todo/slovenian-ascii.txt +100 -0
- data/lib/training_data/todo/slovenian-iso8859_2.txt +96 -0
- data/lib/training_data/todo/sq.txt +110 -0
- data/lib/training_data/todo/swahili.txt +120 -0
- data/lib/training_data/todo/tagalog.txt +135 -0
- data/lib/training_data/todo/tamil.txt +123 -0
- data/lib/training_data/todo/turkish.txt +117 -0
- data/lib/training_data/todo/ukrainian-koi8_r.txt +214 -0
- data/lib/training_data/todo/vietnamese.txt +92 -0
- data/lib/training_data/todo/welsh.txt +148 -0
- data/lib/training_data/todo/yiddish-utf.txt +83 -0
- data/lib/training_data/uk-utf8.txt +75 -0
- data/lib/training_data/vi-utf8.txt +47 -0
- data/lib/training_data/zh-utf8.txt +228 -0
- data/test/language_detector_test.rb +78 -0
- metadata +232 -0
@@ -0,0 +1,157 @@
|
|
1
|
+
|
2
|
+
|
3
|
+
|
4
|
+
�������� ������� ������� ������.
|
5
|
+
����� ����� �� ����������
|
6
|
+
������ - ����� - ����� ������
|
7
|
+
����� �������� �����
|
8
|
+
|
9
|
+
|
10
|
+
��� �� ��� ����� ���� ������� ����������...
|
11
|
+
������ ����� �����...
|
12
|
+
����� �� ����...���� ��������...���� ��������...
|
13
|
+
���� . ����� ������ �� ���� ��� ���� ��� ����� .
|
14
|
+
����� ���� ���� ��������...
|
15
|
+
� ����� ��� ������� ����� ������ ���� ��� �� ��� ������� ��� � �����
|
16
|
+
���� ������� ���� - ��� �� �������-
|
17
|
+
���� ����� �����...
|
18
|
+
|
19
|
+
���� ����� ������� ������ ����:
|
20
|
+
�� � ����� ����� �� ��������� ���� �� ������� ������� .
|
21
|
+
����� �������� ��� ����.
|
22
|
+
|
23
|
+
|
24
|
+
����� �����
|
25
|
+
����� ������...
|
26
|
+
�� ����� ������ �� ��������� ����� ��� ������� ���� ������� . ��� ���
|
27
|
+
��� ���������� ������� ��� ��������� ������� � ������ ���� �� ������
|
28
|
+
� ����� ����� ����� : ����� ��� ������� ������� ������� ������ ���� ��
|
29
|
+
������� ������� �� ���� ���� ������ ������ ��� ��� ���� ������ ������
|
30
|
+
- 17 -
|
31
|
+
������ ��� ������.
|
32
|
+
��� �� ��� ������ ������ ���� ��������
|
33
|
+
��� ��� ������ ���ǡ
|
34
|
+
��� ������ ���� ���� ������.
|
35
|
+
������ - ����� - ����� ������
|
36
|
+
���������...
|
37
|
+
������ ���� �����
|
38
|
+
|
39
|
+
������ ����� ��� ����� ������...
|
40
|
+
|
41
|
+
���� ����� �� ��� ��� ���� ���� ���� ����� �� ���� ��� ���� ���� �����
|
42
|
+
����� ������ ��������
|
43
|
+
����� ��� ���� ��������...
|
44
|
+
(������ : ����� ����� ����� �����)
|
45
|
+
����� ����� �����
|
46
|
+
����� �����...
|
47
|
+
���� �� ������ ������ �� ��� ������� ������ ��� ���� ���� � ��� ����
|
48
|
+
������� �� ���� ������� �������� ����� � �� ��� �������� �� ������ �����
|
49
|
+
|
50
|
+
�������� ���������...
|
51
|
+
|
52
|
+
����� ����� �� �� �����...
|
53
|
+
�������� .
|
54
|
+
|
55
|
+
|
56
|
+
|
57
|
+
��� ����� ������� �� ����� ���� ����� ���� ����� ����� ����� ��� ��������
|
58
|
+
�� ������ ������ �� ��� ��� ������� ������ ��� ���� ���� �� ���� .
|
59
|
+
����� ������� �� �������.
|
60
|
+
|
61
|
+
�� ����� ��� ���� ��� �� ����� ������ ������� ��� ���� �� ������ .
|
62
|
+
����� ������...
|
63
|
+
|
64
|
+
����� �� ������ ������.
|
65
|
+
|
66
|
+
����� ���� �� ����������.
|
67
|
+
|
68
|
+
|
69
|
+
����� ��� ��������
|
70
|
+
���� ����� ��� ������� �� ��������� ����� �� ������ ��� ����� ��������
|
71
|
+
����� �� ������� �� ���������
|
72
|
+
|
73
|
+
�� � ����� ����� �� ��������� ���� �� ������� ������� .
|
74
|
+
������ ������� ����� ����� ��� �����. ���� ���� ��������� �� ������ ���
|
75
|
+
������ ��� �������� ��� ������.
|
76
|
+
|
77
|
+
|
78
|
+
|
79
|
+
|
80
|
+
- 12 -
|
81
|
+
������ ��� ��� ���� ������ ����� �� ���� ������ �� ���� �� ���� ����
|
82
|
+
�� ���� ����� ���� ���� ����� �� ������ �� �� ���� ����� �� ������� ����
|
83
|
+
��� ������ ������... ��� ������ ������...
|
84
|
+
����� ��������...�� ������� ���������...
|
85
|
+
������ ���� ��� ��� ���� ���� � ������� ������� ��� ����� ������ ����
|
86
|
+
|
87
|
+
����� ������ ��� ������� ���� �������.
|
88
|
+
|
89
|
+
������� ��������� ���� ����� ��� ����� �� ������ ���� ����� ����� ������
|
90
|
+
�� �� ���� ������ ������ ������ ����� ��� ���� ����� ������ ���� �������
|
91
|
+
������ ����� �����...
|
92
|
+
|
93
|
+
������� �� ������ ��������...
|
94
|
+
���� �� �� ����� ������ �� ���� ����� �� ����� � ����� ���� ��� ��� ����
|
95
|
+
�������� ���� ���� ��� ����� ����� ������� .
|
96
|
+
|
97
|
+
��� ���� �� ����� ��������...
|
98
|
+
���� ����� �������� ��� ����� �������...
|
99
|
+
����� ��� ���� ��������...
|
100
|
+
��� ������ ���� �������� ��� �����.
|
101
|
+
����� �� �� ��� ��� ���� ������� ����� ����� ��� ��� ����� ���� ��� �����
|
102
|
+
����� �� �� ��� ��� ���� ������� ����� ����� ��� ��� ����� ���� ��� �����
|
103
|
+
����� �� ������� ���� ������
|
104
|
+
������� ����� ��� ���� ����� � ����� �� ���� ����� ����� �������� � ���
|
105
|
+
|
106
|
+
|
107
|
+
���� ����� ������� ������ ����:
|
108
|
+
|
109
|
+
������ ��� �����.
|
110
|
+
����� ������� �� �����.
|
111
|
+
���� ��������...
|
112
|
+
|
113
|
+
����� �� ����� ������ ���� �����
|
114
|
+
|
115
|
+
������ - ��� ������ ���� ����� -
|
116
|
+
���� ����� ��� ���������!!
|
117
|
+
����� ������...
|
118
|
+
������� ��� ������� ��� ����� ���������...
|
119
|
+
����� ��� ���������...
|
120
|
+
|
121
|
+
����� ��������...���� ��������...
|
122
|
+
���� �������� ��� ������...
|
123
|
+
���� ����� ��� ������� �� ��������� ����� �� ������ ��� ����� ��������
|
124
|
+
������ ���� ����� ������ ������
|
125
|
+
����� �� ������ ������.
|
126
|
+
��� ��� ��� ����� ���� ����� �� ��� ��� ���� ���� ����� ��� ��� ���.
|
127
|
+
���� ��������...
|
128
|
+
���� ��� ������ ��� ��� ��� ���� ��� ����� ����� ����� ��� ������� ������
|
129
|
+
|
130
|
+
|
131
|
+
����� ��� ��������
|
132
|
+
�������� ���� ���� ��� ����� ����� ������� .
|
133
|
+
�� ����� ������ �� ��������� ����� ��� ������� ���� ������� . ��� ���
|
134
|
+
����� ������� �� �������.
|
135
|
+
��� ����� ������
|
136
|
+
|
137
|
+
�������� �� ����� ������ ����� �������� ������ ��� ����� ����� . �������
|
138
|
+
����� ������� �� �����.
|
139
|
+
���� ����� ��� ����� ����� ����...
|
140
|
+
������� ��� ���� ���� ����� ��� ���� ����� � ��� ���� ���� ������ �������
|
141
|
+
��� ���� ������ ������ � ���� ���� ��� ����� ���� ���� ��� ����� ����
|
142
|
+
��� ��� ���� ��� ���� �� ��� ��� ����� ��� �� ���� ��� ����� ��� ����
|
143
|
+
|
144
|
+
|
145
|
+
����� ������ ��� �����...
|
146
|
+
|
147
|
+
������ ������� ������ �����.
|
148
|
+
���� �� ����� ����� �� ������ ���� ������ ����� �� ���� ������ �����
|
149
|
+
������� ���� ����� ���...������ �� ������...
|
150
|
+
|
151
|
+
|
152
|
+
������ - ����� - ����� ������
|
153
|
+
��� ���� ������ �� �� �� ���� �� ������� ������ �� ������� �������� ����
|
154
|
+
����� ���� ����� ����� ����� ����� ����� � �������� ��� ��� ����� ����
|
155
|
+
����� ����� �����
|
156
|
+
������� ������...
|
157
|
+
�� ����� ��� ���� ��� �� ����� ������ ������� ��� ���� �� ������ .
|
@@ -0,0 +1,86 @@
|
|
1
|
+
�� �� �� ������� ���큫��� ��������� ���� �
|
2
|
+
������ ��끃�� ����������� �������:
|
3
|
+
�� ݻ���� ����ݻ�:
|
4
|
+
- ����ѳϳ�������� ѳ�������� ѳٳ�: ��ϳ�� � �����, �� ٻ�
|
5
|
+
- ����� ������ �������� ��� ����� ����� г۳�����
|
6
|
+
�끣, ����� ����� ����� �� ������ �: ������ ��� ��
|
7
|
+
���� ��� ����� 퉣������ ��� ��� �멁����, �ﯫ� ����
|
8
|
+
- ��� �� �DZ ѳݷ���� ų�ݷ�ϳ� ������������ݻ��:
|
9
|
+
�� �� ������ ����� �� ����� �
|
10
|
+
|
11
|
+
ϳ�ٳϻ���������ݻ���, ����� ݳ�� ���ݳϳ� �����ݻ���:
|
12
|
+
��ϳ�� ѳ���, �� �� û �ٻ� �� ����������� ��� ���� ϳ� �����
|
13
|
+
�����> ��ٳ���, ����ݻ�� 㵻��: �ϳ�� ��� �� ���� ��ݳ�۳�
|
14
|
+
����� ������� ���� �: ��� ���� �� �� �����
|
15
|
+
�, û г۳���۳� �ϻջ��� �������� ϳ��� � ѳϳ���� �� ��ݻ� ٻ�
|
16
|
+
|
17
|
+
�ϻջ��ݻ� �� �������, ���� �ϳ, ��ѳݳ �� �᷻���ϳ� �ϳ:
|
18
|
+
|
19
|
+
ѳ�������, �� �ٳ�� �� ������, ���� �� ٻճ��� ��:
|
20
|
+
ѳٵ���ٳ� ����, �� ��� ��ݻ��� ѳݹ���` ��˳������� �� �: �廱��
|
21
|
+
��˳���� ��ݳ� ѳٳ���ݻ�� ���ݳ���ٵ.
|
22
|
+
���˳�� ������, �� �ϳ�� �� ѳ������: �����ѻ�� ������ݻ��
|
23
|
+
��˳���� ϳ�����������: �� �� �ϳ г۳���, ����� ����������
|
24
|
+
��� ��� ���, �� �������� ���������� ��������:
|
25
|
+
ѳ��ϳϳ� ��� ϳ�����ݻ�: ��� ѳ�� �, �� ٻ��` ѳۻ��, ������
|
26
|
+
������ �����, ����镫 ��� ��: ���� �� ��� �� ����髯� ���
|
27
|
+
��� ��� �������� �� ���� �סּ����� ��� ����: �竉 ����, ��
|
28
|
+
��ϳ�� ���ɻ�, �� ��� ����� �ϳ: ���� ����� ���dzɳϳ�
|
29
|
+
�Ͻ���������, �����ó��� ������ݻ� �� ѻ���� (ٳ��� ������� �����
|
30
|
+
300 ��� ��� ��������ٳ� ѳٳ� �� ������` ������� ѳ����
|
31
|
+
|
32
|
+
|
33
|
+
��� � ���� в� ���Ⱥ��Ʋ��
|
34
|
+
������� �����끛��� ቫ ���� ��鉗 ��灩�� ���
|
35
|
+
ѻ�� �۹ ����ݳѳ�����۳�, �۹ ���ݳ����ݳϳ� ٻ˳�ǽ�ݻ��
|
36
|
+
���� �, ������� ��� ���� �, �� ����� �����
|
37
|
+
�ϳݹ�ݳ�۳� ����ݻ�� ׳ݳ���� �� ������ ����ϳ� ����ٳ�
|
38
|
+
�� ���ϳ۳ϳ� ��������۳� ��ٳ�ݻ���� ��˳�� ����� �� �����ݳ���:
|
39
|
+
|
40
|
+
|
41
|
+
ݳ˳����߳��۳� ����� ѳٻٳ����۳ٵ:
|
42
|
+
����� ѻ� ѳ�������� ѳٳ�, �ųݹ�ϻ���, �����
|
43
|
+
��� ������ � �����ݳ�����۳� �׳�����ݳ����۳��, �� <�û
|
44
|
+
������� ����� � ���� ������ ��ӳ���� ���ݻ��� ��׳���:
|
45
|
+
���ね�に� ���:
|
46
|
+
ϳ����ϳ� ϳ�����ݻ�� ݻ�ϳ۳������ݻ�: ���㹻� ٻ� �ɳ�ݻ�� �߳�����
|
47
|
+
|
48
|
+
ϳ����, ���ٻ�ϳ� �� ѳٳ���˳� ٻ� ϳ�ٳϻ�����۳� ٳݹ����,
|
49
|
+
��������� ������ ����� ���� ��� ���� ݳų���. ���-�� ��
|
50
|
+
ٻ�, �����, ��� ��� ������, ������� �����: γ� ��� ϳ� ��� �����
|
51
|
+
<ѳ�� �ϳ>, ˳����� ��� ������ ������� ѻ�:
|
52
|
+
|
53
|
+
|
54
|
+
��竁 �偝� �� ��������� ������� ����
|
55
|
+
��� � ��������뉗, �� �� ���㫇�� �� ��� ���-�� �흁�����
|
56
|
+
û���� ��� ���ݹ��� �� �۹����� ѳ�ݻ� �� �dz�� �ճݻ��
|
57
|
+
|
58
|
+
������ݻ��� ѻ�� ���� ���� ����������: γ�˳���߳���� ���, ��
|
59
|
+
- ��� ����, �� �� ቧ �����遫�� ����� ������
|
60
|
+
��� �� ��� ������ ���, ��� ��������� ���: ������� ���
|
61
|
+
�� ���-� �������� �, �� �篣�� ��, ���駕�, ����� �:
|
62
|
+
�큟��, �� ��� �������� ��� ���� ��� ��, �火��� ��, ��
|
63
|
+
��� � ϳٳ�-ϳٳ� ٳ����� ٻ� ������: ���� �������۳� ����� ٳ���
|
64
|
+
��ﯣ �� ��灩�� ���� ������ �� ������� ��
|
65
|
+
95�. ��ٳݳ�����۳� <�ݹ��������> ѻ�� ���� ���ϻݹ�ݳ�ݻ�
|
66
|
+
����ݳϳݳ�� óջ��� ��� ݻ�����ݻ�� �� ��ﳹ�ϳ� ������ ����
|
67
|
+
����髯� �����, �������灝�, �� �� ��火� ���:
|
68
|
+
�������������� ������ �� ����� ��������: ��� ���� �` լ��
|
69
|
+
��������� �� ���>,- ��� � ���镧 ���鉣����:
|
70
|
+
�߳�ٳ� �� �����ٳ� �ݳ��������, ѳ�������������� �� ��������� ��
|
71
|
+
- ����� �� ͻ� ������ ���ݳϳ� ѳ����:
|
72
|
+
���� �� ���� �� ��� ��������� ����� ���뉫 �� ������,
|
73
|
+
��������, ��� �������� ���� �: ����� ������,
|
74
|
+
����끫���� ������ ��, �� ��������� ����� �� ��� ��
|
75
|
+
����ӳϳ�� �ϳ ���� ���� ϳ� �������, �� ���ݳ���۳�� ��ӳٵ
|
76
|
+
�ݹ������ ���:
|
77
|
+
������ �� ��� �篣�� �� �������:
|
78
|
+
����ٳ��, ��ɻ� ���� ��ݻݳ� ѻﳷ� �������������ݻ�� ѳٳ�:
|
79
|
+
��ﳹ�����, ݳ������ ѳ��ݳϳ� ������ ����� ݻ����������: �
|
80
|
+
�����ݳ���� ���������۳� ٻ� ��ݻ� ��˳��������ݻ�� ѻ�, ���� ��
|
81
|
+
|
82
|
+
靋����������` ���� ������ �������� ��큙����: ����, ��
|
83
|
+
�� �����۳��� ݻ�ϳ۳���� ٻճ������` �.���ѳ����۳�� ��, ��
|
84
|
+
ѻ�� � ��ݳ���� ���, ��� ���� ݳ˳�����۳��:
|
85
|
+
- ��灙�運��� ������� ���� ����, �� �����韛� ���, ��
|
86
|
+
��陁��: ��������� �鉧, �� ��� ����� ������ ቫ
|
@@ -0,0 +1,136 @@
|
|
1
|
+
perifrasietara mugatzen ez bagara. Adibidez:25
|
2
|
+
|
3
|
+
Cambridge University Press.
|
4
|
+
|
5
|
+
Euskalki guztietan, ezin elementuaz osatutako perifrasiak erabil
|
6
|
+
|
7
|
+
3.2. EZIN IZAN
|
8
|
+
(14b) ulertu + behar duzu
|
9
|
+
|
10
|
+
Brunot ezin zen baliatu gaurko kontzeptu pragmatiko eta linguistikoez.
|
11
|
+
A.K.: Ofizialki ez. Aztertzaileek ohar bat idazten dute beren txosten
|
12
|
+
|
13
|
+
Badaude, alegia, 3.3.2 eta 3.3.3an aipatutako bi joerak berak. Euskara
|
14
|
+
|
15
|
+
|
16
|
+
|
17
|
+
zer gertatuko den derrigorrez), (2)an posibilitatea (mundu horretan zer gerta
|
18
|
+
|
19
|
+
|
20
|
+
A.K.: Asko. Mundu bat dago hor. Kontzeptu batzuk hizkuntzen irakaskuntzan
|
21
|
+
modaltasun epistemikoak hiztunaren sinesmenak adierazten ditu. Ondoko bi
|
22
|
+
|
23
|
+
|
24
|
+
ateratzen duen Euskaltzaindiko batzordeko partaide da aspaldiko partez.
|
25
|
+
A.K.: Ez dakit oraindik. Ez dut astirik izan ongi aztertzeko non komeni
|
26
|
+
daitezke.10 Hizkuntza desberdin askotan formalki agerian egoten diren
|
27
|
+
(43a) *esateko beharrik
|
28
|
+
azken urteotan egiten ari diren ikerketak interes haundikoak izan daitezke
|
29
|
+
3.3. BEHAR IZAN
|
30
|
+
Herrian finkatu naiz, hasieran Donostian eta azken lau urteotan Zarautzen.
|
31
|
+
urruti samar dago nik ulertzen dudan kontzeptutik. Bestalde, G. Leech
|
32
|
+
batetatik, geruzapena delako kontzeptuaz ere balia gaitezke.13 Frantses
|
33
|
+
|
34
|
+
|
35
|
+
|
36
|
+
|
37
|
+
|
38
|
+
luzatzea, denbora minimoan egiteko apostu egin nuen. Eta hala egin nuen.
|
39
|
+
buruz beste bat hasita daukat. Eta berriena: miscellanea idiomatica delako
|
40
|
+
litzateke egokia eros(i) nezake (bizkaieraz neike) eta joan ninteke
|
41
|
+
|
42
|
+
Halere, azken urteotan nahaste bat gertatzen ari da zenbait hiztunengan,
|
43
|
+
*Euskal Herrian Euskaraz. Euskararen defentsarako herri mugimendua
|
44
|
+
Forma gramatikalizatuagoen esanahiak orokorragoak, zabalagoak eta
|
45
|
+
|
46
|
+
(E) Baliabide linguistikoen zerrenda ez da amaitzen hemen aditzezko
|
47
|
+
|
48
|
+
zenbait baliokide erabili ohi diren testuinguruetara larregi zabaltzea.
|
49
|
+
|
50
|
+
|
51
|
+
|
52
|
+
Euskaltzaindia (1987). Euskal gramatika: lehen urratsak, 2. tomoa. Bilbo: Euskaltzaindia.
|
53
|
+
|
54
|
+
|
55
|
+
|
56
|
+
|
57
|
+
epistemikoa adierazten baitu,18 adibidez:
|
58
|
+
|
59
|
+
|
60
|
+
gramatiketan aipatu ohi diren aditz modalen ezaugarri nagusiak2 -ezaugarri
|
61
|
+
26. Wilbur-entzat (1981:172) ahal, behar eta nahi "root-modal particles"
|
62
|
+
Kategoria semantiko gisa, aldiz, modaltasun kontzeptua edozein
|
63
|
+
|
64
|
+
|
65
|
+
daukagu; hau egiazko aintzindaritzat emango nuke. Orain dela bi urte,
|
66
|
+
bihar edo) beharbada modaltasun epistemikoa adieraz dezakete.
|
67
|
+
|
68
|
+
|
69
|
+
eta J. Svartvik-en 1975eko A communicative grammar of English delakoa
|
70
|
+
moduan erabili duzula interesatzen zaizkizun puntu batzuk aztertzeko?
|
71
|
+
|
72
|
+
Behar bezala, nahi berez izena da, nahiz nahi-ren izenezko erabilera
|
73
|
+
|
74
|
+
derrigorrez sinonimotzat jotzen direnik, baizik eta hein batetako kidetasun
|
75
|
+
ideiari jarraituz idatzi zen lehenengo hizkuntz deskribapena; jakina,
|
76
|
+
|
77
|
+
Galdera: Ematen da notarik edo bestelako kalifikapenik?
|
78
|
+
A.K.: Badago, bai. Bistan dago Atalase Maila tresna "aplikatu" eta praktiko
|
79
|
+
Euskarazko gauza pare bat orrialde hauetan bertan osorik irakur daitezke:
|
80
|
+
|
81
|
+
zaidan kaleratzea, ezta nor egongo litzatekeen argitaratzeko prest ere.
|
82
|
+
acts kontzeptua dute iturri, baina kontzeptua geroztik oso landua izan
|
83
|
+
berriro--hots, (55) eta (56), (55) eta (57) erabiltzea baino hobe:
|
84
|
+
|
85
|
+
|
86
|
+
|
87
|
+
|
88
|
+
|
89
|
+
hau da, ea gramatika deskribapen "osorik" aurkitzen den munduan. Baina
|
90
|
+
haundia da, dedikazio gehiegi eskatuko luke, eta suposatzen duen ezagupen
|
91
|
+
�
|
92
|
+
hitza dakarkidala burura, asoziazioz edo). "Epaimahai" bezala, bi kanpoko
|
93
|
+
|
94
|
+
7. Hegoaldeko euskaran; iparraldeko hizkeretan, berriz, (2)ko egiturak
|
95
|
+
gogoa eduki < nahi izan < �
|
96
|
+
|
97
|
+
Lhande, P. (1926). Dictionnaire basque-fran�ais. Paris: Gabriel Beauchesne.
|
98
|
+
|
99
|
+
gero eta presio gehiago egiten ari da Inglaterran tesiak lehenbailehen
|
100
|
+
|
101
|
+
kasua, non derrigorrezkoa baita ahal izan-en erabilpena (edo beste
|
102
|
+
erabilpena nahi-rena baino are murritzagoa dela dirudi.
|
103
|
+
|
104
|
+
|
105
|
+
|
106
|
+
dela inoiz egingo?
|
107
|
+
|
108
|
+
|
109
|
+
unibertsitateko tesi doktorala denez, inglesez dago noski. Luzeraz, 400
|
110
|
+
erabileran berean ez ezik, zuzentasunari buruzko kontzeptuetan ere. Konfusio
|
111
|
+
ditu, bereizketa zenbait arrazoi sintaktikotan oinarritzen dituelarik.
|
112
|
+
gerundiboa bezalatsu erabilirik).24
|
113
|
+
besteak beste, inoiz berezitzat hartu dituzte ikuspegi sintaktiko batetatik,
|
114
|
+
posibilitatea edo ez-segurtasuna
|
115
|
+
A.K.: Ez dut uste neronek bakarrik tamaina haundiko euskal gramatika
|
116
|
+
Eta 1993ko abenduan Londresko Unibertsitatean doktoratu egin zen linguistikan,
|
117
|
+
|
118
|
+
12. King (1993:110).
|
119
|
+
probetxagarriak gramatika komunikatiboaren teoria lantzerakoan?
|
120
|
+
|
121
|
+
|
122
|
+
ahozko azterketa bat da, "viva voce" deitzen dena (edo laburturik, "viva"
|
123
|
+
|
124
|
+
Euskarazko Orrialdea
|
125
|
+
|
126
|
+
*IXA taldearen orria
|
127
|
+
(deskribapen morfosintaktikoa, alegia). Gramatika komunikatibo batean,
|
128
|
+
|
129
|
+
A.K.: Izugarrizkoa. Hitz gutxitan, pragmatikan aztertzen dira linguista
|
130
|
+
|
131
|
+
|
132
|
+
|
133
|
+
|
134
|
+
|
135
|
+
|
136
|
+
Wilbur, T.H. (1981). Basque syntax. Euskalarien nazioarteko jardunaldiak, pp. 169-186,
|
@@ -0,0 +1,97 @@
|
|
1
|
+
|
2
|
+
�i��-�������� ��i��i������ ���i���� ����i ������� ������ i
|
3
|
+
�����) � ��������� ������ ��� ������. ��� ��������� �� �i���
|
4
|
+
i���� ����� �����i����, ��� �� ���� ���������: ����, ���� i ����.
|
5
|
+
��������� ��������i, ��������� I�i�.
|
6
|
+
�����. � �����i �������� ���������� �i� ������i� ����i��������
|
7
|
+
�i��� ������ �����i�����-������������ ��� �������i.
|
8
|
+
1997) �� �����.
|
9
|
+
������������ ������ ���i�i���. ��� �� ����i����� ����� ��
|
10
|
+
�������� ������������ �������� ������ ��������� ����� �i����� I��������.
|
11
|
+
����� �� ��������. �� �� ����������� �������� �����������
|
12
|
+
������i� (������i���� ����������), ����i���i ������i��i��� I����
|
13
|
+
�������� ������������ �������� ������ "��������
|
14
|
+
��������� ���������� ������i��� ��������i��. � ������i � ������i�
|
15
|
+
�����������. ��������� ��� ���i������ �... ���� ������-�����������
|
16
|
+
�������i-�������������i � ����i i ����i��, � ���� �i ���� ���i� ��
|
17
|
+
|
18
|
+
� �������i �i�����i ����i�� ��������� ����i i ������,
|
19
|
+
����� ����������� ������? �� �� ��� �i ����, ��� ����� ������i� i�
|
20
|
+
���������� �i������ ����i���� ������ ������������i. � ���� ��� --
|
21
|
+
|
22
|
+
����������. �� ������� ���������� ��� �� ���'������ �������, �
|
23
|
+
������ �����������i� (�����).
|
24
|
+
����i����� ����������. ������� ����� ����� i ��� ��������
|
25
|
+
�������i.
|
26
|
+
������i, ���������i� ����i-������ I��� ������ ������� ���������� �
|
27
|
+
���������", ������ �������, �i������ i ���������, � �������
|
28
|
+
|
29
|
+
���������� ���� ������. ����������� �� ���i, ������ ����� ����
|
30
|
+
eve@nil.belpak.minsk.by
|
31
|
+
I�������. � ������i�� �� ������i � ��������.
|
32
|
+
������i���� �������� ������� ������i��� � ����i� ����i i ��������
|
33
|
+
|
34
|
+
���� ���� ��� ���, ��������i ������ ���������i�i ������ ����: ���
|
35
|
+
|
36
|
+
|
37
|
+
��� �������� �����, i ����� ��� ������ ���� � �������i �����i� i,
|
38
|
+
�������� ������������ �������� ������ "�������� �����".
|
39
|
+
|
40
|
+
|
41
|
+
����, ���� i ���� ��� ����� �� �����. ��� ����� �����i������ ����,
|
42
|
+
����i��������. ������ ����, �� ������� ��� �'���� ���i ���������
|
43
|
+
���������� -- �� ���� �� ��������.
|
44
|
+
����� ������i�.
|
45
|
+
����������� ��� � ���, ���, ��������� ����������� "�������", ��
|
46
|
+
��i��-i������������i���. ����� �� �'����� ���� �����i�������� ����
|
47
|
+
1997) ����� ����� � ����i�� (12.08.97)
|
48
|
+
����� ������� i ����� ��� �������i�...
|
49
|
+
|
50
|
+
�������� "���������" ����� ���� ����������� ���'i ������������
|
51
|
+
|
52
|
+
���� �� ��������, ��������� ��i��� (11.09.97)
|
53
|
+
|
54
|
+
���������� "��������� ������" (10.09.97)
|
55
|
+
|
56
|
+
���������� ����� �������� �� ����, ��� ���������� �� �����, ��
|
57
|
+
|
58
|
+
|
59
|
+
�����i������ � ������, ���� ��������� � ������� �i����.
|
60
|
+
�i���� � 900 (12.09.97)
|
61
|
+
|
62
|
+
� ����� ����������� �i��������� i �����.
|
63
|
+
��������� ������. ��i� ����� ������� i ��������� �� 16 �� 18
|
64
|
+
�������� -- �� ��������, ��� ����������� �� ���'i ������� ������
|
65
|
+
��������i ���������� i ���i ������� � ������i; ��i����
|
66
|
+
�������� ������������ �������� ������ ��������� ����� �i����� I��������.
|
67
|
+
-- � ��� ����� ������i�� �����i; �����i� �� ���i��� -- �������;
|
68
|
+
���������� �i�������� � ��������i ���������� ������� �������i.
|
69
|
+
�����i������ � ������, ���� ��������� � ������� �i����.
|
70
|
+
�����������. ��������� ��� ���i������ �... ���� ������-�����������
|
71
|
+
����������� "���i���" ������i�� ����� ����'������
|
72
|
+
|
73
|
+
|
74
|
+
�������� ������������ �������� ������ ��������� ����� �i����� I��������.
|
75
|
+
��������i �������i ����� ����� � ��������� �������. ��� ��������i
|
76
|
+
�� ����� ������� ����� i ������� ��� ����� �������� ����� ������i�
|
77
|
+
|
78
|
+
����i����� ����� �� ������i���� ���������i ��i��i�����
|
79
|
+
|
80
|
+
��������� ����i, ����i��, �i�������, ���, �i�������, ������ii,
|
81
|
+
� ������ ������ ������i ����� �i����i�i ������i� �����i����� �
|
82
|
+
|
83
|
+
� ����i���i� ����� ��������, �i������� i �����i ������
|
84
|
+
�����) � ��������� ������ ��� ������. ��� ��������� �� �i���
|
85
|
+
�����������i ���� ����������� �������� �������, �����������
|
86
|
+
�����i������ � ������, ���� ��������� � ������� �i����.
|
87
|
+
|
88
|
+
�����i������ � ������, ���� ��������� � ������� �i����.
|
89
|
+
|
90
|
+
������ ��i������ �����i ������i�i ������������� �����, ��� ����
|
91
|
+
��������� ����i� ������� ��������i� ����������� ���������,
|
92
|
+
������i��� � ������ "�i�����i ���'��" i i���� ���������� i
|
93
|
+
� ����� � ���i�� ���� "���� �������� ������". �� �i����
|
94
|
+
��������i, ���i, �����i i ������i � ����� ������
|
95
|
+
� ���������� ����� �� �i�����i��� ����� ��i���� 3
|
96
|
+
� �������i �i�����i ����i�� ��������� ����i i ������,
|
97
|
+
�������� � ������ ���� �������� �����i�.
|