scylla 0.1.0

Sign up to get free protection for your applications and to get access to all the features.
Files changed (76) hide show
  1. data/.document +5 -0
  2. data/Gemfile +17 -0
  3. data/Gemfile.lock +30 -0
  4. data/LICENSE.txt +20 -0
  5. data/README.rdoc +19 -0
  6. data/Rakefile +52 -0
  7. data/VERSION +1 -0
  8. data/lib/scylla/classifier.rb +65 -0
  9. data/lib/scylla/generator.rb +73 -0
  10. data/lib/scylla/loader.rb +37 -0
  11. data/lib/scylla/string.rb +11 -0
  12. data/lib/scylla/tasks.rb +20 -0
  13. data/lib/scylla.rb +10 -0
  14. data/scylla.gemspec +117 -0
  15. data/source_texts/13375P33K.txt +199 -0
  16. data/source_texts/afrikaans.txt +114 -0
  17. data/source_texts/arabic.txt +576 -0
  18. data/source_texts/armenian.txt +86 -0
  19. data/source_texts/bulgarian.txt +834 -0
  20. data/source_texts/catalan.txt +413 -0
  21. data/source_texts/chinese.txt +199 -0
  22. data/source_texts/danish.txt +219 -0
  23. data/source_texts/english.txt +35 -0
  24. data/source_texts/esperanto.txt +199 -0
  25. data/source_texts/finnish.txt +71 -0
  26. data/source_texts/french.txt +89 -0
  27. data/source_texts/german.txt +137 -0
  28. data/source_texts/greek-iso8859-7.txt +139 -0
  29. data/source_texts/hebrew.txt +199 -0
  30. data/source_texts/hindi.txt +199 -0
  31. data/source_texts/hungarian.txt +102 -0
  32. data/source_texts/icelandic.txt +131 -0
  33. data/source_texts/indonesian.txt +93 -0
  34. data/source_texts/irish.txt +209 -0
  35. data/source_texts/italian.txt +120 -0
  36. data/source_texts/japanese.txt +199 -0
  37. data/source_texts/korean.txt +134 -0
  38. data/source_texts/latin.txt +120 -0
  39. data/source_texts/malay.txt +108 -0
  40. data/source_texts/marathi.txt +100 -0
  41. data/source_texts/mingo.txt +146 -0
  42. data/source_texts/nepali.txt +131 -0
  43. data/source_texts/norwegian.txt +157 -0
  44. data/source_texts/polish.txt +91 -0
  45. data/source_texts/portuguese.txt +88 -0
  46. data/source_texts/quechua.txt +108 -0
  47. data/source_texts/romanian.txt +103 -0
  48. data/source_texts/rumantsch.txt +110 -0
  49. data/source_texts/russian.txt +199 -0
  50. data/source_texts/sanskrit.txt +135 -0
  51. data/source_texts/scots_gaelic.txt +93 -0
  52. data/source_texts/serbian-ascii.txt +121 -0
  53. data/source_texts/slovak-ascii.txt +102 -0
  54. data/source_texts/slovenian-ascii.txt +100 -0
  55. data/source_texts/spanish.txt +834 -0
  56. data/source_texts/swahili.txt +120 -0
  57. data/source_texts/swedish.txt +75 -0
  58. data/source_texts/tagalog.txt +135 -0
  59. data/source_texts/tamil.txt +167 -0
  60. data/source_texts/thai.txt +86 -0
  61. data/source_texts/turkish.txt +117 -0
  62. data/source_texts/ukrainian-koi8_u.txt +214 -0
  63. data/source_texts/vietnamese.txt +92 -0
  64. data/source_texts/welsh.txt +148 -0
  65. data/source_texts/yiddish-utf.txt +83 -0
  66. data/test/classifier_test.rb +29 -0
  67. data/test/fixtures/source_texts/danish.txt +219 -0
  68. data/test/fixtures/source_texts/english.txt +35 -0
  69. data/test/fixtures/source_texts/french.txt +89 -0
  70. data/test/fixtures/source_texts/german.txt +137 -0
  71. data/test/fixtures/source_texts/spanish.txt +834 -0
  72. data/test/generator_test.rb +72 -0
  73. data/test/helper.rb +22 -0
  74. data/test/loader_test.rb +31 -0
  75. data/test/scylla_test.rb +20 -0
  76. metadata +173 -0
@@ -0,0 +1,86 @@
1
+ �� �� �� ������󑩁� ���큫��󑩁� ��������� ���� �
2
+ ������ ��끃�� ����������� �����󧫉��:
3
+ �� ݻ���� ����ݻ�:
4
+ - ����ѳϳ�������� ѳ�������� ѳٳ�: ��ϳ�� � �����, �� ٻ�
5
+ - ����� ������ �������� ��� ����� ����� г۳�����
6
+ �끣, ����󑩯� ����� ����� �� ������ �: ������ ��� ��
7
+ ���� �󫉕�� ����� 퉣������ ��� ��� �멁����, �ﯫ� ����
8
+ - ��� �� �DZ ѳݷ���� ų�ݷ�ϳ� ������������ݻ��:
9
+ �� �� ������ ����� �� ����� �󫉧
10
+
11
+ ϳ�ٳϻ���������ݻ���, ����� ݳ�� ���ݳϳ� �����ݻ���:
12
+ ��ϳ�� ѳ���, �� �� û �ٻ� �� ����������� ��� ���� ϳ� �����
13
+ �����> ��ٳ���, ����ݻ�� 㵻��: �ϳ�� ��� �� ���� ��ݳ�۳�
14
+ ����� �����󑩯�� ���� �: ��� ���� �� �� �����
15
+ �, û г۳���۳� �ϻջ��� �������� ϳ��� � ѳϳ���� �� ��ݻ� ٻ�
16
+
17
+ �ϻջ��ݻ� �� �������, ���� �ϳ, ��ѳݳ �� �᷻���ϳ� �ϳ:
18
+
19
+ ѳ�������, �� �ٳ�� �� ������, ���� �� ٻճ��� ��:
20
+ ѳٵ���ٳ� ����, �� ��� ��ݻ��� ѳݹ���` ��˳������� �� �: �廱��
21
+ ��˳���� ��ݳ� ѳٳ���ݻ�� ���ݳ���ٵ.
22
+ ���˳�� ������, �� �ϳ�� �� ѳ������: �����ѻ�� ������ݻ��
23
+ ��˳���� ϳ�����������: �� �� �ϳ г۳���, ����� ����������
24
+ ��� ��� ���, �� �������� ���������� �������󑩯�:
25
+ ѳ��ϳϳ� ��� ϳ�����ݻ�: ��� ѳ�� �, �� ٻ��` ѳۻ��, ������
26
+ �����󑩯� �����, ����镫 ��� ��: ���� �� ��� �� ����髯� ���
27
+ ��� ��� �������� �� ���� �סּ����� ��� ����: �竉 ����, ��
28
+ ��ϳ�� ���ɻ�, �� ��� ����� �ϳ: ���� ����� ���dzɳϳ�
29
+ �Ͻ���������, �����ó��� ������ݻ� �� ѻ���� (ٳ��� ������� �����
30
+ 300 ��� ��� ��������ٳ� ѳٳ� �� ������` ������� ѳ����
31
+
32
+
33
+ ��� � ���� в� ���Ⱥ��Ʋ��
34
+ ������� �����끛��� ቫ 񁫝���� ��鉗 ��灩�󑩁� ���
35
+ ѻ�� �۹ ����ݳѳ�����۳�, �۹ ���ݳ����ݳϳ� ٻ˳�ǽ�ݻ��
36
+ ���� �, ������󑩯󫫉� ��� ���� �󫉫, �� ����󑩯� �����
37
+ �ϳݹ�ݳ�۳� ����ݻ�� ׳ݳ���� �� ������ ����ϳ� ����ٳ�
38
+ �� ���ϳ۳ϳ� ��������۳� ��ٳ�ݻ���� ��˳�� ����� �� �����ݳ���:
39
+
40
+
41
+ ݳ˳����߳��۳� ����� ѳٻٳ����۳ٵ:
42
+ ����� ѻ� ѳ�������� ѳٳ�, �ųݹ�ϻ���, �����
43
+ ��� ��񳵻���� � �����ݳ�����۳� �׳�����ݳ����۳��, �� <�û
44
+ ������� ����� � ���� ������ ��ӳ���� ���ݻ��� ��׳���:
45
+ ���ね�に� ���:
46
+ ϳ����ϳ� ϳ�����ݻ�� ݻ�ϳ۳������ݻ�: ���㹻� ٻ� �ɳ�ݻ�� �߳�����
47
+
48
+ ϳ����, ���ٻ�ϳ� �� ѳٳ���˳� ٻ� ϳ�ٳϻ�����۳� ٳݹ����,
49
+ ��������� ������ ����� ���� ��� ���� ׷ݳų���. ���-�� ��
50
+ ٻ�, �����, ��� ��� ������, ������� �����: γ� ��� ϳ� ��� �����
51
+ <ѳ�� �ϳ>, ˳����� ��� ������ ������� ѻ�:
52
+
53
+
54
+ ��竁󑩯󫫉 �偝� �� ��������� ������� ����
55
+ ��� � ��������뉗, �� �� ���㫇�� �� ��� ���-�� �흁�����
56
+ û���� ��� ���ݹ��� �� �۹����� ѳ�ݻ� �� �dz�� �ճݻ��
57
+
58
+ ������ݻ��� ѻ�� ���� ���� ����������: γ�˳���߳���� ���, ��
59
+ - ��� ����, �� �� ቧ �����遫�� ��񕯫��� �����󑩯󫫉�
60
+ ��� �� ��� ������ ���󩑏, ��� ��������� ���: ������� ���
61
+ �� ���-� �������� �, �� �篣�󑩯� ��, ���駕�, ����� �:
62
+ �큟��, �� ��� �������� ��� ���� ��� ��, �火��� ��, ��
63
+ ��� � ϳٳ�-ϳٳ� ٳ����� ٻ� ������: ���� �������۳� ����� ٳ���
64
+ ��ﯣ �� ��灩�� ���� ������ �� ����񫯣��� ��
65
+ 95�. ��ٳݳ�����۳� <�ݹ��������> ѻ�� ���߻� ���ϻݹ�ݳ�ݻ�
66
+ ����ݳϳݳ�� óջ��� ��� ݻ�����ݻ�� �� ��ﳹ�ϳ� ������ ����
67
+ ����髯󑩯� �����, �������灝�, �� �� ��火� ���:
68
+ �������������� ������ �� ����� ��������: ��� ���� �` լ��
69
+ ��������� �� ���>,- ��� � ���镧 ���鉣����:
70
+ �߳�ٳ� �� �����ٳ� �ݳ��������, ѳ�������������� �� ��������� ��
71
+ - ����� �� ͻ� ������ ���ݳϳ� ѳ����:
72
+ ���� �� ���� �� ��� ��������� ����󧫉� ���뉫 �� ������,
73
+ ������󑩯��, ��� �������� ���� �: ����� ������,
74
+ ����끫���� ������ ��, �� ��������� ����� �� ��� ��
75
+ ����ӳϳ�� �ϳ ���� ���� ϳ� �������, �� ���ݳ���۳�� ��ӳٵ
76
+ �ݹ������ ���:
77
+ ������ �� ��� �篣�󑩯� �� ������󑩯�:
78
+ ����ٳ��, ��ɻ� ���� ��ݻݳ� ѻﳷ� �������������ݻ�� ѳٳ�:
79
+ ��ﳹ�����, ݳ������ ѳ��ݳϳ� ������ ����� ݻ����������: �
80
+ �����ݳ���� ���������۳� ٻ� ��ݻ� ��˳��������ݻ�� ѻ�, ���� ��
81
+
82
+ 靋����������` ���� ������ �������󑩁� ��큙����: ����, ��
83
+ �� �����۳��� ݻ�ϳ۳���� ٻճ������` �.���ѳ����۳�� �߻�, ��
84
+ ѻ�� � ��ݳ���� ���, ��� ���� ݳ˳�����۳��:
85
+ - ��灙�運��� ������� ���� ����, �� �����韛� ���񕁫, ��
86
+ ��陁��: ��������� �鉧, �� ��� ����� ����󑩁�� ቫ