ruby_wordcram 1.0.1 → 2.0.0
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- checksums.yaml +4 -4
- data/.gitignore +3 -0
- data/.mvn/extensions.xml +8 -0
- data/.mvn/wrapper/maven-wrapper.properties +1 -0
- data/Rakefile +28 -5
- data/docs/_posts/2017-03-07-getting_started.md +3 -2
- data/docs/_posts/2017-03-07-under_the_hood.md +33 -0
- data/lib/WordCram.jar +0 -0
- data/lib/jsoup-1.10.2.jar +0 -0
- data/lib/ruby_wordcram/version.rb +1 -1
- data/lib/ruby_wordcram.rb +1 -2
- data/pom.rb +53 -0
- data/pom.xml +87 -0
- data/ruby_wordcram.gemspec +1 -2
- data/src/cue/lang/Counter.java +141 -0
- data/src/cue/lang/IterableText.java +10 -0
- data/src/cue/lang/NGramIterator.java +151 -0
- data/src/cue/lang/SentenceIterator.java +86 -0
- data/src/cue/lang/WordIterator.java +60 -0
- data/src/cue/lang/stop/StopWords.java +114 -0
- data/src/cue/lang/stop/arabic +351 -0
- data/src/cue/lang/stop/armenian +45 -0
- data/src/cue/lang/stop/catalan +219 -0
- data/src/cue/lang/stop/croatian +2024 -0
- data/src/cue/lang/stop/czech +256 -0
- data/src/cue/lang/stop/danish +94 -0
- data/src/cue/lang/stop/dutch +107 -0
- data/src/cue/lang/stop/english +183 -0
- data/src/cue/lang/stop/esperanto +180 -0
- data/src/cue/lang/stop/farsi +966 -0
- data/src/cue/lang/stop/finnish +235 -0
- data/src/cue/lang/stop/french +543 -0
- data/src/cue/lang/stop/german +231 -0
- data/src/cue/lang/stop/greek +637 -0
- data/src/cue/lang/stop/hebrew +220 -0
- data/src/cue/lang/stop/hindi +97 -0
- data/src/cue/lang/stop/hungarian +202 -0
- data/src/cue/lang/stop/italian +279 -0
- data/src/cue/lang/stop/latin +1 -0
- data/src/cue/lang/stop/norwegian +176 -0
- data/src/cue/lang/stop/polish +138 -0
- data/src/cue/lang/stop/portuguese +204 -0
- data/src/cue/lang/stop/romanian +284 -0
- data/src/cue/lang/stop/russian +652 -0
- data/src/cue/lang/stop/slovak +110 -0
- data/src/cue/lang/stop/slovenian +448 -0
- data/src/cue/lang/stop/spanish +308 -0
- data/src/cue/lang/stop/swedish +114 -0
- data/src/cue/lang/stop/turkish +117 -0
- data/src/cue/lang/unicode/BlockUtil.java +103 -0
- data/src/cue/lang/unicode/Normalizer.java +55 -0
- data/src/cue/lang/unicode/Normalizer6.java +32 -0
- data/src/license.txt +201 -0
- data/src/wordcram/Anglers.java +137 -0
- data/src/wordcram/BBTree.java +133 -0
- data/src/wordcram/BBTreeBuilder.java +61 -0
- data/src/wordcram/Colorers.java +52 -0
- data/src/wordcram/EngineWord.java +73 -0
- data/src/wordcram/Fonters.java +17 -0
- data/src/wordcram/HsbWordColorer.java +28 -0
- data/src/wordcram/ImageShaper.java +91 -0
- data/src/wordcram/Observer.java +9 -0
- data/src/wordcram/PlacerHeatMap.java +134 -0
- data/src/wordcram/Placers.java +74 -0
- data/src/wordcram/PlottingWordNudger.java +38 -0
- data/src/wordcram/PlottingWordPlacer.java +36 -0
- data/src/wordcram/ProcessingWordRenderer.java +42 -0
- data/src/wordcram/RandomWordNudger.java +44 -0
- data/src/wordcram/RenderOptions.java +10 -0
- data/src/wordcram/ShapeBasedPlacer.java +66 -0
- data/src/wordcram/Sizers.java +54 -0
- data/src/wordcram/SketchCallbackObserver.java +70 -0
- data/src/wordcram/SpiralWordNudger.java +31 -0
- data/src/wordcram/SvgWordRenderer.java +110 -0
- data/src/wordcram/SwirlWordPlacer.java +25 -0
- data/src/wordcram/UpperLeftWordPlacer.java +27 -0
- data/src/wordcram/WaveWordPlacer.java +25 -0
- data/src/wordcram/Word.java +357 -0
- data/src/wordcram/WordAngler.java +20 -0
- data/src/wordcram/WordArray.java +18 -0
- data/src/wordcram/WordBag.java +31 -0
- data/src/wordcram/WordColorer.java +25 -0
- data/src/wordcram/WordCounter.java +96 -0
- data/src/wordcram/WordCram.java +920 -0
- data/src/wordcram/WordCramEngine.java +196 -0
- data/src/wordcram/WordFonter.java +24 -0
- data/src/wordcram/WordNudger.java +44 -0
- data/src/wordcram/WordPlacer.java +44 -0
- data/src/wordcram/WordRenderer.java +10 -0
- data/src/wordcram/WordShaper.java +78 -0
- data/src/wordcram/WordSizer.java +46 -0
- data/src/wordcram/WordSkipReason.java +42 -0
- data/src/wordcram/WordSorterAndScaler.java +31 -0
- data/src/wordcram/WordSource.java +5 -0
- data/src/wordcram/text/Html.java +15 -0
- data/src/wordcram/text/Html2Text.java +17 -0
- data/src/wordcram/text/Text.java +15 -0
- data/src/wordcram/text/TextFile.java +23 -0
- data/src/wordcram/text/TextSource.java +5 -0
- data/src/wordcram/text/WebPage.java +23 -0
- metadata +94 -5
- data/lib/cue.language.jar +0 -0
- data/lib/jsoup-1.7.2.jar +0 -0
- data/vendors/Rakefile +0 -51
@@ -0,0 +1,220 @@
|
|
1
|
+
אני
|
2
|
+
את
|
3
|
+
אתה
|
4
|
+
אנחנו
|
5
|
+
אתן
|
6
|
+
אתם
|
7
|
+
הם
|
8
|
+
הן
|
9
|
+
היא
|
10
|
+
הוא
|
11
|
+
שלי
|
12
|
+
שלו
|
13
|
+
שלך
|
14
|
+
שלכה
|
15
|
+
שלה
|
16
|
+
שלנו
|
17
|
+
שלכם
|
18
|
+
שלכן
|
19
|
+
שלהם
|
20
|
+
שלהן
|
21
|
+
לי
|
22
|
+
לו
|
23
|
+
לה
|
24
|
+
לנו
|
25
|
+
לכם
|
26
|
+
לכן
|
27
|
+
להם
|
28
|
+
להן
|
29
|
+
אותה
|
30
|
+
אותו
|
31
|
+
זה
|
32
|
+
זאת
|
33
|
+
אלה
|
34
|
+
אלו
|
35
|
+
תחת
|
36
|
+
מתחת
|
37
|
+
מעל
|
38
|
+
בין
|
39
|
+
עם
|
40
|
+
עד
|
41
|
+
נגר
|
42
|
+
על
|
43
|
+
אל
|
44
|
+
מול
|
45
|
+
של
|
46
|
+
אצל
|
47
|
+
כמו
|
48
|
+
אחר
|
49
|
+
אותו
|
50
|
+
בלי
|
51
|
+
לפני
|
52
|
+
אחרי
|
53
|
+
מאחורי
|
54
|
+
עלי
|
55
|
+
עליו
|
56
|
+
עליה
|
57
|
+
עליך
|
58
|
+
עלינו
|
59
|
+
עליכם
|
60
|
+
לעיכן
|
61
|
+
עליהם
|
62
|
+
עליהן
|
63
|
+
כל
|
64
|
+
כולם
|
65
|
+
כולן
|
66
|
+
כך
|
67
|
+
ככה
|
68
|
+
כזה
|
69
|
+
זה
|
70
|
+
זות
|
71
|
+
אותי
|
72
|
+
אותה
|
73
|
+
אותם
|
74
|
+
אותך
|
75
|
+
אותו
|
76
|
+
אותן
|
77
|
+
אותנו
|
78
|
+
ואת
|
79
|
+
את
|
80
|
+
אתכם
|
81
|
+
אתכן
|
82
|
+
איתי
|
83
|
+
איתו
|
84
|
+
איתך
|
85
|
+
איתה
|
86
|
+
איתם
|
87
|
+
איתן
|
88
|
+
איתנו
|
89
|
+
איתכם
|
90
|
+
איתכן
|
91
|
+
יהיה
|
92
|
+
תהיה
|
93
|
+
היתי
|
94
|
+
היתה
|
95
|
+
היה
|
96
|
+
להיות
|
97
|
+
עצמי
|
98
|
+
עצמו
|
99
|
+
עצמה
|
100
|
+
עצמם
|
101
|
+
עצמן
|
102
|
+
עצמנו
|
103
|
+
עצמהם
|
104
|
+
עצמהן
|
105
|
+
מי
|
106
|
+
מה
|
107
|
+
איפה
|
108
|
+
היכן
|
109
|
+
במקוםשבו
|
110
|
+
אם
|
111
|
+
לאן
|
112
|
+
למקוםשבו
|
113
|
+
מקוםבו
|
114
|
+
איזה
|
115
|
+
מהיכן
|
116
|
+
איך
|
117
|
+
כיצד
|
118
|
+
באיזומידה
|
119
|
+
מתי
|
120
|
+
בשעהש
|
121
|
+
כאשר
|
122
|
+
כש
|
123
|
+
למרות
|
124
|
+
לפני
|
125
|
+
אחרי
|
126
|
+
מאיזוסיבה
|
127
|
+
הסיבהשבגללה
|
128
|
+
למה
|
129
|
+
מדוע
|
130
|
+
לאיזותכלית
|
131
|
+
כי
|
132
|
+
יש
|
133
|
+
אין
|
134
|
+
אך
|
135
|
+
מנין
|
136
|
+
מאין
|
137
|
+
מאיפה
|
138
|
+
יכל
|
139
|
+
יכלה
|
140
|
+
יכלו
|
141
|
+
יכול
|
142
|
+
יכולה
|
143
|
+
יכולים
|
144
|
+
יכולות
|
145
|
+
יוכלו
|
146
|
+
יוכל
|
147
|
+
מסוגל
|
148
|
+
לא
|
149
|
+
רק
|
150
|
+
אולי
|
151
|
+
אין
|
152
|
+
לאו
|
153
|
+
אי
|
154
|
+
כלל
|
155
|
+
נגד
|
156
|
+
אם
|
157
|
+
עם
|
158
|
+
אל
|
159
|
+
אלה
|
160
|
+
אלו
|
161
|
+
אף
|
162
|
+
על
|
163
|
+
מעל
|
164
|
+
מתחת
|
165
|
+
מצד
|
166
|
+
בשביל
|
167
|
+
לבין
|
168
|
+
באמצע
|
169
|
+
בתוך
|
170
|
+
דרך
|
171
|
+
מבעד
|
172
|
+
באמצעות
|
173
|
+
למעלה
|
174
|
+
למטה
|
175
|
+
מחוץ
|
176
|
+
מן
|
177
|
+
לעבר
|
178
|
+
מכאן
|
179
|
+
כאן
|
180
|
+
הנה
|
181
|
+
הרי
|
182
|
+
פה
|
183
|
+
שם
|
184
|
+
אך
|
185
|
+
ברם
|
186
|
+
שוב
|
187
|
+
אבל
|
188
|
+
מבלי
|
189
|
+
בלי
|
190
|
+
מלבד
|
191
|
+
רק
|
192
|
+
בגלל
|
193
|
+
מכיוון
|
194
|
+
עד
|
195
|
+
אשר
|
196
|
+
ואילו
|
197
|
+
למרות
|
198
|
+
אס
|
199
|
+
כמו
|
200
|
+
כפי
|
201
|
+
אז
|
202
|
+
אחריכן
|
203
|
+
לכן
|
204
|
+
לפיכך
|
205
|
+
מאד
|
206
|
+
עז
|
207
|
+
מעט
|
208
|
+
מעטים
|
209
|
+
במידה
|
210
|
+
שוב
|
211
|
+
יותרמדי
|
212
|
+
גם
|
213
|
+
כן
|
214
|
+
נו
|
215
|
+
אחר
|
216
|
+
אחרת
|
217
|
+
אחרים
|
218
|
+
אחרות
|
219
|
+
אשר
|
220
|
+
או
|
@@ -0,0 +1,97 @@
|
|
1
|
+
के
|
2
|
+
का
|
3
|
+
एक
|
4
|
+
में
|
5
|
+
की
|
6
|
+
है
|
7
|
+
यह
|
8
|
+
और
|
9
|
+
से
|
10
|
+
हैं
|
11
|
+
को
|
12
|
+
पर
|
13
|
+
इस
|
14
|
+
होता
|
15
|
+
कि
|
16
|
+
जो
|
17
|
+
कर
|
18
|
+
मे
|
19
|
+
गया
|
20
|
+
करने
|
21
|
+
किया
|
22
|
+
लिये
|
23
|
+
अपने
|
24
|
+
ने
|
25
|
+
बनी
|
26
|
+
नहीं
|
27
|
+
तो
|
28
|
+
ही
|
29
|
+
या
|
30
|
+
एवं
|
31
|
+
दिया
|
32
|
+
हो
|
33
|
+
इसका
|
34
|
+
था
|
35
|
+
द्वारा
|
36
|
+
हुआ
|
37
|
+
तक
|
38
|
+
साथ
|
39
|
+
करना
|
40
|
+
वाले
|
41
|
+
बाद
|
42
|
+
लिए
|
43
|
+
आप
|
44
|
+
कुछ
|
45
|
+
सकते
|
46
|
+
किसी
|
47
|
+
ये
|
48
|
+
इसके
|
49
|
+
सबसे
|
50
|
+
इसमें
|
51
|
+
थे
|
52
|
+
दो
|
53
|
+
होने
|
54
|
+
वह
|
55
|
+
वे
|
56
|
+
करते
|
57
|
+
बहुत
|
58
|
+
कहा
|
59
|
+
वर्ग
|
60
|
+
कई
|
61
|
+
करें
|
62
|
+
होती
|
63
|
+
अपनी
|
64
|
+
उनके
|
65
|
+
थी
|
66
|
+
यदि
|
67
|
+
हुई
|
68
|
+
जा
|
69
|
+
ना
|
70
|
+
इसे
|
71
|
+
कहते
|
72
|
+
जब
|
73
|
+
होते
|
74
|
+
कोई
|
75
|
+
हुए
|
76
|
+
व
|
77
|
+
न
|
78
|
+
अभी
|
79
|
+
जैसे
|
80
|
+
सभी
|
81
|
+
करता
|
82
|
+
उनकी
|
83
|
+
तरह
|
84
|
+
उस
|
85
|
+
आदि
|
86
|
+
कुल
|
87
|
+
एस
|
88
|
+
रहा
|
89
|
+
इसकी
|
90
|
+
सकता
|
91
|
+
रहे
|
92
|
+
उनका
|
93
|
+
इसी
|
94
|
+
रखें
|
95
|
+
अपना
|
96
|
+
पे
|
97
|
+
उसके
|
@@ -0,0 +1,202 @@
|
|
1
|
+
a
|
2
|
+
ahogy
|
3
|
+
ahol
|
4
|
+
aki
|
5
|
+
akik
|
6
|
+
akkor
|
7
|
+
alatt
|
8
|
+
által
|
9
|
+
általában
|
10
|
+
amely
|
11
|
+
amelyek
|
12
|
+
amelyekben
|
13
|
+
amelyeket
|
14
|
+
amelyet
|
15
|
+
amelynek
|
16
|
+
ami
|
17
|
+
amit
|
18
|
+
amolyan
|
19
|
+
amíg
|
20
|
+
amikor
|
21
|
+
át
|
22
|
+
abban
|
23
|
+
ahhoz
|
24
|
+
annak
|
25
|
+
arra
|
26
|
+
arról
|
27
|
+
az
|
28
|
+
azok
|
29
|
+
azon
|
30
|
+
azt
|
31
|
+
azzal
|
32
|
+
azért
|
33
|
+
aztán
|
34
|
+
azután
|
35
|
+
azonban
|
36
|
+
bár
|
37
|
+
be
|
38
|
+
belül
|
39
|
+
benne
|
40
|
+
cikk
|
41
|
+
cikkek
|
42
|
+
cikkeket
|
43
|
+
csak
|
44
|
+
de
|
45
|
+
e
|
46
|
+
eddig
|
47
|
+
egész
|
48
|
+
egy
|
49
|
+
egyes
|
50
|
+
egyetlen
|
51
|
+
egyéb
|
52
|
+
egyik
|
53
|
+
egyre
|
54
|
+
ekkor
|
55
|
+
el
|
56
|
+
elég
|
57
|
+
ellen
|
58
|
+
elõ
|
59
|
+
elõször
|
60
|
+
elõtt
|
61
|
+
elsõ
|
62
|
+
én
|
63
|
+
éppen
|
64
|
+
ebben
|
65
|
+
ehhez
|
66
|
+
emilyen
|
67
|
+
ennek
|
68
|
+
erre
|
69
|
+
ez
|
70
|
+
ezt
|
71
|
+
ezek
|
72
|
+
ezen
|
73
|
+
ezzel
|
74
|
+
ezért
|
75
|
+
és
|
76
|
+
fel
|
77
|
+
felé
|
78
|
+
ha
|
79
|
+
hanem
|
80
|
+
hiszen
|
81
|
+
hogy
|
82
|
+
hogyan
|
83
|
+
igen
|
84
|
+
így
|
85
|
+
illetve
|
86
|
+
ill.
|
87
|
+
ill
|
88
|
+
ilyen
|
89
|
+
ilyenkor
|
90
|
+
inkább
|
91
|
+
is
|
92
|
+
ison
|
93
|
+
ismét
|
94
|
+
itt
|
95
|
+
jó
|
96
|
+
jól
|
97
|
+
jobban
|
98
|
+
kell
|
99
|
+
kellett
|
100
|
+
keresztül
|
101
|
+
keressünk
|
102
|
+
ki
|
103
|
+
kívül
|
104
|
+
között
|
105
|
+
közül
|
106
|
+
legalább
|
107
|
+
lehet
|
108
|
+
lehetett
|
109
|
+
legyen
|
110
|
+
lenne
|
111
|
+
lenni
|
112
|
+
lesz
|
113
|
+
lett
|
114
|
+
maga
|
115
|
+
magát
|
116
|
+
majd
|
117
|
+
majd
|
118
|
+
már
|
119
|
+
más
|
120
|
+
másik
|
121
|
+
meg
|
122
|
+
még
|
123
|
+
mellett
|
124
|
+
mert
|
125
|
+
mely
|
126
|
+
melyek
|
127
|
+
mi
|
128
|
+
mit
|
129
|
+
míg
|
130
|
+
miért
|
131
|
+
milyen
|
132
|
+
mikor
|
133
|
+
minden
|
134
|
+
mindent
|
135
|
+
mindenki
|
136
|
+
mindig
|
137
|
+
mint
|
138
|
+
mintha
|
139
|
+
mivel
|
140
|
+
most
|
141
|
+
nagy
|
142
|
+
nagyobb
|
143
|
+
nagyon
|
144
|
+
ne
|
145
|
+
néha
|
146
|
+
nekem
|
147
|
+
neki
|
148
|
+
nem
|
149
|
+
néhány
|
150
|
+
nélkül
|
151
|
+
nincs
|
152
|
+
olyan
|
153
|
+
ott
|
154
|
+
össze
|
155
|
+
õ
|
156
|
+
õk
|
157
|
+
õket
|
158
|
+
pedig
|
159
|
+
persze
|
160
|
+
rá
|
161
|
+
s
|
162
|
+
saját
|
163
|
+
sem
|
164
|
+
semmi
|
165
|
+
sok
|
166
|
+
sokat
|
167
|
+
sokkal
|
168
|
+
számára
|
169
|
+
szemben
|
170
|
+
szerint
|
171
|
+
szinte
|
172
|
+
talán
|
173
|
+
tehát
|
174
|
+
teljes
|
175
|
+
tovább
|
176
|
+
továbbá
|
177
|
+
több
|
178
|
+
úgy
|
179
|
+
ugyanis
|
180
|
+
új
|
181
|
+
újabb
|
182
|
+
újra
|
183
|
+
után
|
184
|
+
utána
|
185
|
+
utolsó
|
186
|
+
vagy
|
187
|
+
vagyis
|
188
|
+
valaki
|
189
|
+
valami
|
190
|
+
valamint
|
191
|
+
való
|
192
|
+
vagyok
|
193
|
+
van
|
194
|
+
vannak
|
195
|
+
volt
|
196
|
+
voltam
|
197
|
+
voltak
|
198
|
+
voltunk
|
199
|
+
vissza
|
200
|
+
vele
|
201
|
+
viszont
|
202
|
+
volna
|