ruby_wordcram 1.0.1 → 2.0.0
Sign up to get free protection for your applications and to get access to all the features.
- checksums.yaml +4 -4
- data/.gitignore +3 -0
- data/.mvn/extensions.xml +8 -0
- data/.mvn/wrapper/maven-wrapper.properties +1 -0
- data/Rakefile +28 -5
- data/docs/_posts/2017-03-07-getting_started.md +3 -2
- data/docs/_posts/2017-03-07-under_the_hood.md +33 -0
- data/lib/WordCram.jar +0 -0
- data/lib/jsoup-1.10.2.jar +0 -0
- data/lib/ruby_wordcram/version.rb +1 -1
- data/lib/ruby_wordcram.rb +1 -2
- data/pom.rb +53 -0
- data/pom.xml +87 -0
- data/ruby_wordcram.gemspec +1 -2
- data/src/cue/lang/Counter.java +141 -0
- data/src/cue/lang/IterableText.java +10 -0
- data/src/cue/lang/NGramIterator.java +151 -0
- data/src/cue/lang/SentenceIterator.java +86 -0
- data/src/cue/lang/WordIterator.java +60 -0
- data/src/cue/lang/stop/StopWords.java +114 -0
- data/src/cue/lang/stop/arabic +351 -0
- data/src/cue/lang/stop/armenian +45 -0
- data/src/cue/lang/stop/catalan +219 -0
- data/src/cue/lang/stop/croatian +2024 -0
- data/src/cue/lang/stop/czech +256 -0
- data/src/cue/lang/stop/danish +94 -0
- data/src/cue/lang/stop/dutch +107 -0
- data/src/cue/lang/stop/english +183 -0
- data/src/cue/lang/stop/esperanto +180 -0
- data/src/cue/lang/stop/farsi +966 -0
- data/src/cue/lang/stop/finnish +235 -0
- data/src/cue/lang/stop/french +543 -0
- data/src/cue/lang/stop/german +231 -0
- data/src/cue/lang/stop/greek +637 -0
- data/src/cue/lang/stop/hebrew +220 -0
- data/src/cue/lang/stop/hindi +97 -0
- data/src/cue/lang/stop/hungarian +202 -0
- data/src/cue/lang/stop/italian +279 -0
- data/src/cue/lang/stop/latin +1 -0
- data/src/cue/lang/stop/norwegian +176 -0
- data/src/cue/lang/stop/polish +138 -0
- data/src/cue/lang/stop/portuguese +204 -0
- data/src/cue/lang/stop/romanian +284 -0
- data/src/cue/lang/stop/russian +652 -0
- data/src/cue/lang/stop/slovak +110 -0
- data/src/cue/lang/stop/slovenian +448 -0
- data/src/cue/lang/stop/spanish +308 -0
- data/src/cue/lang/stop/swedish +114 -0
- data/src/cue/lang/stop/turkish +117 -0
- data/src/cue/lang/unicode/BlockUtil.java +103 -0
- data/src/cue/lang/unicode/Normalizer.java +55 -0
- data/src/cue/lang/unicode/Normalizer6.java +32 -0
- data/src/license.txt +201 -0
- data/src/wordcram/Anglers.java +137 -0
- data/src/wordcram/BBTree.java +133 -0
- data/src/wordcram/BBTreeBuilder.java +61 -0
- data/src/wordcram/Colorers.java +52 -0
- data/src/wordcram/EngineWord.java +73 -0
- data/src/wordcram/Fonters.java +17 -0
- data/src/wordcram/HsbWordColorer.java +28 -0
- data/src/wordcram/ImageShaper.java +91 -0
- data/src/wordcram/Observer.java +9 -0
- data/src/wordcram/PlacerHeatMap.java +134 -0
- data/src/wordcram/Placers.java +74 -0
- data/src/wordcram/PlottingWordNudger.java +38 -0
- data/src/wordcram/PlottingWordPlacer.java +36 -0
- data/src/wordcram/ProcessingWordRenderer.java +42 -0
- data/src/wordcram/RandomWordNudger.java +44 -0
- data/src/wordcram/RenderOptions.java +10 -0
- data/src/wordcram/ShapeBasedPlacer.java +66 -0
- data/src/wordcram/Sizers.java +54 -0
- data/src/wordcram/SketchCallbackObserver.java +70 -0
- data/src/wordcram/SpiralWordNudger.java +31 -0
- data/src/wordcram/SvgWordRenderer.java +110 -0
- data/src/wordcram/SwirlWordPlacer.java +25 -0
- data/src/wordcram/UpperLeftWordPlacer.java +27 -0
- data/src/wordcram/WaveWordPlacer.java +25 -0
- data/src/wordcram/Word.java +357 -0
- data/src/wordcram/WordAngler.java +20 -0
- data/src/wordcram/WordArray.java +18 -0
- data/src/wordcram/WordBag.java +31 -0
- data/src/wordcram/WordColorer.java +25 -0
- data/src/wordcram/WordCounter.java +96 -0
- data/src/wordcram/WordCram.java +920 -0
- data/src/wordcram/WordCramEngine.java +196 -0
- data/src/wordcram/WordFonter.java +24 -0
- data/src/wordcram/WordNudger.java +44 -0
- data/src/wordcram/WordPlacer.java +44 -0
- data/src/wordcram/WordRenderer.java +10 -0
- data/src/wordcram/WordShaper.java +78 -0
- data/src/wordcram/WordSizer.java +46 -0
- data/src/wordcram/WordSkipReason.java +42 -0
- data/src/wordcram/WordSorterAndScaler.java +31 -0
- data/src/wordcram/WordSource.java +5 -0
- data/src/wordcram/text/Html.java +15 -0
- data/src/wordcram/text/Html2Text.java +17 -0
- data/src/wordcram/text/Text.java +15 -0
- data/src/wordcram/text/TextFile.java +23 -0
- data/src/wordcram/text/TextSource.java +5 -0
- data/src/wordcram/text/WebPage.java +23 -0
- metadata +94 -5
- data/lib/cue.language.jar +0 -0
- data/lib/jsoup-1.7.2.jar +0 -0
- data/vendors/Rakefile +0 -51
@@ -0,0 +1,138 @@
|
|
1
|
+
ach
|
2
|
+
aj
|
3
|
+
albo
|
4
|
+
bardzo
|
5
|
+
bez
|
6
|
+
bo
|
7
|
+
być
|
8
|
+
ci
|
9
|
+
cię
|
10
|
+
ciebie
|
11
|
+
co
|
12
|
+
czy
|
13
|
+
daleko
|
14
|
+
dla
|
15
|
+
dlaczego
|
16
|
+
dlatego
|
17
|
+
do
|
18
|
+
dobrze
|
19
|
+
dokąd
|
20
|
+
dość
|
21
|
+
dużo
|
22
|
+
dwa
|
23
|
+
dwaj
|
24
|
+
dwie
|
25
|
+
dwoje
|
26
|
+
dziś
|
27
|
+
dzisiaj
|
28
|
+
gdyby
|
29
|
+
gdzie
|
30
|
+
go
|
31
|
+
ich
|
32
|
+
ile
|
33
|
+
im
|
34
|
+
inny
|
35
|
+
ja
|
36
|
+
ją
|
37
|
+
jak
|
38
|
+
jakby
|
39
|
+
jaki
|
40
|
+
je
|
41
|
+
jeden
|
42
|
+
jedna
|
43
|
+
jedno
|
44
|
+
jego
|
45
|
+
jej
|
46
|
+
jemu
|
47
|
+
jeśli
|
48
|
+
jest
|
49
|
+
jestem
|
50
|
+
jeżeli
|
51
|
+
już
|
52
|
+
każdy
|
53
|
+
kiedy
|
54
|
+
kierunku
|
55
|
+
kto
|
56
|
+
ku
|
57
|
+
lub
|
58
|
+
ma
|
59
|
+
mają
|
60
|
+
mam
|
61
|
+
mi
|
62
|
+
mną
|
63
|
+
mnie
|
64
|
+
moi
|
65
|
+
mój
|
66
|
+
moja
|
67
|
+
moje
|
68
|
+
może
|
69
|
+
mu
|
70
|
+
my
|
71
|
+
na
|
72
|
+
nam
|
73
|
+
nami
|
74
|
+
nas
|
75
|
+
nasi
|
76
|
+
nasz
|
77
|
+
nasza
|
78
|
+
nasze
|
79
|
+
natychmiast
|
80
|
+
nią
|
81
|
+
nic
|
82
|
+
nich
|
83
|
+
nie
|
84
|
+
niego
|
85
|
+
niej
|
86
|
+
niemu
|
87
|
+
nigdy
|
88
|
+
nim
|
89
|
+
nimi
|
90
|
+
niż
|
91
|
+
obok
|
92
|
+
od
|
93
|
+
około
|
94
|
+
on
|
95
|
+
ona
|
96
|
+
one
|
97
|
+
oni
|
98
|
+
ono
|
99
|
+
owszem
|
100
|
+
po
|
101
|
+
pod
|
102
|
+
ponieważ
|
103
|
+
przed
|
104
|
+
przedtem
|
105
|
+
są
|
106
|
+
sam
|
107
|
+
sama
|
108
|
+
się
|
109
|
+
skąd
|
110
|
+
tak
|
111
|
+
taki
|
112
|
+
tam
|
113
|
+
ten
|
114
|
+
to
|
115
|
+
tobą
|
116
|
+
tobie
|
117
|
+
tu
|
118
|
+
tutaj
|
119
|
+
twoi
|
120
|
+
twój
|
121
|
+
twoja
|
122
|
+
twoje
|
123
|
+
ty
|
124
|
+
wam
|
125
|
+
wami
|
126
|
+
was
|
127
|
+
wasi
|
128
|
+
wasz
|
129
|
+
wasza
|
130
|
+
wasze
|
131
|
+
we
|
132
|
+
więc
|
133
|
+
wszystko
|
134
|
+
wtedy
|
135
|
+
wy
|
136
|
+
żaden
|
137
|
+
zawsze
|
138
|
+
że
|
@@ -0,0 +1,204 @@
|
|
1
|
+
de
|
2
|
+
a
|
3
|
+
o
|
4
|
+
que
|
5
|
+
e
|
6
|
+
do
|
7
|
+
da
|
8
|
+
em
|
9
|
+
um
|
10
|
+
para
|
11
|
+
pra
|
12
|
+
com
|
13
|
+
não
|
14
|
+
uma
|
15
|
+
os
|
16
|
+
no
|
17
|
+
se
|
18
|
+
na
|
19
|
+
por
|
20
|
+
mais
|
21
|
+
as
|
22
|
+
dos
|
23
|
+
como
|
24
|
+
mas
|
25
|
+
ao
|
26
|
+
ele
|
27
|
+
das
|
28
|
+
à
|
29
|
+
seu
|
30
|
+
sua
|
31
|
+
ou
|
32
|
+
quando
|
33
|
+
muito
|
34
|
+
nos
|
35
|
+
já
|
36
|
+
eu
|
37
|
+
também
|
38
|
+
só
|
39
|
+
pelo
|
40
|
+
pela
|
41
|
+
até
|
42
|
+
isso
|
43
|
+
ela
|
44
|
+
entre
|
45
|
+
depois
|
46
|
+
sem
|
47
|
+
mesmo
|
48
|
+
aos
|
49
|
+
seus
|
50
|
+
quem
|
51
|
+
nas
|
52
|
+
me
|
53
|
+
esse
|
54
|
+
eles
|
55
|
+
você
|
56
|
+
essa
|
57
|
+
num
|
58
|
+
nem
|
59
|
+
suas
|
60
|
+
meu
|
61
|
+
às
|
62
|
+
minha
|
63
|
+
numa
|
64
|
+
pelos
|
65
|
+
elas
|
66
|
+
qual
|
67
|
+
nós
|
68
|
+
lhe
|
69
|
+
deles
|
70
|
+
essas
|
71
|
+
esses
|
72
|
+
pelas
|
73
|
+
este
|
74
|
+
dele
|
75
|
+
tu
|
76
|
+
te
|
77
|
+
vocês
|
78
|
+
vos
|
79
|
+
lhes
|
80
|
+
meus
|
81
|
+
minhas
|
82
|
+
teu
|
83
|
+
tua
|
84
|
+
teus
|
85
|
+
tuas
|
86
|
+
nosso
|
87
|
+
nossa
|
88
|
+
nossos
|
89
|
+
nossas
|
90
|
+
dela
|
91
|
+
delas
|
92
|
+
esta
|
93
|
+
estes
|
94
|
+
estas
|
95
|
+
aquele
|
96
|
+
aquela
|
97
|
+
aqueles
|
98
|
+
aquelas
|
99
|
+
isto
|
100
|
+
aquilo
|
101
|
+
estou
|
102
|
+
está
|
103
|
+
estamos
|
104
|
+
estão
|
105
|
+
estive
|
106
|
+
esteve
|
107
|
+
estivemos
|
108
|
+
estiveram
|
109
|
+
estava
|
110
|
+
estávamos
|
111
|
+
estavam
|
112
|
+
estivera
|
113
|
+
estivéramos
|
114
|
+
esteja
|
115
|
+
estejamos
|
116
|
+
estejam
|
117
|
+
estivesse
|
118
|
+
estivéssemos
|
119
|
+
estivessem
|
120
|
+
estiver
|
121
|
+
estivermos
|
122
|
+
estiverem
|
123
|
+
hei
|
124
|
+
há
|
125
|
+
havemos
|
126
|
+
hão
|
127
|
+
houve
|
128
|
+
houvemos
|
129
|
+
houveram
|
130
|
+
houvera
|
131
|
+
houvéramos
|
132
|
+
haja
|
133
|
+
hajamos
|
134
|
+
hajam
|
135
|
+
houvesse
|
136
|
+
houvéssemos
|
137
|
+
houvessem
|
138
|
+
houver
|
139
|
+
houvermos
|
140
|
+
houverem
|
141
|
+
houverei
|
142
|
+
houverá
|
143
|
+
houveremos
|
144
|
+
houverão
|
145
|
+
houveria
|
146
|
+
houveríamos
|
147
|
+
houveriam
|
148
|
+
sou
|
149
|
+
somos
|
150
|
+
são
|
151
|
+
era
|
152
|
+
éramos
|
153
|
+
eram
|
154
|
+
fui
|
155
|
+
foi
|
156
|
+
fomos
|
157
|
+
foram
|
158
|
+
fora
|
159
|
+
fôramos
|
160
|
+
seja
|
161
|
+
sejamos
|
162
|
+
sejam
|
163
|
+
fosse
|
164
|
+
fôssemos
|
165
|
+
fossem
|
166
|
+
for
|
167
|
+
formos
|
168
|
+
forem
|
169
|
+
serei
|
170
|
+
será
|
171
|
+
seremos
|
172
|
+
serão
|
173
|
+
seria
|
174
|
+
seríamos
|
175
|
+
seriam
|
176
|
+
tenho
|
177
|
+
tem
|
178
|
+
temos
|
179
|
+
tém
|
180
|
+
tinha
|
181
|
+
tínhamos
|
182
|
+
tinham
|
183
|
+
tive
|
184
|
+
teve
|
185
|
+
tivemos
|
186
|
+
tiveram
|
187
|
+
tivera
|
188
|
+
tivéramos
|
189
|
+
tenha
|
190
|
+
tenhamos
|
191
|
+
tenham
|
192
|
+
tivesse
|
193
|
+
tivéssemos
|
194
|
+
tivessem
|
195
|
+
tiver
|
196
|
+
tivermos
|
197
|
+
tiverem
|
198
|
+
terei
|
199
|
+
terá
|
200
|
+
teremos
|
201
|
+
terão
|
202
|
+
teria
|
203
|
+
teríamos
|
204
|
+
teriam
|
@@ -0,0 +1,284 @@
|
|
1
|
+
a
|
2
|
+
abia
|
3
|
+
acea
|
4
|
+
aceasta
|
5
|
+
această
|
6
|
+
aceea
|
7
|
+
acei
|
8
|
+
aceia
|
9
|
+
acel
|
10
|
+
acela
|
11
|
+
acele
|
12
|
+
acelea
|
13
|
+
acest
|
14
|
+
acesta
|
15
|
+
aceste
|
16
|
+
acestea
|
17
|
+
aceşti
|
18
|
+
aceştia
|
19
|
+
acolo
|
20
|
+
acord
|
21
|
+
acum
|
22
|
+
ai
|
23
|
+
aia
|
24
|
+
aibă
|
25
|
+
aici
|
26
|
+
al
|
27
|
+
ăla
|
28
|
+
ale
|
29
|
+
alea
|
30
|
+
ălea
|
31
|
+
altceva
|
32
|
+
altcineva
|
33
|
+
am
|
34
|
+
ar
|
35
|
+
are
|
36
|
+
aş
|
37
|
+
aşadar
|
38
|
+
asemenea
|
39
|
+
asta
|
40
|
+
ăsta
|
41
|
+
astăzi
|
42
|
+
astea
|
43
|
+
ăstea
|
44
|
+
ăştia
|
45
|
+
asupra
|
46
|
+
aţi
|
47
|
+
au
|
48
|
+
avea
|
49
|
+
avem
|
50
|
+
aveţi
|
51
|
+
azi
|
52
|
+
bine
|
53
|
+
bucur
|
54
|
+
bună
|
55
|
+
ca
|
56
|
+
că
|
57
|
+
căci
|
58
|
+
când
|
59
|
+
care
|
60
|
+
cărei
|
61
|
+
căror
|
62
|
+
cărui
|
63
|
+
cât
|
64
|
+
câte
|
65
|
+
câţi
|
66
|
+
către
|
67
|
+
câtva
|
68
|
+
caut
|
69
|
+
ce
|
70
|
+
cel
|
71
|
+
ceva
|
72
|
+
chiar
|
73
|
+
cinci
|
74
|
+
cînd
|
75
|
+
cine
|
76
|
+
cineva
|
77
|
+
cît
|
78
|
+
cîte
|
79
|
+
cîţi
|
80
|
+
cîtva
|
81
|
+
contra
|
82
|
+
cu
|
83
|
+
cum
|
84
|
+
cumva
|
85
|
+
curând
|
86
|
+
curînd
|
87
|
+
da
|
88
|
+
dă
|
89
|
+
dacă
|
90
|
+
dar
|
91
|
+
dată
|
92
|
+
datorită
|
93
|
+
dau
|
94
|
+
de
|
95
|
+
deci
|
96
|
+
deja
|
97
|
+
deoarece
|
98
|
+
departe
|
99
|
+
deşi
|
100
|
+
din
|
101
|
+
dinaintea
|
102
|
+
dintr-
|
103
|
+
dintre
|
104
|
+
doi
|
105
|
+
doilea
|
106
|
+
două
|
107
|
+
drept
|
108
|
+
după
|
109
|
+
ea
|
110
|
+
ei
|
111
|
+
el
|
112
|
+
ele
|
113
|
+
eram
|
114
|
+
este
|
115
|
+
eşti
|
116
|
+
eu
|
117
|
+
face
|
118
|
+
fără
|
119
|
+
fata
|
120
|
+
fi
|
121
|
+
fie
|
122
|
+
fiecare
|
123
|
+
fii
|
124
|
+
fim
|
125
|
+
fiţi
|
126
|
+
fiu
|
127
|
+
frumos
|
128
|
+
graţie
|
129
|
+
halbă
|
130
|
+
iar
|
131
|
+
ieri
|
132
|
+
îi
|
133
|
+
îl
|
134
|
+
îmi
|
135
|
+
împotriva
|
136
|
+
în
|
137
|
+
înainte
|
138
|
+
înaintea
|
139
|
+
încât
|
140
|
+
încît
|
141
|
+
încotro
|
142
|
+
între
|
143
|
+
întrucât
|
144
|
+
întrucît
|
145
|
+
îţi
|
146
|
+
la
|
147
|
+
lângă
|
148
|
+
le
|
149
|
+
li
|
150
|
+
lîngă
|
151
|
+
lor
|
152
|
+
lui
|
153
|
+
mă
|
154
|
+
mai
|
155
|
+
mâine
|
156
|
+
mea
|
157
|
+
mei
|
158
|
+
mele
|
159
|
+
mereu
|
160
|
+
meu
|
161
|
+
mi
|
162
|
+
mie
|
163
|
+
mîine
|
164
|
+
mine
|
165
|
+
mult
|
166
|
+
multă
|
167
|
+
mulţi
|
168
|
+
mulţumesc
|
169
|
+
ne
|
170
|
+
nevoie
|
171
|
+
nicăieri
|
172
|
+
nici
|
173
|
+
nimeni
|
174
|
+
nimeri
|
175
|
+
nimic
|
176
|
+
nişte
|
177
|
+
noastră
|
178
|
+
noastre
|
179
|
+
noi
|
180
|
+
noroc
|
181
|
+
noştri
|
182
|
+
nostru
|
183
|
+
nouă
|
184
|
+
nu
|
185
|
+
opt
|
186
|
+
ori
|
187
|
+
oricând
|
188
|
+
oricare
|
189
|
+
oricât
|
190
|
+
orice
|
191
|
+
oricînd
|
192
|
+
oricine
|
193
|
+
oricît
|
194
|
+
oricum
|
195
|
+
oriunde
|
196
|
+
până
|
197
|
+
patra
|
198
|
+
patru
|
199
|
+
patrulea
|
200
|
+
pe
|
201
|
+
pentru
|
202
|
+
peste
|
203
|
+
pic
|
204
|
+
pînă
|
205
|
+
poate
|
206
|
+
pot
|
207
|
+
prea
|
208
|
+
prima
|
209
|
+
primul
|
210
|
+
prin
|
211
|
+
printr-
|
212
|
+
puţin
|
213
|
+
puţina
|
214
|
+
puţină
|
215
|
+
rog
|
216
|
+
sa
|
217
|
+
să
|
218
|
+
săi
|
219
|
+
sale
|
220
|
+
şapte
|
221
|
+
şase
|
222
|
+
sau
|
223
|
+
său
|
224
|
+
se
|
225
|
+
şi
|
226
|
+
sînt
|
227
|
+
sîntem
|
228
|
+
sînteţi
|
229
|
+
spate
|
230
|
+
spre
|
231
|
+
ştiu
|
232
|
+
sub
|
233
|
+
sunt
|
234
|
+
suntem
|
235
|
+
sunteţi
|
236
|
+
sută
|
237
|
+
ta
|
238
|
+
tăi
|
239
|
+
tale
|
240
|
+
tău
|
241
|
+
te
|
242
|
+
ţi
|
243
|
+
ţie
|
244
|
+
timp
|
245
|
+
tine
|
246
|
+
toată
|
247
|
+
toate
|
248
|
+
tot
|
249
|
+
toţi
|
250
|
+
totuşi
|
251
|
+
trei
|
252
|
+
treia
|
253
|
+
treilea
|
254
|
+
tu
|
255
|
+
un
|
256
|
+
una
|
257
|
+
unde
|
258
|
+
undeva
|
259
|
+
unei
|
260
|
+
uneia
|
261
|
+
unele
|
262
|
+
uneori
|
263
|
+
unii
|
264
|
+
unor
|
265
|
+
unora
|
266
|
+
unu
|
267
|
+
unui
|
268
|
+
unuia
|
269
|
+
unul
|
270
|
+
vă
|
271
|
+
vi
|
272
|
+
voastră
|
273
|
+
voastre
|
274
|
+
voi
|
275
|
+
voştri
|
276
|
+
vostru
|
277
|
+
vouă
|
278
|
+
vreme
|
279
|
+
vreo
|
280
|
+
vreun
|
281
|
+
zece
|
282
|
+
zero
|
283
|
+
zi
|
284
|
+
zice
|