taraskevizer 1.4.3 → 1.4.4
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/README.md +7 -7
- package/dist/index.cjs +33 -9
- package/dist/index.d.ts +3 -7
- package/dist/index.js +33 -9
- package/package.json +1 -1
package/README.md
CHANGED
|
@@ -63,13 +63,13 @@ When to replace `і`(`i`) by `й`(`j`) after vowels:
|
|
|
63
63
|
|
|
64
64
|
### html
|
|
65
65
|
|
|
66
|
-
Type: `
|
|
66
|
+
Type: `boolean|object`
|
|
67
67
|
|
|
68
68
|
Default value: `false`
|
|
69
69
|
|
|
70
|
-
If `object`, some parts of a text are wrapped in HTML tags.
|
|
70
|
+
If `true|object`, some parts of a text are wrapped in HTML tags.
|
|
71
71
|
|
|
72
|
-
#### g
|
|
72
|
+
#### html.g
|
|
73
73
|
|
|
74
74
|
Type: `boolean`
|
|
75
75
|
|
|
@@ -85,19 +85,19 @@ true: <tarH>ґ</tarH> <tarH>Ґ</tarH>
|
|
|
85
85
|
|
|
86
86
|
### nonHtml
|
|
87
87
|
|
|
88
|
-
Type: `
|
|
88
|
+
Type: `boolean|object`
|
|
89
89
|
|
|
90
90
|
Default value: `false`
|
|
91
91
|
|
|
92
92
|
If `html` is defined, will be ignored
|
|
93
93
|
|
|
94
|
-
#### nodeColors
|
|
94
|
+
#### nonHtml.nodeColors
|
|
95
95
|
|
|
96
96
|
Type: `boolean`
|
|
97
97
|
|
|
98
98
|
Default value: `false`
|
|
99
99
|
|
|
100
|
-
#### h
|
|
100
|
+
#### nonHtml.h
|
|
101
101
|
|
|
102
102
|
Type: `boolean`
|
|
103
103
|
|
|
@@ -111,7 +111,7 @@ false: Ґ ґ
|
|
|
111
111
|
true: Г г
|
|
112
112
|
```
|
|
113
113
|
|
|
114
|
-
#### variations
|
|
114
|
+
#### nonHtml.variations
|
|
115
115
|
|
|
116
116
|
Type: `number`
|
|
117
117
|
|
package/dist/index.cjs
CHANGED
|
@@ -143,6 +143,7 @@ var greekLetters = [
|
|
|
143
143
|
["υ", /й/],
|
|
144
144
|
["κ", /к/],
|
|
145
145
|
["λ", /л/],
|
|
146
|
+
["μ‘π", /мп/],
|
|
146
147
|
["μ", /м/],
|
|
147
148
|
["ν", /н/],
|
|
148
149
|
["ο", /о/],
|
|
@@ -189,6 +190,8 @@ var greekLettersUpperCase = [
|
|
|
189
190
|
["Υ", /Й/],
|
|
190
191
|
["Κ", /К/],
|
|
191
192
|
["Λ", /Л/],
|
|
193
|
+
["Μ‘Π", /МП/],
|
|
194
|
+
["Μ‘π", /Мп/],
|
|
192
195
|
["Μ", /М/],
|
|
193
196
|
["Ν", /Н/],
|
|
194
197
|
["Ο", /О/],
|
|
@@ -210,25 +213,38 @@ var greekLettersUpperCase = [
|
|
|
210
213
|
];
|
|
211
214
|
var thWords = [
|
|
212
215
|
["θει", /тэі(?=зм|ст)/],
|
|
216
|
+
[" αγαθ", / агат/],
|
|
213
217
|
[" αναθεμ", / анатэм/],
|
|
218
|
+
["ανθραπα", /антрапа/],
|
|
219
|
+
[" απαθε", / апатэ(?=оз|аты|м)/],
|
|
214
220
|
[" αρθα", / арта(?=графі|д[ао]кс|эпі)/],
|
|
215
221
|
[" αρίθμετ", / арытмэт/],
|
|
216
222
|
[" αθεν", / атэн/],
|
|
217
223
|
[" καλιθε", / калітэ/],
|
|
218
224
|
[" καθεδ", / катэд(?=\(?а?р)/],
|
|
225
|
+
["λυαμπιρίνθ", /лябірынт/],
|
|
226
|
+
["λυαγαρίθμ", /лягарытм/],
|
|
227
|
+
[" μαρθί ", / мар[фт]ы /],
|
|
228
|
+
[" μαρθη ", / марфе /],
|
|
219
229
|
[" μαθεματί", / матэматы/],
|
|
220
230
|
[" μιθ", / міт(?=[ауы]|оляг| )/],
|
|
221
231
|
[" μεθ", / мэт(?=[ао]д)/],
|
|
232
|
+
["παθ", /пат(?=ал[ёя]гі|оляг|ычн|ыя|ы[ійю] |[ауы] |а[ўм] |амі | )/],
|
|
222
233
|
[" πιθαγορ", / пітагор/],
|
|
223
234
|
[" ρίθμ", / ры[тф]м/],
|
|
235
|
+
["σίνθετ", /сынтэ[зт]/],
|
|
236
|
+
[" θομασ", / томас/],
|
|
237
|
+
[" θρομμπ", / тромб/],
|
|
238
|
+
[" θρον", / трон/],
|
|
239
|
+
["θραμμποζ", /трамбоз/],
|
|
224
240
|
[" θεαδοσ", / тэадос/],
|
|
225
241
|
[" θεαρεμ", / тэарэм/],
|
|
226
242
|
[" θεατ", / тэат(?=ар |р)/],
|
|
227
243
|
[" θεμ", / тэм(?=[аеуы])/],
|
|
228
|
-
["
|
|
229
|
-
["
|
|
230
|
-
["
|
|
231
|
-
["
|
|
244
|
+
[" θε", / тэ(?=[ао]р|салёнік|сал)/],
|
|
245
|
+
["θε", /тэ(?=с\S*алёнік|\S*зіс)/],
|
|
246
|
+
["θερμα", /тэрма/],
|
|
247
|
+
[" εθ", / эт(?=ы[кч]|эр)/]
|
|
232
248
|
];
|
|
233
249
|
|
|
234
250
|
// src/dict/arabic.ts
|
|
@@ -434,6 +450,7 @@ var rawWordlist = [
|
|
|
434
450
|
["анэ", /ане(?=стэ[зт])/],
|
|
435
451
|
["апазыцы", /апазіцы/],
|
|
436
452
|
["апаляґет", /апалагет/],
|
|
453
|
+
[" апатэ", / апафе(?=оз|аты|м)/],
|
|
437
454
|
["апсыд", /апсід/],
|
|
438
455
|
// Апсыда
|
|
439
456
|
["апэльсін", /апельсін/],
|
|
@@ -837,9 +854,11 @@ var rawWordlist = [
|
|
|
837
854
|
[" люўр", / луўр/],
|
|
838
855
|
// [' $1ляг$2', / ((?:пра|не)?)лаг(аван|і|уе)/],
|
|
839
856
|
["лябара", /лабара(?=[нт])/],
|
|
857
|
+
["лябірын", /лабірын(?=[тц])/],
|
|
840
858
|
["лябатам", /лабатам/],
|
|
841
859
|
["ляванд", /лаванд/],
|
|
842
|
-
["лягарыт",
|
|
860
|
+
["лягарыт", /лагарыф/],
|
|
861
|
+
["лягатып", /лагатып/],
|
|
843
862
|
["лягуна", /лагуна/],
|
|
844
863
|
["ляйпцыг", /лейпцыг/],
|
|
845
864
|
["ляйтматы", /лейтматы/],
|
|
@@ -2162,7 +2181,12 @@ var taraskSync = (text, options) => {
|
|
|
2162
2181
|
splitted = restoreCase(splitted, splittedOrig);
|
|
2163
2182
|
const nodeColors = isNonHtmlObject && nonHtml.nodeColors;
|
|
2164
2183
|
if (html || nodeColors)
|
|
2165
|
-
splitted = toTags(
|
|
2184
|
+
splitted = toTags(
|
|
2185
|
+
splitted,
|
|
2186
|
+
splittedOrig,
|
|
2187
|
+
abc === ALPHABET.CYRILLIC,
|
|
2188
|
+
apply.F
|
|
2189
|
+
);
|
|
2166
2190
|
text = splitted.join(" ").replace(/ /g, " ").replace(/ (\p{P}|\p{S}|\d|() /gu, "$1");
|
|
2167
2191
|
let gReplacer;
|
|
2168
2192
|
if (html) {
|
|
@@ -2209,13 +2233,13 @@ function restoreCase(text, orig) {
|
|
|
2209
2233
|
}
|
|
2210
2234
|
return text;
|
|
2211
2235
|
}
|
|
2212
|
-
function toTags(text, orig,
|
|
2236
|
+
function toTags(text, orig, isCyrillic, applyF) {
|
|
2213
2237
|
for (let i = 0; i < text.length; i++) {
|
|
2214
2238
|
const word = text[i];
|
|
2215
2239
|
const oWord = orig[i];
|
|
2216
2240
|
if (oWord === word)
|
|
2217
2241
|
continue;
|
|
2218
|
-
const wordH = word.replace(G_REGEX, ($0) => gobj[$0]);
|
|
2242
|
+
const wordH = isCyrillic ? word.replace(G_REGEX, ($0) => gobj[$0]) : word;
|
|
2219
2243
|
if (oWord === wordH)
|
|
2220
2244
|
continue;
|
|
2221
2245
|
if (!/\(/.test(word)) {
|
|
@@ -2228,7 +2252,7 @@ function toTags(text, orig, abc, applyF) {
|
|
|
2228
2252
|
text[i] = wordLetters.join("");
|
|
2229
2253
|
continue;
|
|
2230
2254
|
}
|
|
2231
|
-
if (
|
|
2255
|
+
if (isCyrillic) {
|
|
2232
2256
|
const word1 = word.replace(/ь/g, "");
|
|
2233
2257
|
switch (oWord) {
|
|
2234
2258
|
case word1:
|
package/dist/index.d.ts
CHANGED
|
@@ -16,13 +16,9 @@ type HtmlOptions = {
|
|
|
16
16
|
type TaraskOptionsStrict = {
|
|
17
17
|
abc: Alphabet;
|
|
18
18
|
j: J$1;
|
|
19
|
-
|
|
20
|
-
|
|
21
|
-
|
|
22
|
-
} | {
|
|
23
|
-
html: false;
|
|
24
|
-
nonHtml: true | NonHtmlOptions;
|
|
25
|
-
});
|
|
19
|
+
html: boolean | HtmlOptions;
|
|
20
|
+
nonHtml: boolean | NonHtmlOptions;
|
|
21
|
+
};
|
|
26
22
|
type TaraskOptions = DeepPartial<TaraskOptionsStrict>;
|
|
27
23
|
type Tarask = (text: string, options?: TaraskOptions) => string;
|
|
28
24
|
type TaraskAsync = Promisify<Tarask>;
|
package/dist/index.js
CHANGED
|
@@ -113,6 +113,7 @@ var greekLetters = [
|
|
|
113
113
|
["υ", /й/],
|
|
114
114
|
["κ", /к/],
|
|
115
115
|
["λ", /л/],
|
|
116
|
+
["μ‘π", /мп/],
|
|
116
117
|
["μ", /м/],
|
|
117
118
|
["ν", /н/],
|
|
118
119
|
["ο", /о/],
|
|
@@ -159,6 +160,8 @@ var greekLettersUpperCase = [
|
|
|
159
160
|
["Υ", /Й/],
|
|
160
161
|
["Κ", /К/],
|
|
161
162
|
["Λ", /Л/],
|
|
163
|
+
["Μ‘Π", /МП/],
|
|
164
|
+
["Μ‘π", /Мп/],
|
|
162
165
|
["Μ", /М/],
|
|
163
166
|
["Ν", /Н/],
|
|
164
167
|
["Ο", /О/],
|
|
@@ -180,25 +183,38 @@ var greekLettersUpperCase = [
|
|
|
180
183
|
];
|
|
181
184
|
var thWords = [
|
|
182
185
|
["θει", /тэі(?=зм|ст)/],
|
|
186
|
+
[" αγαθ", / агат/],
|
|
183
187
|
[" αναθεμ", / анатэм/],
|
|
188
|
+
["ανθραπα", /антрапа/],
|
|
189
|
+
[" απαθε", / апатэ(?=оз|аты|м)/],
|
|
184
190
|
[" αρθα", / арта(?=графі|д[ао]кс|эпі)/],
|
|
185
191
|
[" αρίθμετ", / арытмэт/],
|
|
186
192
|
[" αθεν", / атэн/],
|
|
187
193
|
[" καλιθε", / калітэ/],
|
|
188
194
|
[" καθεδ", / катэд(?=\(?а?р)/],
|
|
195
|
+
["λυαμπιρίνθ", /лябірынт/],
|
|
196
|
+
["λυαγαρίθμ", /лягарытм/],
|
|
197
|
+
[" μαρθί ", / мар[фт]ы /],
|
|
198
|
+
[" μαρθη ", / марфе /],
|
|
189
199
|
[" μαθεματί", / матэматы/],
|
|
190
200
|
[" μιθ", / міт(?=[ауы]|оляг| )/],
|
|
191
201
|
[" μεθ", / мэт(?=[ао]д)/],
|
|
202
|
+
["παθ", /пат(?=ал[ёя]гі|оляг|ычн|ыя|ы[ійю] |[ауы] |а[ўм] |амі | )/],
|
|
192
203
|
[" πιθαγορ", / пітагор/],
|
|
193
204
|
[" ρίθμ", / ры[тф]м/],
|
|
205
|
+
["σίνθετ", /сынтэ[зт]/],
|
|
206
|
+
[" θομασ", / томас/],
|
|
207
|
+
[" θρομμπ", / тромб/],
|
|
208
|
+
[" θρον", / трон/],
|
|
209
|
+
["θραμμποζ", /трамбоз/],
|
|
194
210
|
[" θεαδοσ", / тэадос/],
|
|
195
211
|
[" θεαρεμ", / тэарэм/],
|
|
196
212
|
[" θεατ", / тэат(?=ар |р)/],
|
|
197
213
|
[" θεμ", / тэм(?=[аеуы])/],
|
|
198
|
-
["
|
|
199
|
-
["
|
|
200
|
-
["
|
|
201
|
-
["
|
|
214
|
+
[" θε", / тэ(?=[ао]р|салёнік|сал)/],
|
|
215
|
+
["θε", /тэ(?=с\S*алёнік|\S*зіс)/],
|
|
216
|
+
["θερμα", /тэрма/],
|
|
217
|
+
[" εθ", / эт(?=ы[кч]|эр)/]
|
|
202
218
|
];
|
|
203
219
|
|
|
204
220
|
// src/dict/arabic.ts
|
|
@@ -404,6 +420,7 @@ var rawWordlist = [
|
|
|
404
420
|
["анэ", /ане(?=стэ[зт])/],
|
|
405
421
|
["апазыцы", /апазіцы/],
|
|
406
422
|
["апаляґет", /апалагет/],
|
|
423
|
+
[" апатэ", / апафе(?=оз|аты|м)/],
|
|
407
424
|
["апсыд", /апсід/],
|
|
408
425
|
// Апсыда
|
|
409
426
|
["апэльсін", /апельсін/],
|
|
@@ -807,9 +824,11 @@ var rawWordlist = [
|
|
|
807
824
|
[" люўр", / луўр/],
|
|
808
825
|
// [' $1ляг$2', / ((?:пра|не)?)лаг(аван|і|уе)/],
|
|
809
826
|
["лябара", /лабара(?=[нт])/],
|
|
827
|
+
["лябірын", /лабірын(?=[тц])/],
|
|
810
828
|
["лябатам", /лабатам/],
|
|
811
829
|
["ляванд", /лаванд/],
|
|
812
|
-
["лягарыт",
|
|
830
|
+
["лягарыт", /лагарыф/],
|
|
831
|
+
["лягатып", /лагатып/],
|
|
813
832
|
["лягуна", /лагуна/],
|
|
814
833
|
["ляйпцыг", /лейпцыг/],
|
|
815
834
|
["ляйтматы", /лейтматы/],
|
|
@@ -2132,7 +2151,12 @@ var taraskSync = (text, options) => {
|
|
|
2132
2151
|
splitted = restoreCase(splitted, splittedOrig);
|
|
2133
2152
|
const nodeColors = isNonHtmlObject && nonHtml.nodeColors;
|
|
2134
2153
|
if (html || nodeColors)
|
|
2135
|
-
splitted = toTags(
|
|
2154
|
+
splitted = toTags(
|
|
2155
|
+
splitted,
|
|
2156
|
+
splittedOrig,
|
|
2157
|
+
abc === ALPHABET.CYRILLIC,
|
|
2158
|
+
apply.F
|
|
2159
|
+
);
|
|
2136
2160
|
text = splitted.join(" ").replace(/ /g, " ").replace(/ (\p{P}|\p{S}|\d|() /gu, "$1");
|
|
2137
2161
|
let gReplacer;
|
|
2138
2162
|
if (html) {
|
|
@@ -2179,13 +2203,13 @@ function restoreCase(text, orig) {
|
|
|
2179
2203
|
}
|
|
2180
2204
|
return text;
|
|
2181
2205
|
}
|
|
2182
|
-
function toTags(text, orig,
|
|
2206
|
+
function toTags(text, orig, isCyrillic, applyF) {
|
|
2183
2207
|
for (let i = 0; i < text.length; i++) {
|
|
2184
2208
|
const word = text[i];
|
|
2185
2209
|
const oWord = orig[i];
|
|
2186
2210
|
if (oWord === word)
|
|
2187
2211
|
continue;
|
|
2188
|
-
const wordH = word.replace(G_REGEX, ($0) => gobj[$0]);
|
|
2212
|
+
const wordH = isCyrillic ? word.replace(G_REGEX, ($0) => gobj[$0]) : word;
|
|
2189
2213
|
if (oWord === wordH)
|
|
2190
2214
|
continue;
|
|
2191
2215
|
if (!/\(/.test(word)) {
|
|
@@ -2198,7 +2222,7 @@ function toTags(text, orig, abc, applyF) {
|
|
|
2198
2222
|
text[i] = wordLetters.join("");
|
|
2199
2223
|
continue;
|
|
2200
2224
|
}
|
|
2201
|
-
if (
|
|
2225
|
+
if (isCyrillic) {
|
|
2202
2226
|
const word1 = word.replace(/ь/g, "");
|
|
2203
2227
|
switch (oWord) {
|
|
2204
2228
|
case word1:
|