npm - henkan - Versions diffs - 0.7.0 → 0.9.0 - Mend

henkan 0.7.0 → 0.9.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (63) hide show

package/README.md +4 -2
package/dist/index.cjs.js +8 -156
package/dist/index.cjs.js.map +3 -3
package/dist/index.mjs +10 -152
package/dist/index.mjs.map +2 -2
package/dist/types/constants.d.ts +0 -3
package/dist/types/constants.d.ts.map +1 -1
package/dist/types/types.d.ts +0 -6
package/dist/types/types.d.ts.map +1 -1
package/dist/types/utils.d.ts +7 -17
package/dist/types/utils.d.ts.map +1 -1
package/docs/api/README.md +0 -1
package/docs/api/functions/capitalizeString.md +1 -1
package/docs/api/functions/convertJMdict.md +1 -1
package/docs/api/functions/convertKanjiDic.md +1 -1
package/docs/api/functions/convertKradFile.md +1 -1
package/docs/api/functions/convertRadkFile.md +1 -1
package/docs/api/functions/convertTanakaCorpus.md +1 -1
package/docs/api/functions/generateAnkiNote.md +1 -1
package/docs/api/functions/generateAnkiNotesFile.md +1 -1
package/docs/api/functions/getKanji.md +1 -1
package/docs/api/functions/getKanjiExtended.md +1 -1
package/docs/api/functions/getWord.md +1 -1
package/docs/api/functions/isStringArray.md +1 -1
package/docs/api/functions/isValidArray.md +1 -1
package/docs/api/functions/isValidArrayWithFirstElement.md +1 -1
package/docs/api/functions/shuffleArray.md +1 -1
package/docs/api/functions/synthesizeSpeech.md +13 -25
package/docs/api/interfaces/DictKanji.md +5 -5
package/docs/api/interfaces/DictKanjiForm.md +4 -4
package/docs/api/interfaces/DictKanjiMisc.md +5 -5
package/docs/api/interfaces/DictKanjiReading.md +3 -3
package/docs/api/interfaces/DictKanjiReadingMeaning.md +3 -3
package/docs/api/interfaces/DictKanjiReadingMeaningGroup.md +3 -3
package/docs/api/interfaces/DictKanjiWithRadicals.md +3 -3
package/docs/api/interfaces/DictMeaning.md +11 -11
package/docs/api/interfaces/DictRadical.md +4 -4
package/docs/api/interfaces/DictReading.md +5 -5
package/docs/api/interfaces/DictWord.md +8 -8
package/docs/api/interfaces/ExamplePart.md +7 -7
package/docs/api/interfaces/GlossSpecificNumber.md +3 -3
package/docs/api/interfaces/Grammar.md +15 -15
package/docs/api/interfaces/GrammarMeaning.md +3 -3
package/docs/api/interfaces/Kana.md +11 -11
package/docs/api/interfaces/Kanji.md +22 -22
package/docs/api/interfaces/KanjiComponent.md +3 -3
package/docs/api/interfaces/KanjiForm.md +4 -4
package/docs/api/interfaces/NoteAndTag.md +3 -3
package/docs/api/interfaces/Phrase.md +5 -5
package/docs/api/interfaces/Radical.md +16 -16
package/docs/api/interfaces/Reading.md +5 -5
package/docs/api/interfaces/ResultEntry.md +7 -7
package/docs/api/interfaces/TanakaExample.md +7 -7
package/docs/api/interfaces/Translation.md +3 -3
package/docs/api/interfaces/UsefulRegExps.md +8 -20
package/docs/api/interfaces/Word.md +14 -14
package/docs/api/type-aliases/Dict.md +1 -1
package/docs/api/type-aliases/DictName.md +1 -1
package/docs/api/type-aliases/EntryType.md +1 -1
package/docs/api/type-aliases/JLPT.md +1 -1
package/docs/api/type-aliases/Result.md +1 -1
package/package.json +2 -2
package/docs/api/functions/makeSSML.md +0 -33

package/README.md CHANGED Viewed

@@ -36,7 +36,7 @@ pnpm add henkan
  - JMdict, KANJIDIC, Tanaka Corpus, RADK and KRAD conversion
  - User-friendly schemas for dictionary entries
  - Anki note generation
- - Other useful tools (TTSFree.com audio generation, Japanese RegExps, array checking etc.)
+ - Other useful tools (Amazon Polly audio generation, Japanese RegExps, array checking etc.)
 ---
@@ -55,12 +55,14 @@ const dictContent = fs.readFileSync(dictPath, 'utf-8');
 const dictWords = convertJMdict(dictContent);
+const jmDict = undefined, id = undefined, kanjiDic = undefined, tanakaCorpus = undefined;
 const noteTypeName = 'Word';
 const deckName = 'Japanese::Vocabulary::No kanji form words';
 const noKanjiFormWords = dictWords
     .filter(word => word.kanjiForms === undefined)
-    .map(word => getWord(undefined, undefined, undefined, undefined, word, noteTypeName, deckName));
+    .map(word => getWord(jmDict, id, kanjiDic, tanakaCorpus, word, noteTypeName, deckName));
 const ankiNotesFile = generateAnkiNotesFile(noKanjiFormWords);

package/dist/index.cjs.js CHANGED Viewed

@@ -49,14 +49,10 @@ __export(index_exports, {
   isValidArray: () => isValidArray,
   isValidArrayWithFirstElement: () => isValidArrayWithFirstElement,
   isWord: () => isWord,
-  makeSSML: () => makeSSML,
   notSearchedForms: () => notSearchedForms,
   noteMap: () => noteMap,
-  numberMap: () => numberMap,
   regexps: () => regexps,
-  romajiMap: () => romajiMap,
   shuffleArray: () => shuffleArray,
-  symbolMap: () => symbolMap,
   synthesizeSpeech: () => synthesizeSpeech
 });
 module.exports = __toCommonJS(index_exports);
@@ -66,60 +62,11 @@ var regexps = {
   hiragana: /[\u{3040}-\u{309F}]/u,
   katakana: /[\u{30A0}-\u{30FF}]/u,
   kanji: new RegExp("\\p{Script=Han}+", "u"),
-  scriptSplit: /([\p{sc=Han}]+|[\p{sc=Hiragana}]+|[\p{sc=Katakana}]+|[^\p{sc=Han}\p{sc=Hiragana}\p{sc=Katakana}]+)/u,
   regExChars: /[-\/\\^$*+?.()|[\]{}]/,
   tanakaID: /#ID=(?<id>\d+_\d+)$/,
   tanakaPart: /(?<base>[^()\[\]\{\}\s]+)(?:\((?<reading>[\S]+)\))?(?:\[(?<glossnum>[\S]+)\])?(?:\{(?<inflection>[\S]+)\})?/,
   tanakaReferenceID: /#(?<entryid>[\d]+)/
 };
-var romajiMap = {
-  A: "\u30A8\u30FC",
-  B: "\u30D3\u30FC",
-  C: "\u30B7\u30FC",
-  D: "\u30C7\u30A3\u30FC",
-  E: "\u30A4\u30FC",
-  F: "\u30A8\u30D5",
-  G: "\u30B8\u30FC",
-  H: "\u30A8\u30A4\u30C1",
-  I: "\u30A2\u30A4",
-  J: "\u30B8\u30A7\u30FC",
-  K: "\u30B1\u30FC",
-  L: "\u30A8\u30EB",
-  M: "\u30A8\u30E0",
-  N: "\u30A8\u30CC",
-  O: "\u30AA\u30FC",
-  P: "\u30D4\u30FC",
-  Q: "\u30AD\u30E5\u30FC",
-  R: "\u30A2\u30FC\u30EB",
-  S: "\u30A8\u30B9",
-  T: "\u30C6\u30A3\u30FC",
-  U: "\u30E6\u30FC",
-  V: "\u30D6\u30A4",
-  W: "\u30C0\u30D6\u30EA\u30E5\u30FC",
-  X: "\u30A8\u30C3\u30AF\u30B9",
-  Y: "\u30EF\u30A4",
-  Z: "\u30BC\u30C3\u30C8"
-};
-var numberMap = {
-  "0": "\u30BC\u30ED",
-  "1": "\u30A4\u30C1",
-  "2": "\u30CB",
-  "3": "\u30B5\u30F3",
-  "4": "\u30E8\u30F3",
-  "5": "\u30B4",
-  "6": "\u30ED\u30AF",
-  "7": "\u30CA\u30CA",
-  "8": "\u30CF\u30C1",
-  "9": "\u30AD\u30E5\u30A6"
-};
-var symbolMap = {
-  "\uFF04": "\u30C9\u30EB",
-  "%": "\u30D1\u30FC\u30BB\u30F3\u30C8",
-  "\xA5": "\u30A8\u30F3",
-  "#": "\u30B7\u30E3\u30FC\u30D7",
-  "@": "\u30A2\u30C3\u30C8",
-  "&": "\u30A2\u30F3\u30C9"
-};
 var notSearchedForms = /* @__PURE__ */ new Set([
   "search-only kana form",
   "Search-only kana form",
@@ -1187,7 +1134,7 @@ var noteMap = /* @__PURE__ */ new Map([
 var import_libxmljs2 = __toESM(require("libxmljs2"));
 var import_xml2js = __toESM(require("xml2js"));
 var import_iconv_lite = __toESM(require("iconv-lite"));
-var import_node_fetch = __toESM(require("node-fetch"));
+var import_client_polly = require("@aws-sdk/client-polly");
 var Kuroshiro = require("kuroshiro");
 var KuromojiAnalyzer = require("kuroshiro-analyzer-kuromoji");
 function capitalizeString(value) {
@@ -2055,108 +2002,17 @@ function getKanjiExtended(kanjiChar, info, dict, useJpdbWords, jmDict, svgList,
     throw err;
   }
 }
-var getCharType = (char) => {
-  if (regexps.kanji.test(char)) return "kanji";
-  if (regexps.hiragana.test(char)) return "hiragana";
-  if (regexps.katakana.test(char)) return "katakana";
-  return "other";
-};
-var splitByScript = (text) => text.match(regexps.scriptSplit) || [];
-var convertToHiragana = (str) => str.replace(
-  regexps.katakana,
-  (c) => String.fromCharCode(c.charCodeAt(0) - 96)
-);
-var convertOtherToKatakana = (str) => str.split("").map((c) => {
-  if (romajiMap[c.toUpperCase()]) return romajiMap[c.toUpperCase()];
-  if (numberMap[c]) return numberMap[c];
-  if (symbolMap[c]) return symbolMap[c];
-  return c;
-}).join("");
-function makeSSML(formText, fullReading) {
-  let ssml = "";
-  const allTypes = Array.from(
-    formText
-  ).map((c) => getCharType(c));
-  const uniqueTypes = Array.from(new Set(allTypes));
-  if (uniqueTypes.length === 1)
-    switch (uniqueTypes[0]) {
-      case "kanji":
-        ssml = `<speak><phoneme alphabet="x-amazon-yomigana" ph="${fullReading}">${formText}</phoneme></speak>`;
-        break;
-      case "katakana":
-        ssml = `<speak><phoneme alphabet="x-amazon-pron-kana" ph="${formText}">${formText}</phoneme></speak>`;
-        break;
-      case "hiragana":
-      default:
-        ssml = `<speak>${formText}</speak>`;
-    }
-  else {
-    const segments = splitByScript(formText);
-    let pureKanjiReading = convertToHiragana(fullReading);
-    segments.forEach((seg) => {
-      const type = getCharType(
-        seg[0]
-      );
-      if (type !== "kanji") {
-        const converted = type === "other" ? convertToHiragana(convertOtherToKatakana(seg)) : convertToHiragana(seg);
-        pureKanjiReading = pureKanjiReading.replace(converted, "");
-      }
-    });
-    const kanjiSegments = segments.filter(
-      (seg) => getCharType(seg[0]) === "kanji"
-    );
-    let readingPointer = 0;
-    const ssmlSegments = segments.map((seg) => {
-      const type = getCharType(
-        seg[0]
-      );
-      if (type === "kanji") {
-        const expectedLength = pureKanjiReading.length / kanjiSegments.length;
-        const allocated = pureKanjiReading.slice(
-          readingPointer,
-          readingPointer + Math.ceil(expectedLength)
-        );
-        readingPointer += allocated.length;
-        return `<phoneme alphabet="x-amazon-yomigana" ph="${allocated}">${seg}</phoneme>`;
-      } else if (type === "katakana")
-        return `<phoneme alphabet="x-amazon-pron-kana" ph="${seg}">${seg}</phoneme>`;
-      else if (type === "other") {
-        const katakanaReading = convertOtherToKatakana(seg);
-        return `<phoneme alphabet="x-amazon-pron-kana" ph="${katakanaReading}">${seg}</phoneme>`;
-      } else return seg;
-    });
-    ssml = `<speak>${ssmlSegments.join("")}</speak>`;
-  }
-  return ssml;
-}
-async function synthesizeSpeech(ssmlText, apiKey, options) {
+async function synthesizeSpeech(client, input, options) {
   return await new Promise(
     async (resolve, reject) => {
       try {
-        const res = await (0, import_node_fetch.default)("https://ttsfree.com/api/v1/tts", {
-          method: "POST",
-          body: JSON.stringify({
-            text: ssmlText,
-            ...options
-          }),
-          headers: {
-            "Content-Type": "application/json",
-            apikey: apiKey
-          }
+        const command = new import_client_polly.SynthesizeSpeechCommand({
+          Text: input,
+          ...options
         });
-        if (!res.ok)
-          throw new Error(
-            `TTS request failed:
-${res.status}: ${res.statusText}`
-          );
-        const data = await res.json();
-        if (data.status !== "success" || data.mess !== "success" || data.audioData.length === 0)
-          throw new Error("Invalid TTS response data");
-        const mp3Buffer = Buffer.from(
-          data.audioData,
-          "base64"
-        );
-        resolve(mp3Buffer);
+        const response = await client.send(command);
+        const stream = response.AudioStream ? Buffer.from(await response.AudioStream.transformToByteArray()) : null;
+        resolve(stream);
       } catch (err) {
         reject(err);
       }
@@ -2398,14 +2254,10 @@ ${ankiNotes}`;
   isValidArray,
   isValidArrayWithFirstElement,
   isWord,
-  makeSSML,
   notSearchedForms,
   noteMap,
-  numberMap,
   regexps,
-  romajiMap,
   shuffleArray,
-  symbolMap,
   synthesizeSpeech
 });
 //# sourceMappingURL=index.cjs.js.map