npm - @polytts/browser-adapters - Versions diffs - 0.1.0 → 0.1.2 - Mend

@polytts/browser-adapters 0.1.0 → 0.1.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (7) hide show

package/dist/index.js +9 -4
package/dist/kokoro.worker.d.ts +1 -0
package/dist/kokoro.worker.js +145 -0
package/dist/piper.worker.js +2 -1
package/dist/readable-stream-polyfill-Cq7fDEUz.js +47 -0
package/package.json +2 -2
package/dist/piper-phonemes-vbFJj8yz.js +0 -19

package/dist/index.js CHANGED Viewed

@@ -1,5 +1,5 @@
 import { a as isIOSDevice, i as detectPreferredOrtProvider, o as isWebKitAppleRuntime, r as createOrtWasmSessionWithFallback } from "./ort-runtime-CjOKbTPg.js";
-import { t as phonemesToIds } from "./piper-phonemes-vbFJj8yz.js";
+import { n as phonemesToIds, t as ensureReadableStreamAsyncIterator } from "./readable-stream-polyfill-Cq7fDEUz.js";
 import { r as SUPERTONIC_MODEL_SESSION_KEYS, t as SUPERTONIC_STYLE_IDS } from "./supertonic.shared-Dk6nkm3-.js";
 import { getModelAssets, normalizeSpeakSpeed, pcmToAudioData } from "@polytts/core";
 //#region src/adapters/browser-speech.ts
@@ -325,7 +325,7 @@ const kittenAdapter = {
 		stream: true,
 		dynamicVoices: false
 	},
-	isSupported: () => typeof WebAssembly !== "undefined" && typeof Worker !== "undefined",
+	isSupported: () => !isIOSDevice() && typeof WebAssembly !== "undefined" && typeof Worker !== "undefined",
 	createModel(spec, _context) {
 		return new KittenModel(spec);
 	}
@@ -531,7 +531,7 @@ const kokoroAdapter = {
 		stream: true,
 		dynamicVoices: true
 	},
-	isSupported: (spec) => isKokoroDeviceSupported(spec.config?.device),
+	isSupported: (spec) => !isIOSDevice() && isKokoroDeviceSupported(spec.config?.device),
 	createModel(spec, _context) {
 		return new KokoroModel(spec);
 	}
@@ -604,6 +604,10 @@ var PiperModel = class {
 		return isIOSDevice();
 	}
 	async load(signal, onProgress) {
+		if (this.useMainThread && this.mainThread) {
+			onProgress?.(1);
+			return;
+		}
 		const voiceConfig = await this.loadConfig(signal);
 		const modelData = await this.loadModelData(signal, onProgress);
 		if (this.useMainThread) {
@@ -682,6 +686,7 @@ var PiperModel = class {
 			intraOpNumThreads: 1
 		});
 		if (signal.aborted) throw new DOMException("Aborted", "AbortError");
+		ensureReadableStreamAsyncIterator();
 		const { phonemize } = await import("phonemizer");
 		this.mainThread = {
 			session,
@@ -907,7 +912,7 @@ const supertonicAdapter = {
 		stream: false,
 		dynamicVoices: false
 	},
-	isSupported: () => typeof WebAssembly !== "undefined" && typeof Worker !== "undefined",
+	isSupported: () => !isIOSDevice() && typeof WebAssembly !== "undefined" && typeof Worker !== "undefined",
 	createModel(spec, context) {
 		return new SupertonicModel(spec, context);
 	}

package/dist/kokoro.worker.d.ts ADDED Viewed

	@@ -0,0 +1 @@
1	+ export { };

package/dist/kokoro.worker.js ADDED Viewed

@@ -0,0 +1,145 @@
+//#region src/adapters/kokoro.worker.ts
+const KOKORO_ERROR_LOG_LEVEL = 40;
+const abortedRequestIds = /* @__PURE__ */ new Set();
+let tts = null;
+let currentModuleUrl;
+const DEFAULT_MODULE_KEY = "kokoro-js";
+const kokoroModuleCache = /* @__PURE__ */ new Map();
+async function loadKokoroBrowserModule(moduleUrl) {
+	const key = moduleUrl ?? DEFAULT_MODULE_KEY;
+	const cached = kokoroModuleCache.get(key);
+	if (cached) return cached;
+	const loadPromise = moduleUrl ? import(
+		/* @vite-ignore */
+		moduleUrl
+) : import("kokoro-js");
+	kokoroModuleCache.set(key, loadPromise);
+	try {
+		return await loadPromise;
+	} catch (error) {
+		kokoroModuleCache.delete(key);
+		throw error;
+	}
+}
+function ensureNotAborted(requestId) {
+	if (abortedRequestIds.has(requestId)) throw new DOMException("Aborted", "AbortError");
+}
+function configureKokoroEnvironment(env) {
+	if (!env) return;
+	if (!("caches" in globalThis) || globalThis.caches == null) {
+		env.useBrowserCache = false;
+		env.useWasmCache = false;
+	}
+	env.logLevel = Math.max(env.logLevel ?? KOKORO_ERROR_LOG_LEVEL, KOKORO_ERROR_LOG_LEVEL);
+}
+async function loadTTS(KokoroTTS, modelRef, preferredDevice, requestId) {
+	const progress_callback = (progress) => {
+		if (progress.status === "progress" && progress.loaded != null && progress.total) self.postMessage({
+			type: "progress",
+			requestId,
+			progress: progress.loaded / progress.total
+		});
+	};
+	const tryLoad = (device) => KokoroTTS.from_pretrained(modelRef, {
+		dtype: device === "webgpu" ? "fp32" : "q8",
+		device,
+		progress_callback
+	});
+	if (preferredDevice === "wasm") return {
+		tts: await tryLoad("wasm"),
+		device: "wasm"
+	};
+	try {
+		return {
+			tts: await tryLoad("webgpu"),
+			device: "webgpu"
+		};
+	} catch {
+		return {
+			tts: await tryLoad("wasm"),
+			device: "wasm"
+		};
+	}
+}
+self.onmessage = async (event) => {
+	const message = event.data;
+	if (message.type === "abort") {
+		abortedRequestIds.add(message.requestId);
+		return;
+	}
+	const { requestId } = message;
+	try {
+		switch (message.type) {
+			case "load": {
+				currentModuleUrl = message.moduleUrl;
+				const kokoroModule = await loadKokoroBrowserModule(currentModuleUrl);
+				configureKokoroEnvironment(kokoroModule.env);
+				const loaded = await loadTTS(kokoroModule.KokoroTTS, message.modelRef, message.device, requestId);
+				tts = loaded.tts;
+				ensureNotAborted(requestId);
+				const voices = Object.entries(tts.voices ?? {}).map(([id, info]) => ({
+					id,
+					name: info?.name ?? id,
+					language: info?.language ?? (id.startsWith("b") ? "en-GB" : "en-US"),
+					gender: info?.gender
+				}));
+				self.postMessage({
+					type: "done",
+					requestId,
+					voices,
+					device: loaded.device
+				});
+				break;
+			}
+			case "generate": {
+				if (!tts) throw new Error("Kokoro model not loaded");
+				ensureNotAborted(requestId);
+				const result = await tts.generate(message.text, { voice: message.voiceId });
+				ensureNotAborted(requestId);
+				const audio = result.audio;
+				const buffer = audio.buffer.slice(audio.byteOffset, audio.byteOffset + audio.byteLength);
+				self.postMessage({
+					type: "done",
+					requestId,
+					audio: buffer,
+					sampleRate: result.sampling_rate ?? 24e3
+				}, [buffer]);
+				break;
+			}
+			case "stream": {
+				if (!tts) throw new Error("Kokoro model not loaded");
+				const { TextSplitterStream } = await loadKokoroBrowserModule(currentModuleUrl);
+				const splitter = new TextSplitterStream();
+				const stream = tts.stream(splitter, { voice: message.voiceId });
+				splitter.push(message.text);
+				splitter.close();
+				for await (const { audio } of stream) {
+					ensureNotAborted(requestId);
+					const samples = audio.audio;
+					const buffer = samples.buffer.slice(samples.byteOffset, samples.byteOffset + samples.byteLength);
+					self.postMessage({
+						type: "chunk",
+						requestId,
+						audio: buffer,
+						sampleRate: audio.sampling_rate ?? 24e3
+					}, [buffer]);
+				}
+				ensureNotAborted(requestId);
+				self.postMessage({
+					type: "done",
+					requestId
+				});
+				break;
+			}
+		}
+	} catch (error) {
+		if (error.name !== "AbortError") self.postMessage({
+			type: "error",
+			requestId,
+			message: error instanceof Error ? error.message : String(error)
+		});
+	} finally {
+		abortedRequestIds.delete(requestId);
+	}
+};
+//#endregion

package/dist/piper.worker.js CHANGED Viewed

@@ -1,6 +1,7 @@
 import { r as createOrtWasmSessionWithFallback } from "./ort-runtime-CjOKbTPg.js";
-import { t as phonemesToIds } from "./piper-phonemes-vbFJj8yz.js";
+import { n as phonemesToIds, t as ensureReadableStreamAsyncIterator } from "./readable-stream-polyfill-Cq7fDEUz.js";
 //#region src/adapters/piper.worker.ts
+ensureReadableStreamAsyncIterator();
 let session = null;
 let voiceConfig = null;
 const abortedRequestIds = /* @__PURE__ */ new Set();

package/dist/readable-stream-polyfill-Cq7fDEUz.js ADDED Viewed

@@ -0,0 +1,47 @@
+//#region src/adapters/piper-phonemes.ts
+const BOS = "^";
+const PAD = "_";
+const EOS = "$";
+function phonemesToIds(phonemes, config) {
+	const map = config.phoneme_id_map;
+	const ids = [];
+	if (map[BOS]) ids.push(...map[BOS]);
+	for (const phoneme of phonemes) {
+		const phonemeIds = map[phoneme];
+		if (phonemeIds === void 0) continue;
+		ids.push(...phonemeIds);
+		if (map[PAD]) ids.push(...map[PAD]);
+	}
+	if (map[EOS]) ids.push(...map[EOS]);
+	return ids;
+}
+//#endregion
+//#region src/adapters/readable-stream-polyfill.ts
+/**
+* Polyfill `ReadableStream[Symbol.asyncIterator]` for Safari < 17.6.
+*
+* The `phonemizer` package uses `for await...of` on a ReadableStream to decompress its embedded
+* data, which hangs on older Safari/iOS Safari. See:
+* https://github.com/xenova/phonemizer.js/issues/2
+*/
+function ensureReadableStreamAsyncIterator() {
+	if (typeof ReadableStream !== "undefined" && !ReadableStream.prototype[Symbol.asyncIterator]) Object.defineProperty(ReadableStream.prototype, Symbol.asyncIterator, {
+		async *value() {
+			const reader = this.getReader();
+			try {
+				while (true) {
+					const { done, value } = await reader.read();
+					if (done) return;
+					yield value;
+				}
+			} finally {
+				reader.releaseLock();
+			}
+		},
+		enumerable: false,
+		writable: true,
+		configurable: true
+	});
+}
+//#endregion
+export { phonemesToIds as n, ensureReadableStreamAsyncIterator as t };

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@polytts/browser-adapters",
-  "version": "0.1.0",
+  "version": "0.1.2",
   "description": "Official browser adapter implementations for polytts.",
   "keywords": [
     "adapters",
@@ -39,7 +39,7 @@
     "kokoro-js": "latest",
     "onnxruntime-web": "latest",
     "phonemizer": "latest",
-    "@polytts/core": "0.1.0"
+    "@polytts/core": "0.1.2"
   },
   "devDependencies": {
     "@types/node": "^25.6.0",

package/dist/piper-phonemes-vbFJj8yz.js DELETED Viewed

@@ -1,19 +0,0 @@
-//#region src/adapters/piper-phonemes.ts
-const BOS = "^";
-const PAD = "_";
-const EOS = "$";
-function phonemesToIds(phonemes, config) {
-	const map = config.phoneme_id_map;
-	const ids = [];
-	if (map[BOS]) ids.push(...map[BOS]);
-	for (const phoneme of phonemes) {
-		const phonemeIds = map[phoneme];
-		if (phonemeIds === void 0) continue;
-		ids.push(...phonemeIds);
-		if (map[PAD]) ids.push(...map[PAD]);
-	}
-	if (map[EOS]) ids.push(...map[EOS]);
-	return ids;
-}
-//#endregion
-export { phonemesToIds as t };