npm - react-native-sherpa-onnx - Versions diffs - 0.2.0 → 0.3.0 - Mend

react-native-sherpa-onnx 0.2.0 → 0.3.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (175) hide show

package/README.md +232 -236
package/SherpaOnnx.podspec +68 -64
package/android/build.gradle +182 -192
package/android/codegen.gradle +57 -0
package/android/prebuilt-download.gradle +428 -0
package/android/prebuilt-versions.gradle +43 -0
package/android/proguard-rules.pro +10 -0
package/android/src/main/assets/testModels/add_mul_add.onnx +28 -0
package/android/src/main/assets/testModels/nnapi_internal_uint8_support.onnx +0 -0
package/android/src/main/assets/testModels/qnn_multi_ctx_embed.onnx +0 -0
package/android/src/main/cpp/CMakeLists.txt +166 -129
package/android/src/main/cpp/CMakePresets.json +54 -0
package/android/src/main/cpp/crypto/sha256.cpp +174 -0
package/android/src/main/cpp/crypto/sha256.h +16 -0
package/android/src/main/cpp/jni/archive/sherpa-onnx-archive-helper.cpp +404 -0
package/android/src/main/cpp/jni/archive/sherpa-onnx-archive-helper.h +56 -0
package/android/src/main/cpp/jni/archive/sherpa-onnx-archive-jni.cpp +181 -0
package/android/src/main/cpp/jni/audio/sherpa-onnx-audio-convert-jni.cpp +888 -0
package/{ios → android/src/main/cpp/jni/model_detect}/sherpa-onnx-common.h +18 -18
package/android/src/main/cpp/jni/model_detect/sherpa-onnx-detect-jni-common.cpp +86 -0
package/android/src/main/cpp/jni/model_detect/sherpa-onnx-detect-jni-common.h +20 -0
package/android/src/main/cpp/jni/model_detect/sherpa-onnx-model-detect-helper.cpp +423 -0
package/android/src/main/cpp/jni/model_detect/sherpa-onnx-model-detect-helper.h +55 -0
package/android/src/main/cpp/jni/model_detect/sherpa-onnx-model-detect-stt.cpp +399 -0
package/android/src/main/cpp/jni/model_detect/sherpa-onnx-model-detect-tts.cpp +238 -0
package/{ios → android/src/main/cpp/jni/model_detect}/sherpa-onnx-model-detect.h +122 -89
package/android/src/main/cpp/jni/model_detect/sherpa-onnx-stt-wrapper.cpp +99 -0
package/android/src/main/cpp/jni/model_detect/sherpa-onnx-stt-wrapper.h +16 -0
package/android/src/main/cpp/jni/model_detect/sherpa-onnx-tts-wrapper.cpp +78 -0
package/android/src/main/cpp/jni/model_detect/sherpa-onnx-tts-wrapper.h +16 -0
package/android/src/main/cpp/jni/module/sherpa-onnx-module-jni.cpp +190 -0
package/android/src/main/cpp/jni/tts/sherpa-onnx-tts-zipvoice-jni.cpp +301 -0
package/android/src/main/java/com/sherpaonnx/SherpaOnnxArchiveHelper.kt +94 -0
package/android/src/main/java/com/sherpaonnx/{SherpaOnnxCoreHelper.kt → SherpaOnnxAssetHelper.kt} +350 -236
package/android/src/main/java/com/sherpaonnx/SherpaOnnxModule.kt +791 -483
package/android/src/main/java/com/sherpaonnx/SherpaOnnxSttHelper.kt +699 -109
package/android/src/main/java/com/sherpaonnx/SherpaOnnxTtsHelper.kt +1123 -668
package/android/src/main/java/com/sherpaonnx/ZipvoiceTtsWrapper.kt +187 -0
package/ios/SherpaOnnx+Assets.h +11 -0
package/ios/SherpaOnnx+Assets.mm +325 -0
package/ios/SherpaOnnx+STT.mm +455 -118
package/ios/SherpaOnnx+TTS.mm +1101 -712
package/ios/SherpaOnnx.h +17 -6
package/ios/SherpaOnnx.mm +206 -311
package/ios/SherpaOnnx.xcconfig +19 -19
package/ios/SherpaOnnxCoreMLHelper.swift +24 -0
package/ios/archive/sherpa-onnx-archive-helper.h +21 -0
package/ios/archive/sherpa-onnx-archive-helper.mm +296 -0
package/ios/libarchive_darwin_config.h +153 -0
package/{android/src/main/cpp/jni → ios/model_detect}/sherpa-onnx-common.h +18 -18
package/ios/model_detect/sherpa-onnx-model-detect-helper.h +49 -0
package/ios/model_detect/sherpa-onnx-model-detect-helper.mm +210 -0
package/ios/model_detect/sherpa-onnx-model-detect-stt.mm +344 -0
package/ios/model_detect/sherpa-onnx-model-detect-tts.mm +201 -0
package/{android/src/main/cpp/jni → ios/model_detect}/sherpa-onnx-model-detect.h +117 -89
package/ios/scripts/patch-libarchive-includes.sh +61 -0
package/ios/scripts/setup-ios-libarchive.sh +98 -0
package/ios/stt/sherpa-onnx-stt-wrapper.h +129 -0
package/ios/stt/sherpa-onnx-stt-wrapper.mm +523 -0
package/ios/{sherpa-onnx-tts-wrapper.h → tts/sherpa-onnx-tts-wrapper.h} +90 -85
package/ios/{sherpa-onnx-tts-wrapper.mm → tts/sherpa-onnx-tts-wrapper.mm} +376 -345
package/lib/module/NativeSherpaOnnx.js +3 -0
package/lib/module/NativeSherpaOnnx.js.map +1 -1
package/lib/module/audio/index.js +22 -0
package/lib/module/audio/index.js.map +1 -0
package/lib/module/diarization/index.js +1 -1
package/lib/module/diarization/index.js.map +1 -1
package/lib/module/download/ModelDownloadManager.js +918 -0
package/lib/module/download/ModelDownloadManager.js.map +1 -0
package/lib/module/download/extractTarBz2.js +53 -0
package/lib/module/download/extractTarBz2.js.map +1 -0
package/lib/module/download/index.js +6 -0
package/lib/module/download/index.js.map +1 -0
package/lib/module/download/validation.js +178 -0
package/lib/module/download/validation.js.map +1 -0
package/lib/module/enhancement/index.js +1 -1
package/lib/module/enhancement/index.js.map +1 -1
package/lib/module/index.js +41 -3
package/lib/module/index.js.map +1 -1
package/lib/module/separation/index.js +1 -1
package/lib/module/separation/index.js.map +1 -1
package/lib/module/stt/index.js +127 -60
package/lib/module/stt/index.js.map +1 -1
package/lib/module/stt/sttModelLanguages.js +512 -0
package/lib/module/stt/sttModelLanguages.js.map +1 -0
package/lib/module/stt/types.js +53 -1
package/lib/module/stt/types.js.map +1 -1
package/lib/module/tts/index.js +216 -289
package/lib/module/tts/index.js.map +1 -1
package/lib/module/tts/types.js +86 -1
package/lib/module/tts/types.js.map +1 -1
package/lib/module/types.js.map +1 -1
package/lib/module/utils.js +86 -73
package/lib/module/utils.js.map +1 -1
package/lib/module/vad/index.js +1 -1
package/lib/module/vad/index.js.map +1 -1
package/lib/typescript/src/NativeSherpaOnnx.d.ts +192 -38
package/lib/typescript/src/NativeSherpaOnnx.d.ts.map +1 -1
package/lib/typescript/src/audio/index.d.ts +13 -0
package/lib/typescript/src/audio/index.d.ts.map +1 -0
package/lib/typescript/src/diarization/index.d.ts +3 -2
package/lib/typescript/src/diarization/index.d.ts.map +1 -1
package/lib/typescript/src/download/ModelDownloadManager.d.ts +108 -0
package/lib/typescript/src/download/ModelDownloadManager.d.ts.map +1 -0
package/lib/typescript/src/download/extractTarBz2.d.ts +14 -0
package/lib/typescript/src/download/extractTarBz2.d.ts.map +1 -0
package/lib/typescript/src/download/index.d.ts +7 -0
package/lib/typescript/src/download/index.d.ts.map +1 -0
package/lib/typescript/src/download/validation.d.ts +57 -0
package/lib/typescript/src/download/validation.d.ts.map +1 -0
package/lib/typescript/src/enhancement/index.d.ts +3 -2
package/lib/typescript/src/enhancement/index.d.ts.map +1 -1
package/lib/typescript/src/index.d.ts +26 -2
package/lib/typescript/src/index.d.ts.map +1 -1
package/lib/typescript/src/separation/index.d.ts +3 -2
package/lib/typescript/src/separation/index.d.ts.map +1 -1
package/lib/typescript/src/stt/index.d.ts +31 -43
package/lib/typescript/src/stt/index.d.ts.map +1 -1
package/lib/typescript/src/stt/sttModelLanguages.d.ts +52 -0
package/lib/typescript/src/stt/sttModelLanguages.d.ts.map +1 -0
package/lib/typescript/src/stt/types.d.ts +196 -9
package/lib/typescript/src/stt/types.d.ts.map +1 -1
package/lib/typescript/src/tts/index.d.ts +25 -211
package/lib/typescript/src/tts/index.d.ts.map +1 -1
package/lib/typescript/src/tts/types.d.ts +148 -25
package/lib/typescript/src/tts/types.d.ts.map +1 -1
package/lib/typescript/src/types.d.ts +0 -32
package/lib/typescript/src/types.d.ts.map +1 -1
package/lib/typescript/src/utils.d.ts +28 -13
package/lib/typescript/src/utils.d.ts.map +1 -1
package/lib/typescript/src/vad/index.d.ts +3 -2
package/lib/typescript/src/vad/index.d.ts.map +1 -1
package/package.json +250 -222
package/scripts/check-qnn-support.sh +78 -0
package/scripts/setup-ios-framework.sh +379 -282
package/src/NativeSherpaOnnx.ts +474 -251
package/src/audio/index.ts +32 -0
package/src/diarization/index.ts +4 -2
package/src/download/ModelDownloadManager.ts +1325 -0
package/src/download/extractTarBz2.ts +78 -0
package/src/download/index.ts +43 -0
package/src/download/validation.ts +279 -0
package/src/enhancement/index.ts +4 -2
package/src/index.tsx +78 -27
package/src/separation/index.ts +4 -2
package/src/stt/index.ts +249 -89
package/src/stt/sttModelLanguages.ts +237 -0
package/src/stt/types.ts +263 -9
package/src/tts/index.ts +470 -458
package/src/tts/types.ts +373 -218
package/src/types.ts +0 -44
package/src/utils.ts +145 -131
package/src/vad/index.ts +4 -2
package/third_party/ffmpeg_prebuilt/ANDROID_RELEASE_TAG +1 -0
package/third_party/libarchive_prebuilt/ANDROID_RELEASE_TAG +1 -0
package/third_party/libarchive_prebuilt/IOS_RELEASE_TAG +1 -0
package/third_party/sherpa-onnx-prebuilt/ANDROID_RELEASE_TAG +1 -0
package/third_party/sherpa-onnx-prebuilt/IOS_RELEASE_TAG +1 -0
package/android/src/main/cpp/include/sherpa-onnx/c-api/c-api.h +0 -1918
package/android/src/main/cpp/include/sherpa-onnx/c-api/cxx-api.h +0 -841
package/android/src/main/cpp/jni/sherpa-onnx-model-detect.cpp +0 -541
package/android/src/main/cpp/jni/sherpa-onnx-stt-jni.cpp +0 -336
package/android/src/main/cpp/jni/sherpa-onnx-stt-wrapper.cpp +0 -222
package/android/src/main/cpp/jni/sherpa-onnx-stt-wrapper.h +0 -68
package/android/src/main/cpp/jni/sherpa-onnx-tts-jni.cpp +0 -823
package/android/src/main/cpp/jni/sherpa-onnx-tts-wrapper.cpp +0 -387
package/android/src/main/cpp/jni/sherpa-onnx-tts-wrapper.h +0 -147
package/ios/Frameworks/sherpa_onnx.xcframework.zip +0 -0
package/ios/include/sherpa-onnx/c-api/c-api.h +0 -1918
package/ios/include/sherpa-onnx/c-api/cxx-api.h +0 -841
package/ios/sherpa-onnx-model-detect.mm +0 -441
package/ios/sherpa-onnx-stt-wrapper.h +0 -48
package/ios/sherpa-onnx-stt-wrapper.mm +0 -201
package/scripts/copy-headers.js +0 -184
package/scripts/setup-assets.js +0 -323

package/src/tts/index.ts CHANGED Viewed

@@ -1,458 +1,470 @@
-import { NativeEventEmitter } from 'react-native';
-import SherpaOnnx from '../NativeSherpaOnnx';
-import type {
-  TTSInitializeOptions,
-  TtsUpdateOptions,
-  SynthesisOptions,
-  GeneratedAudio,
-  GeneratedAudioWithTimestamps,
-  TTSModelInfo,
-  TtsStreamChunk,
-  TtsStreamEnd,
-  TtsStreamError,
-} from './types';
-import type { InitializeOptions } from '../types';
-import { resolveModelPath } from '../utils';
-/**
- * Initialize Text-to-Speech (TTS) with model directory.
- *
- * Supports multiple model source types:
- * - Asset models (bundled in app)
- * - File system models (downloaded or user-provided)
- * - Auto-detection (tries asset first, then file system)
- *
- * Supported model types (auto-detected or explicit):
- * - VITS (includes Piper, Coqui, MeloTTS, MMS)
- * - Matcha (acoustic model + vocoder)
- * - Kokoro (multi-speaker, multi-language)
- * - KittenTTS (lightweight, multi-speaker)
- * - Zipvoice (voice cloning capable)
- *
- * @param options - TTS initialization options or model path configuration
- * @returns Promise resolving to result with success and detected models
- * @example
- * ```typescript
- * // Simple string (auto-detect)
- * const result = await initializeTTS('models/sherpa-onnx-vits-piper-en_US-lessac-medium');
- * console.log('Detected models:', result.detectedModels);
- *
- * // Asset model
- * const result = await initializeTTS({
- *   modelPath: { type: 'asset', path: 'models/vits-piper-en' }
- * });
- *
- * // File system model with options
- * const result = await initializeTTS({
- *   modelPath: { type: 'file', path: '/path/to/model' },
- *   numThreads: 4,
- *   debug: true
- * });
- *
- * // With explicit model type
- * const result = await initializeTTS({
- *   modelPath: { type: 'asset', path: 'models/kokoro-en' },
- *   modelType: 'kokoro'
- * });
- * ```
- */
-export async function initializeTTS(
-  options: TTSInitializeOptions | InitializeOptions['modelPath']
-): Promise<{
-  success: boolean;
-  detectedModels: Array<{ type: string; modelDir: string }>;
-}> {
-  // Handle both object syntax and direct path syntax
-  let modelPath: InitializeOptions['modelPath'];
-  let modelType: string | undefined;
-  let numThreads: number | undefined;
-  let debug: boolean | undefined;
-  let noiseScale: number | undefined;
-  let noiseScaleW: number | undefined;
-  let lengthScale: number | undefined;
-  if (typeof options === 'object' && 'modelPath' in options) {
-    modelPath = options.modelPath;
-    modelType = options.modelType;
-    numThreads = options.numThreads;
-    debug = options.debug;
-    noiseScale = options.noiseScale;
-    noiseScaleW = options.noiseScaleW;
-    lengthScale = options.lengthScale;
-  } else {
-    modelPath = options as InitializeOptions['modelPath'];
-    modelType = undefined;
-    numThreads = undefined;
-    debug = undefined;
-    noiseScale = undefined;
-    noiseScaleW = undefined;
-    lengthScale = undefined;
-  }
-  const resolvedPath = await resolveModelPath(modelPath);
-  return SherpaOnnx.initializeTts(
-    resolvedPath,
-    modelType ?? 'auto',
-    numThreads ?? 2,
-    debug ?? false,
-    noiseScale,
-    noiseScaleW,
-    lengthScale
-  );
-}
-/**
- * Update TTS parameters by re-initializing with stored config.
- */
-export async function updateTtsParams(options: TtsUpdateOptions): Promise<{
-  success: boolean;
-  detectedModels: Array<{ type: string; modelDir: string }>;
-}> {
-  const noiseArg =
-    options.noiseScale === undefined ? Number.NaN : options.noiseScale;
-  const noiseWArg =
-    options.noiseScaleW === undefined ? Number.NaN : options.noiseScaleW;
-  const lengthArg =
-    options.lengthScale === undefined ? Number.NaN : options.lengthScale;
-  return SherpaOnnx.updateTtsParams(noiseArg, noiseWArg, lengthArg);
-}
-/**
- * Generate speech from text.
- *
- * Returns raw audio samples as float array in range [-1.0, 1.0].
- * You can save these samples to a WAV file, stream them, or process them further.
- *
- * @param text - Text to convert to speech
- * @param options - Synthesis options (speaker ID, speed)
- * @returns Promise resolving to generated audio data
- * @example
- * ```typescript
- * // Basic usage
- * const audio = await generateSpeech('Hello, world!');
- * console.log(`Generated ${audio.samples.length} samples at ${audio.sampleRate} Hz`);
- *
- * // With options
- * const audio = await generateSpeech('Hello, world!', {
- *   sid: 0,      // Speaker ID (for multi-speaker models)
- *   speed: 1.2   // 20% faster
- * });
- *
- * // Slower speech
- * const audio = await generateSpeech('Speak slowly', { speed: 0.8 });
- * ```
- */
-export async function generateSpeech(
-  text: string,
-  options?: SynthesisOptions
-): Promise<GeneratedAudio> {
-  return SherpaOnnx.generateTts(text, options?.sid ?? 0, options?.speed ?? 1.0);
-}
-/**
- * Generate speech from text and return subtitle/timestamp metadata.
- *
- * Timestamps are estimated based on the output duration when models do not
- * provide native timing information.
- */
-export async function generateSpeechWithTimestamps(
-  text: string,
-  options?: SynthesisOptions
-): Promise<GeneratedAudioWithTimestamps> {
-  return SherpaOnnx.generateTtsWithTimestamps(
-    text,
-    options?.sid ?? 0,
-    options?.speed ?? 1.0
-  );
-}
-const nativeTtsEventModule =
-  SherpaOnnx &&
-  typeof (SherpaOnnx as any).addListener === 'function' &&
-  typeof (SherpaOnnx as any).removeListeners === 'function'
-    ? (SherpaOnnx as any)
-    : undefined;
-const ttsEventEmitter = new NativeEventEmitter(nativeTtsEventModule);
-export type TtsStreamHandlers = {
-  onChunk?: (chunk: TtsStreamChunk) => void;
-  onEnd?: (event: TtsStreamEnd) => void;
-  onError?: (event: TtsStreamError) => void;
-};
-/**
- * Generate speech in streaming mode (emits chunk events).
- *
- * Returns an unsubscribe function to remove event listeners.
- */
-export async function generateSpeechStream(
-  text: string,
-  options: SynthesisOptions | undefined,
-  handlers: TtsStreamHandlers
-): Promise<() => void> {
-  const subscriptions = [
-    ttsEventEmitter.addListener('ttsStreamChunk', (event) => {
-      handlers.onChunk?.(event as TtsStreamChunk);
-    }),
-    ttsEventEmitter.addListener('ttsStreamEnd', (event) => {
-      handlers.onEnd?.(event as TtsStreamEnd);
-    }),
-    ttsEventEmitter.addListener('ttsStreamError', (event) => {
-      handlers.onError?.(event as TtsStreamError);
-    }),
-  ];
-  try {
-    await SherpaOnnx.generateTtsStream(
-      text,
-      options?.sid ?? 0,
-      options?.speed ?? 1.0
-    );
-  } catch (error) {
-    // Clean up listeners if native call fails
-    subscriptions.forEach((sub) => sub.remove());
-    throw error;
-  }
-  return () => {
-    subscriptions.forEach((sub) => sub.remove());
-  };
-}
-/**
- * Cancel ongoing streaming TTS generation.
- */
-export function cancelSpeechStream(): Promise<void> {
-  return SherpaOnnx.cancelTtsStream();
-}
-/**
- * Start PCM playback for streaming TTS.
- */
-export function startTtsPcmPlayer(
-  sampleRate: number,
-  channels: number
-): Promise<void> {
-  return SherpaOnnx.startTtsPcmPlayer(sampleRate, channels);
-}
-/**
- * Write PCM samples to the streaming TTS player.
- */
-export function writeTtsPcmChunk(samples: number[]): Promise<void> {
-  return SherpaOnnx.writeTtsPcmChunk(samples);
-}
-/**
- * Stop PCM playback for streaming TTS.
- */
-export function stopTtsPcmPlayer(): Promise<void> {
-  return SherpaOnnx.stopTtsPcmPlayer();
-}
-/**
- * Get TTS model information.
- *
- * Returns the sample rate and number of available speakers/voices.
- * Call this after initialization to check model capabilities.
- *
- * @returns Promise resolving to model information
- * @example
- * ```typescript
- * await initializeTTS('models/kokoro-en');
- * const info = await getModelInfo();
- *
- * console.log(`Sample rate: ${info.sampleRate} Hz`);
- * console.log(`Available speakers: ${info.numSpeakers}`);
- *
- * if (info.numSpeakers > 1) {
- *   // Multi-speaker model, can use different voices
- *   const audio = await generateSpeech('Hello', { sid: 1 });
- * }
- * ```
- */
-export async function getModelInfo(): Promise<TTSModelInfo> {
-  const [sampleRate, numSpeakers] = await Promise.all([
-    SherpaOnnx.getTtsSampleRate(),
-    SherpaOnnx.getTtsNumSpeakers(),
-  ]);
-  return {
-    sampleRate,
-    numSpeakers,
-  };
-}
-/**
- * Get the sample rate of the initialized TTS model.
- *
- * @returns Promise resolving to sample rate in Hz
- * @example
- * ```typescript
- * const sampleRate = await getSampleRate();
- * console.log(`Model outputs audio at ${sampleRate} Hz`);
- * ```
- */
-export function getSampleRate(): Promise<number> {
-  return SherpaOnnx.getTtsSampleRate();
-}
-/**
- * Get the number of speakers/voices available in the model.
- *
- * @returns Promise resolving to number of speakers
- * - 0 or 1: Single-speaker model
- * - >1: Multi-speaker model
- * @example
- * ```typescript
- * const numSpeakers = await getNumSpeakers();
- *
- * if (numSpeakers > 1) {
- *   console.log(`Model has ${numSpeakers} different voices`);
- *   // Generate with different voices
- *   for (let i = 0; i < numSpeakers; i++) {
- *     const audio = await generateSpeech('Hello', { sid: i });
- *     // ... use audio
- *   }
- * }
- * ```
- */
-export function getNumSpeakers(): Promise<number> {
-  return SherpaOnnx.getTtsNumSpeakers();
-}
-/**
- * Release TTS resources.
- *
- * Call this when you're done using TTS to free up memory.
- * After calling this, you must call `initializeTTS()` again before
- * using TTS functions.
- *
- * @example
- * ```typescript
- * await initializeTTS('models/vits-piper-en');
- * const audio = await generateSpeech('Hello');
- * // ... use audio
- * await unloadTTS(); // Free resources
- * ```
- */
-export function unloadTTS(): Promise<void> {
-  return SherpaOnnx.unloadTts();
-}
-/**
- * Save generated TTS audio to a WAV file.
- *
- * @param audio - Generated audio from generateSpeech()
- * @param filePath - Absolute path where to save the WAV file
- * @returns Promise resolving to the file path where audio was saved
- * @example
- * ```typescript
- * import { Platform } from 'react-native';
- * import RNFS from 'react-native-fs';
- *
- * const audio = await generateSpeech('Hello, world!');
- *
- * // Save to documents directory
- * const documentsPath = Platform.OS === 'ios'
- *   ? RNFS.DocumentDirectoryPath
- *   : RNFS.ExternalDirectoryPath;
- * const filePath = `${documentsPath}/speech_${Date.now()}.wav`;
- *
- * const savedPath = await saveAudioToFile(audio, filePath);
- * console.log('Audio saved to:', savedPath);
- * ```
- */
-export function saveAudioToFile(
-  audio: GeneratedAudio,
-  filePath: string
-): Promise<string> {
-  return SherpaOnnx.saveTtsAudioToFile(
-    audio.samples,
-    audio.sampleRate,
-    filePath
-  );
-}
-/**
- * Save generated TTS audio to a WAV file via Android SAF content URI.
- *
- * @param audio - Generated audio from generateSpeech()
- * @param directoryUri - Directory content URI from SAF
- * @param filename - Desired file name
- * @returns Promise resolving to content URI of the saved file
- */
-export function saveAudioToContentUri(
-  audio: GeneratedAudio,
-  directoryUri: string,
-  filename: string
-): Promise<string> {
-  return SherpaOnnx.saveTtsAudioToContentUri(
-    audio.samples,
-    audio.sampleRate,
-    directoryUri,
-    filename
-  );
-}
-/**
- * Save a text file via Android SAF content URI.
- *
- * @param text - Text content to write
- * @param directoryUri - Directory content URI from SAF
- * @param filename - Desired file name
- * @param mimeType - MIME type (default: text/plain)
- * @returns Promise resolving to content URI of the saved file
- */
-export function saveTextToContentUri(
-  text: string,
-  directoryUri: string,
-  filename: string,
-  mimeType = 'text/plain'
-): Promise<string> {
-  return SherpaOnnx.saveTtsTextToContentUri(
-    text,
-    directoryUri,
-    filename,
-    mimeType
-  );
-}
-/**
- * Copy a SAF content URI to a cache file for local playback (Android only).
- *
- * @param fileUri - Content URI of the saved WAV file
- * @param filename - Desired cache filename
- * @returns Promise resolving to absolute path of the cached file
- */
-export function copyContentUriToCache(
-  fileUri: string,
-  filename: string
-): Promise<string> {
-  return SherpaOnnx.copyTtsContentUriToCache(fileUri, filename);
-}
-/**
- * Share a TTS audio file (file path or content URI).
- *
- * @param fileUri - File path or content URI
- * @param mimeType - MIME type (default: audio/wav)
- */
-export function shareAudioFile(
-  fileUri: string,
-  mimeType = 'audio/wav'
-): Promise<void> {
-  return SherpaOnnx.shareTtsAudio(fileUri, mimeType);
-}
-// Export types
-export type {
-  TTSInitializeOptions,
-  TTSModelType,
-  SynthesisOptions,
-  GeneratedAudio,
-  GeneratedAudioWithTimestamps,
-  TtsSubtitleItem,
-  TTSModelInfo,
-} from './types';
+import { DeviceEventEmitter } from 'react-native';
+import SherpaOnnx from '../NativeSherpaOnnx';
+import type {
+  TTSInitializeOptions,
+  TTSModelType,
+  TtsModelOptions,
+  TtsUpdateOptions,
+  TtsGenerationOptions,
+  GeneratedAudio,
+  GeneratedAudioWithTimestamps,
+  TTSModelInfo,
+  TtsEngine,
+  TtsStreamChunk,
+  TtsStreamEnd,
+  TtsStreamError,
+  TtsStreamHandlers,
+} from './types';
+import type { ModelPathConfig } from '../types';
+import { resolveModelPath } from '../utils';
+let ttsInstanceCounter = 0;
+/**
+ * Flatten model-specific options for the given model type to native init/update params.
+ * When modelType is 'auto' or missing, returns undefined for all (native uses defaults).
+ */
+function flattenTtsModelOptionsForNative(
+  modelType: TTSModelType | undefined,
+  modelOptions: TtsModelOptions | undefined
+): {
+  noiseScale: number | undefined;
+  noiseScaleW: number | undefined;
+  lengthScale: number | undefined;
+} {
+  if (
+    !modelOptions ||
+    !modelType ||
+    modelType === 'auto' ||
+    modelType === 'zipvoice' // Zipvoice does not use noise/length scale; native uses its own defaults
+  )
+    return {
+      noiseScale: undefined,
+      noiseScaleW: undefined,
+      lengthScale: undefined,
+    };
+  const block =
+    modelType === 'vits'
+      ? modelOptions.vits
+      : modelType === 'matcha'
+      ? modelOptions.matcha
+      : modelType === 'kokoro'
+      ? modelOptions.kokoro
+      : modelType === 'kitten'
+      ? modelOptions.kitten
+      : modelType === 'pocket'
+      ? modelOptions.pocket
+      : undefined;
+  if (!block)
+    return {
+      noiseScale: undefined,
+      noiseScaleW: undefined,
+      lengthScale: undefined,
+    };
+  const out: {
+    noiseScale: number | undefined;
+    noiseScaleW: number | undefined;
+    lengthScale: number | undefined;
+  } = {
+    noiseScale: undefined,
+    noiseScaleW: undefined,
+    lengthScale: undefined,
+  };
+  const n = block as {
+    noiseScale?: number;
+    noiseScaleW?: number;
+    lengthScale?: number;
+  };
+  if (n.noiseScale !== undefined && typeof n.noiseScale === 'number')
+    out.noiseScale = n.noiseScale;
+  if (n.noiseScaleW !== undefined && typeof n.noiseScaleW === 'number')
+    out.noiseScaleW = n.noiseScaleW;
+  if (n.lengthScale !== undefined && typeof n.lengthScale === 'number')
+    out.lengthScale = n.lengthScale;
+  return out;
+}
+/**
+ * Detect TTS model type and structure without initializing the engine.
+ * Uses the same native file-based detection as createTTS. Stateless; no instance required.
+ *
+ * @param modelPath - Model path configuration (asset, file, or auto)
+ * @param options - Optional modelType (default: 'auto')
+ * @returns Object with success, detectedModels (array of { type, modelDir }), and modelType (primary detected type)
+ * @example
+ * ```typescript
+ * const result = await detectTtsModel({ type: 'asset', path: 'models/vits-piper-en' });
+ * if (result.success) console.log('Detected type:', result.modelType, result.detectedModels);
+ * ```
+ */
+export async function detectTtsModel(
+  modelPath: ModelPathConfig,
+  options?: { modelType?: TTSModelType }
+): Promise<{
+  success: boolean;
+  detectedModels: Array<{ type: string; modelDir: string }>;
+  modelType?: string;
+}> {
+  const resolvedPath = await resolveModelPath(modelPath);
+  return SherpaOnnx.detectTtsModel(resolvedPath, options?.modelType);
+}
+/**
+ * Convert TtsGenerationOptions to a flat object for the native bridge.
+ * Flattens referenceAudio { samples, sampleRate } to referenceAudio array + referenceSampleRate.
+ */
+function toNativeTtsOptions(
+  options?: TtsGenerationOptions
+): Record<string, unknown> {
+  if (options == null) return {};
+  const out: Record<string, unknown> = {};
+  if (options.sid !== undefined) out.sid = options.sid;
+  if (options.speed !== undefined) out.speed = options.speed;
+  if (options.silenceScale !== undefined)
+    out.silenceScale = options.silenceScale;
+  if (options.referenceAudio != null) {
+    out.referenceAudio = options.referenceAudio.samples;
+    out.referenceSampleRate = options.referenceAudio.sampleRate;
+  }
+  if (options.referenceText !== undefined)
+    out.referenceText = options.referenceText;
+  if (options.numSteps !== undefined) out.numSteps = options.numSteps;
+  if (options.extra != null && Object.keys(options.extra).length > 0)
+    out.extra = options.extra;
+  return out;
+}
+// TTS stream events are sent from native via sendEventWithName; use DeviceEventEmitter
+// so we don't need NativeEventEmitter (which expects addListener/removeListeners on the module).
+/**
+ * Create a TTS engine instance. Call destroy() on the returned engine when done to free native resources.
+ *
+ * @param options - TTS initialization options or model path configuration
+ * @returns Promise resolving to a TtsEngine instance
+ * @example
+ * ```typescript
+ * const tts = await createTTS({
+ *   modelPath: { type: 'asset', path: 'models/vits-piper-en' },
+ *   modelType: 'vits',
+ *   modelOptions: { vits: { noiseScale: 0.667 } },
+ * });
+ * const audio = await tts.generateSpeech('Hello world');
+ * await tts.destroy();
+ * ```
+ */
+export async function createTTS(
+  options: TTSInitializeOptions | ModelPathConfig
+): Promise<TtsEngine> {
+  const instanceId = `tts_${++ttsInstanceCounter}`;
+  let modelPath: ModelPathConfig;
+  let modelType: TTSModelType | undefined;
+  let provider: string | undefined;
+  let numThreads: number | undefined;
+  let debug: boolean | undefined;
+  let modelOptions: TtsModelOptions | undefined;
+  let ruleFsts: string | undefined;
+  let ruleFars: string | undefined;
+  let maxNumSentences: number | undefined;
+  let silenceScale: number | undefined;
+  if ('modelPath' in options) {
+    modelPath = options.modelPath;
+    modelType = options.modelType;
+    provider = options.provider;
+    numThreads = options.numThreads;
+    debug = options.debug;
+    modelOptions = options.modelOptions;
+    ruleFsts = options.ruleFsts;
+    ruleFars = options.ruleFars;
+    maxNumSentences = options.maxNumSentences;
+    silenceScale = options.silenceScale;
+  } else {
+    modelPath = options;
+    modelType = undefined;
+    provider = undefined;
+    numThreads = undefined;
+    debug = undefined;
+    modelOptions = undefined;
+    ruleFsts = undefined;
+    ruleFars = undefined;
+    maxNumSentences = undefined;
+    silenceScale = undefined;
+  }
+  const flat = flattenTtsModelOptionsForNative(modelType, modelOptions);
+  const resolvedPath = await resolveModelPath(modelPath);
+  const result = await SherpaOnnx.initializeTts(
+    instanceId,
+    resolvedPath,
+    modelType ?? 'auto',
+    numThreads ?? 2,
+    debug ?? false,
+    flat.noiseScale,
+    flat.noiseScaleW,
+    flat.lengthScale,
+    ruleFsts,
+    ruleFars,
+    maxNumSentences,
+    silenceScale,
+    provider
+  );
+  if (!result.success) {
+    throw new Error(
+      `TTS initialization failed: ${JSON.stringify(
+        result.detectedModels ?? []
+      )}`
+    );
+  }
+  const firstDetected = result.detectedModels?.[0];
+  const effectiveModelType: TTSModelType | undefined =
+    modelType && modelType !== 'auto'
+      ? modelType
+      : (firstDetected?.type as TTSModelType);
+  let destroyed = false;
+  const guard = () => {
+    if (destroyed) {
+      throw new Error(
+        `TTS instance ${instanceId} has been destroyed; cannot call methods on it.`
+      );
+    }
+  };
+  const engine: TtsEngine = {
+    get instanceId() {
+      return instanceId;
+    },
+    async generateSpeech(
+      text: string,
+      opts?: TtsGenerationOptions
+    ): Promise<GeneratedAudio> {
+      guard();
+      return SherpaOnnx.generateTts(instanceId, text, toNativeTtsOptions(opts));
+    },
+    async generateSpeechWithTimestamps(
+      text: string,
+      opts?: TtsGenerationOptions
+    ): Promise<GeneratedAudioWithTimestamps> {
+      guard();
+      return SherpaOnnx.generateTtsWithTimestamps(
+        instanceId,
+        text,
+        toNativeTtsOptions(opts)
+      );
+    },
+    async generateSpeechStream(
+      text: string,
+      opts: TtsGenerationOptions | undefined,
+      handlers: TtsStreamHandlers
+    ): Promise<() => void> {
+      guard();
+      const subscriptions = [
+        DeviceEventEmitter.addListener('ttsStreamChunk', (event: unknown) => {
+          const e = event as TtsStreamChunk;
+          if (e.instanceId != null && e.instanceId !== instanceId) return;
+          handlers.onChunk?.(e);
+        }),
+        DeviceEventEmitter.addListener('ttsStreamEnd', (event: unknown) => {
+          const e = event as TtsStreamEnd;
+          if (e.instanceId != null && e.instanceId !== instanceId) return;
+          handlers.onEnd?.(e);
+        }),
+        DeviceEventEmitter.addListener('ttsStreamError', (event: unknown) => {
+          const e = event as TtsStreamError;
+          if (e.instanceId != null && e.instanceId !== instanceId) return;
+          handlers.onError?.(e);
+        }),
+      ];
+      try {
+        await SherpaOnnx.generateTtsStream(
+          instanceId,
+          text,
+          toNativeTtsOptions(opts)
+        );
+      } catch (error) {
+        subscriptions.forEach((sub) => sub.remove());
+        throw error;
+      }
+      return () => {
+        subscriptions.forEach((sub) => sub.remove());
+      };
+    },
+    async cancelSpeechStream(): Promise<void> {
+      guard();
+      return SherpaOnnx.cancelTtsStream(instanceId);
+    },
+    async startPcmPlayer(sampleRate: number, channels: number): Promise<void> {
+      guard();
+      return SherpaOnnx.startTtsPcmPlayer(instanceId, sampleRate, channels);
+    },
+    async writePcmChunk(samples: number[]): Promise<void> {
+      guard();
+      return SherpaOnnx.writeTtsPcmChunk(instanceId, samples);
+    },
+    async stopPcmPlayer(): Promise<void> {
+      guard();
+      return SherpaOnnx.stopTtsPcmPlayer(instanceId);
+    },
+    async updateParams(opts: TtsUpdateOptions): Promise<{
+      success: boolean;
+      detectedModels: Array<{ type: string; modelDir: string }>;
+    }> {
+      guard();
+      const effectiveModelTypeForUpdate =
+        opts.modelType && opts.modelType !== 'auto'
+          ? opts.modelType
+          : effectiveModelType;
+      const flatOpts = flattenTtsModelOptionsForNative(
+        effectiveModelTypeForUpdate,
+        opts.modelOptions
+      );
+      const noiseArg =
+        flatOpts.noiseScale === undefined ? Number.NaN : flatOpts.noiseScale;
+      const noiseWArg =
+        flatOpts.noiseScaleW === undefined ? Number.NaN : flatOpts.noiseScaleW;
+      const lengthArg =
+        flatOpts.lengthScale === undefined ? Number.NaN : flatOpts.lengthScale;
+      return SherpaOnnx.updateTtsParams(
+        instanceId,
+        noiseArg,
+        noiseWArg,
+        lengthArg
+      );
+    },
+    async getModelInfo(): Promise<TTSModelInfo> {
+      guard();
+      const [sampleRate, numSpeakers] = await Promise.all([
+        SherpaOnnx.getTtsSampleRate(instanceId),
+        SherpaOnnx.getTtsNumSpeakers(instanceId),
+      ]);
+      return { sampleRate, numSpeakers };
+    },
+    async getSampleRate(): Promise<number> {
+      guard();
+      return SherpaOnnx.getTtsSampleRate(instanceId);
+    },
+    async getNumSpeakers(): Promise<number> {
+      guard();
+      return SherpaOnnx.getTtsNumSpeakers(instanceId);
+    },
+    async destroy(): Promise<void> {
+      if (destroyed) return;
+      destroyed = true;
+      await SherpaOnnx.unloadTts(instanceId);
+    },
+  };
+  return engine;
+}
+// ========== Module-level utilities (stateless, no instance required) ==========
+/**
+ * Save generated TTS audio to a WAV file.
+ */
+export function saveAudioToFile(
+  audio: GeneratedAudio,
+  filePath: string
+): Promise<string> {
+  return SherpaOnnx.saveTtsAudioToFile(
+    audio.samples,
+    audio.sampleRate,
+    filePath
+  );
+}
+/**
+ * Save generated TTS audio to a WAV file via Android SAF content URI.
+ */
+export function saveAudioToContentUri(
+  audio: GeneratedAudio,
+  directoryUri: string,
+  filename: string
+): Promise<string> {
+  return SherpaOnnx.saveTtsAudioToContentUri(
+    audio.samples,
+    audio.sampleRate,
+    directoryUri,
+    filename
+  );
+}
+/**
+ * Save a text file via Android SAF content URI.
+ */
+export function saveTextToContentUri(
+  text: string,
+  directoryUri: string,
+  filename: string,
+  mimeType = 'text/plain'
+): Promise<string> {
+  return SherpaOnnx.saveTtsTextToContentUri(
+    text,
+    directoryUri,
+    filename,
+    mimeType
+  );
+}
+/**
+ * Copy a SAF content URI to a cache file for local playback (Android only).
+ */
+export function copyContentUriToCache(
+  fileUri: string,
+  filename: string
+): Promise<string> {
+  return SherpaOnnx.copyTtsContentUriToCache(fileUri, filename);
+}
+/**
+ * Share a TTS audio file (file path or content URI).
+ */
+export function shareAudioFile(
+  fileUri: string,
+  mimeType = 'audio/wav'
+): Promise<void> {
+  return SherpaOnnx.shareTtsAudio(fileUri, mimeType);
+}
+// Export types and runtime type list
+export type {
+  TTSInitializeOptions,
+  TTSModelType,
+  TtsModelOptions,
+  TtsVitsModelOptions,
+  TtsMatchaModelOptions,
+  TtsKokoroModelOptions,
+  TtsKittenModelOptions,
+  TtsPocketModelOptions,
+  TtsUpdateOptions,
+  TtsGenerationOptions,
+  GeneratedAudio,
+  GeneratedAudioWithTimestamps,
+  TtsSubtitleItem,
+  TTSModelInfo,
+  TtsEngine,
+  TtsStreamHandlers,
+  TtsStreamChunk,
+  TtsStreamEnd,
+  TtsStreamError,
+} from './types';
+export { TTS_MODEL_TYPES } from './types';