npm - react-native-sherpa-onnx - Versions diffs - 0.3.5 → 0.3.7 - Mend

react-native-sherpa-onnx 0.3.5 → 0.3.7

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (232) hide show

package/LICENSE +1 -0
package/README.md +90 -21
package/SherpaOnnx.podspec +3 -0
package/THIRD_PARTY_LICENSES/README.md +62 -0
package/THIRD_PARTY_LICENSES/ffmpeg.txt +502 -0
package/THIRD_PARTY_LICENSES/libarchive.txt +65 -0
package/THIRD_PARTY_LICENSES/nvidia_omla.txt +181 -0
package/THIRD_PARTY_LICENSES/onnxruntime.txt +21 -0
package/THIRD_PARTY_LICENSES/opus.txt +44 -0
package/THIRD_PARTY_LICENSES/sherpa-onnx.txt +201 -0
package/THIRD_PARTY_LICENSES/shine.txt +482 -0
package/THIRD_PARTY_LICENSES/zstd.txt +30 -0
package/android/build.gradle +7 -3
package/android/prebuilt-download.gradle +345 -153
package/android/prebuilt-versions.gradle +2 -2
package/android/src/main/assets/model_licenses/asr-models-license-status.csv +409 -0
package/android/src/main/assets/model_licenses/qnn-asr-models-license-status.csv +695 -0
package/android/src/main/assets/model_licenses/tts-models-license-status.csv +596 -0
package/android/src/main/cpp/CMakeLists.txt +28 -10
package/android/src/main/cpp/jni/archive/sherpa-onnx-archive-helper.cpp +306 -6
package/android/src/main/cpp/jni/archive/sherpa-onnx-archive-helper.h +33 -4
package/android/src/main/cpp/jni/archive/sherpa-onnx-archive-jni.cpp +266 -7
package/android/src/main/cpp/jni/audio/sherpa-onnx-audio-convert-jni.cpp +268 -2
package/android/src/main/cpp/jni/model_detect/sherpa-onnx-model-detect-tts.cpp +6 -2
package/android/src/main/cpp/jni/model_detect/sherpa-onnx-validate-tts.cpp +4 -2
package/android/src/main/java/com/sherpaonnx/SherpaOnnxArchiveHelper.kt +137 -7
package/android/src/main/java/com/sherpaonnx/SherpaOnnxAssetHelper.kt +51 -6
package/android/src/main/java/com/sherpaonnx/SherpaOnnxModule.kt +159 -0
package/android/src/main/java/com/sherpaonnx/SherpaOnnxOnlineSttHelper.kt +4 -1
package/android/src/main/java/com/sherpaonnx/SherpaOnnxTtsHelper.kt +112 -97
package/ios/Resources/model_licenses/asr-models-license-status.csv +409 -0
package/ios/Resources/model_licenses/qnn-asr-models-license-status.csv +695 -0
package/ios/Resources/model_licenses/tts-models-license-status.csv +596 -0
package/ios/SherpaOnnx+OnlineSTT.mm +2 -0
package/ios/SherpaOnnx+PcmLiveStream.mm +2 -29
package/ios/SherpaOnnx+TTS.mm +178 -20
package/ios/SherpaOnnx.mm +108 -1
package/ios/SherpaOnnxAudioConvert.h +10 -0
package/ios/SherpaOnnxAudioConvert.mm +257 -1
package/ios/archive/sherpa-onnx-archive-helper.h +10 -0
package/ios/archive/sherpa-onnx-archive-helper.mm +56 -5
package/ios/model_detect/sherpa-onnx-model-detect-tts.mm +13 -2
package/ios/model_detect/sherpa-onnx-validate-tts.mm +4 -2
package/ios/online_stt/sherpa-onnx-online-stt-wrapper.h +1 -0
package/ios/online_stt/sherpa-onnx-online-stt-wrapper.mm +4 -0
package/ios/tts/sherpa-onnx-tts-wrapper.h +37 -0
package/ios/tts/sherpa-onnx-tts-wrapper.mm +149 -3
package/lib/module/NativeSherpaOnnx.js.map +1 -1
package/lib/module/audio/index.js +8 -0
package/lib/module/audio/index.js.map +1 -1
package/lib/module/download/ModelDownloadManager.js +10 -929
package/lib/module/download/ModelDownloadManager.js.map +1 -1
package/lib/module/download/activeModelOperations.js +26 -0
package/lib/module/download/activeModelOperations.js.map +1 -0
package/lib/module/download/background-downloader.d.js +2 -0
package/lib/module/download/background-downloader.d.js.map +1 -0
package/lib/module/download/bulkPurge.js +72 -0
package/lib/module/download/bulkPurge.js.map +1 -0
package/lib/module/download/checksumPrompt.js +19 -0
package/lib/module/download/checksumPrompt.js.map +1 -0
package/lib/module/download/constants.js +7 -0
package/lib/module/download/constants.js.map +1 -0
package/lib/module/download/downloadEvents.js +35 -0
package/lib/module/download/downloadEvents.js.map +1 -0
package/lib/module/download/downloadTask.js +385 -0
package/lib/module/download/downloadTask.js.map +1 -0
package/lib/module/download/ensureModel.js +89 -0
package/lib/module/download/ensureModel.js.map +1 -0
package/lib/module/download/index.js +4 -3
package/lib/module/download/index.js.map +1 -1
package/lib/module/download/localModels.js +151 -0
package/lib/module/download/localModels.js.map +1 -0
package/lib/module/download/modelExtraction.js +174 -0
package/lib/module/download/modelExtraction.js.map +1 -0
package/lib/module/download/paths.js +98 -0
package/lib/module/download/paths.js.map +1 -0
package/lib/module/download/postDownloadProcessing.js +206 -0
package/lib/module/download/postDownloadProcessing.js.map +1 -0
package/lib/module/download/protectedModelKeys.js +31 -0
package/lib/module/download/protectedModelKeys.js.map +1 -0
package/lib/module/download/registry.js +267 -0
package/lib/module/download/registry.js.map +1 -0
package/lib/module/download/retry.js +59 -0
package/lib/module/download/retry.js.map +1 -0
package/lib/module/download/types.js +17 -0
package/lib/module/download/types.js.map +1 -0
package/lib/module/download/validation.js +101 -5
package/lib/module/download/validation.js.map +1 -1
package/lib/module/{download → extraction}/extractTarBz2.js +3 -1
package/lib/module/extraction/extractTarBz2.js.map +1 -0
package/lib/module/extraction/extractTarZst.js +54 -0
package/lib/module/extraction/extractTarZst.js.map +1 -0
package/lib/module/extraction/index.js +190 -0
package/lib/module/extraction/index.js.map +1 -0
package/lib/module/extraction/types.js +2 -0
package/lib/module/extraction/types.js.map +1 -0
package/lib/module/index.js +2 -1
package/lib/module/index.js.map +1 -1
package/lib/module/licenses.js +63 -0
package/lib/module/licenses.js.map +1 -0
package/lib/module/stt/index.js +16 -2
package/lib/module/stt/index.js.map +1 -1
package/lib/module/stt/streaming.js +2 -0
package/lib/module/stt/streaming.js.map +1 -1
package/lib/module/stt/streamingTypes.js.map +1 -1
package/lib/module/stt/types.js.map +1 -1
package/lib/module/tts/index.js +20 -2
package/lib/module/tts/index.js.map +1 -1
package/lib/module/tts/streaming.js +4 -0
package/lib/module/tts/streaming.js.map +1 -1
package/lib/module/tts/types.js.map +1 -1
package/lib/module/utils.js +16 -1
package/lib/module/utils.js.map +1 -1
package/lib/typescript/src/NativeSherpaOnnx.d.ts +72 -5
package/lib/typescript/src/NativeSherpaOnnx.d.ts.map +1 -1
package/lib/typescript/src/audio/index.d.ts +10 -0
package/lib/typescript/src/audio/index.d.ts.map +1 -1
package/lib/typescript/src/download/ModelDownloadManager.d.ts +10 -108
package/lib/typescript/src/download/ModelDownloadManager.d.ts.map +1 -1
package/lib/typescript/src/download/activeModelOperations.d.ts +6 -0
package/lib/typescript/src/download/activeModelOperations.d.ts.map +1 -0
package/lib/typescript/src/download/bulkPurge.d.ts +14 -0
package/lib/typescript/src/download/bulkPurge.d.ts.map +1 -0
package/lib/typescript/src/download/checksumPrompt.d.ts +3 -0
package/lib/typescript/src/download/checksumPrompt.d.ts.map +1 -0
package/lib/typescript/src/download/constants.d.ts +5 -0
package/lib/typescript/src/download/constants.d.ts.map +1 -0
package/lib/typescript/src/download/downloadEvents.d.ts +6 -0
package/lib/typescript/src/download/downloadEvents.d.ts.map +1 -0
package/lib/typescript/src/download/downloadTask.d.ts +20 -0
package/lib/typescript/src/download/downloadTask.d.ts.map +1 -0
package/lib/typescript/src/download/ensureModel.d.ts +26 -0
package/lib/typescript/src/download/ensureModel.d.ts.map +1 -0
package/lib/typescript/src/download/index.d.ts +7 -5
package/lib/typescript/src/download/index.d.ts.map +1 -1
package/lib/typescript/src/download/localModels.d.ts +15 -0
package/lib/typescript/src/download/localModels.d.ts.map +1 -0
package/lib/typescript/src/download/modelExtraction.d.ts +36 -0
package/lib/typescript/src/download/modelExtraction.d.ts.map +1 -0
package/lib/typescript/src/download/paths.d.ts +28 -0
package/lib/typescript/src/download/paths.d.ts.map +1 -0
package/lib/typescript/src/download/postDownloadProcessing.d.ts +19 -0
package/lib/typescript/src/download/postDownloadProcessing.d.ts.map +1 -0
package/lib/typescript/src/download/protectedModelKeys.d.ts +6 -0
package/lib/typescript/src/download/protectedModelKeys.d.ts.map +1 -0
package/lib/typescript/src/download/registry.d.ts +14 -0
package/lib/typescript/src/download/registry.d.ts.map +1 -0
package/lib/typescript/src/download/retry.d.ts +15 -0
package/lib/typescript/src/download/retry.d.ts.map +1 -0
package/lib/typescript/src/download/types.d.ts +96 -0
package/lib/typescript/src/download/types.d.ts.map +1 -0
package/lib/typescript/src/download/validation.d.ts +19 -0
package/lib/typescript/src/download/validation.d.ts.map +1 -1
package/lib/typescript/src/extraction/extractTarBz2.d.ts.map +1 -0
package/lib/typescript/src/extraction/extractTarZst.d.ts +14 -0
package/lib/typescript/src/extraction/extractTarZst.d.ts.map +1 -0
package/lib/typescript/src/extraction/index.d.ts +50 -0
package/lib/typescript/src/extraction/index.d.ts.map +1 -0
package/lib/typescript/src/extraction/types.d.ts +60 -0
package/lib/typescript/src/extraction/types.d.ts.map +1 -0
package/lib/typescript/src/index.d.ts +1 -0
package/lib/typescript/src/index.d.ts.map +1 -1
package/lib/typescript/src/licenses.d.ts +10 -0
package/lib/typescript/src/licenses.d.ts.map +1 -0
package/lib/typescript/src/stt/index.d.ts +4 -1
package/lib/typescript/src/stt/index.d.ts.map +1 -1
package/lib/typescript/src/stt/streaming.d.ts.map +1 -1
package/lib/typescript/src/stt/streamingTypes.d.ts +5 -0
package/lib/typescript/src/stt/streamingTypes.d.ts.map +1 -1
package/lib/typescript/src/stt/types.d.ts +3 -1
package/lib/typescript/src/stt/types.d.ts.map +1 -1
package/lib/typescript/src/tts/index.d.ts +3 -1
package/lib/typescript/src/tts/index.d.ts.map +1 -1
package/lib/typescript/src/tts/streaming.d.ts.map +1 -1
package/lib/typescript/src/tts/types.d.ts +6 -5
package/lib/typescript/src/tts/types.d.ts.map +1 -1
package/lib/typescript/src/utils.d.ts +5 -0
package/lib/typescript/src/utils.d.ts.map +1 -1
package/package.json +11 -1
package/scripts/{check-model-csvs.sh → ci/check-model-csvs.sh} +9 -2
package/scripts/ci/collect_all_sherpa_model_streams.sh +101 -0
package/scripts/ci/collect_one_sherpa_release_stream.sh +189 -0
package/scripts/ci/sherpa_asr_model_release_streams.json +21 -0
package/scripts/ci/sherpa_tts_model_release_streams.json +13 -0
package/scripts/ci/update_model_license_csv.sh +765 -0
package/scripts/setup-ios-framework.sh +14 -11
package/scripts/update_commercial_use.js +73 -0
package/src/NativeSherpaOnnx.ts +92 -5
package/src/audio/index.ts +20 -0
package/src/download/ModelDownloadManager.ts +55 -1343
package/src/download/activeModelOperations.ts +38 -0
package/src/download/background-downloader.d.ts +43 -0
package/src/download/bulkPurge.ts +102 -0
package/src/download/checksumPrompt.ts +25 -0
package/src/download/constants.ts +5 -0
package/src/download/downloadEvents.ts +55 -0
package/src/download/downloadTask.ts +497 -0
package/src/download/ensureModel.ts +124 -0
package/src/download/index.ts +19 -2
package/src/download/localModels.ts +234 -0
package/src/download/modelExtraction.ts +244 -0
package/src/download/paths.ts +134 -0
package/src/download/postDownloadProcessing.ts +292 -0
package/src/download/protectedModelKeys.ts +30 -0
package/src/download/registry.ts +404 -0
package/src/download/retry.ts +76 -0
package/src/download/types.ts +120 -0
package/src/download/validation.ts +114 -8
package/src/{download → extraction}/extractTarBz2.ts +3 -1
package/src/extraction/extractTarZst.ts +79 -0
package/src/extraction/index.ts +269 -0
package/src/extraction/types.ts +63 -0
package/src/index.tsx +2 -0
package/src/licenses.ts +100 -0
package/src/stt/index.ts +20 -2
package/src/stt/streaming.ts +3 -0
package/src/stt/streamingTypes.ts +5 -0
package/src/stt/types.ts +3 -1
package/src/tts/index.ts +30 -2
package/src/tts/streaming.ts +10 -0
package/src/tts/types.ts +6 -5
package/src/utils.ts +22 -1
package/third_party/libarchive_prebuilt/ANDROID_RELEASE_TAG +1 -1
package/third_party/libarchive_prebuilt/IOS_RELEASE_TAG +1 -1
package/third_party/sherpa-onnx-prebuilt/ANDROID_RELEASE_TAG +1 -1
package/third_party/sherpa-onnx-prebuilt/IOS_RELEASE_TAG +1 -1
package/android/src/main/cpp/jni/tts/sherpa-onnx-tts-zipvoice-jni.cpp +0 -301
package/android/src/main/java/com/sherpaonnx/ZipvoiceTtsWrapper.kt +0 -187
package/lib/module/download/extractTarBz2.js.map +0 -1
package/lib/typescript/src/download/extractTarBz2.d.ts.map +0 -1
package/scripts/check-qnn-support.sh +0 -78
/package/lib/typescript/src/{download → extraction}/extractTarBz2.d.ts +0 -0

package/src/stt/index.ts CHANGED Viewed

@@ -40,7 +40,7 @@ function normalizeSttResult(raw: {
  *
  * @param modelPath - Model path configuration (asset, file, or auto)
  * @param options - Optional preferInt8 and modelType (default: auto)
- * @returns Object with success, detectedModels (array of { type, modelDir }), and modelType (primary detected type)
+ * @returns Object with success, detectedModels (array of { type, modelDir }), modelType (primary detected type), optional error when success is false, and optionally isHardwareSpecificUnsupported
  * @example
  * ```typescript
  * const path = { type: 'asset' as const, path: 'models/sherpa-onnx-whisper-tiny-en' };
@@ -55,15 +55,33 @@ export async function detectSttModel(
   options?: { preferInt8?: boolean; modelType?: STTModelType }
 ): Promise<{
   success: boolean;
+  /** Native validation/detect failure. */
+  error?: string;
   detectedModels: Array<{ type: string; modelDir: string }>;
   modelType?: string;
+  isHardwareSpecificUnsupported?: boolean;
 }> {
   const resolvedPath = await resolveModelPath(modelPath);
-  return SherpaOnnx.detectSttModel(
+  const raw = await SherpaOnnx.detectSttModel(
     resolvedPath,
     options?.preferInt8,
     options?.modelType
   );
+  const err =
+    typeof (raw as { error?: unknown }).error === 'string'
+      ? String((raw as { error: string }).error).trim()
+      : '';
+  return {
+    success: raw.success,
+    ...(err.length > 0 ? { error: err } : {}),
+    ...(raw.isHardwareSpecificUnsupported === true
+      ? { isHardwareSpecificUnsupported: true }
+      : {}),
+    detectedModels: raw.detectedModels ?? [],
+    ...(raw.modelType != null && raw.modelType !== ''
+      ? { modelType: raw.modelType }
+      : {}),
+  };
 }
 /**

package/src/stt/streaming.ts CHANGED Viewed

@@ -82,6 +82,7 @@ function flattenInitOptionsForNative(options: StreamingSttInitOptions): {
   provider?: string;
   ruleFsts?: string;
   ruleFars?: string;
+  dither?: number;
   blankPenalty?: number;
   debug?: boolean;
   rule1MustContainNonSilence?: boolean;
@@ -107,6 +108,7 @@ function flattenInitOptionsForNative(options: StreamingSttInitOptions): {
     provider: options.provider,
     ruleFsts: options.ruleFsts,
     ruleFars: options.ruleFars,
+    dither: options.dither,
     blankPenalty: options.blankPenalty,
     debug: options.debug,
     rule1MustContainNonSilence: ep?.rule1?.mustContainNonSilence,
@@ -200,6 +202,7 @@ export async function createStreamingSTT(
   if (flat.provider !== undefined) nativeOptions.provider = flat.provider;
   if (flat.ruleFsts !== undefined) nativeOptions.ruleFsts = flat.ruleFsts;
   if (flat.ruleFars !== undefined) nativeOptions.ruleFars = flat.ruleFars;
+  if (flat.dither !== undefined) nativeOptions.dither = flat.dither;
   if (flat.blankPenalty !== undefined)
     nativeOptions.blankPenalty = flat.blankPenalty;
   if (flat.debug !== undefined) nativeOptions.debug = flat.debug;

package/src/stt/streamingTypes.ts CHANGED Viewed

@@ -75,6 +75,11 @@ export interface StreamingSttInitOptions {
   ruleFsts?: string;
   /** Path(s) to rule FARs for ITN. */
   ruleFars?: string;
+  /**
+   * Feature extraction dither. **Android:** applied natively. **iOS:** ignored (C/CXX API has no
+   * `dither` on `FeatureConfig`); library default applies.
+   */
+  dither?: number;
   /** Blank penalty. */
   blankPenalty?: number;
   /** Enable debug logging. Default: false. */

package/src/stt/types.ts CHANGED Viewed

@@ -228,7 +228,9 @@ export interface STTInitializeOptions {
   ruleFars?: string;
   /**
-   * Dither for feature extraction (Kotlin FeatureConfig.dither). Default 0.
+   * Dither for feature extraction (Kotlin `FeatureConfig.dither`). Default: no dither.
+   * **Android:** applied natively. **iOS:** ignored — the bundled sherpa-onnx C/CXX API does not
+   * expose this field; the native default is used.
    */
   dither?: number;

package/src/tts/index.ts CHANGED Viewed

@@ -86,7 +86,7 @@ function flattenTtsModelOptionsForNative(
  *
  * @param modelPath - Model path configuration (asset, file, or auto)
  * @param options - Optional modelType (default: 'auto')
- * @returns Object with success, detectedModels (array of { type, modelDir }), modelType (primary detected type), and optionally lexiconLanguageCandidates (language ids for multi-lang Kokoro/Kitten)
+ * @returns Object with success, detectedModels (array of { type, modelDir }), modelType (primary detected type), optional error when success is false, and optionally lexiconLanguageCandidates (language ids for multi-lang Kokoro/Kitten)
  * @example
  * ```typescript
  * const result = await detectTtsModel({ type: 'asset', path: 'models/vits-piper-en' });
@@ -101,13 +101,31 @@ export async function detectTtsModel(
   options?: { modelType?: TTSModelType }
 ): Promise<{
   success: boolean;
+  /** Native validation/detect failure (e.g. missing lexicon for Zipvoice). */
+  error?: string;
   detectedModels: Array<{ type: string; modelDir: string }>;
   modelType?: string;
   /** Language ids from detected lexicon files ("default" for lexicon.txt, or e.g. "us-en", "zh" from lexicon-us-en.txt, lexicon-zh.txt). Present for Kokoro/Kitten; use for language selection UI. */
   lexiconLanguageCandidates?: string[];
 }> {
   const resolvedPath = await resolveModelPath(modelPath);
-  return SherpaOnnx.detectTtsModel(resolvedPath, options?.modelType);
+  const raw = await SherpaOnnx.detectTtsModel(resolvedPath, options?.modelType);
+  const err =
+    typeof (raw as { error?: unknown }).error === 'string'
+      ? String((raw as { error: string }).error).trim()
+      : '';
+  return {
+    success: raw.success,
+    ...(err.length > 0 ? { error: err } : {}),
+    detectedModels: raw.detectedModels ?? [],
+    ...(raw.modelType != null && raw.modelType !== ''
+      ? { modelType: raw.modelType }
+      : {}),
+    ...(raw.lexiconLanguageCandidates != null &&
+    raw.lexiconLanguageCandidates.length > 0
+      ? { lexiconLanguageCandidates: raw.lexiconLanguageCandidates }
+      : {}),
+  };
 }
 /**
@@ -124,6 +142,16 @@ function toNativeTtsOptions(
   if (options.silenceScale !== undefined)
     out.silenceScale = options.silenceScale;
   if (options.referenceAudio != null) {
+    const sr = options.referenceAudio.sampleRate;
+    if (
+      typeof __DEV__ !== 'undefined' &&
+      __DEV__ &&
+      (!Number.isFinite(sr) || sr <= 0)
+    ) {
+      console.warn(
+        '[react-native-sherpa-onnx] TTS referenceAudio.sampleRate must be > 0 for voice cloning (Zipvoice/Pocket).'
+      );
+    }
     out.referenceAudio = options.referenceAudio.samples;
     out.referenceSampleRate = options.referenceAudio.sampleRate;
   }

package/src/tts/streaming.ts CHANGED Viewed

@@ -90,6 +90,16 @@ function toNativeTtsOptions(
   if (options.silenceScale !== undefined)
     out.silenceScale = options.silenceScale;
   if (options.referenceAudio != null) {
+    const sr = options.referenceAudio.sampleRate;
+    if (
+      typeof __DEV__ !== 'undefined' &&
+      __DEV__ &&
+      (!Number.isFinite(sr) || sr <= 0)
+    ) {
+      console.warn(
+        '[react-native-sherpa-onnx] TTS referenceAudio.sampleRate must be > 0 for voice cloning (Zipvoice/Pocket).'
+      );
+    }
     out.referenceAudio = options.referenceAudio.samples;
     out.referenceSampleRate = options.referenceAudio.sampleRate;
   }

package/src/tts/types.ts CHANGED Viewed

@@ -202,15 +202,16 @@ export interface TtsGenerationOptions {
   silenceScale?: number;
   /**
-   * Reference audio for voice cloning (Kotlin GenerationConfig).
-   * In the Kotlin/RN stack, only Pocket TTS uses this; other model types (vits, matcha, kokoro, kitten) ignore it.
-   * Mono float samples in [-1, 1] and sample rate in Hz.
+   * Reference audio for voice cloning (native GenerationConfig / Zipvoice prompt).
+   * **Native (iOS & Android):** Requires non-empty samples and `sampleRate > 0`. Used for **Zipvoice** (cloning) and **Pocket** (Mimi encoder).
+   * Other model types (vits, matcha, kokoro, kitten) are **rejected** if reference audio is passed.
+   * Mono float samples in [-1, 1].
    */
   referenceAudio?: { samples: number[]; sampleRate: number };
   /**
-   * Transcript text of the reference audio (Kotlin GenerationConfig.referenceText).
-   * Required for Pocket TTS when referenceAudio is provided; ignored by other model types.
+   * Transcript of the reference utterance for **Zipvoice** voice cloning (prompt text); **required** when cloning with Zipvoice (non-empty after trim).
+   * **Pocket:** not read by sherpa-onnx native code; optional, e.g. for app metadata only.
    */
   referenceText?: string;

package/src/utils.ts CHANGED Viewed

@@ -1,6 +1,7 @@
 import { Platform } from 'react-native';
 import type { ModelPathConfig } from './types';
 import SherpaOnnx from './NativeSherpaOnnx';
+import { resolveActualModelDir } from './download';
 /**
  * Utility functions for model path handling
@@ -73,13 +74,33 @@ export function autoModelPath(path: string): ModelPathConfig {
  * This handles different path types (asset, file, auto) and returns
  * a platform-specific absolute path that can be used by native code.
  *
+ * For type 'file', the path is normalized so that when the given path is an
+ * install directory (e.g. with .ready and manifest.json and one model subdir),
+ * the returned path is the subdirectory that actually contains the .onnx files.
+ * This allows apps that build paths as baseDir/modelId to work without change.
+ *
  * @param config - Model path configuration
  * @returns Promise resolving to absolute path usable by native code
  */
 export async function resolveModelPath(
   config: ModelPathConfig
 ): Promise<string> {
-  return SherpaOnnx.resolveModelPath(config);
+  const path = await SherpaOnnx.resolveModelPath(config);
+  if (config.type === 'file') {
+    const resolved = await resolveActualModelDir(path);
+    // Diagnostic: log so we can tell if /usr/share/espeak-ng-data is due to our path or sherpa-onnx fallback.
+    if (__DEV__) {
+      console.log(
+        '[SherpaOnnx] resolveModelPath(file): native path=',
+        path,
+        resolved !== path
+          ? `resolvedActualModelDir=> ${resolved}`
+          : '(unchanged)'
+      );
+    }
+    return resolved;
+  }
+  return path;
 }
 /**

package/third_party/libarchive_prebuilt/ANDROID_RELEASE_TAG CHANGED Viewed

	@@ -1 +1 @@
1	- libarchive-android-v3.8.5-1
1	+ libarchive-android-v3.8.5-2

package/third_party/libarchive_prebuilt/IOS_RELEASE_TAG CHANGED Viewed

	@@ -1 +1 @@
1	- libarchive-ios-v3.8.5-1
1	+ libarchive-ios-v3.8.5-2

package/third_party/sherpa-onnx-prebuilt/ANDROID_RELEASE_TAG CHANGED Viewed

	@@ -1 +1 @@
1	- sherpa-onnx-android-v1.12.28
1	+ sherpa-onnx-android-v1.12.31-1

package/third_party/sherpa-onnx-prebuilt/IOS_RELEASE_TAG CHANGED Viewed

	@@ -1 +1 @@
1	- ~~framework~~-v1.12.28
1	+ sherpa-onnx-ios-v1.12.31-1

package/android/src/main/cpp/jni/tts/sherpa-onnx-tts-zipvoice-jni.cpp DELETED Viewed

@@ -1,301 +0,0 @@
-/**
- * sherpa-onnx-tts-zipvoice-jni.cpp
- *
- * Purpose: JNI for Zipvoice TTS using the sherpa-onnx C-API (OfflineTtsZipvoiceModelConfig). The
- * Kotlin TTS API does not expose Zipvoice config, so this native layer is used for Zipvoice-only flows.
- */
-#include <jni.h>
-#include <cstring>
-#include <android/log.h>
-#include "sherpa-onnx/c-api/c-api.h"
-#define LOG_TAG "ZipvoiceTtsJni"
-#define LOGI(...) __android_log_print(ANDROID_LOG_INFO, LOG_TAG, __VA_ARGS__)
-#define LOGE(...) __android_log_print(ANDROID_LOG_ERROR, LOG_TAG, __VA_ARGS__)
-namespace {
-// Helper: get a non-null C string from a jstring (returns "" for null).
-struct JStringGuard {
-  JNIEnv* env;
-  jstring jstr;
-  const char* cstr;
-  JStringGuard(JNIEnv* e, jstring s) : env(e), jstr(s), cstr(nullptr) {
-    if (s) cstr = env->GetStringUTFChars(s, nullptr);
-  }
-  ~JStringGuard() {
-    if (cstr) env->ReleaseStringUTFChars(jstr, cstr);
-  }
-  const char* get() const { return cstr ? cstr : ""; }
-};
-// Build a Java float[] + int pair as Object[] { float[], Integer } for returning generated audio.
-jobjectArray buildAudioResult(JNIEnv* env, const float* samples, int32_t n, int32_t sampleRate) {
-  jclass objClass = env->FindClass("java/lang/Object");
-  if (!objClass) return nullptr;
-  jobjectArray result = env->NewObjectArray(2, objClass, nullptr);
-  if (!result) {
-    env->DeleteLocalRef(objClass);
-    return nullptr;
-  }
-  // Element 0: float[] samples
-  jfloatArray jsamples = env->NewFloatArray(n);
-  if (jsamples && n > 0) {
-    env->SetFloatArrayRegion(jsamples, 0, n, samples);
-  }
-  env->SetObjectArrayElement(result, 0, jsamples);
-  if (jsamples) env->DeleteLocalRef(jsamples);
-  // Element 1: Integer sampleRate
-  jclass intClass = env->FindClass("java/lang/Integer");
-  jmethodID intValueOf = env->GetStaticMethodID(intClass, "valueOf", "(I)Ljava/lang/Integer;");
-  jobject jrate = env->CallStaticObjectMethod(intClass, intValueOf, sampleRate);
-  env->SetObjectArrayElement(result, 1, jrate);
-  env->DeleteLocalRef(intClass);
-  if (jrate) env->DeleteLocalRef(jrate);
-  env->DeleteLocalRef(objClass);
-  return result;
-}
-}  // namespace
-extern "C" {
-// Create a Zipvoice TTS instance via C-API. Returns the pointer as a jlong (0 on failure).
-JNIEXPORT jlong JNICALL
-Java_com_sherpaonnx_ZipvoiceTtsWrapper_nativeCreate(
-    JNIEnv* env, jobject /* this */,
-    jstring j_tokens, jstring j_encoder, jstring j_decoder, jstring j_vocoder,
-    jstring j_data_dir, jstring j_lexicon,
-    jfloat feat_scale, jfloat t_shift, jfloat target_rms, jfloat guidance_scale,
-    jint num_threads, jboolean debug,
-    jstring j_rule_fsts, jstring j_rule_fars, jint max_num_sentences, jfloat silence_scale,
-    jstring j_provider) {
-  JStringGuard tokens(env, j_tokens);
-  JStringGuard encoder(env, j_encoder);
-  JStringGuard decoder(env, j_decoder);
-  JStringGuard vocoder(env, j_vocoder);
-  JStringGuard dataDir(env, j_data_dir);
-  JStringGuard lexicon(env, j_lexicon);
-  JStringGuard ruleFsts(env, j_rule_fsts);
-  JStringGuard ruleFars(env, j_rule_fars);
-  JStringGuard provider(env, j_provider);
-  LOGI("nativeCreate: tokens=%s, encoder=%s, decoder=%s, vocoder=%s, dataDir=%s, lexicon=%s",
-       tokens.get(), encoder.get(), decoder.get(), vocoder.get(), dataDir.get(), lexicon.get());
-  LOGI("nativeCreate: featScale=%.3f, tShift=%.3f, targetRms=%.3f, guidanceScale=%.3f, threads=%d, debug=%d",
-       feat_scale, t_shift, target_rms, guidance_scale, num_threads, debug);
-  LOGI("nativeCreate: ruleFsts=%s, ruleFars=%s, maxNumSentences=%d, silenceScale=%.3f, provider=%s",
-       ruleFsts.get(), ruleFars.get(), max_num_sentences, silence_scale, provider.get());
-  SherpaOnnxOfflineTtsConfig config;
-  memset(&config, 0, sizeof(config));
-  config.model.zipvoice.tokens = tokens.get();
-  config.model.zipvoice.encoder = encoder.get();
-  config.model.zipvoice.decoder = decoder.get();
-  config.model.zipvoice.vocoder = vocoder.get();
-  config.model.zipvoice.data_dir = dataDir.get();
-  config.model.zipvoice.lexicon = lexicon.get();
-  config.model.zipvoice.feat_scale = feat_scale;
-  config.model.zipvoice.t_shift = t_shift;
-  config.model.zipvoice.target_rms = target_rms;
-  config.model.zipvoice.guidance_scale = guidance_scale;
-  config.model.num_threads = num_threads;
-  config.model.debug = debug ? 1 : 0;
-  config.model.provider = (provider.get() && *provider.get()) ? provider.get() : "cpu";
-  config.rule_fsts = ruleFsts.get();
-  config.rule_fars = ruleFars.get();
-  config.max_num_sentences = max_num_sentences;
-  config.silence_scale = silence_scale;
-  const SherpaOnnxOfflineTts* tts = SherpaOnnxCreateOfflineTts(&config);
-  if (!tts) {
-    LOGE("nativeCreate: SherpaOnnxCreateOfflineTts returned null");
-    return 0;
-  }
-  LOGI("nativeCreate: success, sampleRate=%d, numSpeakers=%d",
-       SherpaOnnxOfflineTtsSampleRate(tts), SherpaOnnxOfflineTtsNumSpeakers(tts));
-  return reinterpret_cast<jlong>(tts);
-}
-// Destroy a Zipvoice TTS instance.
-JNIEXPORT void JNICALL
-Java_com_sherpaonnx_ZipvoiceTtsWrapper_nativeDestroy(
-    JNIEnv* /* env */, jobject /* this */, jlong ptr) {
-  auto* tts = reinterpret_cast<const SherpaOnnxOfflineTts*>(ptr);
-  if (tts) {
-    SherpaOnnxDestroyOfflineTts(tts);
-    LOGI("nativeDestroy: released");
-  }
-}
-// Get the sample rate of the Zipvoice TTS model.
-JNIEXPORT jint JNICALL
-Java_com_sherpaonnx_ZipvoiceTtsWrapper_nativeGetSampleRate(
-    JNIEnv* /* env */, jobject /* this */, jlong ptr) {
-  auto* tts = reinterpret_cast<const SherpaOnnxOfflineTts*>(ptr);
-  return tts ? SherpaOnnxOfflineTtsSampleRate(tts) : 0;
-}
-// Get the number of speakers of the Zipvoice TTS model.
-JNIEXPORT jint JNICALL
-Java_com_sherpaonnx_ZipvoiceTtsWrapper_nativeGetNumSpeakers(
-    JNIEnv* /* env */, jobject /* this */, jlong ptr) {
-  auto* tts = reinterpret_cast<const SherpaOnnxOfflineTts*>(ptr);
-  return tts ? SherpaOnnxOfflineTtsNumSpeakers(tts) : 0;
-}
-// Generate audio (non-zero-shot). Returns Object[] { float[], Integer }.
-JNIEXPORT jobjectArray JNICALL
-Java_com_sherpaonnx_ZipvoiceTtsWrapper_nativeGenerate(
-    JNIEnv* env, jobject /* this */,
-    jlong ptr, jstring j_text, jint sid, jfloat speed) {
-  auto* tts = reinterpret_cast<const SherpaOnnxOfflineTts*>(ptr);
-  if (!tts) {
-    LOGE("nativeGenerate: tts pointer is null");
-    return nullptr;
-  }
-  JStringGuard text(env, j_text);
-  LOGI("nativeGenerate: text=%s, sid=%d, speed=%.2f", text.get(), sid, speed);
-  const SherpaOnnxGeneratedAudio* audio =
-      SherpaOnnxOfflineTtsGenerate(tts, text.get(), sid, speed);
-  if (!audio) {
-    LOGE("nativeGenerate: SherpaOnnxOfflineTtsGenerate returned null");
-    return nullptr;
-  }
-  LOGI("nativeGenerate: got %d samples at %d Hz", audio->n, audio->sample_rate);
-  jobjectArray result = buildAudioResult(env, audio->samples, audio->n, audio->sample_rate);
-  SherpaOnnxDestroyOfflineTtsGeneratedAudio(audio);
-  return result;
-}
-// Generate audio with callback for streaming. Returns Object[] { float[], Integer } for the
-// final concatenated audio. The callback is invoked per chunk.
-JNIEXPORT jobjectArray JNICALL
-Java_com_sherpaonnx_ZipvoiceTtsWrapper_nativeGenerateWithCallback(
-    JNIEnv* env, jobject thiz,
-    jlong ptr, jstring j_text, jint sid, jfloat speed) {
-  auto* tts = reinterpret_cast<const SherpaOnnxOfflineTts*>(ptr);
-  if (!tts) {
-    LOGE("nativeGenerateWithCallback: tts pointer is null");
-    return nullptr;
-  }
-  JStringGuard text(env, j_text);
-  // We use the progress callback variant to get chunks.
-  // The JNI environment and `thiz` are stored in a struct passed through void* arg.
-  struct CallbackCtx {
-    JNIEnv* env;
-    jobject thiz;
-    jmethodID onChunkId;
-    bool cancelled;
-  };
-  jclass cls = env->GetObjectClass(thiz);
-  jmethodID onChunkId = env->GetMethodID(cls, "onNativeChunk", "([FI)Z");
-  env->DeleteLocalRef(cls);
-  if (!onChunkId) {
-    LOGE("nativeGenerateWithCallback: onNativeChunk method not found");
-    return nullptr;
-  }
-  CallbackCtx ctx{env, thiz, onChunkId, false};
-  auto callback = [](const float* samples, int32_t n, float /* progress */, void* arg) -> int32_t {
-    auto* c = static_cast<CallbackCtx*>(arg);
-    if (c->cancelled) return 0;
-    jfloatArray chunk = c->env->NewFloatArray(n);
-    if (chunk && n > 0) {
-      c->env->SetFloatArrayRegion(chunk, 0, n, samples);
-    }
-    // Call Java: boolean onNativeChunk(float[] samples, int n)
-    jboolean cont = c->env->CallBooleanMethod(c->thiz, c->onChunkId, chunk, n);
-    if (chunk) c->env->DeleteLocalRef(chunk);
-    if (!cont) {
-      c->cancelled = true;
-      return 0;
-    }
-    return 1;
-  };
-  const SherpaOnnxGeneratedAudio* audio =
-      SherpaOnnxOfflineTtsGenerateWithProgressCallbackWithArg(
-          tts, text.get(), sid, speed, callback, &ctx);
-  if (!audio) {
-    LOGE("nativeGenerateWithCallback: generate returned null");
-    return nullptr;
-  }
-  jobjectArray result = buildAudioResult(env, audio->samples, audio->n, audio->sample_rate);
-  SherpaOnnxDestroyOfflineTtsGeneratedAudio(audio);
-  return result;
-}
-// Zero-shot voice cloning with Zipvoice. Returns Object[] { float[], Integer }.
-JNIEXPORT jobjectArray JNICALL
-Java_com_sherpaonnx_ZipvoiceTtsWrapper_nativeGenerateWithZipvoice(
-    JNIEnv* env, jobject /* this */,
-    jlong ptr, jstring j_text, jstring j_prompt_text,
-    jfloatArray j_prompt_samples, jint prompt_sr,
-    jfloat speed, jint num_steps) {
-  auto* tts = reinterpret_cast<const SherpaOnnxOfflineTts*>(ptr);
-  if (!tts) {
-    LOGE("nativeGenerateWithZipvoice: tts pointer is null");
-    return nullptr;
-  }
-  JStringGuard text(env, j_text);
-  JStringGuard promptText(env, j_prompt_text);
-  jfloat* promptSamples = nullptr;
-  jint nPrompt = 0;
-  if (j_prompt_samples) {
-    nPrompt = env->GetArrayLength(j_prompt_samples);
-    promptSamples = env->GetFloatArrayElements(j_prompt_samples, nullptr);
-  }
-  LOGI("nativeGenerateWithZipvoice: text=%s, promptLen=%d, promptSr=%d, speed=%.2f, steps=%d",
-       text.get(), nPrompt, prompt_sr, speed, num_steps);
-  const SherpaOnnxGeneratedAudio* audio =
-      SherpaOnnxOfflineTtsGenerateWithZipvoice(
-          tts, text.get(), promptText.get(),
-          promptSamples, nPrompt, prompt_sr,
-          speed, num_steps);
-  if (promptSamples) {
-    env->ReleaseFloatArrayElements(j_prompt_samples, promptSamples, JNI_ABORT);
-  }
-  if (!audio) {
-    LOGE("nativeGenerateWithZipvoice: returned null");
-    return nullptr;
-  }
-  LOGI("nativeGenerateWithZipvoice: got %d samples at %d Hz", audio->n, audio->sample_rate);
-  jobjectArray result = buildAudioResult(env, audio->samples, audio->n, audio->sample_rate);
-  SherpaOnnxDestroyOfflineTtsGeneratedAudio(audio);
-  return result;
-}
-}  // extern "C"