npm - whisper.rn - Versions diffs - 0.3.6 → 0.3.8 - Mend

whisper.rn 0.3.6 → 0.3.8

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (37) hide show

package/README.md +28 -0
package/android/src/main/java/com/rnwhisper/AudioUtils.java +119 -0
package/android/src/main/java/com/rnwhisper/WhisperContext.java +74 -39
package/android/src/main/jni.cpp +45 -12
package/android/src/newarch/java/com/rnwhisper/RNWhisperModule.java +26 -0
package/cpp/rn-whisper.cpp +51 -0
package/cpp/rn-whisper.h +2 -1
package/ios/RNWhisper.mm +81 -22
package/ios/RNWhisper.xcodeproj/project.pbxproj +27 -3
package/ios/RNWhisper.xcodeproj/project.xcworkspace/xcuserdata/jhen.xcuserdatad/UserInterfaceState.xcuserstate +0 -0
package/ios/RNWhisper.xcodeproj/xcuserdata/jhen.xcuserdatad/xcschemes/xcschememanagement.plist +5 -0
package/ios/RNWhisperAudioSessionUtils.h +13 -0
package/ios/RNWhisperAudioSessionUtils.m +85 -0
package/ios/RNWhisperAudioUtils.h +9 -0
package/ios/RNWhisperAudioUtils.m +83 -0
package/ios/RNWhisperContext.h +1 -0
package/ios/RNWhisperContext.mm +101 -28
package/lib/commonjs/AudioSessionIos.js +91 -0
package/lib/commonjs/AudioSessionIos.js.map +1 -0
package/lib/commonjs/NativeRNWhisper.js.map +1 -1
package/lib/commonjs/index.js +82 -14
package/lib/commonjs/index.js.map +1 -1
package/lib/module/AudioSessionIos.js +83 -0
package/lib/module/AudioSessionIos.js.map +1 -0
package/lib/module/NativeRNWhisper.js.map +1 -1
package/lib/module/index.js +77 -14
package/lib/module/index.js.map +1 -1
package/lib/typescript/AudioSessionIos.d.ts +54 -0
package/lib/typescript/AudioSessionIos.d.ts.map +1 -0
package/lib/typescript/NativeRNWhisper.d.ts +8 -0
package/lib/typescript/NativeRNWhisper.d.ts.map +1 -1
package/lib/typescript/index.d.ts +62 -4
package/lib/typescript/index.d.ts.map +1 -1
package/package.json +1 -1
package/src/AudioSessionIos.ts +90 -0
package/src/NativeRNWhisper.ts +11 -1
package/src/index.ts +178 -28

package/lib/typescript/AudioSessionIos.d.ts ADDED Viewed

@@ -0,0 +1,54 @@
+/**
+ * @see https://developer.apple.com/documentation/avfaudio/avaudiosessioncategory?language=objc
+ */
+export declare enum AudioSessionCategoryIos {
+    Ambient = "Ambient",
+    SoloAmbient = "SoloAmbient",
+    Playback = "Playback",
+    Record = "Record",
+    PlayAndRecord = "PlayAndRecord",
+    MultiRoute = "MultiRoute"
+}
+/**
+ * @see https://developer.apple.com/documentation/avfaudio/avaudiosessioncategoryoptions?language=objc
+ */
+export declare enum AudioSessionCategoryOptionIos {
+    MixWithOthers = "MixWithOthers",
+    DuckOthers = "DuckOthers",
+    InterruptSpokenAudioAndMixWithOthers = "InterruptSpokenAudioAndMixWithOthers",
+    AllowBluetooth = "AllowBluetooth",
+    AllowBluetoothA2DP = "AllowBluetoothA2DP",
+    AllowAirPlay = "AllowAirPlay",
+    DefaultToSpeaker = "DefaultToSpeaker"
+}
+/**
+ * @see https://developer.apple.com/documentation/avfaudio/avaudiosessionmode?language=objc
+ */
+export declare enum AudioSessionModeIos {
+    Default = "Default",
+    VoiceChat = "VoiceChat",
+    VideoChat = "VideoChat",
+    GameChat = "GameChat",
+    VideoRecording = "VideoRecording",
+    Measurement = "Measurement",
+    MoviePlayback = "MoviePlayback",
+    SpokenAudio = "SpokenAudio"
+}
+/**
+ * AudioSession Utility, iOS only.
+ */
+declare const _default: {
+    Category: typeof AudioSessionCategoryIos;
+    CategoryOption: typeof AudioSessionCategoryOptionIos;
+    Mode: typeof AudioSessionModeIos;
+    getCurrentCategory: () => Promise<{
+        category: AudioSessionCategoryIos;
+        options: AudioSessionCategoryOptionIos[];
+    }>;
+    getCurrentMode: () => Promise<AudioSessionModeIos>;
+    setCategory: (category: AudioSessionCategoryIos, options: AudioSessionCategoryOptionIos[]) => Promise<void>;
+    setMode: (mode: AudioSessionModeIos) => Promise<void>;
+    setActive: (active: boolean) => Promise<void>;
+};
+export default _default;
+//# sourceMappingURL=AudioSessionIos.d.ts.map

package/lib/typescript/AudioSessionIos.d.ts.map ADDED Viewed

@@ -0,0 +1 @@

+ {"version":3,"file":"AudioSessionIos.d.ts","sourceRoot":"","sources":["../../src/AudioSessionIos.ts"],"names":[],"mappings":"AAGA;;GAEG;AACH,oBAAY,uBAAuB;IACjC,OAAO,YAAY;IACnB,WAAW,gBAAgB;IAC3B,QAAQ,aAAa;IACrB,MAAM,WAAW;IACjB,aAAa,kBAAkB;IAC/B,UAAU,eAAe;CAC1B;AAED;;GAEG;AACH,oBAAY,6BAA6B;IACvC,aAAa,kBAAkB;IAC/B,UAAU,eAAe;IACzB,oCAAoC,yCAAyC;IAC7E,cAAc,mBAAmB;IACjC,kBAAkB,uBAAuB;IACzC,YAAY,iBAAiB;IAC7B,gBAAgB,qBAAqB;CACtC;AAED;;GAEG;AACH,oBAAY,mBAAmB;IAC7B,OAAO,YAAY;IACnB,SAAS,cAAc;IACvB,SAAS,cAAc;IACvB,QAAQ,aAAa;IACrB,cAAc,mBAAmB;IACjC,WAAW,gBAAgB;IAC3B,aAAa,kBAAkB;IAC/B,WAAW,gBAAgB;CAC5B;AAMD;;GAEG;;;;;8BAM6B,QAAQ;QACpC,QAAQ,EAAE,uBAAuB,CAAC;QAClC,OAAO,EAAE,6BAA6B,EAAE,CAAC;KAC1C,CAAC;0BASwB,QAAQ,mBAAmB,CAAC;4BAO1C,uBAAuB,WACxB,6BAA6B,EAAE,KACvC,QAAQ,IAAI,CAAC;oBAKM,mBAAmB,KAAG,QAAQ,IAAI,CAAC;wBAK/B,OAAO,KAAG,QAAQ,IAAI,CAAC;;AApCnD,wBAwCC"}

package/lib/typescript/NativeRNWhisper.d.ts CHANGED Viewed

@@ -60,6 +60,14 @@ export interface Spec extends TurboModule {
     transcribeFile(contextId: number, jobId: number, path: string, options: {}): Promise<TranscribeResult>;
     startRealtimeTranscribe(contextId: number, jobId: number, options: TranscribeOptions): Promise<void>;
     abortTranscribe(contextId: number, jobId: number): Promise<void>;
+    getAudioSessionCurrentCategory: () => Promise<{
+        category: string;
+        options: Array<string>;
+    }>;
+    getAudioSessionCurrentMode: () => Promise<string>;
+    setAudioSessionCategory: (category: string, options: Array<string>) => Promise<void>;
+    setAudioSessionMode: (mode: string) => Promise<void>;
+    setAudioSessionActive: (active: boolean) => Promise<void>;
 }
 declare const _default: Spec;
 export default _default;

package/lib/typescript/NativeRNWhisper.d.ts.map CHANGED Viewed

	@@ -1 +1 @@
1	- {"version":3,"file":"NativeRNWhisper.d.ts","sourceRoot":"","sources":["../../src/NativeRNWhisper.ts"],"names":[],"mappings":"AAAA,OAAO,KAAK,EAAE,WAAW,EAAE,MAAM,8CAA8C,CAAA;AAI/E,MAAM,MAAM,iBAAiB,GAAG;IAC9B,wDAAwD;IACxD,QAAQ,CAAC,EAAE,MAAM,CAAC;IAClB,iEAAiE;IACjE,SAAS,CAAC,EAAE,OAAO,CAAC;IACpB,oGAAoG;IACpG,UAAU,CAAC,EAAE,MAAM,CAAC;IACpB,qDAAqD;IACrD,UAAU,CAAC,EAAE,MAAM,CAAC;IACpB,2CAA2C;IAC3C,MAAM,CAAC,EAAE,MAAM,CAAC;IAChB,oCAAoC;IACpC,eAAe,CAAC,EAAE,OAAO,CAAC;IAC1B,2CAA2C;IAC3C,SAAS,CAAC,EAAE,MAAM,CAAC;IACnB,kCAAkC;IAClC,MAAM,CAAC,EAAE,MAAM,CAAC;IAChB,mDAAmD;IACnD,QAAQ,CAAC,EAAE,MAAM,CAAC;IAClB,mCAAmC;IACnC,WAAW,CAAC,EAAE,MAAM,CAAC;IACrB,cAAc,CAAC,EAAE,MAAM,CAAC;IACxB,gCAAgC;IAChC,QAAQ,CAAC,EAAE,MAAM,CAAC;IAClB,wCAAwC;IACxC,MAAM,CAAC,EAAE,MAAM,CAAC;IAChB,8CAA8C;IAC9C,OAAO,CAAC,EAAE,OAAO,CAAC;IAClB,qBAAqB;IACrB,MAAM,CAAC,EAAE,MAAM,CAAC;CACjB,CAAA;AAED,MAAM,MAAM,gBAAgB,GAAG;IAC7B,MAAM,EAAE,MAAM,CAAC;IACf,QAAQ,EAAE,KAAK,CAAC;QACd,IAAI,EAAE,MAAM,CAAC;QACb,EAAE,EAAE,MAAM,CAAC;QACX,EAAE,EAAE,MAAM,CAAC;KACZ,CAAC,CAAC;IACH,SAAS,EAAE,OAAO,CAAC;CACpB,CAAA;AAED,MAAM,MAAM,WAAW,GAAG;IACxB,GAAG,EAAE,MAAM,CAAC;IACZ,QAAQ,EAAE,MAAM,CAAC;CAClB,CAAA;AAED,KAAK,oBAAoB,GAAG;IAC1B,QAAQ,EAAE,MAAM,CAAC;IACjB,aAAa,EAAE,OAAO,CAAC;IACvB,oBAAoB,CAAC,EAAE,OAAO,CAAC;IAC/B,YAAY,CAAC,EAAE,WAAW,EAAE,CAAC;CAC9B,CAAA;AAED,MAAM,WAAW,IAAK,SAAQ,WAAW;IACvC,YAAY,IAAI;QACd,SAAS,EAAE,OAAO,CAAA;QAClB,mBAAmB,EAAE,OAAO,CAAA;KAC7B,CAAC;IACF,WAAW,CAAC,OAAO,EAAE,oBAAoB,GAAG,OAAO,CAAC,MAAM,CAAC,CAAC;IAC5D,cAAc,CAAC,SAAS,EAAE,MAAM,GAAG,OAAO,CAAC,IAAI,CAAC,CAAC;IACjD,kBAAkB,IAAI,OAAO,CAAC,IAAI,CAAC,CAAC;IACpC,cAAc,CACZ,SAAS,EAAE,MAAM,EACjB,KAAK,EAAE,MAAM,EACb,IAAI,EAAE,MAAM,EACZ,OAAO,EAAE,EAAE,GACV,OAAO,CAAC,gBAAgB,CAAC,CAAC;IAC7B,uBAAuB,CACrB,SAAS,EAAE,MAAM,EACjB,KAAK,EAAE,MAAM,EACb,OAAO,EAAE,iBAAiB,GACzB,OAAO,CAAC,IAAI,CAAC,CAAC;IACjB,eAAe,CAAC,SAAS,EAAE,MAAM,EAAE,KAAK,EAAE,MAAM,GAAG,OAAO,CAAC,IAAI,CAAC,CAAC;~~CAClE~~;;AAED,wBAAiE"}
1	+ {"version":3,"file":"NativeRNWhisper.d.ts","sourceRoot":"","sources":["../../src/NativeRNWhisper.ts"],"names":[],"mappings":"AAAA,OAAO,KAAK,EAAE,WAAW,EAAE,MAAM,8CAA8C,CAAA;AAI/E,MAAM,MAAM,iBAAiB,GAAG;IAC9B,wDAAwD;IACxD,QAAQ,CAAC,EAAE,MAAM,CAAC;IAClB,iEAAiE;IACjE,SAAS,CAAC,EAAE,OAAO,CAAC;IACpB,oGAAoG;IACpG,UAAU,CAAC,EAAE,MAAM,CAAC;IACpB,qDAAqD;IACrD,UAAU,CAAC,EAAE,MAAM,CAAC;IACpB,2CAA2C;IAC3C,MAAM,CAAC,EAAE,MAAM,CAAC;IAChB,oCAAoC;IACpC,eAAe,CAAC,EAAE,OAAO,CAAC;IAC1B,2CAA2C;IAC3C,SAAS,CAAC,EAAE,MAAM,CAAC;IACnB,kCAAkC;IAClC,MAAM,CAAC,EAAE,MAAM,CAAC;IAChB,mDAAmD;IACnD,QAAQ,CAAC,EAAE,MAAM,CAAC;IAClB,mCAAmC;IACnC,WAAW,CAAC,EAAE,MAAM,CAAC;IACrB,cAAc,CAAC,EAAE,MAAM,CAAC;IACxB,gCAAgC;IAChC,QAAQ,CAAC,EAAE,MAAM,CAAC;IAClB,wCAAwC;IACxC,MAAM,CAAC,EAAE,MAAM,CAAC;IAChB,8CAA8C;IAC9C,OAAO,CAAC,EAAE,OAAO,CAAC;IAClB,qBAAqB;IACrB,MAAM,CAAC,EAAE,MAAM,CAAC;CACjB,CAAA;AAED,MAAM,MAAM,gBAAgB,GAAG;IAC7B,MAAM,EAAE,MAAM,CAAC;IACf,QAAQ,EAAE,KAAK,CAAC;QACd,IAAI,EAAE,MAAM,CAAC;QACb,EAAE,EAAE,MAAM,CAAC;QACX,EAAE,EAAE,MAAM,CAAC;KACZ,CAAC,CAAC;IACH,SAAS,EAAE,OAAO,CAAC;CACpB,CAAA;AAED,MAAM,MAAM,WAAW,GAAG;IACxB,GAAG,EAAE,MAAM,CAAC;IACZ,QAAQ,EAAE,MAAM,CAAC;CAClB,CAAA;AAED,KAAK,oBAAoB,GAAG;IAC1B,QAAQ,EAAE,MAAM,CAAC;IACjB,aAAa,EAAE,OAAO,CAAC;IACvB,oBAAoB,CAAC,EAAE,OAAO,CAAC;IAC/B,YAAY,CAAC,EAAE,WAAW,EAAE,CAAC;CAC9B,CAAA;AAED,MAAM,WAAW,IAAK,SAAQ,WAAW;IACvC,YAAY,IAAI;QACd,SAAS,EAAE,OAAO,CAAA;QAClB,mBAAmB,EAAE,OAAO,CAAA;KAC7B,CAAC;IACF,WAAW,CAAC,OAAO,EAAE,oBAAoB,GAAG,OAAO,CAAC,MAAM,CAAC,CAAC;IAC5D,cAAc,CAAC,SAAS,EAAE,MAAM,GAAG,OAAO,CAAC,IAAI,CAAC,CAAC;IACjD,kBAAkB,IAAI,OAAO,CAAC,IAAI,CAAC,CAAC;IACpC,cAAc,CACZ,SAAS,EAAE,MAAM,EACjB,KAAK,EAAE,MAAM,EACb,IAAI,EAAE,MAAM,EACZ,OAAO,EAAE,EAAE,GACV,OAAO,CAAC,gBAAgB,CAAC,CAAC;IAC7B,uBAAuB,CACrB,SAAS,EAAE,MAAM,EACjB,KAAK,EAAE,MAAM,EACb,OAAO,EAAE,iBAAiB,GACzB,OAAO,CAAC,IAAI,CAAC,CAAC;IACjB,eAAe,CAAC,SAAS,EAAE,MAAM,EAAE,KAAK,EAAE,MAAM,GAAG,OAAO,CAAC,IAAI,CAAC,CAAC;IAGjE,8BAA8B,EAAE,MAAM,OAAO,CAAC;QAC5C,QAAQ,EAAE,MAAM,CAAC;QACjB,OAAO,EAAE,KAAK,CAAC,MAAM,CAAC,CAAC;KACxB,CAAC,CAAC;IACH,0BAA0B,EAAE,MAAM,OAAO,CAAC,MAAM,CAAC,CAAC;IAClD,uBAAuB,EAAE,CAAC,QAAQ,EAAE,MAAM,EAAE,OAAO,EAAE,KAAK,CAAC,MAAM,CAAC,KAAK,OAAO,CAAC,IAAI,CAAC,CAAC;IACrF,mBAAmB,EAAE,CAAC,IAAI,EAAE,MAAM,KAAK,OAAO,CAAC,IAAI,CAAC,CAAC;IACrD,qBAAqB,EAAE,CAAC,MAAM,EAAE,OAAO,KAAK,OAAO,CAAC,IAAI,CAAC,CAAC;CAC3D;;AAED,wBAAiE"}

package/lib/typescript/index.d.ts CHANGED Viewed

@@ -1,16 +1,39 @@
 import type { TranscribeOptions, TranscribeResult } from './NativeRNWhisper';
-export type { TranscribeOptions, TranscribeResult };
+import AudioSessionIos from './AudioSessionIos';
+import type { AudioSessionCategoryIos, AudioSessionCategoryOptionIos, AudioSessionModeIos } from './AudioSessionIos';
+export type { TranscribeOptions, TranscribeResult, AudioSessionCategoryIos, AudioSessionCategoryOptionIos, AudioSessionModeIos, };
+export type TranscribeNewSegmentsResult = {
+    nNew: number;
+    totalNNew: number;
+    result: string;
+    segments: TranscribeResult['segments'];
+};
+export type TranscribeNewSegmentsNativeEvent = {
+    contextId: number;
+    jobId: number;
+    result: TranscribeNewSegmentsResult;
+};
 export type TranscribeFileOptions = TranscribeOptions & {
     /**
      * Progress callback, the progress is between 0 and 100
      */
     onProgress?: (progress: number) => void;
+    /**
+     * Callback when new segments are transcribed
+     */
+    onNewSegments?: (result: TranscribeNewSegmentsResult) => void;
 };
 export type TranscribeProgressNativeEvent = {
     contextId: number;
     jobId: number;
     progress: number;
 };
+export type AudioSessionSettingIos = {
+    category: AudioSessionCategoryIos;
+    options?: AudioSessionCategoryOptionIos[];
+    mode?: AudioSessionModeIos;
+    active?: boolean;
+};
 export type TranscribeRealtimeOptions = TranscribeOptions & {
     /**
      * Realtime record max duration in seconds.
@@ -24,6 +47,40 @@ export type TranscribeRealtimeOptions = TranscribeOptions & {
      * (Default: Equal to `realtimeMaxAudioSec`)
      */
     realtimeAudioSliceSec?: number;
+    /**
+     * Output path for audio file. If not set, the audio file will not be saved
+     * (Default: Undefined)
+     */
+    audioOutputPath?: string;
+    /**
+     * Start transcribe on recording when the audio volume is greater than the threshold by using VAD (Voice Activity Detection).
+     * The first VAD will be triggered after 2 second of recording.
+     * (Default: false)
+     */
+    useVad?: boolean;
+    /**
+     * The length of the collected audio is used for VAD. (ms) (Default: 2000)
+     */
+    vadMs?: number;
+    /**
+     * VAD threshold. (Default: 0.6)
+     */
+    vadThold?: number;
+    /**
+     * Frequency to apply High-pass filter in VAD. (Default: 100.0)
+     */
+    vadFreqThold?: number;
+    /**
+     * iOS: Audio session settings when start transcribe
+     * Keep empty to use current audio session state
+     */
+    audioSessionOnStartIos?: AudioSessionSettingIos;
+    /**
+     * iOS: Audio session settings when stop transcribe
+     * - Keep empty to use last audio session state
+     * - Use `restore` to restore audio session state before start transcribe
+     */
+    audioSessionOnStopIos?: string | AudioSessionSettingIos;
 };
 export type TranscribeRealtimeEvent = {
     contextId: number;
@@ -67,14 +124,14 @@ export declare class WhisperContext {
     /** Transcribe audio file */
     transcribe(filePath: string | number, options?: TranscribeFileOptions): {
         /** Stop the transcribe */
-        stop: () => void;
+        stop: () => Promise<void>;
         /** Transcribe result promise */
         promise: Promise<TranscribeResult>;
     };
     /** Transcribe the microphone audio stream, the microphone user permission is required */
     transcribeRealtime(options?: TranscribeRealtimeOptions): Promise<{
         /** Stop the realtime transcribe */
-        stop: () => void;
+        stop: () => Promise<void>;
         /** Subscribe to realtime transcribe events */
         subscribe: (callback: (event: TranscribeRealtimeEvent) => void) => void;
     }>;
@@ -89,7 +146,7 @@ export type ContextOptions = {
      */
     coreMLModelAsset?: {
         filename: string;
-        assets: number[];
+        assets: string[] | number[];
     };
     /** Is the file path a bundle asset for pure string filePath */
     isBundleAsset?: boolean;
@@ -102,4 +159,5 @@ export declare const libVersion: string;
 export declare const isUseCoreML: boolean;
 /** Is allow fallback to CPU if load CoreML model failed */
 export declare const isCoreMLAllowFallback: boolean;
+export { AudioSessionIos };
 //# sourceMappingURL=index.d.ts.map

package/lib/typescript/index.d.ts.map CHANGED Viewed

	@@ -1 +1 @@
1	- {"version":3,"file":"index.d.ts","sourceRoot":"","sources":["../../src/index.ts"],"names":[],"mappings":"AAQA,OAAO,KAAK,EACV,iBAAiB,EACjB,gBAAgB,EAEjB,MAAM,mBAAmB,CAAA;AAY1B,YAAY,~~EAAE~~,iBAAiB,EAAE,gBAAgB,EAAE,CAAA;~~AASnD~~,MAAM,MAAM,qBAAqB,GAAG,iBAAiB,GAAG;IACtD;;OAEG;IACH,UAAU,CAAC,EAAE,CAAC,QAAQ,EAAE,MAAM,KAAK,IAAI,CAAA;~~CACxC~~,CAAA;AAED,MAAM,MAAM,6BAA6B,GAAG;IAC1C,SAAS,EAAE,MAAM,CAAA;IACjB,KAAK,EAAE,MAAM,CAAA;IACb,QAAQ,EAAE,MAAM,CAAA;CACjB,CAAA;AAGD,MAAM,MAAM,yBAAyB,GAAG,iBAAiB,GAAG;IAC1D;;;;OAIG;IACH,gBAAgB,CAAC,EAAE,MAAM,CAAA;IACzB;;;;OAIG;IACH,qBAAqB,CAAC,EAAE,MAAM,CAAA;~~CAC~~/B,CAAA;AAED,MAAM,MAAM,uBAAuB,GAAG;IACpC,SAAS,EAAE,MAAM,CAAA;IACjB,KAAK,EAAE,MAAM,CAAA;IACb,oEAAoE;IACpE,WAAW,EAAE,OAAO,CAAA;IACpB,iBAAiB,CAAC,EAAE,OAAO,CAAA;IAC3B,IAAI,EAAE,MAAM,CAAA;IACZ,IAAI,CAAC,EAAE,gBAAgB,CAAA;IACvB,KAAK,CAAC,EAAE,MAAM,CAAA;IACd,WAAW,EAAE,MAAM,CAAA;IACnB,aAAa,EAAE,MAAM,CAAA;IACrB,MAAM,CAAC,EAAE,KAAK,CAAC;QACb,IAAI,EAAE,MAAM,CAAA;QACZ,KAAK,CAAC,EAAE,MAAM,CAAA;QACd,IAAI,CAAC,EAAE,gBAAgB,CAAA;QACvB,WAAW,EAAE,MAAM,CAAA;QACnB,aAAa,EAAE,MAAM,CAAA;KACtB,CAAC,CAAA;CACH,CAAA;AAED,MAAM,MAAM,+BAA+B,GAAG;IAC5C,oEAAoE;IACpE,WAAW,EAAE,OAAO,CAAA;IACpB,iBAAiB,CAAC,EAAE,OAAO,CAAA;IAC3B,IAAI,EAAE,MAAM,CAAA;IACZ,WAAW,EAAE,MAAM,CAAA;IACnB,aAAa,EAAE,MAAM,CAAA;IACrB,WAAW,EAAE,OAAO,CAAA;IACpB,UAAU,EAAE,MAAM,CAAA;IAClB,IAAI,CAAC,EAAE,gBAAgB,CAAA;IACvB,KAAK,CAAC,EAAE,MAAM,CAAA;CACf,CAAA;AAED,MAAM,MAAM,6BAA6B,GAAG;IAC1C,SAAS,EAAE,MAAM,CAAA;IACjB,KAAK,EAAE,MAAM,CAAA;IACb,OAAO,EAAE,+BAA+B,CAAA;CACzC,CAAA;~~AAED~~,qBAAa,cAAc;IACzB,EAAE,EAAE,MAAM,CAAA;gBAEE,EAAE,EAAE,MAAM;IAItB,4BAA4B;IAC5B,UAAU,CACR,QAAQ,EAAE,MAAM,GAAG,MAAM,EACzB,OAAO,GAAE,qBAA0B,GAClC;QACD,0BAA0B;QAC1B,IAAI,EAAE,MAAM,IAAI,CAAA;~~QAChB~~,gCAAgC;QAChC,OAAO,EAAE,OAAO,CAAC,gBAAgB,CAAC,CAAA;KACnC;~~IA2DD~~,yFAAyF;IACnF,kBAAkB,CAAC,OAAO,GAAE,yBAA8B,GAAG,OAAO,CAAC;QACzE,mCAAmC;QACnC,IAAI,EAAE,MAAM,IAAI,CAAA;~~QAChB~~,8CAA8C;QAC9C,SAAS,EAAE,CAAC,QAAQ,EAAE,CAAC,KAAK,EAAE,uBAAuB,KAAK,IAAI,KAAK,IAAI,CAAA;KACxE,CAAC;~~IAqGI~~,OAAO,IAAI,OAAO,CAAC,IAAI,CAAC;CAG/B;AAED,MAAM,MAAM,cAAc,GAAG;IAC3B,QAAQ,EAAE,MAAM,GAAG,MAAM,CAAA;IACzB;;;;OAIG;IACH,gBAAgB,CAAC,EAAE;QACjB,QAAQ,EAAE,MAAM,CAAA;QAChB,MAAM,EAAE,MAAM,EAAE,CAAA;~~KACjB~~,CAAA;IACD,+DAA+D;IAC/D,aAAa,CAAC,EAAE,OAAO,CAAA;CACxB,CAAA;AASD,wBAAsB,WAAW,CAAC,EAChC,QAAQ,EACR,gBAAgB,EAChB,aAAa,GACd,EAAE,cAAc,GAAG,OAAO,CAAC,cAAc,CAAC,~~CA4C1C~~;AAED,wBAAsB,iBAAiB,IAAI,OAAO,CAAC,IAAI,CAAC,CAEvD;AAED,qCAAqC;AACrC,eAAO,MAAM,UAAU,EAAE,MAAgB,CAAA;AAIzC,kCAAkC;AAClC,eAAO,MAAM,WAAW,EAAE,OAAqB,CAAA;AAE/C,2DAA2D;AAC3D,eAAO,MAAM,qBAAqB,EAAE,OAA+B,CAAA"}
1	+ {"version":3,"file":"index.d.ts","sourceRoot":"","sources":["../../src/index.ts"],"names":[],"mappings":"AAQA,OAAO,KAAK,EACV,iBAAiB,EACjB,gBAAgB,EAEjB,MAAM,mBAAmB,CAAA;AAC1B,OAAO,eAAe,MAAM,mBAAmB,CAAA;AAC/C,OAAO,KAAK,EACV,uBAAuB,EACvB,6BAA6B,EAC7B,mBAAmB,EACpB,MAAM,mBAAmB,CAAA;AAY1B,YAAY,EACV,iBAAiB,EACjB,gBAAgB,EAChB,uBAAuB,EACvB,6BAA6B,EAC7B,mBAAmB,GACpB,CAAA;AAQD,MAAM,MAAM,2BAA2B,GAAG;IACxC,IAAI,EAAE,MAAM,CAAA;IACZ,SAAS,EAAE,MAAM,CAAA;IACjB,MAAM,EAAE,MAAM,CAAA;IACd,QAAQ,EAAE,gBAAgB,CAAC,UAAU,CAAC,CAAA;CACvC,CAAA;AAED,MAAM,MAAM,gCAAgC,GAAG;IAC7C,SAAS,EAAE,MAAM,CAAA;IACjB,KAAK,EAAE,MAAM,CAAA;IACb,MAAM,EAAE,2BAA2B,CAAA;CACpC,CAAA;AAGD,MAAM,MAAM,qBAAqB,GAAG,iBAAiB,GAAG;IACtD;;OAEG;IACH,UAAU,CAAC,EAAE,CAAC,QAAQ,EAAE,MAAM,KAAK,IAAI,CAAA;IACvC;;OAEG;IACH,aAAa,CAAC,EAAE,CAAC,MAAM,EAAE,2BAA2B,KAAK,IAAI,CAAA;CAC9D,CAAA;AAED,MAAM,MAAM,6BAA6B,GAAG;IAC1C,SAAS,EAAE,MAAM,CAAA;IACjB,KAAK,EAAE,MAAM,CAAA;IACb,QAAQ,EAAE,MAAM,CAAA;CACjB,CAAA;AAED,MAAM,MAAM,sBAAsB,GAAG;IACnC,QAAQ,EAAE,uBAAuB,CAAA;IACjC,OAAO,CAAC,EAAE,6BAA6B,EAAE,CAAA;IACzC,IAAI,CAAC,EAAE,mBAAmB,CAAA;IAC1B,MAAM,CAAC,EAAE,OAAO,CAAA;CACjB,CAAA;AAGD,MAAM,MAAM,yBAAyB,GAAG,iBAAiB,GAAG;IAC1D;;;;OAIG;IACH,gBAAgB,CAAC,EAAE,MAAM,CAAA;IACzB;;;;OAIG;IACH,qBAAqB,CAAC,EAAE,MAAM,CAAA;IAC9B;;;OAGG;IACH,eAAe,CAAC,EAAE,MAAM,CAAA;IACxB;;;;OAIG;IACH,MAAM,CAAC,EAAE,OAAO,CAAA;IAChB;;OAEG;IACH,KAAK,CAAC,EAAE,MAAM,CAAA;IACd;;OAEG;IACH,QAAQ,CAAC,EAAE,MAAM,CAAA;IACjB;;OAEG;IACH,YAAY,CAAC,EAAE,MAAM,CAAA;IACrB;;;OAGG;IACH,sBAAsB,CAAC,EAAE,sBAAsB,CAAA;IAC/C;;;;OAIG;IACH,qBAAqB,CAAC,EAAE,MAAM,GAAG,sBAAsB,CAAA;CACxD,CAAA;AAED,MAAM,MAAM,uBAAuB,GAAG;IACpC,SAAS,EAAE,MAAM,CAAA;IACjB,KAAK,EAAE,MAAM,CAAA;IACb,oEAAoE;IACpE,WAAW,EAAE,OAAO,CAAA;IACpB,iBAAiB,CAAC,EAAE,OAAO,CAAA;IAC3B,IAAI,EAAE,MAAM,CAAA;IACZ,IAAI,CAAC,EAAE,gBAAgB,CAAA;IACvB,KAAK,CAAC,EAAE,MAAM,CAAA;IACd,WAAW,EAAE,MAAM,CAAA;IACnB,aAAa,EAAE,MAAM,CAAA;IACrB,MAAM,CAAC,EAAE,KAAK,CAAC;QACb,IAAI,EAAE,MAAM,CAAA;QACZ,KAAK,CAAC,EAAE,MAAM,CAAA;QACd,IAAI,CAAC,EAAE,gBAAgB,CAAA;QACvB,WAAW,EAAE,MAAM,CAAA;QACnB,aAAa,EAAE,MAAM,CAAA;KACtB,CAAC,CAAA;CACH,CAAA;AAED,MAAM,MAAM,+BAA+B,GAAG;IAC5C,oEAAoE;IACpE,WAAW,EAAE,OAAO,CAAA;IACpB,iBAAiB,CAAC,EAAE,OAAO,CAAA;IAC3B,IAAI,EAAE,MAAM,CAAA;IACZ,WAAW,EAAE,MAAM,CAAA;IACnB,aAAa,EAAE,MAAM,CAAA;IACrB,WAAW,EAAE,OAAO,CAAA;IACpB,UAAU,EAAE,MAAM,CAAA;IAClB,IAAI,CAAC,EAAE,gBAAgB,CAAA;IACvB,KAAK,CAAC,EAAE,MAAM,CAAA;CACf,CAAA;AAED,MAAM,MAAM,6BAA6B,GAAG;IAC1C,SAAS,EAAE,MAAM,CAAA;IACjB,KAAK,EAAE,MAAM,CAAA;IACb,OAAO,EAAE,+BAA+B,CAAA;CACzC,CAAA;AAaD,qBAAa,cAAc;IACzB,EAAE,EAAE,MAAM,CAAA;gBAEE,EAAE,EAAE,MAAM;IAItB,4BAA4B;IAC5B,UAAU,CACR,QAAQ,EAAE,MAAM,GAAG,MAAM,EACzB,OAAO,GAAE,qBAA0B,GAClC;QACD,0BAA0B;QAC1B,IAAI,EAAE,MAAM,OAAO,CAAC,IAAI,CAAC,CAAA;QACzB,gCAAgC;QAChC,OAAO,EAAE,OAAO,CAAC,gBAAgB,CAAC,CAAA;KACnC;IAuFD,yFAAyF;IACnF,kBAAkB,CAAC,OAAO,GAAE,yBAA8B,GAAG,OAAO,CAAC;QACzE,mCAAmC;QACnC,IAAI,EAAE,MAAM,OAAO,CAAC,IAAI,CAAC,CAAA;QACzB,8CAA8C;QAC9C,SAAS,EAAE,CAAC,QAAQ,EAAE,CAAC,KAAK,EAAE,uBAAuB,KAAK,IAAI,KAAK,IAAI,CAAA;KACxE,CAAC;IAmII,OAAO,IAAI,OAAO,CAAC,IAAI,CAAC;CAG/B;AAED,MAAM,MAAM,cAAc,GAAG;IAC3B,QAAQ,EAAE,MAAM,GAAG,MAAM,CAAA;IACzB;;;;OAIG;IACH,gBAAgB,CAAC,EAAE;QACjB,QAAQ,EAAE,MAAM,CAAA;QAChB,MAAM,EAAE,MAAM,EAAE,GAAG,MAAM,EAAE,CAAA;KAC5B,CAAA;IACD,+DAA+D;IAC/D,aAAa,CAAC,EAAE,OAAO,CAAA;CACxB,CAAA;AASD,wBAAsB,WAAW,CAAC,EAChC,QAAQ,EACR,gBAAgB,EAChB,aAAa,GACd,EAAE,cAAc,GAAG,OAAO,CAAC,cAAc,CAAC,CAqD1C;AAED,wBAAsB,iBAAiB,IAAI,OAAO,CAAC,IAAI,CAAC,CAEvD;AAED,qCAAqC;AACrC,eAAO,MAAM,UAAU,EAAE,MAAgB,CAAA;AAIzC,kCAAkC;AAClC,eAAO,MAAM,WAAW,EAAE,OAAqB,CAAA;AAE/C,2DAA2D;AAC3D,eAAO,MAAM,qBAAqB,EAAE,OAA+B,CAAA;AAEnE,OAAO,EAAE,eAAe,EAAE,CAAA"}

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "whisper.rn",
-  "version": "0.3.6",
+  "version": "0.3.8",
   "description": "React Native binding of whisper.cpp",
   "main": "lib/commonjs/index",
   "module": "lib/module/index",

package/src/AudioSessionIos.ts ADDED Viewed

@@ -0,0 +1,90 @@
+import { Platform } from 'react-native'
+import RNWhisper from './NativeRNWhisper'
+/**
+ * @see https://developer.apple.com/documentation/avfaudio/avaudiosessioncategory?language=objc
+ */
+export enum AudioSessionCategoryIos {
+  Ambient = 'Ambient',
+  SoloAmbient = 'SoloAmbient',
+  Playback = 'Playback',
+  Record = 'Record',
+  PlayAndRecord = 'PlayAndRecord',
+  MultiRoute = 'MultiRoute',
+}
+/**
+ * @see https://developer.apple.com/documentation/avfaudio/avaudiosessioncategoryoptions?language=objc
+ */
+export enum AudioSessionCategoryOptionIos {
+  MixWithOthers = 'MixWithOthers',
+  DuckOthers = 'DuckOthers',
+  InterruptSpokenAudioAndMixWithOthers = 'InterruptSpokenAudioAndMixWithOthers',
+  AllowBluetooth = 'AllowBluetooth',
+  AllowBluetoothA2DP = 'AllowBluetoothA2DP',
+  AllowAirPlay = 'AllowAirPlay',
+  DefaultToSpeaker = 'DefaultToSpeaker',
+}
+/**
+ * @see https://developer.apple.com/documentation/avfaudio/avaudiosessionmode?language=objc
+ */
+export enum AudioSessionModeIos {
+  Default = 'Default',
+  VoiceChat = 'VoiceChat',
+  VideoChat = 'VideoChat',
+  GameChat = 'GameChat',
+  VideoRecording = 'VideoRecording',
+  Measurement = 'Measurement',
+  MoviePlayback = 'MoviePlayback',
+  SpokenAudio = 'SpokenAudio',
+}
+const checkPlatform = () => {
+  if (Platform.OS !== 'ios') throw new Error('Only supported on iOS')
+}
+/**
+ * AudioSession Utility, iOS only.
+ */
+export default {
+  Category: AudioSessionCategoryIos,
+  CategoryOption: AudioSessionCategoryOptionIos,
+  Mode: AudioSessionModeIos,
+  getCurrentCategory: async (): Promise<{
+    category: AudioSessionCategoryIos,
+    options: AudioSessionCategoryOptionIos[],
+  }> => {
+    checkPlatform()
+    const result = await RNWhisper.getAudioSessionCurrentCategory()
+    return {
+      category: (result.category.replace('AVAudioSessionCategory', '') as AudioSessionCategoryIos),
+      options: result.options?.map((option: string) => (option.replace('AVAudioSessionCategoryOption', '') as AudioSessionCategoryOptionIos)),
+    }
+  },
+  getCurrentMode: async (): Promise<AudioSessionModeIos> => {
+    checkPlatform()
+    const mode = await RNWhisper.getAudioSessionCurrentMode()
+    return (mode.replace('AVAudioSessionMode', '') as AudioSessionModeIos)
+  },
+  setCategory: async (
+    category: AudioSessionCategoryIos,
+    options: AudioSessionCategoryOptionIos[],
+  ): Promise<void> => {
+    checkPlatform()
+    await RNWhisper.setAudioSessionCategory(category, options)
+  },
+  setMode: async (mode: AudioSessionModeIos): Promise<void> => {
+    checkPlatform()
+    await RNWhisper.setAudioSessionMode(mode)
+  },
+  setActive: async (active: boolean): Promise<void> => {
+    checkPlatform()
+    await RNWhisper.setAudioSessionActive(active)
+  },
+}

package/src/NativeRNWhisper.ts CHANGED Viewed

@@ -68,7 +68,7 @@ export interface Spec extends TurboModule {
     contextId: number,
     jobId: number,
     path: string,
-    options: {}, // TranscribeOptions & { onProgress?: boolean }
+    options: {}, // TranscribeOptions & { onProgress?: boolean, onNewSegments?: boolean }
   ): Promise<TranscribeResult>;
   startRealtimeTranscribe(
     contextId: number,
@@ -76,6 +76,16 @@ export interface Spec extends TurboModule {
     options: TranscribeOptions,
   ): Promise<void>;
   abortTranscribe(contextId: number, jobId: number): Promise<void>;
+  // iOS specific
+  getAudioSessionCurrentCategory: () => Promise<{
+    category: string,
+    options: Array<string>,
+  }>;
+  getAudioSessionCurrentMode: () => Promise<string>;
+  setAudioSessionCategory: (category: string, options: Array<string>) => Promise<void>;
+  setAudioSessionMode: (mode: string) => Promise<void>;
+  setAudioSessionActive: (active: boolean) => Promise<void>;
 }
 export default TurboModuleRegistry.get<Spec>('RNWhisper') as Spec

package/src/index.ts CHANGED Viewed

@@ -11,6 +11,12 @@ import type {
   TranscribeResult,
   CoreMLAsset,
 } from './NativeRNWhisper'
+import AudioSessionIos from './AudioSessionIos'
+import type {
+  AudioSessionCategoryIos,
+  AudioSessionCategoryOptionIos,
+  AudioSessionModeIos,
+} from './AudioSessionIos'
 import { version } from './version.json'
 let EventEmitter: NativeEventEmitter | DeviceEventEmitterStatic
@@ -22,20 +28,43 @@ if (Platform.OS === 'android') {
   EventEmitter = DeviceEventEmitter
 }
-export type { TranscribeOptions, TranscribeResult }
+export type {
+  TranscribeOptions,
+  TranscribeResult,
+  AudioSessionCategoryIos,
+  AudioSessionCategoryOptionIos,
+  AudioSessionModeIos,
+}
 const EVENT_ON_TRANSCRIBE_PROGRESS = '@RNWhisper_onTranscribeProgress'
+const EVENT_ON_TRANSCRIBE_NEW_SEGMENTS = '@RNWhisper_onTranscribeNewSegments'
 const EVENT_ON_REALTIME_TRANSCRIBE = '@RNWhisper_onRealtimeTranscribe'
 const EVENT_ON_REALTIME_TRANSCRIBE_END = '@RNWhisper_onRealtimeTranscribeEnd'
+export type TranscribeNewSegmentsResult = {
+  nNew: number
+  totalNNew: number
+  result: string
+  segments: TranscribeResult['segments']
+}
+export type TranscribeNewSegmentsNativeEvent = {
+  contextId: number
+  jobId: number
+  result: TranscribeNewSegmentsResult
+}
 // Fn -> Boolean in TranscribeFileNativeOptions
 export type TranscribeFileOptions = TranscribeOptions & {
   /**
    * Progress callback, the progress is between 0 and 100
    */
   onProgress?: (progress: number) => void
+  /**
+   * Callback when new segments are transcribed
+   */
+  onNewSegments?: (result: TranscribeNewSegmentsResult) => void
 }
 export type TranscribeProgressNativeEvent = {
@@ -44,6 +73,13 @@ export type TranscribeProgressNativeEvent = {
   progress: number
 }
+export type AudioSessionSettingIos = {
+  category: AudioSessionCategoryIos
+  options?: AudioSessionCategoryOptionIos[]
+  mode?: AudioSessionModeIos
+  active?: boolean
+}
 // Codegen missing TSIntersectionType support so we dont put it into the native spec
 export type TranscribeRealtimeOptions = TranscribeOptions & {
   /**
@@ -58,6 +94,40 @@ export type TranscribeRealtimeOptions = TranscribeOptions & {
    * (Default: Equal to `realtimeMaxAudioSec`)
    */
   realtimeAudioSliceSec?: number
+  /**
+   * Output path for audio file. If not set, the audio file will not be saved
+   * (Default: Undefined)
+   */
+  audioOutputPath?: string
+  /**
+   * Start transcribe on recording when the audio volume is greater than the threshold by using VAD (Voice Activity Detection).
+   * The first VAD will be triggered after 2 second of recording.
+   * (Default: false)
+   */
+  useVad?: boolean
+  /**
+   * The length of the collected audio is used for VAD. (ms) (Default: 2000)
+   */
+  vadMs?: number
+  /**
+   * VAD threshold. (Default: 0.6)
+   */
+  vadThold?: number
+  /**
+   * Frequency to apply High-pass filter in VAD. (Default: 100.0)
+   */
+  vadFreqThold?: number
+  /**
+   * iOS: Audio session settings when start transcribe
+   * Keep empty to use current audio session state
+   */
+  audioSessionOnStartIos?: AudioSessionSettingIos
+  /**
+   * iOS: Audio session settings when stop transcribe
+   * - Keep empty to use last audio session state
+   * - Use `restore` to restore audio session state before start transcribe
+   */
+  audioSessionOnStopIos?: string | AudioSessionSettingIos
 }
 export type TranscribeRealtimeEvent = {
@@ -99,6 +169,17 @@ export type TranscribeRealtimeNativeEvent = {
   payload: TranscribeRealtimeNativePayload
 }
+const updateAudioSession = async (setting: AudioSessionSettingIos) => {
+  await AudioSessionIos.setCategory(
+    setting.category,
+    setting.options || [],
+  )
+  if (setting.mode) {
+    await AudioSessionIos.setMode(setting.mode)
+  }
+  await AudioSessionIos.setActive(setting.active ?? true)
+}
 export class WhisperContext {
   id: number
@@ -112,7 +193,7 @@ export class WhisperContext {
     options: TranscribeFileOptions = {},
   ): {
     /** Stop the transcribe */
-    stop: () => void
+    stop: () => Promise<void>
     /** Transcribe result promise */
     promise: Promise<TranscribeResult>
   } {
@@ -126,13 +207,16 @@ export class WhisperContext {
       }
     } else {
       if (filePath.startsWith('http'))
-        throw new Error('Transcribe remote file is not supported, please download it first')
+        throw new Error(
+          'Transcribe remote file is not supported, please download it first',
+        )
       path = filePath
     }
     if (path.startsWith('file://')) path = path.slice(7)
     const jobId: number = Math.floor(Math.random() * 10000)
-    const { onProgress, ...rest } = options
+    const { onProgress, onNewSegments, ...rest } = options
     let progressListener: any
     let lastProgress: number = 0
     if (onProgress) {
@@ -152,37 +236,60 @@ export class WhisperContext {
         progressListener = null
       }
     }
+    let newSegmentsListener: any
+    if (onNewSegments) {
+      newSegmentsListener = EventEmitter.addListener(
+        EVENT_ON_TRANSCRIBE_NEW_SEGMENTS,
+        (evt: TranscribeNewSegmentsNativeEvent) => {
+          const { contextId, result } = evt
+          if (contextId !== this.id || evt.jobId !== jobId) return
+          onNewSegments(result)
+        },
+      )
+    }
+    const removeNewSegmenetsListener = () => {
+      if (newSegmentsListener) {
+        newSegmentsListener.remove()
+        newSegmentsListener = null
+      }
+    }
     return {
       stop: async () => {
         await RNWhisper.abortTranscribe(this.id, jobId)
         removeProgressListener()
+        removeNewSegmenetsListener()
       },
       promise: RNWhisper.transcribeFile(this.id, jobId, path, {
         ...rest,
-        onProgress: !!onProgress
-      }).then((result) => {
-        removeProgressListener()
-        if (!result.isAborted && lastProgress !== 100) {
-          // Handle the case that the last progress event is not triggered
-          onProgress?.(100)
-        }
-        return result
-      }).catch((e) => {
-        removeProgressListener()
-        throw e
-      }),
+        onProgress: !!onProgress,
+        onNewSegments: !!onNewSegments,
+      })
+        .then((result) => {
+          removeProgressListener()
+          removeNewSegmenetsListener()
+          if (!result.isAborted && lastProgress !== 100) {
+            // Handle the case that the last progress event is not triggered
+            onProgress?.(100)
+          }
+          return result
+        })
+        .catch((e) => {
+          removeProgressListener()
+          removeNewSegmenetsListener()
+          throw e
+        }),
     }
   }
   /** Transcribe the microphone audio stream, the microphone user permission is required */
   async transcribeRealtime(options: TranscribeRealtimeOptions = {}): Promise<{
     /** Stop the realtime transcribe */
-    stop: () => void
+    stop: () => Promise<void>
     /** Subscribe to realtime transcribe events */
     subscribe: (callback: (event: TranscribeRealtimeEvent) => void) => void
   }> {
-    const jobId: number = Math.floor(Math.random() * 10000)
-    await RNWhisper.startRealtimeTranscribe(this.id, jobId, options)
     let lastTranscribePayload: TranscribeRealtimeNativePayload
     const slices: TranscribeRealtimeNativePayload[] = []
@@ -234,8 +341,40 @@ export class WhisperContext {
       return { ...payload, ...mergedPayload, slices }
     }
+    let prevAudioSession: AudioSessionSettingIos | undefined
+    if (Platform.OS === 'ios' && options?.audioSessionOnStartIos) {
+      // iOS: Remember current audio session state
+      if (options?.audioSessionOnStopIos === 'restore') {
+        const categoryResult = await AudioSessionIos.getCurrentCategory()
+        const mode = await AudioSessionIos.getCurrentMode()
+        prevAudioSession = {
+          ...categoryResult,
+          mode,
+          active: false, // TODO: Need to check isOtherAudioPlaying to set active
+        }
+      }
+      // iOS: Update audio session state
+      await updateAudioSession(options?.audioSessionOnStartIos)
+    }
+    if (Platform.OS === 'ios' && typeof options?.audioSessionOnStopIos === 'object') {
+      prevAudioSession = options?.audioSessionOnStopIos
+    }
+    const jobId: number = Math.floor(Math.random() * 10000)
+    try {
+      await RNWhisper.startRealtimeTranscribe(this.id, jobId, options)
+    } catch (e) {
+      if (prevAudioSession) await updateAudioSession(prevAudioSession)
+      throw e
+    }
     return {
-      stop: () => RNWhisper.abortTranscribe(this.id, jobId),
+      stop: async () => {
+        await RNWhisper.abortTranscribe(this.id, jobId)
+        if (prevAudioSession) await updateAudioSession(prevAudioSession)
+      },
       subscribe: (callback: (event: TranscribeRealtimeEvent) => void) => {
         let transcribeListener: any = EventEmitter.addListener(
           EVENT_ON_REALTIME_TRANSCRIBE,
@@ -295,7 +434,7 @@ export type ContextOptions = {
    */
   coreMLModelAsset?: {
     filename: string
-    assets: number[]
+    assets: string[] | number[]
   }
   /** Is the file path a bundle asset for pure string filePath */
   isBundleAsset?: boolean
@@ -320,12 +459,19 @@ export async function initWhisper({
     if (filename && assets) {
       coreMLAssets = assets
         ?.map((asset) => {
-          const { uri } = Image.resolveAssetSource(asset)
-          const filepath = coreMLModelAssetPaths.find((p) => uri.includes(p))
-          if (filepath) {
+          if (typeof asset === 'number') {
+            const { uri } = Image.resolveAssetSource(asset)
+            const filepath = coreMLModelAssetPaths.find((p) => uri.includes(p))
+            if (filepath) {
+              return {
+                uri,
+                filepath: `${filename}/${filepath}`,
+              }
+            }
+          } else if (typeof asset === 'string') {
             return {
-              uri,
-              filepath: `${filename}/${filepath}`,
+              uri: asset,
+              filepath: `${filename}/${asset}`,
             }
           }
           return undefined
@@ -344,7 +490,9 @@ export async function initWhisper({
     }
   } else {
     if (!isBundleAsset && filePath.startsWith('http'))
-      throw new Error('Transcribe remote file is not supported, please download it first')
+      throw new Error(
+        'Transcribe remote file is not supported, please download it first',
+      )
     path = filePath
   }
   if (path.startsWith('file://')) path = path.slice(7)
@@ -372,3 +520,5 @@ export const isUseCoreML: boolean = !!useCoreML
 /** Is allow fallback to CPU if load CoreML model failed */
 export const isCoreMLAllowFallback: boolean = !!coreMLAllowFallback
+export { AudioSessionIos }