npm - @tensamin/audio - Versions diffs - 0.1.1 → 0.1.3 - Mend

@tensamin/audio 0.1.1 → 0.1.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (57) hide show

package/README.md +50 -3
package/dist/chunk-6P2RDBW5.mjs +47 -0
package/dist/chunk-EXH2PNUE.mjs +212 -0
package/{src/vad/vad-state.ts → dist/chunk-JJASCVEW.mjs} +21 -33
package/dist/chunk-OZ7KMC4S.mjs +46 -0
package/dist/chunk-R5JVHKWA.mjs +98 -0
package/dist/chunk-WBQAMGXK.mjs +0 -0
package/dist/chunk-XMTQPMQ6.mjs +91 -0
package/dist/chunk-XO6B3D4A.mjs +67 -0
package/dist/context/audio-context.d.mts +32 -0
package/dist/context/audio-context.d.ts +32 -0
package/dist/context/audio-context.js +75 -0
package/dist/context/audio-context.mjs +16 -0
package/dist/extensibility/plugins.d.mts +9 -0
package/dist/extensibility/plugins.d.ts +9 -0
package/dist/extensibility/plugins.js +238 -0
package/dist/extensibility/plugins.mjs +14 -0
package/dist/index.d.mts +10 -216
package/dist/index.d.ts +10 -216
package/dist/index.js +298 -80
package/dist/index.mjs +29 -352
package/dist/livekit/integration.d.mts +11 -0
package/dist/livekit/integration.d.ts +11 -0
package/dist/livekit/integration.js +585 -0
package/dist/livekit/integration.mjs +12 -0
package/dist/noise-suppression/rnnoise-node.d.mts +10 -0
package/dist/noise-suppression/rnnoise-node.d.ts +10 -0
package/dist/noise-suppression/rnnoise-node.js +101 -0
package/dist/noise-suppression/rnnoise-node.mjs +6 -0
package/dist/pipeline/audio-pipeline.d.mts +6 -0
package/dist/pipeline/audio-pipeline.d.ts +6 -0
package/dist/pipeline/audio-pipeline.js +499 -0
package/dist/pipeline/audio-pipeline.mjs +11 -0
package/dist/types.d.mts +155 -0
package/dist/types.d.ts +155 -0
package/dist/types.js +18 -0
package/dist/types.mjs +1 -0
package/dist/vad/vad-node.d.mts +9 -0
package/dist/vad/vad-node.d.ts +9 -0
package/dist/vad/vad-node.js +122 -0
package/dist/vad/vad-node.mjs +6 -0
package/dist/vad/vad-state.d.mts +15 -0
package/dist/vad/vad-state.d.ts +15 -0
package/dist/vad/vad-state.js +83 -0
package/dist/vad/vad-state.mjs +6 -0
package/package.json +8 -5
package/.github/workflows/publish.yml +0 -29
package/bun.lock +0 -258
package/src/context/audio-context.ts +0 -69
package/src/extensibility/plugins.ts +0 -45
package/src/index.ts +0 -8
package/src/livekit/integration.ts +0 -61
package/src/noise-suppression/rnnoise-node.ts +0 -62
package/src/pipeline/audio-pipeline.ts +0 -154
package/src/types.ts +0 -167
package/src/vad/vad-node.ts +0 -78
package/tsconfig.json +0 -46

package/dist/index.js CHANGED Viewed

@@ -90,37 +90,66 @@ async function closeAudioContext() {
 var import_mitt = __toESM(require("mitt"));
 // src/noise-suppression/rnnoise-node.ts
-var import_web_noise_suppressor = require("@sapphi-red/web-noise-suppressor");
-var DEFAULT_WASM_URL = "https://unpkg.com/@sapphi-red/web-noise-suppressor@0.3.5/dist/rnnoise.wasm";
-var DEFAULT_SIMD_WASM_URL = "https://unpkg.com/@sapphi-red/web-noise-suppressor@0.3.5/dist/rnnoise_simd.wasm";
-var DEFAULT_WORKLET_URL = "https://unpkg.com/@sapphi-red/web-noise-suppressor@0.3.5/dist/noise-suppressor-worklet.min.js";
 var RNNoisePlugin = class {
   name = "rnnoise-ns";
   wasmBuffer = null;
   async createNode(context, config) {
+    const { loadRnnoise, RnnoiseWorkletNode } = await import("@sapphi-red/web-noise-suppressor");
     if (!config?.enabled) {
+      console.log("Noise suppression disabled, using passthrough node");
       const pass = context.createGain();
       return pass;
     }
-    if (!this.wasmBuffer) {
-      this.wasmBuffer = await (0, import_web_noise_suppressor.loadRnnoise)({
-        url: config.wasmUrl || DEFAULT_WASM_URL,
-        simdUrl: DEFAULT_SIMD_WASM_URL
-        // We should probably allow config for this too, but for now default is fine.
-      });
+    if (!config?.wasmUrl || !config?.simdUrl || !config?.workletUrl) {
+      const error = new Error(
+        `RNNoisePlugin requires 'wasmUrl', 'simdUrl', and 'workletUrl' to be configured. Please download the assets from @sapphi-red/web-noise-suppressor and provide the URLs in the config. Current config: wasmUrl=${config?.wasmUrl}, simdUrl=${config?.simdUrl}, workletUrl=${config?.workletUrl}
+To disable noise suppression, set noiseSuppression.enabled to false.`
+      );
+      console.error(error.message);
+      throw error;
+    }
+    try {
+      if (!this.wasmBuffer) {
+        console.log("Loading RNNoise WASM binary...");
+        this.wasmBuffer = await loadRnnoise({
+          url: config.wasmUrl,
+          simdUrl: config.simdUrl
+        });
+        console.log("RNNoise WASM loaded successfully");
+      }
+    } catch (error) {
+      const err = new Error(
+        `Failed to load RNNoise WASM binary: ${error instanceof Error ? error.message : String(error)}`
+      );
+      console.error(err);
+      throw err;
     }
-    const workletUrl = config.workletUrl || DEFAULT_WORKLET_URL;
+    const workletUrl = config.workletUrl;
     try {
       await context.audioWorklet.addModule(workletUrl);
+      console.log("RNNoise worklet loaded successfully");
     } catch (e) {
-      console.warn("Failed to add RNNoise worklet module:", e);
+      const error = new Error(
+        `Failed to load RNNoise worklet from ${workletUrl}: ${e instanceof Error ? e.message : String(e)}. Ensure the workletUrl points to a valid RNNoise worklet script.`
+      );
+      console.error(error.message);
+      throw error;
+    }
+    try {
+      const node = new RnnoiseWorkletNode(context, {
+        wasmBinary: this.wasmBuffer,
+        maxChannels: 1
+        // Mono for now
+      });
+      console.log("RNNoise worklet node created successfully");
+      return node;
+    } catch (error) {
+      const err = new Error(
+        `Failed to create RNNoise worklet node: ${error instanceof Error ? error.message : String(error)}`
+      );
+      console.error(err);
+      throw err;
     }
-    const node = new import_web_noise_suppressor.RnnoiseWorkletNode(context, {
-      wasmBinary: this.wasmBuffer,
-      maxChannels: 1
-      // Mono for now
-    });
-    return node;
   }
 };
@@ -168,22 +197,52 @@ registerProcessor('energy-vad-processor', EnergyVadProcessor);
 var EnergyVADPlugin = class {
   name = "energy-vad";
   async createNode(context, config, onDecision) {
+    if (!config?.enabled) {
+      console.log("VAD disabled, using passthrough node");
+      const pass = context.createGain();
+      return pass;
+    }
     const blob = new Blob([energyVadWorkletCode], {
       type: "application/javascript"
     });
     const url = URL.createObjectURL(blob);
     try {
       await context.audioWorklet.addModule(url);
+      console.log("Energy VAD worklet loaded successfully");
     } catch (e) {
-      console.warn("Failed to add Energy VAD worklet:", e);
-      throw e;
-    } finally {
+      const error = new Error(
+        `Failed to load Energy VAD worklet: ${e instanceof Error ? e.message : String(e)}`
+      );
+      console.error(error.message);
       URL.revokeObjectURL(url);
+      throw error;
+    }
+    URL.revokeObjectURL(url);
+    let node;
+    try {
+      node = new AudioWorkletNode(context, "energy-vad-processor");
+      console.log("Energy VAD node created successfully");
+    } catch (e) {
+      const error = new Error(
+        `Failed to create Energy VAD node: ${e instanceof Error ? e.message : String(e)}`
+      );
+      console.error(error.message);
+      throw error;
     }
-    const node = new AudioWorkletNode(context, "energy-vad-processor");
     node.port.onmessage = (event) => {
-      const { probability } = event.data;
-      onDecision(probability);
+      try {
+        const { probability } = event.data;
+        if (typeof probability === "number" && !isNaN(probability)) {
+          onDecision(probability);
+        } else {
+          console.warn("Invalid VAD probability received:", event.data);
+        }
+      } catch (error) {
+        console.error("Error in VAD message handler:", error);
+      }
+    };
+    node.port.onmessageerror = (event) => {
+      console.error("VAD port message error:", event);
     };
     return node;
   }
@@ -283,42 +342,84 @@ var VADStateMachine = class {
 async function createAudioPipeline(sourceTrack, config = {}) {
   const context = getAudioContext();
   registerPipeline();
+  const nsEnabled = config.noiseSuppression?.enabled !== false && Boolean(config.noiseSuppression?.wasmUrl && config.noiseSuppression?.simdUrl && config.noiseSuppression?.workletUrl);
+  const vadEnabled = config.vad?.enabled !== false;
   const fullConfig = {
-    noiseSuppression: { enabled: true, ...config.noiseSuppression },
-    vad: { enabled: true, ...config.vad },
+    noiseSuppression: {
+      enabled: nsEnabled,
+      ...config.noiseSuppression
+    },
+    vad: {
+      enabled: vadEnabled,
+      ...config.vad
+    },
     output: {
       speechGain: 1,
-      silenceGain: 0,
+      silenceGain: vadEnabled ? 0 : 1,
+      // If no VAD, always output audio
       gainRampTime: 0.02,
       ...config.output
     },
     livekit: { manageTrackMute: false, ...config.livekit }
   };
+  console.log("Audio pipeline config:", {
+    noiseSuppression: fullConfig.noiseSuppression?.enabled,
+    vad: fullConfig.vad?.enabled,
+    output: fullConfig.output
+  });
+  if (!sourceTrack || sourceTrack.kind !== "audio") {
+    throw new Error("createAudioPipeline requires a valid audio MediaStreamTrack");
+  }
+  if (sourceTrack.readyState === "ended") {
+    throw new Error("Cannot create pipeline from an ended MediaStreamTrack");
+  }
   const sourceStream = new MediaStream([sourceTrack]);
   const sourceNode = context.createMediaStreamSource(sourceStream);
-  const nsPlugin = getNoiseSuppressionPlugin(
-    fullConfig.noiseSuppression?.pluginName
-  );
-  const nsNode = await nsPlugin.createNode(
-    context,
-    fullConfig.noiseSuppression
-  );
-  const vadPlugin = getVADPlugin(fullConfig.vad?.pluginName);
-  const vadStateMachine = new VADStateMachine(fullConfig.vad);
+  let nsNode;
+  let vadNode;
   const emitter = (0, import_mitt.default)();
-  const vadNode = await vadPlugin.createNode(
-    context,
-    fullConfig.vad,
-    (prob) => {
-      const timestamp = context.currentTime * 1e3;
-      const newState = vadStateMachine.processFrame(prob, timestamp);
-      if (newState.state !== lastVadState.state || Math.abs(newState.probability - lastVadState.probability) > 0.1) {
-        emitter.emit("vadChange", newState);
-        lastVadState = newState;
-        updateGain(newState);
+  try {
+    const nsPlugin = getNoiseSuppressionPlugin(
+      fullConfig.noiseSuppression?.pluginName
+    );
+    nsNode = await nsPlugin.createNode(
+      context,
+      fullConfig.noiseSuppression
+    );
+  } catch (error) {
+    const err = error instanceof Error ? error : new Error(String(error));
+    console.error("Failed to create noise suppression node:", err);
+    emitter.emit("error", err);
+    throw err;
+  }
+  const vadStateMachine = new VADStateMachine(fullConfig.vad);
+  try {
+    const vadPlugin = getVADPlugin(fullConfig.vad?.pluginName);
+    vadNode = await vadPlugin.createNode(
+      context,
+      fullConfig.vad,
+      (prob) => {
+        try {
+          const timestamp = context.currentTime * 1e3;
+          const newState = vadStateMachine.processFrame(prob, timestamp);
+          if (newState.state !== lastVadState.state || Math.abs(newState.probability - lastVadState.probability) > 0.1) {
+            emitter.emit("vadChange", newState);
+            lastVadState = newState;
+            updateGain(newState);
+          }
+        } catch (vadError) {
+          const err = vadError instanceof Error ? vadError : new Error(String(vadError));
+          console.error("Error in VAD callback:", err);
+          emitter.emit("error", err);
+        }
       }
-    }
-  );
+    );
+  } catch (error) {
+    const err = error instanceof Error ? error : new Error(String(error));
+    console.error("Failed to create VAD node:", err);
+    emitter.emit("error", err);
+    throw err;
+  }
   let lastVadState = {
     isSpeaking: false,
     probability: 0,
@@ -334,34 +435,98 @@ async function createAudioPipeline(sourceTrack, config = {}) {
   const gainNode = context.createGain();
   gainNode.gain.value = fullConfig.output?.silenceGain ?? 0;
   const destination = context.createMediaStreamDestination();
-  splitter.connect(delayNode);
-  delayNode.connect(gainNode);
-  gainNode.connect(destination);
+  try {
+    splitter.connect(delayNode);
+    delayNode.connect(gainNode);
+    gainNode.connect(destination);
+  } catch (error) {
+    const err = error instanceof Error ? error : new Error(String(error));
+    console.error("Failed to wire audio pipeline:", err);
+    emitter.emit("error", err);
+    throw err;
+  }
   function updateGain(state) {
-    const { speechGain, silenceGain, gainRampTime } = fullConfig.output;
-    const targetGain = state.isSpeaking ? speechGain ?? 1 : silenceGain ?? 0;
-    const now = context.currentTime;
-    gainNode.gain.setTargetAtTime(targetGain, now, gainRampTime ?? 0.02);
+    try {
+      const { speechGain, silenceGain, gainRampTime } = fullConfig.output;
+      const targetGain = state.isSpeaking ? speechGain ?? 1 : silenceGain ?? 0;
+      const now = context.currentTime;
+      gainNode.gain.setTargetAtTime(targetGain, now, gainRampTime ?? 0.02);
+    } catch (error) {
+      const err = error instanceof Error ? error : new Error(String(error));
+      console.error("Failed to update gain:", err);
+      emitter.emit("error", err);
+    }
+  }
+  const audioTracks = destination.stream.getAudioTracks();
+  console.log("Destination stream tracks:", {
+    count: audioTracks.length,
+    tracks: audioTracks.map((t) => ({
+      id: t.id,
+      label: t.label,
+      enabled: t.enabled,
+      readyState: t.readyState
+    }))
+  });
+  if (audioTracks.length === 0) {
+    const err = new Error(
+      "Failed to create processed audio track: destination stream has no audio tracks. This may indicate an issue with the audio graph connection."
+    );
+    console.error(err);
+    emitter.emit("error", err);
+    throw err;
   }
+  const processedTrack = audioTracks[0];
+  if (!processedTrack || processedTrack.readyState === "ended") {
+    const err = new Error("Processed audio track is invalid or ended");
+    console.error(err);
+    emitter.emit("error", err);
+    throw err;
+  }
+  console.log("Audio pipeline created successfully:", {
+    sourceTrack: {
+      id: sourceTrack.id,
+      label: sourceTrack.label,
+      readyState: sourceTrack.readyState
+    },
+    processedTrack: {
+      id: processedTrack.id,
+      label: processedTrack.label,
+      readyState: processedTrack.readyState
+    },
+    config: {
+      noiseSuppression: fullConfig.noiseSuppression?.enabled,
+      vad: fullConfig.vad?.enabled
+    }
+  });
   function dispose() {
-    sourceNode.disconnect();
-    nsNode.disconnect();
-    splitter.disconnect();
-    vadNode.disconnect();
-    delayNode.disconnect();
-    gainNode.disconnect();
-    destination.stream.getTracks().forEach((t) => t.stop());
-    unregisterPipeline();
+    try {
+      sourceNode.disconnect();
+      nsNode.disconnect();
+      splitter.disconnect();
+      vadNode.disconnect();
+      delayNode.disconnect();
+      gainNode.disconnect();
+      destination.stream.getTracks().forEach((t) => t.stop());
+      unregisterPipeline();
+    } catch (error) {
+      console.error("Error during pipeline disposal:", error);
+    }
   }
   return {
-    processedTrack: destination.stream.getAudioTracks()[0],
+    processedTrack,
     events: emitter,
     get state() {
       return lastVadState;
     },
     setConfig: (newConfig) => {
-      if (newConfig.vad) {
-        vadStateMachine.updateConfig(newConfig.vad);
+      try {
+        if (newConfig.vad) {
+          vadStateMachine.updateConfig(newConfig.vad);
+        }
+      } catch (error) {
+        const err = error instanceof Error ? error : new Error(String(error));
+        console.error("Failed to update config:", err);
+        emitter.emit("error", err);
       }
     },
     dispose
@@ -370,31 +535,84 @@ async function createAudioPipeline(sourceTrack, config = {}) {
 // src/livekit/integration.ts
 async function attachProcessingToTrack(track, config = {}) {
+  if (!track) {
+    throw new Error("attachProcessingToTrack requires a valid LocalAudioTrack");
+  }
   const originalTrack = track.mediaStreamTrack;
-  const pipeline = await createAudioPipeline(originalTrack, config);
-  await track.replaceTrack(pipeline.processedTrack);
+  if (!originalTrack) {
+    throw new Error("LocalAudioTrack has no underlying MediaStreamTrack");
+  }
+  if (originalTrack.readyState === "ended") {
+    throw new Error("Cannot attach processing to an ended MediaStreamTrack");
+  }
+  let pipeline;
+  try {
+    console.log("Creating audio processing pipeline...");
+    pipeline = await createAudioPipeline(originalTrack, config);
+    console.log("Audio processing pipeline created successfully");
+  } catch (error) {
+    const err = new Error(
+      `Failed to create audio pipeline: ${error instanceof Error ? error.message : String(error)}`
+    );
+    console.error(err);
+    throw err;
+  }
+  if (!pipeline.processedTrack) {
+    throw new Error("Pipeline did not return a processed track");
+  }
+  try {
+    console.log("Replacing LiveKit track with processed track...");
+    await track.replaceTrack(pipeline.processedTrack);
+    console.log("LiveKit track replaced successfully");
+  } catch (error) {
+    pipeline.dispose();
+    const err = new Error(
+      `Failed to replace LiveKit track: ${error instanceof Error ? error.message : String(error)}`
+    );
+    console.error(err);
+    throw err;
+  }
   if (config.livekit?.manageTrackMute) {
     let isVadMuted = false;
     pipeline.events.on("vadChange", async (state) => {
-      if (state.isSpeaking) {
-        if (isVadMuted) {
-          await track.unmute();
-          isVadMuted = false;
-        }
-      } else {
-        if (!track.isMuted) {
-          await track.mute();
-          isVadMuted = true;
+      try {
+        if (state.isSpeaking) {
+          if (isVadMuted) {
+            await track.unmute();
+            isVadMuted = false;
+          }
+        } else {
+          if (!track.isMuted) {
+            await track.mute();
+            isVadMuted = true;
+          }
         }
+      } catch (error) {
+        console.error("Error handling VAD-based track muting:", error);
       }
     });
   }
+  pipeline.events.on("error", (error) => {
+    console.error("Audio pipeline error:", error);
+  });
   const originalDispose = pipeline.dispose;
   pipeline.dispose = () => {
-    if (originalTrack.readyState === "live") {
-      track.replaceTrack(originalTrack).catch(console.error);
+    try {
+      if (originalTrack.readyState === "live") {
+        console.log("Restoring original track...");
+        track.replaceTrack(originalTrack).catch((error) => {
+          console.error("Failed to restore original track:", error);
+        });
+      }
+      originalDispose();
+    } catch (error) {
+      console.error("Error during pipeline disposal:", error);
+      try {
+        originalDispose();
+      } catch (disposeError) {
+        console.error("Error calling original dispose:", disposeError);
+      }
     }
-    originalDispose();
   };
   return pipeline;
 }