npm - @ottocode/web-sdk - Versions diffs - 0.1.315 → 0.1.316 - Mend

@ottocode/web-sdk 0.1.315 → 0.1.316

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (8) hide show

package/dist/components/index.js +70 -33
package/dist/components/index.js.map +4 -4
package/dist/hooks/index.js +69 -32
package/dist/hooks/index.js.map +3 -3
package/dist/hooks/useVoiceInput.d.ts.map +1 -1
package/dist/index.js +70 -33
package/dist/index.js.map +4 -4
package/package.json +3 -3

package/dist/hooks/useVoiceInput.d.ts.map CHANGED Viewed

	@@ -1 +1 @@
1	- {"version":3,"file":"useVoiceInput.d.ts","sourceRoot":"","sources":["../../src/hooks/useVoiceInput.ts"],"names":[],"mappings":"~~AA8BA~~,UAAU,oBAAoB;IAC7B,2DAA2D;IAC3D,YAAY,CAAC,EAAE,CAAC,UAAU,EAAE,MAAM,EAAE,OAAO,EAAE,OAAO,KAAK,IAAI,CAAC;IAC9D,OAAO,CAAC,EAAE,CAAC,OAAO,EAAE,MAAM,KAAK,IAAI,CAAC;IACpC,cAAc,CAAC,EAAE,MAAM,IAAI,CAAC;IAC5B,IAAI,CAAC,EAAE,MAAM,CAAC;CACd;AAED,UAAU,mBAAmB;IAC5B,WAAW,EAAE,OAAO,CAAC;IACrB,cAAc,EAAE,OAAO,CAAC;IACxB,WAAW,EAAE,OAAO,CAAC;IACrB,QAAQ,EAAE,YAAY,GAAG,IAAI,CAAC;IAC9B,KAAK,EAAE,MAAM,GAAG,IAAI,CAAC;IACrB,KAAK,EAAE,MAAM,OAAO,CAAC,IAAI,CAAC,CAAC;IAC3B,IAAI,EAAE,MAAM,IAAI,CAAC;CACjB;AAqED;;;;;GAKG;AACH,wBAAgB,aAAa,CAAC,EAC7B,YAAY,EACZ,OAAO,EACP,cAAc,EACd,IAAc,GACd,GAAE,oBAAyB,GAAG,mBAAmB,~~CAmSjD~~"}
1	+ {"version":3,"file":"useVoiceInput.d.ts","sourceRoot":"","sources":["../../src/hooks/useVoiceInput.ts"],"names":[],"mappings":"AA+BA,UAAU,oBAAoB;IAC7B,2DAA2D;IAC3D,YAAY,CAAC,EAAE,CAAC,UAAU,EAAE,MAAM,EAAE,OAAO,EAAE,OAAO,KAAK,IAAI,CAAC;IAC9D,OAAO,CAAC,EAAE,CAAC,OAAO,EAAE,MAAM,KAAK,IAAI,CAAC;IACpC,cAAc,CAAC,EAAE,MAAM,IAAI,CAAC;IAC5B,IAAI,CAAC,EAAE,MAAM,CAAC;CACd;AAED,UAAU,mBAAmB;IAC5B,WAAW,EAAE,OAAO,CAAC;IACrB,cAAc,EAAE,OAAO,CAAC;IACxB,WAAW,EAAE,OAAO,CAAC;IACrB,QAAQ,EAAE,YAAY,GAAG,IAAI,CAAC;IAC9B,KAAK,EAAE,MAAM,GAAG,IAAI,CAAC;IACrB,KAAK,EAAE,MAAM,OAAO,CAAC,IAAI,CAAC,CAAC;IAC3B,IAAI,EAAE,MAAM,IAAI,CAAC;CACjB;AAqED;;;;;GAKG;AACH,wBAAgB,aAAa,CAAC,EAC7B,YAAY,EACZ,OAAO,EACP,cAAc,EACd,IAAc,GACd,GAAE,oBAAyB,GAAG,mBAAmB,CAgUjD"}

package/dist/index.js CHANGED Viewed

@@ -5503,6 +5503,7 @@ ${text.slice(lineStart)}`;
 import { useCallback as useCallback7, useEffect as useEffect12, useRef as useRef4, useState as useState5 } from "react";
 var TARGET_SAMPLE_RATE = 16000;
 var PCM_FRAME_BYTES = 3200;
+var PROCESSOR_BUFFER_SIZE = 4096;
 function getAudioContextConstructor() {
   if (typeof window === "undefined")
     return null;
@@ -5647,8 +5648,7 @@ function useVoiceInput({
   }, []);
   const handleAudioProcess = useCallback7((event) => {
     const audioContext = audioContextRef.current;
-    const socket = socketRef.current;
-    if (!audioContext || !socket || socket.readyState !== WebSocket.OPEN || stoppingRef.current) {
+    if (!audioContext || stoppingRef.current) {
       return;
     }
     const input = event.inputBuffer.getChannelData(0);
@@ -5680,9 +5680,53 @@ function useVoiceInput({
     setIsTranscribing(false);
     stoppingRef.current = false;
     try {
-      const status = await apiClient.getDictationStatus();
+      const streamPromise = navigator.mediaDevices.getUserMedia({
+        audio: {
+          echoCancellation: true,
+          noiseSuppression: true,
+          autoGainControl: true
+        }
+      });
+      const statusPromise = apiClient.getDictationStatus().then((status2) => ({ status: status2 }), (error2) => ({ error: error2 }));
+      const stream = await streamPromise;
+      if (stoppingRef.current) {
+        for (const track of stream.getTracks())
+          track.stop();
+        return;
+      }
+      streamRef.current = stream;
+      const AudioContextCtor = getAudioContextConstructor();
+      if (!AudioContextCtor)
+        throw new Error("AudioContext is unavailable");
+      const audioContext = new AudioContextCtor;
+      audioContextRef.current = audioContext;
+      const source = audioContext.createMediaStreamSource(stream);
+      const analyserNode = audioContext.createAnalyser();
+      analyserNode.fftSize = 256;
+      analyserNode.smoothingTimeConstant = 0.55;
+      const processor = audioContext.createScriptProcessor(PROCESSOR_BUFFER_SIZE, 1, 1);
+      processor.onaudioprocess = handleAudioProcess;
+      source.connect(analyserNode);
+      source.connect(processor);
+      processor.connect(audioContext.destination);
+      sourceRef.current = source;
+      processorRef.current = processor;
+      if (audioContext.state === "suspended") {
+        await audioContext.resume();
+      }
+      if (stoppingRef.current)
+        return;
+      setAnalyser(analyserNode);
+      setIsListening(true);
+      const statusResult = await statusPromise;
+      if ("error" in statusResult)
+        throw statusResult.error;
+      const { status } = statusResult;
+      if (stoppingRef.current)
+        return;
       const model = status.models.find((item) => item.id === status.defaultModel);
       if (!model?.installed) {
+        cleanup();
         handleMissingModel();
         return;
       }
@@ -5690,7 +5734,10 @@ function useVoiceInput({
         model: status.defaultModel,
         language: toLanguageCode(lang)
       });
+      if (stoppingRef.current)
+        return;
       if (!session.modelInstalled) {
+        cleanup();
         handleMissingModel();
         return;
       }
@@ -5703,7 +5750,6 @@ function useVoiceInput({
           reject(new Error("Timed out connecting to local dictation"));
         }, 5000);
         socket.onopen = () => {
-          window.clearTimeout(timeout);
           socket.send(JSON.stringify({
             type: "start",
             model: session.model,
@@ -5715,7 +5761,23 @@ function useVoiceInput({
             },
             partialResults: false
           }));
-          resolve();
+        };
+        socket.onmessage = (event) => {
+          if (typeof event.data !== "string")
+            return;
+          const payload = parseServerEvent(event.data);
+          if (!payload)
+            return;
+          if (payload.type === "ready") {
+            window.clearTimeout(timeout);
+            flushFrameBuffer(false);
+            resolve();
+            return;
+          }
+          if (payload.type === "error") {
+            window.clearTimeout(timeout);
+            reject(new Error(payload.message));
+          }
         };
         socket.onerror = () => {
           window.clearTimeout(timeout);
@@ -5743,32 +5805,6 @@ function useVoiceInput({
           setIsListening(false);
         setIsTranscribing(false);
       };
-      const stream = await navigator.mediaDevices.getUserMedia({
-        audio: {
-          echoCancellation: true,
-          noiseSuppression: true,
-          autoGainControl: true
-        }
-      });
-      streamRef.current = stream;
-      const AudioContextCtor = getAudioContextConstructor();
-      if (!AudioContextCtor)
-        throw new Error("AudioContext is unavailable");
-      const audioContext = new AudioContextCtor;
-      const source = audioContext.createMediaStreamSource(stream);
-      const analyserNode = audioContext.createAnalyser();
-      analyserNode.fftSize = 256;
-      analyserNode.smoothingTimeConstant = 0.55;
-      const processor = audioContext.createScriptProcessor(4096, 1, 1);
-      processor.onaudioprocess = handleAudioProcess;
-      source.connect(analyserNode);
-      source.connect(processor);
-      processor.connect(audioContext.destination);
-      audioContextRef.current = audioContext;
-      sourceRef.current = source;
-      processorRef.current = processor;
-      setAnalyser(analyserNode);
-      setIsListening(true);
     } catch (err) {
       const name = err instanceof Error ? err.name : "";
       const msg = name === "NotAllowedError" ? "Microphone permission denied" : err instanceof Error ? err.message : "Could not start voice input";
@@ -5780,6 +5816,7 @@ function useVoiceInput({
     emitError,
     handleAudioProcess,
     handleMissingModel,
+    flushFrameBuffer,
     isSupported,
     lang
   ]);
@@ -42498,7 +42535,7 @@ var ProviderSetupStep = memo75(function ProviderSetupStep2({
                                 className: "flex items-center gap-2 p-3 bg-card border border-ring rounded-xl overflow-hidden",
                                 children: [
                                   /* @__PURE__ */ jsx154("div", {
-                                    className: "shrink-0",
+                                    className: "shrink-0 flex items-center",
                                     children: /* @__PURE__ */ jsx154(ProviderLogo, {
                                       provider: id,
                                       size: 18
@@ -46640,4 +46677,4 @@ export {
   API_BASE_URL
 };
-//# debugId=5221E4EC6E1F50B064756E2164756E21
+//# debugId=996FED05264406DC64756E2164756E21