npm - @djangocfg/ui-tools - Versions diffs - 2.1.381 → 2.1.382 - Mend

@djangocfg/ui-tools 2.1.381 → 2.1.382

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (183) hide show

package/README.md +132 -899
package/dist/ChatRoot-6IZFM5HM.mjs +5 -0
package/dist/{ChatRoot-EJC5Y2YM.cjs.map → ChatRoot-6IZFM5HM.mjs.map} +1 -1
package/dist/ChatRoot-LW4XNIKP.cjs +14 -0
package/dist/{ChatRoot-QOSKJPM6.mjs.map → ChatRoot-LW4XNIKP.cjs.map} +1 -1
package/dist/DictationField-2ZLQWLYV.mjs +4 -0
package/dist/DictationField-2ZLQWLYV.mjs.map +1 -0
package/dist/DictationField-IPPJ54CU.cjs +13 -0
package/dist/DictationField-IPPJ54CU.cjs.map +1 -0
package/dist/{DocsLayout-2YKPXZYO.mjs → DocsLayout-2P3ONDWJ.mjs} +3 -3
package/dist/{DocsLayout-2YKPXZYO.mjs.map → DocsLayout-2P3ONDWJ.mjs.map} +1 -1
package/dist/{DocsLayout-Q4KS3QWW.cjs → DocsLayout-2YZNS5VK.cjs} +8 -8
package/dist/{DocsLayout-Q4KS3QWW.cjs.map → DocsLayout-2YZNS5VK.cjs.map} +1 -1
package/dist/chunk-4LXG3NBV.mjs +833 -0
package/dist/chunk-4LXG3NBV.mjs.map +1 -0
package/dist/{chunk-XACCHZH2.cjs → chunk-FIRK5CEH.cjs} +42 -4
package/dist/chunk-FIRK5CEH.cjs.map +1 -0
package/dist/{chunk-NWUT327A.mjs → chunk-HIK6BPL7.mjs} +38 -5
package/dist/chunk-HIK6BPL7.mjs.map +1 -0
package/dist/chunk-KMSBGNVC.cjs +835 -0
package/dist/chunk-KMSBGNVC.cjs.map +1 -0
package/dist/chunk-OZAU3QWD.cjs +2493 -0
package/dist/chunk-OZAU3QWD.cjs.map +1 -0
package/dist/chunk-UWVP6LCW.mjs +2447 -0
package/dist/chunk-UWVP6LCW.mjs.map +1 -0
package/dist/index.cjs +1532 -100
package/dist/index.cjs.map +1 -1
package/dist/index.d.cts +1148 -107
package/dist/index.d.ts +1148 -107
package/dist/index.mjs +1421 -51
package/dist/index.mjs.map +1 -1
package/package.json +16 -8
package/src/audio-assets.d.ts +8 -0
package/src/components/markdown/MarkdownMessage/CollapseToggle.tsx +3 -1
package/src/components/markdown/MarkdownMessage/components.tsx +2 -5
package/src/stories/index.ts +32 -2
package/src/tools/Chat/README.md +347 -530
package/src/tools/Chat/components/Attachments.tsx +6 -1
package/src/tools/Chat/components/ChatRoot.tsx +30 -2
package/src/tools/Chat/components/Composer.tsx +20 -3
package/src/tools/Chat/components/ErrorBanner.tsx +7 -3
package/src/tools/Chat/components/MessageActions.tsx +3 -1
package/src/tools/Chat/components/MessageBubble.tsx +6 -5
package/src/tools/Chat/components/MessageList.tsx +87 -1
package/src/tools/Chat/components/ToolCalls.tsx +21 -3
package/src/tools/Chat/context/ChatProvider.tsx +21 -3
package/src/tools/Chat/core/audio/audioBus.ts +10 -163
package/src/tools/Chat/core/audio/defaults.ts +43 -0
package/src/tools/Chat/core/audio/index.ts +1 -0
package/src/tools/Chat/core/audio/preferences.ts +5 -59
package/src/tools/Chat/core/audio/sounds/error.mp3 +0 -0
package/src/tools/Chat/core/audio/sounds/mention.mp3 +0 -0
package/src/tools/Chat/core/audio/sounds/notification.mp3 +0 -0
package/src/tools/Chat/core/audio/sounds/received.mp3 +0 -0
package/src/tools/Chat/core/audio/sounds/sent.mp3 +0 -0
package/src/tools/Chat/core/audio/sounds/start.mp3 +0 -0
package/src/tools/Chat/core/audio/types.ts +28 -0
package/src/tools/Chat/core/reducer.ts +33 -0
package/src/tools/Chat/core/transport/index.ts +13 -0
package/src/tools/Chat/core/transport/mappers/index.ts +6 -0
package/src/tools/Chat/core/transport/mappers/pydantic-ai.ts +142 -0
package/src/tools/Chat/core/transport/pydantic-ai-transport.ts +208 -0
package/src/tools/Chat/core/transport/sse.ts +18 -5
package/src/tools/Chat/hooks/index.ts +25 -0
package/src/tools/Chat/hooks/useAutoFocusOnStreamEnd.ts +5 -3
package/src/tools/Chat/hooks/useChat.ts +28 -0
package/src/tools/Chat/hooks/useChatAudio.ts +59 -180
package/src/tools/Chat/hooks/useChatDockPrefs.ts +74 -0
package/src/tools/Chat/hooks/useChatReset.ts +70 -0
package/src/tools/Chat/hooks/useChatUnread.ts +87 -0
package/src/tools/Chat/hooks/useFocusOnEmptyClick.ts +111 -0
package/src/tools/Chat/hooks/useVisitorFingerprint.ts +48 -0
package/src/tools/Chat/index.ts +69 -1
package/src/tools/Chat/launcher/ChatDock.tsx +263 -0
package/src/tools/Chat/launcher/ChatFAB.tsx +349 -0
package/src/tools/Chat/launcher/ChatGreeting.tsx +200 -0
package/src/tools/Chat/launcher/ChatHeader.tsx +76 -0
package/src/tools/Chat/launcher/ChatHeaderActionButton.tsx +87 -0
package/src/tools/Chat/launcher/ChatHeaderAudioToggle.tsx +47 -0
package/src/tools/Chat/launcher/ChatHeaderLanguageButton.tsx +179 -0
package/src/tools/Chat/launcher/ChatHeaderModeToggle.tsx +57 -0
package/src/tools/Chat/launcher/ChatHeaderResetButton.tsx +93 -0
package/src/tools/Chat/launcher/ChatLauncher.tsx +321 -0
package/src/tools/Chat/launcher/ChatUnreadPreview.tsx +197 -0
package/src/tools/Chat/launcher/index.ts +46 -0
package/src/tools/Chat/launcher/useChatPresence.ts +44 -0
package/src/tools/Chat/stories/01-basic.story.tsx +64 -0
package/src/tools/Chat/stories/02-bubbles.story.tsx +21 -0
package/src/tools/Chat/stories/03-tool-calls.story.tsx +59 -0
package/src/tools/Chat/stories/04-personas.story.tsx +78 -0
package/src/tools/Chat/stories/05-launcher.story.tsx +321 -0
package/src/tools/Chat/stories/06-header.story.tsx +147 -0
package/src/tools/Chat/stories/07-audio-actions.story.tsx +112 -0
package/src/tools/Chat/stories/shared/Frame.tsx +21 -0
package/src/tools/Chat/stories/shared/index.ts +5 -0
package/src/tools/Chat/stories/shared/messages.ts +39 -0
package/src/tools/Chat/stories/shared/personas.ts +13 -0
package/src/tools/Chat/stories/shared/seeds.ts +92 -0
package/src/tools/Chat/stories/shared/transports.ts +36 -0
package/src/tools/Chat/styles/bubbleTokens.ts +71 -0
package/src/tools/Chat/styles/index.ts +16 -0
package/src/tools/Chat/styles/useChatStyles.ts +101 -0
package/src/tools/Chat/types/attachment.ts +25 -0
package/src/tools/Chat/types/config.ts +48 -0
package/src/tools/Chat/types/events.ts +35 -0
package/src/tools/Chat/types/index.ts +34 -0
package/src/tools/Chat/types/labels.ts +38 -0
package/src/tools/Chat/types/message.ts +32 -0
package/src/tools/Chat/types/persona.ts +31 -0
package/src/tools/Chat/types/session.ts +43 -0
package/src/tools/Chat/types/tool-call.ts +17 -0
package/src/tools/Chat/types/transport.ts +28 -0
package/src/tools/Chat/types.ts +5 -240
package/src/tools/MarkdownEditor/MarkdownEditor.tsx +50 -14
package/src/tools/MarkdownEditor/index.ts +1 -1
package/src/tools/SpeechRecognition/README.md +336 -0
package/src/tools/SpeechRecognition/__tests__/ids.test.ts +15 -0
package/src/tools/SpeechRecognition/__tests__/language.test.ts +59 -0
package/src/tools/SpeechRecognition/__tests__/reducer.test.ts +71 -0
package/src/tools/SpeechRecognition/__tests__/transcript.test.ts +52 -0
package/src/tools/SpeechRecognition/components/DevicePicker.tsx +49 -0
package/src/tools/SpeechRecognition/components/DictationButton.tsx +93 -0
package/src/tools/SpeechRecognition/components/EngineBadge.tsx +30 -0
package/src/tools/SpeechRecognition/components/ErrorBanner.tsx +52 -0
package/src/tools/SpeechRecognition/components/LanguagePicker.tsx +63 -0
package/src/tools/SpeechRecognition/components/MicMeter.tsx +63 -0
package/src/tools/SpeechRecognition/components/PushToTalkHint.tsx +51 -0
package/src/tools/SpeechRecognition/components/TranscriptView.tsx +55 -0
package/src/tools/SpeechRecognition/components/index.ts +16 -0
package/src/tools/SpeechRecognition/context/SpeechRecognitionProvider.tsx +47 -0
package/src/tools/SpeechRecognition/context/index.ts +6 -0
package/src/tools/SpeechRecognition/core/audio/defaults.ts +24 -0
package/src/tools/SpeechRecognition/core/engine/external.ts +222 -0
package/src/tools/SpeechRecognition/core/engine/http.ts +147 -0
package/src/tools/SpeechRecognition/core/engine/index.ts +52 -0
package/src/tools/SpeechRecognition/core/engine/mediarecorder.ts +105 -0
package/src/tools/SpeechRecognition/core/engine/websocket.ts +211 -0
package/src/tools/SpeechRecognition/core/engine/webspeech.ts +188 -0
package/src/tools/SpeechRecognition/core/ids.ts +11 -0
package/src/tools/SpeechRecognition/core/index.ts +14 -0
package/src/tools/SpeechRecognition/core/language.ts +78 -0
package/src/tools/SpeechRecognition/core/languages-catalog.ts +229 -0
package/src/tools/SpeechRecognition/core/logger.ts +3 -0
package/src/tools/SpeechRecognition/core/reducer.ts +105 -0
package/src/tools/SpeechRecognition/core/transcript.ts +36 -0
package/src/tools/SpeechRecognition/hooks/index.ts +14 -0
package/src/tools/SpeechRecognition/hooks/useDictation.ts +59 -0
package/src/tools/SpeechRecognition/hooks/useEnginePrefs.ts +15 -0
package/src/tools/SpeechRecognition/hooks/useMicDevices.ts +57 -0
package/src/tools/SpeechRecognition/hooks/useMicLevel.ts +52 -0
package/src/tools/SpeechRecognition/hooks/usePushToTalk.ts +85 -0
package/src/tools/SpeechRecognition/hooks/useResolvedLanguage.ts +28 -0
package/src/tools/SpeechRecognition/hooks/useSpeechLanguageInfo.ts +108 -0
package/src/tools/SpeechRecognition/hooks/useSpeechRecognition.ts +188 -0
package/src/tools/SpeechRecognition/hooks/useVoiceSupport.ts +78 -0
package/src/tools/SpeechRecognition/index.ts +82 -0
package/src/tools/SpeechRecognition/lazy.tsx +19 -0
package/src/tools/SpeechRecognition/store/index.ts +2 -0
package/src/tools/SpeechRecognition/store/prefsStore.ts +54 -0
package/src/tools/SpeechRecognition/stories/01-basic.story.tsx +32 -0
package/src/tools/SpeechRecognition/stories/02-dictation-field.story.tsx +32 -0
package/src/tools/SpeechRecognition/stories/03-push-to-talk.story.tsx +27 -0
package/src/tools/SpeechRecognition/stories/04-mic-meter.story.tsx +35 -0
package/src/tools/SpeechRecognition/stories/05-custom-engine-http.story.tsx +40 -0
package/src/tools/SpeechRecognition/stories/06-custom-engine-ws.story.tsx +48 -0
package/src/tools/SpeechRecognition/stories/07-language-device.story.tsx +57 -0
package/src/tools/SpeechRecognition/stories/08-errors-permissions.story.tsx +25 -0
package/src/tools/SpeechRecognition/stories/09-chat-voice.story.tsx +90 -0
package/src/tools/SpeechRecognition/stories/shared.tsx +123 -0
package/src/tools/SpeechRecognition/types.ts +133 -0
package/src/tools/SpeechRecognition/widgets/DictationField.tsx +105 -0
package/src/tools/SpeechRecognition/widgets/VoiceComposerSlot.tsx +305 -0
package/src/tools/SpeechRecognition/widgets/VoiceMessageRecorder.tsx +88 -0
package/src/tools/SpeechRecognition/widgets/index.ts +6 -0
package/dist/ChatRoot-EJC5Y2YM.cjs +0 -14
package/dist/ChatRoot-QOSKJPM6.mjs +0 -5
package/dist/chunk-NWUT327A.mjs.map +0 -1
package/dist/chunk-QLMKCSR6.mjs +0 -2420
package/dist/chunk-QLMKCSR6.mjs.map +0 -1
package/dist/chunk-SI5RD2GD.cjs +0 -2460
package/dist/chunk-SI5RD2GD.cjs.map +0 -1
package/dist/chunk-XACCHZH2.cjs.map +0 -1
package/src/tools/Chat/Chat.story.tsx +0 -1457

package/src/tools/SpeechRecognition/core/engine/http.ts ADDED Viewed

@@ -0,0 +1,147 @@
+/**
+ * HTTP engine — records audio with MediaRecorder and POSTs each chunk to
+ * a host-supplied URL. The host owns response parsing via `parse()`, so
+ * this engine works with OpenAI Whisper REST, custom Django/FastAPI
+ * endpoints, or anything else that takes audio and returns text.
+ */
+import { newSegmentId } from '../ids';
+import { sttLogger } from '../logger';
+import { createEngineBus } from './index';
+import { startMicCapture, type MicCaptureHandle } from './mediarecorder';
+import type {
+  EngineStartOptions,
+  RecognitionEngine,
+  RecognitionError,
+  Unsub,
+} from '../../types';
+export interface HttpEngineParseResult {
+  text: string;
+  isFinal: boolean;
+  /** Optional engine-provided confidence 0..1. */
+  confidence?: number;
+}
+export interface HttpEngineOptions {
+  /** Endpoint URL. Receives `POST` with the audio chunk as the body. */
+  url: string | ((language: string) => string);
+  /** Per-request headers, awaited each chunk so tokens can be refreshed. */
+  headers?: () => Promise<Record<string, string>> | Record<string, string>;
+  /** Chunk emission interval, ms. Default 750 — long enough for useful audio. */
+  chunkMs?: number;
+  /** Preferred MIME for the encoder. Probed against `MediaRecorder` support. */
+  mime?: string;
+  /** Parse the engine response — return null/undefined to skip emit. */
+  parse: (
+    resp: Response,
+  ) => Promise<HttpEngineParseResult | null | undefined> | HttpEngineParseResult | null | undefined;
+  /** Stable engine id for telemetry / UI badge. Default 'http'. */
+  id?: string;
+}
+export function createHttpEngine(opts: HttpEngineOptions): RecognitionEngine {
+  const bus = createEngineBus();
+  let capture: MicCaptureHandle | null = null;
+  let currentSegmentId: string | null = null;
+  let ctrl: AbortController | null = null;
+  let stopping = false;
+  async function sendChunk(blob: Blob, language: string): Promise<void> {
+    if (stopping) return;
+    const url = typeof opts.url === 'function' ? opts.url(language) : opts.url;
+    const headers = (await opts.headers?.()) ?? {};
+    try {
+      const resp = await fetch(url, {
+        method: 'POST',
+        headers,
+        body: blob,
+        signal: ctrl?.signal,
+      });
+      if (!resp.ok) {
+        bus.emit('error', {
+          code: 'network',
+          message: `STT endpoint returned ${resp.status}`,
+        });
+        return;
+      }
+      const parsed = await opts.parse(resp);
+      if (!parsed || !parsed.text) return;
+      if (!currentSegmentId) currentSegmentId = newSegmentId();
+      if (parsed.isFinal) {
+        bus.emit('final', parsed.text, currentSegmentId, parsed.confidence);
+        currentSegmentId = null;
+      } else {
+        bus.emit('partial', parsed.text, currentSegmentId);
+      }
+    } catch (cause) {
+      if ((cause as { name?: string })?.name === 'AbortError') return;
+      sttLogger.warn('[http] chunk send failed', cause);
+      bus.emit('error', {
+        code: 'network',
+        message: 'Failed to deliver audio chunk to STT endpoint.',
+        cause,
+      });
+    }
+  }
+  return {
+    id: opts.id ?? 'http',
+    isSupported:
+      typeof navigator !== 'undefined' &&
+      !!navigator.mediaDevices?.getUserMedia &&
+      typeof MediaRecorder !== 'undefined',
+    on(event, cb): Unsub {
+      return bus.on(event, cb);
+    },
+    async start(start: EngineStartOptions): Promise<void> {
+      if (capture) return;
+      stopping = false;
+      ctrl = new AbortController();
+      bus.emit('state', 'connecting');
+      try {
+        capture = await startMicCapture({
+          deviceId: start.deviceId,
+          mime: opts.mime,
+          chunkMs: opts.chunkMs ?? 750,
+          onChunk: (chunk) => {
+            void sendChunk(chunk, start.language);
+          },
+          onError: (err) => bus.emit('error', err),
+        });
+        bus.emit('state', 'listening');
+      } catch (cause) {
+        const err = cause as RecognitionError;
+        bus.emit('error', err);
+        bus.emit('state', 'error');
+        throw err;
+      }
+      start.signal?.addEventListener('abort', () => {
+        void this.stop();
+      });
+    },
+    async stop(): Promise<void> {
+      stopping = true;
+      bus.emit('state', 'closing');
+      ctrl?.abort();
+      ctrl = null;
+      await capture?.stop();
+      capture = null;
+      currentSegmentId = null;
+      bus.emit('state', 'closed');
+    },
+    abort(): void {
+      stopping = true;
+      ctrl?.abort();
+      ctrl = null;
+      capture?.stop().catch(() => undefined);
+      capture = null;
+      currentSegmentId = null;
+      bus.emit('state', 'closed');
+    },
+    getStream(): MediaStream | null {
+      return capture?.stream ?? null;
+    },
+  };
+}

package/src/tools/SpeechRecognition/core/engine/index.ts ADDED Viewed

@@ -0,0 +1,52 @@
+/**
+ * Tiny event-bus helper shared by every engine. Lets engine authors avoid
+ * re-implementing add/remove listener bookkeeping while keeping the
+ * public `RecognitionEngine.on(...)` contract identical across engines.
+ */
+import type { EngineEventMap, Unsub } from '../../types';
+type Listeners = {
+  [K in keyof EngineEventMap]: Set<EngineEventMap[K]>;
+};
+export function createEngineBus(): {
+  on: <K extends keyof EngineEventMap>(event: K, cb: EngineEventMap[K]) => Unsub;
+  emit: <K extends keyof EngineEventMap>(
+    event: K,
+    ...args: Parameters<EngineEventMap[K]>
+  ) => void;
+  clear: () => void;
+} {
+  const listeners: Listeners = {
+    partial: new Set(),
+    final: new Set(),
+    error: new Set(),
+    state: new Set(),
+  };
+  return {
+    on(event, cb) {
+      const set = listeners[event] as Set<typeof cb>;
+      set.add(cb);
+      return () => {
+        set.delete(cb);
+      };
+    },
+    emit(event, ...args) {
+      const set = listeners[event];
+      for (const cb of set) {
+        try {
+          (cb as (...a: unknown[]) => void)(...(args as unknown[]));
+        } catch {
+          // listener errors are isolated — never break the engine loop
+        }
+      }
+    },
+    clear() {
+      for (const key of Object.keys(listeners) as Array<keyof Listeners>) {
+        listeners[key].clear();
+      }
+    },
+  };
+}

package/src/tools/SpeechRecognition/core/engine/mediarecorder.ts ADDED Viewed

@@ -0,0 +1,105 @@
+/**
+ * Shared mic capture used by the HTTP and WebSocket engines.
+ *
+ * Probes the browser for a working `MediaRecorder` MIME type and emits
+ * `Blob` chunks on a steady interval. Picks the first supported MIME in
+ * order: `audio/webm;codecs=opus` → `audio/ogg;codecs=opus` →
+ * `audio/mp4;codecs=mp4a`. Falls back to engine default if none match.
+ *
+ * The capture also exposes the raw `MediaStream` so callers can wire up
+ * an `AnalyserNode` for the level meter without owning a second copy.
+ */
+import { sttLogger } from '../logger';
+import type { RecognitionError } from '../../types';
+const PREFERRED_MIMES = [
+  'audio/webm;codecs=opus',
+  'audio/ogg;codecs=opus',
+  'audio/mp4;codecs=mp4a',
+  'audio/webm',
+];
+export function pickMime(preferred?: string): string | undefined {
+  if (typeof MediaRecorder === 'undefined') return undefined;
+  const candidates = preferred ? [preferred, ...PREFERRED_MIMES] : PREFERRED_MIMES;
+  for (const mime of candidates) {
+    if (MediaRecorder.isTypeSupported(mime)) return mime;
+  }
+  return undefined;
+}
+export interface MicCaptureOptions {
+  deviceId?: string;
+  /** Override probed MIME — useful when the backend expects a specific codec. */
+  mime?: string;
+  /** Chunk emission interval, ms. Default 250. */
+  chunkMs?: number;
+  onChunk: (chunk: Blob) => void;
+  onError?: (err: RecognitionError) => void;
+}
+export interface MicCaptureHandle {
+  readonly stream: MediaStream;
+  readonly mime: string | undefined;
+  stop(): Promise<void>;
+}
+function toErr(code: RecognitionError['code'], message: string, cause?: unknown): RecognitionError {
+  return { code, message, cause };
+}
+export async function startMicCapture(
+  opts: MicCaptureOptions,
+): Promise<MicCaptureHandle> {
+  if (typeof navigator === 'undefined' || !navigator.mediaDevices?.getUserMedia) {
+    throw toErr('unsupported', 'getUserMedia is not available in this environment.');
+  }
+  if (typeof MediaRecorder === 'undefined') {
+    throw toErr('unsupported', 'MediaRecorder is not available in this environment.');
+  }
+  let stream: MediaStream;
+  try {
+    stream = await navigator.mediaDevices.getUserMedia({
+      audio: opts.deviceId ? { deviceId: { exact: opts.deviceId } } : true,
+      video: false,
+    });
+  } catch (cause) {
+    const name = (cause as { name?: string })?.name;
+    if (name === 'NotAllowedError' || name === 'SecurityError') {
+      throw toErr('permission-denied', 'Microphone permission denied.', cause);
+    }
+    if (name === 'NotFoundError' || name === 'OverconstrainedError') {
+      throw toErr('no-microphone', 'No microphone found matching the constraints.', cause);
+    }
+    throw toErr('unknown', 'Failed to access microphone.', cause);
+  }
+  const mime = pickMime(opts.mime);
+  const rec = mime ? new MediaRecorder(stream, { mimeType: mime }) : new MediaRecorder(stream);
+  rec.ondataavailable = (e) => {
+    if (e.data && e.data.size > 0) opts.onChunk(e.data);
+  };
+  rec.onerror = (e) => {
+    const err = toErr('engine', 'MediaRecorder error.', e);
+    sttLogger.warn('[capture] recorder error', e);
+    opts.onError?.(err);
+  };
+  rec.start(opts.chunkMs ?? 250);
+  return {
+    stream,
+    mime: mime ?? rec.mimeType,
+    async stop() {
+      const done = new Promise<void>((resolve) => {
+        rec.addEventListener('stop', () => resolve(), { once: true });
+      });
+      if (rec.state !== 'inactive') rec.stop();
+      stream.getTracks().forEach((t) => t.stop());
+      await done;
+    },
+  };
+}

package/src/tools/SpeechRecognition/core/engine/websocket.ts ADDED Viewed

@@ -0,0 +1,211 @@
+/**
+ * WebSocket engine — pushes recorded audio frames over a persistent socket
+ * and parses server responses through a host-supplied `parseMessage`
+ * callback. Works with Deepgram / AssemblyAI realtime endpoints or any
+ * custom gateway that speaks JSON or binary frames.
+ *
+ * Reconnect: simple exponential backoff capped at 5 s; the engine emits
+ * `state: 'connecting'` between attempts so UIs can show "reconnecting…".
+ */
+import { newSegmentId } from '../ids';
+import { sttLogger } from '../logger';
+import { createEngineBus } from './index';
+import { startMicCapture, type MicCaptureHandle } from './mediarecorder';
+import type {
+  EngineStartOptions,
+  RecognitionEngine,
+  RecognitionError,
+  Unsub,
+} from '../../types';
+export type WsParsedEvent =
+  | { kind: 'partial'; text: string; segmentId?: string; confidence?: number }
+  | { kind: 'final'; text: string; segmentId?: string; confidence?: number }
+  | { kind: 'error'; error: RecognitionError }
+  | { kind: 'ignore' };
+export interface WebSocketEngineOptions {
+  url: string | ((language: string) => Promise<string> | string);
+  protocols?: string[];
+  /** Chunk emission interval, ms. Default 250 for realtime feel. */
+  chunkMs?: number;
+  mime?: string;
+  /** Parse one frame (string or binary) into our normalised event shape. */
+  parseMessage: (data: string | ArrayBuffer) => WsParsedEvent;
+  /** Stable engine id for telemetry / UI badge. Default 'websocket'. */
+  id?: string;
+  /** Max reconnect attempts before giving up. Default 5. */
+  maxReconnect?: number;
+}
+const MIN_BACKOFF = 250;
+const MAX_BACKOFF = 5000;
+export function createWebSocketEngine(
+  opts: WebSocketEngineOptions,
+): RecognitionEngine {
+  const bus = createEngineBus();
+  let socket: WebSocket | null = null;
+  let capture: MicCaptureHandle | null = null;
+  let currentSegmentId: string | null = null;
+  let stopping = false;
+  let attempts = 0;
+  function emitParsed(parsed: WsParsedEvent): void {
+    switch (parsed.kind) {
+      case 'partial': {
+        const id = parsed.segmentId ?? currentSegmentId ?? newSegmentId();
+        currentSegmentId = id;
+        bus.emit('partial', parsed.text, id);
+        return;
+      }
+      case 'final': {
+        const id = parsed.segmentId ?? currentSegmentId ?? newSegmentId();
+        bus.emit('final', parsed.text, id, parsed.confidence);
+        currentSegmentId = null;
+        return;
+      }
+      case 'error':
+        bus.emit('error', parsed.error);
+        return;
+      case 'ignore':
+      default:
+        return;
+    }
+  }
+  async function openSocket(language: string): Promise<WebSocket> {
+    const url =
+      typeof opts.url === 'function' ? await opts.url(language) : opts.url;
+    const ws = new WebSocket(url, opts.protocols);
+    ws.binaryType = 'arraybuffer';
+    return ws;
+  }
+  async function connect(start: EngineStartOptions): Promise<void> {
+    if (stopping) return;
+    bus.emit('state', 'connecting');
+    let ws: WebSocket;
+    try {
+      ws = await openSocket(start.language);
+    } catch (cause) {
+      bus.emit('error', {
+        code: 'network',
+        message: 'Failed to open STT socket.',
+        cause,
+      });
+      return;
+    }
+    socket = ws;
+    ws.onopen = () => {
+      attempts = 0;
+      bus.emit('state', 'listening');
+    };
+    ws.onmessage = (e) => {
+      try {
+        const parsed = opts.parseMessage(e.data as string | ArrayBuffer);
+        emitParsed(parsed);
+      } catch (cause) {
+        sttLogger.warn('[ws] parseMessage threw', cause);
+      }
+    };
+    ws.onerror = () => {
+      bus.emit('error', { code: 'network', message: 'STT socket error.' });
+    };
+    ws.onclose = () => {
+      socket = null;
+      if (stopping) {
+        bus.emit('state', 'closed');
+        return;
+      }
+      attempts += 1;
+      const max = opts.maxReconnect ?? 5;
+      if (attempts > max) {
+        bus.emit('error', {
+          code: 'network',
+          message: `STT socket closed; gave up after ${max} attempts.`,
+        });
+        bus.emit('state', 'closed');
+        return;
+      }
+      const delay = Math.min(MIN_BACKOFF * 2 ** (attempts - 1), MAX_BACKOFF);
+      setTimeout(() => {
+        void connect(start);
+      }, delay);
+    };
+  }
+  return {
+    id: opts.id ?? 'websocket',
+    isSupported:
+      typeof WebSocket !== 'undefined' &&
+      typeof navigator !== 'undefined' &&
+      !!navigator.mediaDevices?.getUserMedia &&
+      typeof MediaRecorder !== 'undefined',
+    on(event, cb): Unsub {
+      return bus.on(event, cb);
+    },
+    async start(start: EngineStartOptions): Promise<void> {
+      if (capture) return;
+      stopping = false;
+      attempts = 0;
+      try {
+        capture = await startMicCapture({
+          deviceId: start.deviceId,
+          mime: opts.mime,
+          chunkMs: opts.chunkMs ?? 250,
+          onChunk: (chunk) => {
+            if (socket?.readyState === WebSocket.OPEN) {
+              chunk
+                .arrayBuffer()
+                .then((buf) => socket?.send(buf))
+                .catch((cause) => sttLogger.warn('[ws] send failed', cause));
+            }
+          },
+          onError: (err) => bus.emit('error', err),
+        });
+      } catch (cause) {
+        const err = cause as RecognitionError;
+        bus.emit('error', err);
+        bus.emit('state', 'error');
+        throw err;
+      }
+      await connect(start);
+      start.signal?.addEventListener('abort', () => {
+        void this.stop();
+      });
+    },
+    async stop(): Promise<void> {
+      stopping = true;
+      bus.emit('state', 'closing');
+      try {
+        socket?.close(1000, 'client-stop');
+      } catch {
+        // ignore
+      }
+      socket = null;
+      await capture?.stop();
+      capture = null;
+      currentSegmentId = null;
+      bus.emit('state', 'closed');
+    },
+    abort(): void {
+      stopping = true;
+      try {
+        socket?.close(4000, 'client-abort');
+      } catch {
+        // ignore
+      }
+      socket = null;
+      capture?.stop().catch(() => undefined);
+      capture = null;
+      currentSegmentId = null;
+      bus.emit('state', 'closed');
+    },
+    getStream(): MediaStream | null {
+      return capture?.stream ?? null;
+    },
+  };
+}

package/src/tools/SpeechRecognition/core/engine/webspeech.ts ADDED Viewed

@@ -0,0 +1,188 @@
+/**
+ * Default engine — wraps the browser's `SpeechRecognition` API.
+ *
+ * Lives behind the same `RecognitionEngine` contract every other engine
+ * implements. When the browser doesn't expose `SpeechRecognition`
+ * (Firefox, some mobile WebViews) `isSupported` is `false` and `start()`
+ * throws an `unsupported` error.
+ */
+import { newSegmentId } from '../ids';
+import { sttLogger } from '../logger';
+import { createEngineBus } from './index';
+import type {
+  EngineStartOptions,
+  RecognitionEngine,
+  RecognitionError,
+  RecognitionErrorCode,
+  Unsub,
+} from '../../types';
+// Minimal subset of the Web Speech API we actually rely on. Browsers
+// expose either `SpeechRecognition` (Edge / Safari new) or the older
+// `webkitSpeechRecognition` (Chrome). Both share the same shape.
+interface BrowserSpeechRecognition extends EventTarget {
+  lang: string;
+  interimResults: boolean;
+  continuous: boolean;
+  maxAlternatives: number;
+  start(): void;
+  stop(): void;
+  abort(): void;
+  onresult: ((e: BrowserSpeechRecognitionEvent) => void) | null;
+  onerror: ((e: BrowserSpeechRecognitionError) => void) | null;
+  onstart: (() => void) | null;
+  onend: (() => void) | null;
+}
+interface BrowserSpeechRecognitionResult {
+  isFinal: boolean;
+  0: { transcript: string; confidence: number };
+}
+interface BrowserSpeechRecognitionEvent extends Event {
+  resultIndex: number;
+  results: ArrayLike<BrowserSpeechRecognitionResult>;
+}
+interface BrowserSpeechRecognitionError extends Event {
+  error: string;
+  message?: string;
+}
+type Ctor = new () => BrowserSpeechRecognition;
+function resolveCtor(): Ctor | null {
+  if (typeof window === 'undefined') return null;
+  const w = window as unknown as {
+    SpeechRecognition?: Ctor;
+    webkitSpeechRecognition?: Ctor;
+  };
+  return w.SpeechRecognition ?? w.webkitSpeechRecognition ?? null;
+}
+const ERROR_MAP: Record<string, RecognitionErrorCode> = {
+  'no-speech': 'no-speech',
+  aborted: 'aborted',
+  'audio-capture': 'no-microphone',
+  network: 'network',
+  'not-allowed': 'permission-denied',
+  'service-not-allowed': 'permission-denied',
+  'bad-grammar': 'engine',
+  'language-not-supported': 'language',
+};
+export interface WebSpeechEngineOptions {
+  /** Whether the underlying recognition should be continuous. Default true. */
+  continuous?: boolean;
+  /** Max alternatives the engine should request. Default 1. */
+  maxAlternatives?: number;
+}
+export function createWebSpeechEngine(
+  opts: WebSpeechEngineOptions = {},
+): RecognitionEngine {
+  const Ctor = resolveCtor();
+  const bus = createEngineBus();
+  let instance: BrowserSpeechRecognition | null = null;
+  let currentSegmentId: string | null = null;
+  function teardown(): void {
+    if (!instance) return;
+    instance.onresult = null;
+    instance.onerror = null;
+    instance.onstart = null;
+    instance.onend = null;
+    instance = null;
+    currentSegmentId = null;
+  }
+  return {
+    id: 'webspeech',
+    isSupported: Ctor !== null,
+    on(event, cb): Unsub {
+      return bus.on(event, cb);
+    },
+    async start(start: EngineStartOptions): Promise<void> {
+      if (!Ctor) {
+        const err: RecognitionError = {
+          code: 'unsupported',
+          message: 'Web Speech API is not available in this browser.',
+        };
+        bus.emit('error', err);
+        throw err;
+      }
+      if (instance) {
+        sttLogger.debug('[webspeech] start() called while running — ignoring');
+        return;
+      }
+      bus.emit('state', 'connecting');
+      const rec = new Ctor();
+      rec.lang = start.language;
+      rec.interimResults = start.interim;
+      rec.continuous = opts.continuous ?? true;
+      rec.maxAlternatives = opts.maxAlternatives ?? 1;
+      rec.onstart = () => {
+        bus.emit('state', 'listening');
+      };
+      rec.onend = () => {
+        bus.emit('state', 'closed');
+        teardown();
+      };
+      rec.onerror = (e) => {
+        const code = ERROR_MAP[e.error] ?? 'engine';
+        const err: RecognitionError = {
+          code,
+          message: e.message || `Web Speech error: ${e.error}`,
+        };
+        bus.emit('error', err);
+      };
+      rec.onresult = (e) => {
+        for (let i = e.resultIndex; i < e.results.length; i += 1) {
+          const res = e.results[i];
+          const alt = res[0];
+          const text = alt.transcript;
+          if (!currentSegmentId) currentSegmentId = newSegmentId();
+          if (res.isFinal) {
+            bus.emit('final', text, currentSegmentId, alt.confidence);
+            currentSegmentId = null;
+          } else {
+            bus.emit('partial', text, currentSegmentId);
+          }
+        }
+      };
+      if (start.signal) {
+        start.signal.addEventListener('abort', () => {
+          rec.abort();
+        });
+      }
+      instance = rec;
+      try {
+        rec.start();
+      } catch (cause) {
+        const err: RecognitionError = {
+          code: 'engine',
+          message: 'Failed to start Web Speech recognition.',
+          cause,
+        };
+        bus.emit('error', err);
+        teardown();
+        throw err;
+      }
+    },
+    async stop(): Promise<void> {
+      if (!instance) return;
+      bus.emit('state', 'closing');
+      instance.stop();
+    },
+    abort(): void {
+      if (!instance) return;
+      instance.abort();
+    },
+  };
+}