npm - voice-router-dev - Versions diffs - 0.8.7 → 0.8.9 - Mend

voice-router-dev 0.8.7 → 0.8.9

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (22) hide show

package/CHANGELOG.md +34 -0
package/dist/constants.d.mts +1 -1
package/dist/constants.d.ts +1 -1
package/dist/{field-configs-2c1-pid1.d.mts → field-configs-CSOt3yc9.d.mts} +6194 -6194
package/dist/{field-configs-2c1-pid1.d.ts → field-configs-CSOt3yc9.d.ts} +6194 -6194
package/dist/field-configs.d.mts +1 -1
package/dist/field-configs.d.ts +1 -1
package/dist/index.d.mts +763 -716
package/dist/index.d.ts +763 -716
package/dist/index.js +427 -34
package/dist/index.mjs +427 -34
package/dist/{provider-metadata-MDUUEuqF.d.mts → provider-metadata-BJ29OPW1.d.mts} +6 -6
package/dist/{provider-metadata-_gUWlRXS.d.ts → provider-metadata-D1d-9cng.d.ts} +6 -6
package/dist/provider-metadata.d.mts +1 -1
package/dist/provider-metadata.d.ts +1 -1
package/dist/provider-metadata.js +1 -1
package/dist/provider-metadata.mjs +1 -1
package/dist/{speechToTextChunkResponseModel-o8_dfC4c.d.ts → speechToTextChunkResponseModel-B4kVoFc3.d.ts} +97 -6
package/dist/{speechToTextChunkResponseModel-BYhlHNqP.d.mts → speechToTextChunkResponseModel-DmajV4F-.d.mts} +97 -6
package/dist/webhooks.d.mts +2 -2
package/dist/webhooks.d.ts +2 -2
package/package.json +1 -1

package/CHANGELOG.md CHANGED Viewed

@@ -7,8 +7,42 @@ and this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0
 ## [0.8.7] - 2026-04-18
+### Added
+#### Speechmatics: Real-Time Streaming (`transcribeStream()`)
+Speechmatics now supports WebSocket-based real-time transcription via `wss://{region}.rt.speechmatics.com/v2`. The adapter follows the same pattern as Deepgram/Gladia/AssemblyAI streaming.
+**Protocol flow:**
+1. Connect with `Authorization: Bearer` header
+2. Send `StartRecognition` JSON with `audio_format` + `transcription_config`
+3. Wait for `RecognitionStarted` acknowledgment
+4. Stream binary audio frames via `sendAudio()`
+5. Receive `AddPartialTranscript` (partials) and `AddTranscript` (finals)
+6. `EndOfUtterance` boundaries trigger `onUtterance()` callback
+7. `EndOfStream` → `EndOfTranscript` for clean shutdown
+**Streaming options** (`speechmaticsStreaming`): `encoding`, `sampleRate`, `language`, `domain`, `operatingPoint`, `maxDelay`, `maxDelayMode`, `enablePartials`, `enableEntities`, `diarization`, `maxSpeakers`, `additionalVocab`, `conversationConfig`, `region`.
+**Type changes:**
+- `SpeechmaticsCapabilities.streaming` is now `true` — Speechmatics is included in `StreamingProviderType`
+- `SpeechmaticsStreamingOptions` added to `ProviderStreamingOptions` union and `StreamingOptionsForProvider<P>` conditional type
+- `StreamingOptions.speechmaticsStreaming` field added
 ### Fixed
+#### Soniox: Fix Streaming WebSocket Initialization
+Three bugs in the Soniox streaming adapter:
+| Bug | Before (broken) | After (fixed) |
+|-----|-----------------|----------------|
+| **Init message** | Config sent as URL query params | JSON text frame sent after `ws.onopen` (Soniox requires first frame to be JSON) |
+| **Default model** | `stt-rt-preview` (deprecated/removed) | `stt-rt-v4` |
+| **Close detection** | 1s threshold for early-close detection | 5s threshold (Soniox takes ~3s to close) |
+The JSON init frame now includes `api_key`, `model`, `audio_format`, `sample_rate`, `num_channels`, and all optional config (diarization, language hints, context, etc.).
 #### Speechmatics: Fix Content-Type for URL-Based Batch Transcription
 Speechmatics `POST /v2/jobs` always requires `multipart/form-data`, but the URL path was sending a JSON body with `Content-Type: application/json`, causing HTTP 400 errors.

package/dist/constants.d.mts CHANGED Viewed

@@ -3413,7 +3413,7 @@ declare const OpenAIModel: {
     readonly "whisper-1": "whisper-1";
 };
 declare const OpenAIModelCodes: readonly ["gpt-4o-mini-realtime-preview", "gpt-4o-mini-realtime-preview-2024-12-17", "gpt-4o-mini-transcribe", "gpt-4o-mini-transcribe-2025-12-15", "gpt-4o-realtime-preview", "gpt-4o-realtime-preview-2024-10-01", "gpt-4o-realtime-preview-2024-12-17", "gpt-4o-realtime-preview-2025-06-03", "gpt-4o-transcribe", "gpt-4o-transcribe-diarize", "gpt-audio-1.5", "gpt-audio-mini", "gpt-audio-mini-2025-10-06", "gpt-audio-mini-2025-12-15", "gpt-realtime", "gpt-realtime-1.5", "gpt-realtime-2025-08-28", "gpt-realtime-mini", "gpt-realtime-mini-2025-10-06", "gpt-realtime-mini-2025-12-15", "whisper-1"];
-declare const OpenAIModelLabels: Record<"gpt-4o-mini-transcribe" | "gpt-4o-mini-transcribe-2025-12-15" | "gpt-4o-transcribe" | "gpt-4o-transcribe-diarize" | "whisper-1" | "gpt-4o-mini-realtime-preview" | "gpt-4o-mini-realtime-preview-2024-12-17" | "gpt-4o-realtime-preview" | "gpt-4o-realtime-preview-2024-10-01" | "gpt-4o-realtime-preview-2024-12-17" | "gpt-4o-realtime-preview-2025-06-03" | "gpt-audio-1.5" | "gpt-audio-mini" | "gpt-audio-mini-2025-10-06" | "gpt-audio-mini-2025-12-15" | "gpt-realtime" | "gpt-realtime-1.5" | "gpt-realtime-2025-08-28" | "gpt-realtime-mini" | "gpt-realtime-mini-2025-10-06" | "gpt-realtime-mini-2025-12-15", string>;
+declare const OpenAIModelLabels: Record<"whisper-1" | "gpt-4o-transcribe" | "gpt-4o-mini-transcribe" | "gpt-4o-mini-transcribe-2025-12-15" | "gpt-4o-transcribe-diarize" | "gpt-4o-mini-realtime-preview" | "gpt-4o-mini-realtime-preview-2024-12-17" | "gpt-4o-realtime-preview" | "gpt-4o-realtime-preview-2024-10-01" | "gpt-4o-realtime-preview-2024-12-17" | "gpt-4o-realtime-preview-2025-06-03" | "gpt-audio-1.5" | "gpt-audio-mini" | "gpt-audio-mini-2025-10-06" | "gpt-audio-mini-2025-12-15" | "gpt-realtime" | "gpt-realtime-1.5" | "gpt-realtime-2025-08-28" | "gpt-realtime-mini" | "gpt-realtime-mini-2025-10-06" | "gpt-realtime-mini-2025-12-15", string>;
 /**
  * OpenAI Realtime API models (streaming)
  * @see scripts/generate-openai-models.js

package/dist/constants.d.ts CHANGED Viewed

@@ -3413,7 +3413,7 @@ declare const OpenAIModel: {
     readonly "whisper-1": "whisper-1";
 };
 declare const OpenAIModelCodes: readonly ["gpt-4o-mini-realtime-preview", "gpt-4o-mini-realtime-preview-2024-12-17", "gpt-4o-mini-transcribe", "gpt-4o-mini-transcribe-2025-12-15", "gpt-4o-realtime-preview", "gpt-4o-realtime-preview-2024-10-01", "gpt-4o-realtime-preview-2024-12-17", "gpt-4o-realtime-preview-2025-06-03", "gpt-4o-transcribe", "gpt-4o-transcribe-diarize", "gpt-audio-1.5", "gpt-audio-mini", "gpt-audio-mini-2025-10-06", "gpt-audio-mini-2025-12-15", "gpt-realtime", "gpt-realtime-1.5", "gpt-realtime-2025-08-28", "gpt-realtime-mini", "gpt-realtime-mini-2025-10-06", "gpt-realtime-mini-2025-12-15", "whisper-1"];
-declare const OpenAIModelLabels: Record<"gpt-4o-mini-transcribe" | "gpt-4o-mini-transcribe-2025-12-15" | "gpt-4o-transcribe" | "gpt-4o-transcribe-diarize" | "whisper-1" | "gpt-4o-mini-realtime-preview" | "gpt-4o-mini-realtime-preview-2024-12-17" | "gpt-4o-realtime-preview" | "gpt-4o-realtime-preview-2024-10-01" | "gpt-4o-realtime-preview-2024-12-17" | "gpt-4o-realtime-preview-2025-06-03" | "gpt-audio-1.5" | "gpt-audio-mini" | "gpt-audio-mini-2025-10-06" | "gpt-audio-mini-2025-12-15" | "gpt-realtime" | "gpt-realtime-1.5" | "gpt-realtime-2025-08-28" | "gpt-realtime-mini" | "gpt-realtime-mini-2025-10-06" | "gpt-realtime-mini-2025-12-15", string>;
+declare const OpenAIModelLabels: Record<"whisper-1" | "gpt-4o-transcribe" | "gpt-4o-mini-transcribe" | "gpt-4o-mini-transcribe-2025-12-15" | "gpt-4o-transcribe-diarize" | "gpt-4o-mini-realtime-preview" | "gpt-4o-mini-realtime-preview-2024-12-17" | "gpt-4o-realtime-preview" | "gpt-4o-realtime-preview-2024-10-01" | "gpt-4o-realtime-preview-2024-12-17" | "gpt-4o-realtime-preview-2025-06-03" | "gpt-audio-1.5" | "gpt-audio-mini" | "gpt-audio-mini-2025-10-06" | "gpt-audio-mini-2025-12-15" | "gpt-realtime" | "gpt-realtime-1.5" | "gpt-realtime-2025-08-28" | "gpt-realtime-mini" | "gpt-realtime-mini-2025-10-06" | "gpt-realtime-mini-2025-12-15", string>;
 /**
  * OpenAI Realtime API models (streaming)
  * @see scripts/generate-openai-models.js