npm - @absolutejs/voice - Versions diffs - 0.0.22-beta.483 → 0.0.22-beta.485 - Mend

@absolutejs/voice 0.0.22-beta.483 → 0.0.22-beta.485

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (7) hide show

package/dist/assistantMode.d.ts +22 -0
package/dist/index.d.ts +4 -0
package/dist/index.js +117 -9
package/dist/testing/index.js +35 -5
package/dist/types.d.ts +5 -0
package/dist/webhookVerification.d.ts +27 -0
package/package.json +1 -1

package/dist/assistantMode.d.ts ADDED Viewed

@@ -0,0 +1,22 @@
+import type { CreateVoiceSessionOptions, VoiceSessionRecord } from "./types";
+export type VoiceAssistantMode = "cascade" | "s2s";
+export type VoiceSemanticVADConfig = {
+    createResponseAutomatically?: boolean;
+    eagerness?: "auto" | "high" | "low" | "medium";
+    silenceDurationMs?: number;
+};
+export type VoiceAssistantModality = "audio" | "text";
+export declare const resolveVoiceAssistantMode: <TContext = unknown, TSession extends VoiceSessionRecord = VoiceSessionRecord, TResult = unknown>(options: Pick<CreateVoiceSessionOptions<TContext, TSession, TResult>, "realtime" | "stt" | "tts"> & {
+    assistantMode?: VoiceAssistantMode;
+}) => VoiceAssistantMode;
+export type VoiceAssistantModeDescriptor = {
+    hasRealtime: boolean;
+    hasSTT: boolean;
+    hasTTS: boolean;
+    mode: VoiceAssistantMode;
+    modalities: VoiceAssistantModality[];
+};
+export declare const describeVoiceAssistantMode: <TContext = unknown, TSession extends VoiceSessionRecord = VoiceSessionRecord, TResult = unknown>(options: Pick<CreateVoiceSessionOptions<TContext, TSession, TResult>, "realtime" | "stt" | "tts"> & {
+    assistantMode?: VoiceAssistantMode;
+    modalities?: ReadonlyArray<VoiceAssistantModality>;
+}) => VoiceAssistantModeDescriptor;

package/dist/index.d.ts CHANGED Viewed

@@ -77,7 +77,11 @@ export { DEFAULT_VOICE_REDACTION_PATTERNS, createVoiceTranscriptRedactor, redact
 export type { CreateVoiceTranscriptRedactorOptions, VoiceRedactionPattern, VoiceTranscriptRedactor, } from "./redaction";
 export { DEFAULT_VOICE_PRICE_BOOK, createVoiceCostAccountant, } from "./costAccounting";
 export type { CreateVoiceCostAccountantOptions, VoiceCostAccountant, VoiceCostBreakdown, VoiceCostLLMRecord, VoiceCostSTTRecord, VoiceCostTTSRecord, VoiceCostTelephonyRecord, VoicePriceBook, VoiceProviderRates, } from "./costAccounting";
+export { describeVoiceAssistantMode, resolveVoiceAssistantMode, } from "./assistantMode";
+export type { VoiceAssistantMode, VoiceAssistantModality, VoiceAssistantModeDescriptor, VoiceSemanticVADConfig, } from "./assistantMode";
 export { createPunctuationSemanticTurnDetector, createRegexSemanticTurnDetector, } from "./semanticTurn";
+export { VOICE_WEBHOOK_SIGNATURE_HEADER, VOICE_WEBHOOK_TIMESTAMP_HEADER, extractVoiceWebhookSignatureFromHeaders, signVoiceWebhookBody, verifyVoiceWebhookSignature, } from "./webhookVerification";
+export type { VoiceWebhookVerificationInput, VoiceWebhookVerificationReason, VoiceWebhookVerificationResult, } from "./webhookVerification";
 export type { CreatePunctuationSemanticTurnDetectorOptions, CreateRegexSemanticTurnDetectorOptions, VoiceSemanticTurnDetector, VoiceSemanticTurnInput, VoiceSemanticTurnVerdict, } from "./semanticTurn";
 export { createMonologueAMDDetector } from "./amdDetector";
 export type { MonologueAMDDetectorOptions, VoiceAMDDetector, VoiceAMDDetectorInput, VoiceAMDVerdict, } from "./amdDetector";

package/dist/index.js CHANGED Viewed

@@ -3440,6 +3440,28 @@ var createVoiceMemoryRecordingStore = () => {
   };
 };
+// src/assistantMode.ts
+var resolveVoiceAssistantMode = (options) => {
+  if (options.assistantMode) {
+    return options.assistantMode;
+  }
+  if (options.realtime) {
+    return "s2s";
+  }
+  return "cascade";
+};
+var describeVoiceAssistantMode = (options) => {
+  const mode = resolveVoiceAssistantMode(options);
+  const modalities = options.modalities ? Array.from(new Set(options.modalities)) : ["audio"];
+  return {
+    hasRealtime: Boolean(options.realtime),
+    hasSTT: Boolean(options.stt),
+    hasTTS: Boolean(options.tts),
+    modalities,
+    mode
+  };
+};
 // src/session.ts
 var DEFAULT_RECONNECT_TIMEOUT = 30000;
 var DEFAULT_MAX_RECONNECT_ATTEMPTS = 10;
@@ -4822,13 +4844,20 @@ var createVoiceSession = (options) => {
     if (!inputAdapter) {
       throw new Error("Voice session requires either an stt or realtime adapter.");
     }
-    const openedSession = await inputAdapter.open({
-      format: options.realtime ? options.realtimeInputFormat ?? DEFAULT_REALTIME_FORMAT : DEFAULT_FORMAT,
+    const openedSession = await (options.realtime ? options.realtime.open({
+      format: options.realtimeInputFormat ?? DEFAULT_REALTIME_FORMAT,
       languageStrategy: options.languageStrategy,
       lexicon,
+      modalities: options.modalities,
       phraseHints,
       sessionId: options.id
-    });
+    }) : inputAdapter.open({
+      format: DEFAULT_FORMAT,
+      languageStrategy: options.languageStrategy,
+      lexicon,
+      phraseHints,
+      sessionId: options.id
+    }));
     const generation = ++adapterGenerationCounter;
     sttSession = openedSession;
     activeAdapterGeneration = generation;
@@ -4998,9 +5027,10 @@ var createVoiceSession = (options) => {
       });
       await appendTrace({
         payload: {
+          assistantMode: resolveVoiceAssistantMode(options),
+          realtimeConfigured: Boolean(options.realtime),
           text: output.assistantText,
-          ttsConfigured: Boolean(options.tts),
-          realtimeConfigured: Boolean(options.realtime)
+          ttsConfigured: Boolean(options.tts)
         },
         session,
         turnId: turn.id,
@@ -35374,6 +35404,77 @@ var createRegexSemanticTurnDetector = (options) => {
     }
   };
 };
+// src/webhookVerification.ts
+var VOICE_WEBHOOK_SIGNATURE_HEADER = "x-absolutejs-signature";
+var VOICE_WEBHOOK_TIMESTAMP_HEADER = "x-absolutejs-timestamp";
+var toHex6 = (bytes) => Array.from(bytes, (byte) => byte.toString(16).padStart(2, "0")).join("");
+var timingSafeEqual3 = (left, right) => {
+  if (left.length !== right.length) {
+    return false;
+  }
+  let result = 0;
+  for (let index = 0;index < left.length; index += 1) {
+    result |= left.charCodeAt(index) ^ right.charCodeAt(index);
+  }
+  return result === 0;
+};
+var computeSignature = async (input) => {
+  const encoder2 = new TextEncoder;
+  const key = await crypto.subtle.importKey("raw", encoder2.encode(input.secret), { hash: "SHA-256", name: "HMAC" }, false, ["sign"]);
+  const payload = encoder2.encode(`${input.timestamp}.${input.body}`);
+  const signature = await crypto.subtle.sign("HMAC", key, payload);
+  return `sha256=${toHex6(new Uint8Array(signature))}`;
+};
+var signVoiceWebhookBody = async (input) => computeSignature(input);
+var verifyVoiceWebhookSignature = async (input) => {
+  if (!input.secret) {
+    return { ok: false, reason: "missing-secret" };
+  }
+  if (!input.signature) {
+    return { ok: false, reason: "missing-signature" };
+  }
+  if (!input.signature.startsWith("sha256=")) {
+    return { ok: false, reason: "unsupported-algorithm" };
+  }
+  if (!input.timestamp) {
+    return { ok: false, reason: "missing-timestamp" };
+  }
+  const timestampMs = Number(input.timestamp);
+  const toleranceMs = Math.max(0, input.toleranceMs ?? 5 * 60 * 1000);
+  if (!Number.isFinite(timestampMs) || toleranceMs > 0 && Math.abs((input.now ?? Date.now()) - timestampMs) > toleranceMs) {
+    return { ok: false, reason: "stale-timestamp" };
+  }
+  const expected = await computeSignature({
+    body: input.body,
+    secret: input.secret,
+    timestamp: input.timestamp
+  });
+  if (!timingSafeEqual3(expected, input.signature)) {
+    return { ok: false, reason: "signature-mismatch" };
+  }
+  return { ok: true };
+};
+var extractVoiceWebhookSignatureFromHeaders = (headers) => {
+  const get = (name) => {
+    if (headers instanceof Headers) {
+      return headers.get(name);
+    }
+    const lowerTarget = name.toLowerCase();
+    for (const [key, value] of Object.entries(headers)) {
+      if (key.toLowerCase() === lowerTarget) {
+        if (Array.isArray(value)) {
+          return value[0] ?? null;
+        }
+        return value ?? null;
+      }
+    }
+    return null;
+  };
+  return {
+    signature: get(VOICE_WEBHOOK_SIGNATURE_HEADER),
+    timestamp: get(VOICE_WEBHOOK_TIMESTAMP_HEADER)
+  };
+};
 // src/amdDetector.ts
 var createMonologueAMDDetector = (options = {}) => {
   const minMonologueMs = options.minMonologueMs ?? 8000;
@@ -41921,7 +42022,7 @@ var createVoiceMemoryStore = () => {
 };
 // src/opsWebhook.ts
 import { Elysia as Elysia66 } from "elysia";
-var toHex6 = (bytes) => Array.from(bytes, (byte) => byte.toString(16).padStart(2, "0")).join("");
+var toHex7 = (bytes) => Array.from(bytes, (byte) => byte.toString(16).padStart(2, "0")).join("");
 var signVoiceOpsWebhookBody = async (input) => {
   const encoder2 = new TextEncoder;
   const key = await crypto.subtle.importKey("raw", encoder2.encode(input.secret), {
@@ -41929,9 +42030,9 @@ var signVoiceOpsWebhookBody = async (input) => {
     name: "HMAC"
   }, false, ["sign"]);
   const signature = await crypto.subtle.sign("HMAC", key, encoder2.encode(`${input.timestamp}.${input.body}`));
-  return `sha256=${toHex6(new Uint8Array(signature))}`;
+  return `sha256=${toHex7(new Uint8Array(signature))}`;
 };
-var timingSafeEqual3 = (left, right) => {
+var timingSafeEqual4 = (left, right) => {
   const encoder2 = new TextEncoder;
   const leftBytes = encoder2.encode(left);
   const rightBytes = encoder2.encode(right);
@@ -42038,7 +42139,7 @@ var verifyVoiceOpsWebhookSignature = async (input) => {
     secret: input.secret,
     timestamp: input.timestamp
   });
-  if (!timingSafeEqual3(expected, input.signature)) {
+  if (!timingSafeEqual4(expected, input.signature)) {
     return {
       ok: false,
       reason: "invalid-signature"
@@ -45947,6 +46048,7 @@ export {
   voiceGuardrailPolicyPresets,
   voiceComplianceRedactionDefaults,
   voice,
+  verifyVoiceWebhookSignature,
   verifyVoiceTwilioWebhookSignature,
   verifyVoiceTelnyxWebhookSignature,
   verifyVoicePlivoWebhookSignature,
@@ -45990,6 +46092,7 @@ export {
   summarizeVoiceAssistantRuns,
   summarizeVoiceAssistantHealth,
   startVoiceOpsTask,
+  signVoiceWebhookBody,
   signVoiceTwilioWebhook,
   signVoicePlivoWebhook,
   shapeTelephonyAssistantText,
@@ -46034,6 +46137,7 @@ export {
   resolveVoiceDiagnosticsTraceFilter,
   resolveVoiceAuditTrailFilter,
   resolveVoiceAuditDeliveryFilter,
+  resolveVoiceAssistantMode,
   resolveVoiceAssistantMemoryNamespace,
   resolveTurnDetectionConfig,
   resolveLatestVoiceCallDebuggerSessionId,
@@ -46188,6 +46292,7 @@ export {
   filterVoiceAuditEvents,
   fetchVoiceProofTarget,
   failVoiceOpsTask,
+  extractVoiceWebhookSignatureFromHeaders,
   extractVoiceMediaPipelineIssueEntries,
   exportVoiceTrace,
   exportVoiceAuditTrail,
@@ -46228,6 +46333,7 @@ export {
   evaluateVoiceAgentSquadContractEvidence,
   encodeTwilioMulawBase64,
   encodePcmAsWav,
+  describeVoiceAssistantMode,
   deliverVoiceTraceEventsToSinks,
   deliverVoiceObservabilityExport,
   deliverVoiceMonitorIssueNotifications,
@@ -46733,6 +46839,8 @@ export {
   appendVoiceProviderRouterTraceEvent,
   appendVoiceIOProviderRouterTraceEvent,
   acknowledgeVoiceMonitorIssue,
+  VOICE_WEBHOOK_TIMESTAMP_HEADER,
+  VOICE_WEBHOOK_SIGNATURE_HEADER,
   VOICE_LIVE_OPS_ACTIONS,
   TURN_PROFILE_DEFAULTS,
   DEFAULT_VOICE_REDACTION_PATTERNS,

package/dist/testing/index.js CHANGED Viewed

@@ -5408,6 +5408,28 @@ var createVoiceMemoryRecordingStore = () => {
   };
 };
+// src/assistantMode.ts
+var resolveVoiceAssistantMode = (options) => {
+  if (options.assistantMode) {
+    return options.assistantMode;
+  }
+  if (options.realtime) {
+    return "s2s";
+  }
+  return "cascade";
+};
+var describeVoiceAssistantMode = (options) => {
+  const mode = resolveVoiceAssistantMode(options);
+  const modalities = options.modalities ? Array.from(new Set(options.modalities)) : ["audio"];
+  return {
+    hasRealtime: Boolean(options.realtime),
+    hasSTT: Boolean(options.stt),
+    hasTTS: Boolean(options.tts),
+    modalities,
+    mode
+  };
+};
 // src/session.ts
 var DEFAULT_RECONNECT_TIMEOUT = 30000;
 var DEFAULT_MAX_RECONNECT_ATTEMPTS2 = 10;
@@ -6790,13 +6812,20 @@ var createVoiceSession = (options) => {
     if (!inputAdapter) {
       throw new Error("Voice session requires either an stt or realtime adapter.");
     }
-    const openedSession = await inputAdapter.open({
-      format: options.realtime ? options.realtimeInputFormat ?? DEFAULT_REALTIME_FORMAT : DEFAULT_FORMAT,
+    const openedSession = await (options.realtime ? options.realtime.open({
+      format: options.realtimeInputFormat ?? DEFAULT_REALTIME_FORMAT,
       languageStrategy: options.languageStrategy,
       lexicon,
+      modalities: options.modalities,
       phraseHints,
       sessionId: options.id
-    });
+    }) : inputAdapter.open({
+      format: DEFAULT_FORMAT,
+      languageStrategy: options.languageStrategy,
+      lexicon,
+      phraseHints,
+      sessionId: options.id
+    }));
     const generation = ++adapterGenerationCounter;
     sttSession = openedSession;
     activeAdapterGeneration = generation;
@@ -6966,9 +6995,10 @@ var createVoiceSession = (options) => {
       });
       await appendTrace({
         payload: {
+          assistantMode: resolveVoiceAssistantMode(options),
+          realtimeConfigured: Boolean(options.realtime),
           text: output.assistantText,
-          ttsConfigured: Boolean(options.tts),
-          realtimeConfigured: Boolean(options.realtime)
+          ttsConfigured: Boolean(options.tts)
         },
         session,
         turnId: turn.id,

package/dist/types.d.ts CHANGED Viewed

@@ -194,7 +194,10 @@ export type RealtimeAdapterOpenOptions = {
     format: AudioFormat;
     languageStrategy?: VoiceLanguageStrategy;
     lexicon?: VoiceLexiconEntry[];
+    modalities?: ReadonlyArray<"audio" | "text">;
     phraseHints?: VoicePhraseHint[];
+    promptCacheKey?: string;
+    semanticVAD?: import("./assistantMode").VoiceSemanticVADConfig;
     signal?: AbortSignal;
 };
 export type RealtimeAdapter<TOptions extends RealtimeAdapterOpenOptions = RealtimeAdapterOpenOptions> = {
@@ -732,6 +735,8 @@ export type CreateVoiceSessionOptions<TContext = unknown, TSession extends Voice
     };
     redact?: import("./redaction").VoiceTranscriptRedactor;
     semanticTurnDetector?: import("./semanticTurn").VoiceSemanticTurnDetector;
+    assistantMode?: import("./assistantMode").VoiceAssistantMode;
+    modalities?: ReadonlyArray<"audio" | "text">;
     reconnect: Required<VoiceReconnectConfig>;
     phraseHints?: VoicePhraseHint[];
     sessionMetadata?: Record<string, unknown>;

package/dist/webhookVerification.d.ts ADDED Viewed

@@ -0,0 +1,27 @@
+export type VoiceWebhookVerificationReason = "missing-secret" | "missing-signature" | "missing-timestamp" | "signature-mismatch" | "stale-timestamp" | "unsupported-algorithm";
+export type VoiceWebhookVerificationResult = {
+    ok: true;
+} | {
+    ok: false;
+    reason: VoiceWebhookVerificationReason;
+};
+export type VoiceWebhookVerificationInput = {
+    body: string;
+    now?: number;
+    secret?: string;
+    signature?: string | null;
+    timestamp?: string | null;
+    toleranceMs?: number;
+};
+export declare const VOICE_WEBHOOK_SIGNATURE_HEADER = "x-absolutejs-signature";
+export declare const VOICE_WEBHOOK_TIMESTAMP_HEADER = "x-absolutejs-timestamp";
+export declare const signVoiceWebhookBody: (input: {
+    body: string;
+    secret: string;
+    timestamp: string;
+}) => Promise<string>;
+export declare const verifyVoiceWebhookSignature: (input: VoiceWebhookVerificationInput) => Promise<VoiceWebhookVerificationResult>;
+export declare const extractVoiceWebhookSignatureFromHeaders: (headers: Headers | Record<string, string | string[] | undefined>) => {
+    signature: string | null;
+    timestamp: string | null;
+};

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@absolutejs/voice",
-  "version": "0.0.22-beta.483",
+  "version": "0.0.22-beta.485",
   "description": "Voice primitives and Elysia plugin for AbsoluteJS",
   "repository": {
     "type": "git",