npm - @kodelyth/voice-call - Versions diffs - 2026.5.42 → 2026.6.1 - Mend

@kodelyth/voice-call 2026.5.42 → 2026.6.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (111) hide show

package/package.json +16 -4
package/api.ts +0 -16
package/cli-metadata.ts +0 -10
package/config-api.ts +0 -12
package/index.test.ts +0 -1075
package/index.ts +0 -863
package/runtime-api.ts +0 -20
package/runtime-entry.ts +0 -1
package/setup-api.ts +0 -47
package/src/allowlist.test.ts +0 -18
package/src/allowlist.ts +0 -19
package/src/cli.test.ts +0 -12
package/src/cli.ts +0 -866
package/src/config-compat.test.ts +0 -130
package/src/config-compat.ts +0 -227
package/src/config.test.ts +0 -542
package/src/config.ts +0 -883
package/src/core-bridge.ts +0 -14
package/src/deep-merge.test.ts +0 -40
package/src/deep-merge.ts +0 -23
package/src/gateway-continue-operation.ts +0 -200
package/src/http-headers.test.ts +0 -16
package/src/http-headers.ts +0 -15
package/src/manager/context.ts +0 -50
package/src/manager/events.test.ts +0 -578
package/src/manager/events.ts +0 -332
package/src/manager/lifecycle.ts +0 -53
package/src/manager/lookup.test.ts +0 -52
package/src/manager/lookup.ts +0 -35
package/src/manager/outbound.test.ts +0 -629
package/src/manager/outbound.ts +0 -508
package/src/manager/state.ts +0 -48
package/src/manager/store.ts +0 -107
package/src/manager/timers.test.ts +0 -127
package/src/manager/timers.ts +0 -113
package/src/manager/twiml.test.ts +0 -13
package/src/manager/twiml.ts +0 -17
package/src/manager.closed-loop.test.ts +0 -259
package/src/manager.inbound-allowlist.test.ts +0 -183
package/src/manager.notify.test.ts +0 -390
package/src/manager.restore.test.ts +0 -310
package/src/manager.test-harness.ts +0 -127
package/src/manager.ts +0 -441
package/src/media-stream.test.ts +0 -953
package/src/media-stream.ts +0 -876
package/src/providers/base.ts +0 -99
package/src/providers/mock.test.ts +0 -86
package/src/providers/mock.ts +0 -185
package/src/providers/plivo.test.ts +0 -93
package/src/providers/plivo.ts +0 -601
package/src/providers/shared/call-status.test.ts +0 -24
package/src/providers/shared/call-status.ts +0 -24
package/src/providers/shared/guarded-json-api.test.ts +0 -127
package/src/providers/shared/guarded-json-api.ts +0 -49
package/src/providers/telnyx.test.ts +0 -489
package/src/providers/telnyx.ts +0 -419
package/src/providers/twilio/api.test.ts +0 -184
package/src/providers/twilio/api.ts +0 -100
package/src/providers/twilio/twiml-policy.test.ts +0 -84
package/src/providers/twilio/twiml-policy.ts +0 -87
package/src/providers/twilio/webhook.ts +0 -34
package/src/providers/twilio.test.ts +0 -607
package/src/providers/twilio.ts +0 -861
package/src/providers/twilio.types.ts +0 -17
package/src/realtime-agent-context.test.ts +0 -101
package/src/realtime-agent-context.ts +0 -149
package/src/realtime-defaults.ts +0 -3
package/src/realtime-fast-context.test.ts +0 -74
package/src/realtime-fast-context.ts +0 -27
package/src/realtime-transcription.runtime.ts +0 -4
package/src/realtime-voice.runtime.ts +0 -5
package/src/response-generator.test.ts +0 -385
package/src/response-generator.ts +0 -348
package/src/response-model.test.ts +0 -71
package/src/response-model.ts +0 -23
package/src/runtime.test.ts +0 -625
package/src/runtime.ts +0 -528
package/src/telephony-audio.test.ts +0 -61
package/src/telephony-audio.ts +0 -12
package/src/telephony-tts.test.ts +0 -196
package/src/telephony-tts.ts +0 -235
package/src/test-fixtures.ts +0 -82
package/src/tts-provider-voice.test.ts +0 -34
package/src/tts-provider-voice.ts +0 -21
package/src/tunnel.test.ts +0 -173
package/src/tunnel.ts +0 -314
package/src/types.ts +0 -311
package/src/utils.test.ts +0 -17
package/src/utils.ts +0 -14
package/src/voice-mapping.test.ts +0 -32
package/src/voice-mapping.ts +0 -65
package/src/webhook/realtime-audio-pacer.test.ts +0 -146
package/src/webhook/realtime-audio-pacer.ts +0 -204
package/src/webhook/realtime-handler.test.ts +0 -1450
package/src/webhook/realtime-handler.ts +0 -1382
package/src/webhook/stale-call-reaper.test.ts +0 -89
package/src/webhook/stale-call-reaper.ts +0 -38
package/src/webhook/stream-frame-adapter.test.ts +0 -187
package/src/webhook/stream-frame-adapter.ts +0 -219
package/src/webhook/tailscale.test.ts +0 -216
package/src/webhook/tailscale.ts +0 -129
package/src/webhook-exposure.test.ts +0 -33
package/src/webhook-exposure.ts +0 -84
package/src/webhook-security.test.ts +0 -813
package/src/webhook-security.ts +0 -982
package/src/webhook.hangup-once.lifecycle.test.ts +0 -179
package/src/webhook.test.ts +0 -1615
package/src/webhook.ts +0 -933
package/src/webhook.types.ts +0 -5
package/src/websocket-test-support.ts +0 -72
package/tsconfig.json +0 -16

package/src/response-generator.ts DELETED Viewed

@@ -1,348 +0,0 @@
-/**
- * Voice call response generator - uses the embedded Pi agent for tool support.
- * Routes voice responses through the same agent infrastructure as messaging.
- */
-import crypto from "node:crypto";
-import { applyModelOverrideToSessionEntry } from "klaw/plugin-sdk/model-session-runtime";
-import { normalizeLowercaseStringOrEmpty } from "klaw/plugin-sdk/string-coerce-runtime";
-import type { SessionEntry } from "../api.js";
-import { resolveVoiceCallSessionKey, type VoiceCallConfig } from "./config.js";
-import type { CoreAgentDeps, CoreConfig } from "./core-bridge.js";
-import { resolveVoiceResponseModel } from "./response-model.js";
-export type VoiceResponseParams = {
-  /** Voice call config */
-  voiceConfig: VoiceCallConfig;
-  /** Core Klaw config */
-  coreConfig: CoreConfig;
-  /** Injected host agent runtime */
-  agentRuntime: CoreAgentDeps;
-  /** Call ID for session tracking */
-  callId: string;
-  /** Persisted call session key */
-  sessionKey?: string;
-  /** Caller's phone number */
-  from: string;
-  /** Conversation transcript */
-  transcript: Array<{ speaker: "user" | "bot"; text: string }>;
-  /** Latest user message */
-  userMessage: string;
-};
-export type VoiceResponseResult = {
-  text: string | null;
-  error?: string;
-};
-type VoiceResponsePayload = {
-  text?: string;
-  isError?: boolean;
-  isReasoning?: boolean;
-};
-function isRecord(value: unknown): value is Record<string, unknown> {
-  return typeof value === "object" && value !== null && !Array.isArray(value);
-}
-function readExplicitToolsAllow(value: unknown): string[] | undefined {
-  if (!isRecord(value)) {
-    return undefined;
-  }
-  const allow = value.allow;
-  if (!Array.isArray(allow)) {
-    return undefined;
-  }
-  return allow.filter((entry): entry is string => typeof entry === "string");
-}
-function resolveVoiceAgentToolsAllow(config: CoreConfig, agentId: string): string[] | undefined {
-  const agents = isRecord(config.agents) ? config.agents : undefined;
-  const list = Array.isArray(agents?.list) ? agents.list : [];
-  const agent = list.find((entry) => isRecord(entry) && entry.id === agentId);
-  if (!isRecord(agent)) {
-    return undefined;
-  }
-  return readExplicitToolsAllow(isRecord(agent.tools) ? agent.tools : undefined);
-}
-const VOICE_SPOKEN_OUTPUT_CONTRACT = [
-  "Output format requirements:",
-  '- Return only valid JSON in this exact shape: {"spoken":"..."}',
-  "- Do not include markdown, code fences, planning text, or extra keys.",
-  '- Put exactly what should be spoken to the caller into "spoken".',
-  '- If there is nothing to say, return {"spoken":""}.',
-].join("\n");
-function normalizeSpokenText(value: string): string | null {
-  const normalized = value.replace(/\s+/g, " ").trim();
-  return normalized.length > 0 ? normalized : null;
-}
-function tryParseSpokenJson(text: string): string | null {
-  const candidates: string[] = [];
-  const trimmed = text.trim();
-  if (!trimmed) {
-    return null;
-  }
-  candidates.push(trimmed);
-  const fenced = trimmed.match(/^```(?:json)?\s*([\s\S]*?)\s*```$/i);
-  if (fenced?.[1]) {
-    candidates.push(fenced[1]);
-  }
-  const firstBrace = trimmed.indexOf("{");
-  const lastBrace = trimmed.lastIndexOf("}");
-  if (firstBrace >= 0 && lastBrace > firstBrace) {
-    candidates.push(trimmed.slice(firstBrace, lastBrace + 1));
-  }
-  for (const candidate of candidates) {
-    try {
-      const parsed = JSON.parse(candidate) as { spoken?: unknown };
-      if (typeof parsed?.spoken !== "string") {
-        continue;
-      }
-      return normalizeSpokenText(parsed.spoken) ?? "";
-    } catch {
-      // Continue trying other candidates.
-    }
-  }
-  const inlineSpokenMatch = trimmed.match(/"spoken"\s*:\s*"((?:[^"\\]|\\.)*)"/i);
-  if (!inlineSpokenMatch) {
-    return null;
-  }
-  try {
-    const decoded = JSON.parse(`"${inlineSpokenMatch[1] ?? ""}"`) as string;
-    return normalizeSpokenText(decoded) ?? "";
-  } catch {
-    return null;
-  }
-}
-function isLikelyMetaReasoningParagraph(paragraph: string): boolean {
-  const lower = normalizeLowercaseStringOrEmpty(paragraph);
-  if (!lower) {
-    return false;
-  }
-  if (lower.startsWith("thinking process")) {
-    return true;
-  }
-  if (lower.startsWith("reasoning:") || lower.startsWith("analysis:")) {
-    return true;
-  }
-  if (
-    lower.startsWith("the user ") &&
-    (lower.includes("i should") || lower.includes("i need to") || lower.includes("i will"))
-  ) {
-    return true;
-  }
-  if (
-    lower.includes("this is a natural continuation of the conversation") ||
-    lower.includes("keep the conversation flowing")
-  ) {
-    return true;
-  }
-  return false;
-}
-function sanitizePlainSpokenText(text: string): string | null {
-  const withoutCodeFences = text.replace(/```[\s\S]*?```/g, " ").trim();
-  if (!withoutCodeFences) {
-    return null;
-  }
-  const paragraphs = withoutCodeFences
-    .split(/\n\s*\n+/)
-    .map((paragraph) => paragraph.trim())
-    .filter(Boolean);
-  while (paragraphs.length > 1 && isLikelyMetaReasoningParagraph(paragraphs[0])) {
-    paragraphs.shift();
-  }
-  return normalizeSpokenText(paragraphs.join(" "));
-}
-function extractSpokenTextFromPayloads(payloads: VoiceResponsePayload[]): string | null {
-  const spokenSegments: string[] = [];
-  for (const payload of payloads) {
-    if (payload.isError || payload.isReasoning) {
-      continue;
-    }
-    const rawText = payload.text?.trim() ?? "";
-    if (!rawText) {
-      continue;
-    }
-    const structured = tryParseSpokenJson(rawText);
-    if (structured !== null) {
-      if (structured.length > 0) {
-        spokenSegments.push(structured);
-      }
-      continue;
-    }
-    const plain = sanitizePlainSpokenText(rawText);
-    if (plain) {
-      spokenSegments.push(plain);
-    }
-  }
-  return spokenSegments.length > 0 ? spokenSegments.join(" ").trim() : null;
-}
-function resolveVoiceSandboxSessionKey(agentId: string, sessionKey: string): string {
-  const trimmed = sessionKey.trim();
-  if (trimmed.toLowerCase().startsWith("agent:")) {
-    return trimmed;
-  }
-  return `agent:${agentId}:${trimmed}`;
-}
-/**
- * Generate a voice response using the embedded Pi agent with full tool support.
- * Uses the same agent infrastructure as messaging for consistent behavior.
- */
-export async function generateVoiceResponse(
-  params: VoiceResponseParams,
-): Promise<VoiceResponseResult> {
-  const {
-    voiceConfig,
-    callId,
-    sessionKey,
-    from,
-    transcript,
-    userMessage,
-    coreConfig,
-    agentRuntime,
-  } = params;
-  if (!coreConfig) {
-    return { text: null, error: "Core config unavailable for voice response" };
-  }
-  const cfg = coreConfig;
-  const resolvedSessionKey = resolveVoiceCallSessionKey({
-    config: voiceConfig,
-    callId,
-    phone: from,
-    explicitSessionKey: sessionKey,
-  });
-  const agentId = voiceConfig.agentId ?? "main";
-  const toolsAllow = resolveVoiceAgentToolsAllow(cfg, agentId);
-  // Resolve paths
-  const storePath = agentRuntime.session.resolveStorePath(cfg.session?.store, { agentId });
-  const agentDir = agentRuntime.resolveAgentDir(cfg, agentId);
-  const workspaceDir = agentRuntime.resolveAgentWorkspaceDir(cfg, agentId);
-  // Ensure workspace exists
-  await agentRuntime.ensureAgentWorkspace({ dir: workspaceDir });
-  // Load or create session entry
-  const sessionStore = agentRuntime.session.loadSessionStore(storePath);
-  const now = Date.now();
-  const existingSessionEntry = sessionStore[resolvedSessionKey] as SessionEntry | undefined;
-  // Resolve model from config
-  const { provider, model } = resolveVoiceResponseModel({ voiceConfig, agentRuntime });
-  let sessionEntry = existingSessionEntry;
-  if (!sessionEntry?.sessionId || voiceConfig.responseModel) {
-    sessionEntry = await agentRuntime.session.updateSessionStore(storePath, (store) => {
-      let entry = store[resolvedSessionKey] as SessionEntry | undefined;
-      if (!entry?.sessionId) {
-        entry = {
-          ...entry,
-          sessionId: crypto.randomUUID(),
-          updatedAt: now,
-        };
-        store[resolvedSessionKey] = entry;
-      }
-      if (voiceConfig.responseModel) {
-        applyModelOverrideToSessionEntry({
-          entry,
-          selection: { provider, model },
-          selectionSource: "auto",
-        });
-      }
-      return entry;
-    });
-  }
-  const sessionId = sessionEntry.sessionId;
-  const sessionFile = agentRuntime.session.resolveSessionFilePath(sessionId, sessionEntry, {
-    agentId,
-  });
-  // Resolve thinking level
-  const thinkLevel = agentRuntime.resolveThinkingDefault({ cfg, provider, model });
-  // Resolve agent identity for personalized prompt
-  const identity = agentRuntime.resolveAgentIdentity(cfg, agentId);
-  const agentName = identity?.name?.trim() || "assistant";
-  // Build system prompt with conversation history
-  const basePrompt =
-    voiceConfig.responseSystemPrompt ??
-    `You are ${agentName}, a helpful voice assistant on a phone call. Keep responses brief and conversational (1-2 sentences max). Be natural and friendly. The caller's phone number is ${from}. You have access to tools - use them when helpful.`;
-  let extraSystemPrompt = basePrompt;
-  if (transcript.length > 0) {
-    const history = transcript
-      .map((entry) => `${entry.speaker === "bot" ? "You" : "Caller"}: ${entry.text}`)
-      .join("\n");
-    extraSystemPrompt = `${basePrompt}\n\nConversation so far:\n${history}`;
-  }
-  extraSystemPrompt = `${extraSystemPrompt}\n\n${VOICE_SPOKEN_OUTPUT_CONTRACT}`;
-  // Resolve timeout
-  const timeoutMs = voiceConfig.responseTimeoutMs ?? agentRuntime.resolveAgentTimeoutMs({ cfg });
-  const runId = `voice:${callId}:${Date.now()}`;
-  try {
-    const result = await agentRuntime.runEmbeddedPiAgent({
-      sessionId,
-      sessionKey: resolvedSessionKey,
-      sandboxSessionKey: resolveVoiceSandboxSessionKey(agentId, resolvedSessionKey),
-      agentId,
-      messageProvider: "voice",
-      sessionFile,
-      workspaceDir,
-      config: cfg,
-      prompt: userMessage,
-      provider,
-      model,
-      thinkLevel,
-      verboseLevel: "off",
-      timeoutMs,
-      runId,
-      lane: "voice",
-      extraSystemPrompt,
-      agentDir,
-      toolsAllow,
-    });
-    const text = extractSpokenTextFromPayloads((result.payloads ?? []) as VoiceResponsePayload[]);
-    if (!text && result.meta?.aborted) {
-      return { text: null, error: "Response generation was aborted" };
-    }
-    return { text };
-  } catch (err) {
-    console.error(`[voice-call] Response generation failed:`, err);
-    return { text: null, error: String(err) };
-  }
-}

package/src/response-model.test.ts DELETED Viewed

@@ -1,71 +0,0 @@
-import { describe, expect, it } from "vitest";
-import { VoiceCallConfigSchema } from "./config.js";
-import type { CoreAgentDeps } from "./core-bridge.js";
-import { resolveVoiceResponseModel } from "./response-model.js";
-const agentRuntime = {
-  defaults: {
-    provider: "together",
-    model: "Qwen/Qwen2.5-7B-Instruct-Turbo",
-  },
-} as unknown as CoreAgentDeps;
-describe("resolveVoiceResponseModel", () => {
-  it("falls back to the runtime default model", () => {
-    expect(
-      resolveVoiceResponseModel({
-        voiceConfig: VoiceCallConfigSchema.parse({}),
-        agentRuntime,
-      }),
-    ).toEqual({
-      modelRef: "together/Qwen/Qwen2.5-7B-Instruct-Turbo",
-      provider: "together",
-      model: "Qwen/Qwen2.5-7B-Instruct-Turbo",
-    });
-  });
-  it("uses an explicit provider/model ref", () => {
-    expect(
-      resolveVoiceResponseModel({
-        voiceConfig: VoiceCallConfigSchema.parse({
-          responseModel: "openai/gpt-5.4-mini",
-        }),
-        agentRuntime,
-      }),
-    ).toEqual({
-      modelRef: "openai/gpt-5.4-mini",
-      provider: "openai",
-      model: "gpt-5.4-mini",
-    });
-  });
-  it("uses the runtime default provider for bare model overrides", () => {
-    expect(
-      resolveVoiceResponseModel({
-        voiceConfig: VoiceCallConfigSchema.parse({
-          responseModel: "meta-llama/Llama-4-Scout-17B-16E-Instruct",
-        }),
-        agentRuntime,
-      }),
-    ).toEqual({
-      modelRef: "meta-llama/Llama-4-Scout-17B-16E-Instruct",
-      provider: "meta-llama",
-      model: "Llama-4-Scout-17B-16E-Instruct",
-    });
-  });
-  it("keeps legacy single-segment overrides on the runtime default provider", () => {
-    expect(
-      resolveVoiceResponseModel({
-        voiceConfig: VoiceCallConfigSchema.parse({
-          responseModel: "gpt-5.4-mini",
-        }),
-        agentRuntime,
-      }),
-    ).toEqual({
-      modelRef: "gpt-5.4-mini",
-      provider: "together",
-      model: "gpt-5.4-mini",
-    });
-  });
-});

package/src/response-model.ts DELETED Viewed

@@ -1,23 +0,0 @@
-import type { VoiceCallConfig } from "./config.js";
-import type { CoreAgentDeps } from "./core-bridge.js";
-export function resolveVoiceResponseModel(params: {
-  voiceConfig: VoiceCallConfig;
-  agentRuntime: CoreAgentDeps;
-}): {
-  modelRef: string;
-  provider: string;
-  model: string;
-} {
-  const modelRef =
-    params.voiceConfig.responseModel ??
-    `${params.agentRuntime.defaults.provider}/${params.agentRuntime.defaults.model}`;
-  const slashIndex = modelRef.indexOf("/");
-  return {
-    modelRef,
-    provider:
-      slashIndex === -1 ? params.agentRuntime.defaults.provider : modelRef.slice(0, slashIndex),
-    model: slashIndex === -1 ? modelRef : modelRef.slice(slashIndex + 1),
-  };
-}