npm - heyhank - Versions diffs - 0.1.0 → 0.2.0 - Mend

heyhank 0.1.0 → 0.2.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (156) hide show

package/LICENSE +21 -0
package/README.md +83 -10
package/bin/cli.ts +7 -7
package/bin/ctl.ts +42 -42
package/dist/assets/{AgentsPage-BPhirnCe.js → AgentsPage-B-AAmsMK.js} +3 -3
package/dist/assets/AssistantPage-BV1Mfwdt.js +2 -0
package/dist/assets/BusinessPage-tLpNEz19.js +1 -0
package/dist/assets/{CronManager-DDbz-yiT.js → CronManager-B-K_n3Jg.js} +1 -1
package/dist/assets/HelpPage-Bhf_j6Xr.js +1 -0
package/dist/assets/{IntegrationsPage-CrOitCmJ.js → IntegrationsPage-DAMjs9tM.js} +1 -1
package/dist/assets/JarvisHUD-C_TGXCCn.js +120 -0
package/dist/assets/MediaPage-C48HTTrt.js +1 -0
package/dist/assets/MemoryPage-JkC-qtgp.js +1 -0
package/dist/assets/{PlatformDashboard-Do6F0O2p.js → PlatformDashboard-AUo7tNnE.js} +1 -1
package/dist/assets/{Playground-Fc5cdc5p.js → Playground-AzNMsRBL.js} +1 -1
package/dist/assets/{ProcessPanel-CslEiZkI.js → ProcessPanel-DpE_2sX3.js} +1 -1
package/dist/assets/{PromptsPage-D2EhsdNO.js → PromptsPage-C2RQOs6p.js} +2 -2
package/dist/assets/RunsPage-B9UOyO79.js +1 -0
package/dist/assets/{SandboxManager-a1AVI5q2.js → SandboxManager-jHvYjwfh.js} +1 -1
package/dist/assets/SettingsPage-BBJax6gt.js +51 -0
package/dist/assets/SkillsMarketplace-IjmjfdjD.js +1 -0
package/dist/assets/SocialMediaPage-DoPZHhr2.js +10 -0
package/dist/assets/{TailscalePage-CHiFhZXF.js → TailscalePage-DDEY7ckO.js} +1 -1
package/dist/assets/TelephonyPage-OPNBZYKt.js +9 -0
package/dist/assets/{TerminalPage-Drwyrnfd.js → TerminalPage-BjMbHHW3.js} +1 -1
package/dist/assets/{gemini-live-client-C7rqAW7G.js → gemini-live-client-C70FEtX2.js} +11 -8
package/dist/assets/{index-CEqZnThB.js → index-BgYM4wXw.js} +94 -93
package/dist/assets/index-BkjSoVgn.css +32 -0
package/dist/assets/sw-register-C7NOHtIu.js +1 -0
package/dist/assets/text-chat-client-BSbLJerZ.js +2 -0
package/dist/index.html +2 -2
package/dist/sw.js +1 -1
package/package.json +6 -1
package/server/agent-executor.ts +37 -2
package/server/agent-store.ts +3 -3
package/server/agent-types.ts +11 -0
package/server/assistant-store.ts +232 -6
package/server/auth-manager.ts +9 -0
package/server/cache-headers.ts +1 -1
package/server/calendar-service.ts +10 -0
package/server/ceo/document-store.ts +129 -0
package/server/ceo/finance-store.ts +343 -0
package/server/ceo/kpi-store.ts +208 -0
package/server/ceo/memory-import.ts +277 -0
package/server/ceo/news-store.ts +208 -0
package/server/ceo/template-store.ts +134 -0
package/server/ceo/time-tracking-store.ts +227 -0
package/server/claude-auth-monitor.ts +128 -0
package/server/claude-code-worker.ts +86 -0
package/server/claude-session-discovery.ts +74 -1
package/server/cli-launcher.ts +32 -10
package/server/codex-adapter.ts +2 -2
package/server/codex-ws-proxy.cjs +1 -1
package/server/container-manager.ts +4 -4
package/server/content-intelligence/content-engine.ts +1112 -0
package/server/content-intelligence/platform-knowledge.ts +870 -0
package/server/cron-store.ts +3 -3
package/server/embedding-service.ts +49 -0
package/server/event-bus-types.ts +13 -0
package/server/federation/node-store.ts +5 -4
package/server/fs-utils.ts +28 -1
package/server/hank-notifications-store.ts +91 -0
package/server/hank-tool-executor.ts +1835 -0
package/server/hank-tools.ts +2107 -0
package/server/image-pull-manager.ts +2 -2
package/server/index.ts +25 -2
package/server/llm-providers-streaming.ts +541 -0
package/server/llm-providers.ts +12 -0
package/server/marketplace.ts +249 -0
package/server/mcp-registry.ts +158 -0
package/server/memory-service.ts +296 -0
package/server/obsidian-sync.ts +184 -0
package/server/provider-manager.ts +5 -2
package/server/provider-registry.ts +12 -0
package/server/reminder-scheduler.ts +37 -1
package/server/routes/agent-routes.ts +2 -1
package/server/routes/assistant-routes.ts +198 -5
package/server/routes/ceo-finance-kpi-routes.ts +167 -0
package/server/routes/ceo-news-time-routes.ts +137 -0
package/server/routes/ceo-routes.ts +99 -0
package/server/routes/content-routes.ts +116 -0
package/server/routes/email-routes.ts +147 -0
package/server/routes/env-routes.ts +3 -3
package/server/routes/fs-routes.ts +12 -9
package/server/routes/hank-chat-routes.ts +592 -0
package/server/routes/llm-routes.ts +12 -0
package/server/routes/marketplace-routes.ts +63 -0
package/server/routes/media-routes.ts +1 -1
package/server/routes/memory-routes.ts +127 -0
package/server/routes/platform-routes.ts +14 -675
package/server/routes/sandbox-routes.ts +1 -1
package/server/routes/settings-routes.ts +51 -1
package/server/routes/socialmedia-routes.ts +152 -2
package/server/routes/system-routes.ts +2 -2
package/server/routes/team-routes.ts +71 -0
package/server/routes/telephony-routes.ts +98 -18
package/server/routes.ts +36 -9
package/server/session-creation-service.ts +2 -2
package/server/session-orchestrator.ts +54 -2
package/server/session-types.ts +2 -0
package/server/settings-manager.ts +50 -2
package/server/skill-discovery.ts +68 -0
package/server/socialmedia/adapters/browser-adapter.ts +179 -0
package/server/socialmedia/adapters/postiz-adapter.ts +291 -14
package/server/socialmedia/manager.ts +234 -15
package/server/socialmedia/store.ts +51 -1
package/server/socialmedia/types.ts +35 -2
package/server/socialview/browser-manager.ts +150 -0
package/server/socialview/extractors.ts +1298 -0
package/server/socialview/image-describe.ts +188 -0
package/server/socialview/library.ts +119 -0
package/server/socialview/poster.ts +276 -0
package/server/socialview/routes.ts +371 -0
package/server/socialview/style-analyzer.ts +187 -0
package/server/socialview/style-profiles.ts +67 -0
package/server/socialview/types.ts +166 -0
package/server/socialview/vision.ts +127 -0
package/server/socialview/vnc-manager.ts +110 -0
package/server/style-injector.ts +135 -0
package/server/team-service.ts +239 -0
package/server/team-store.ts +75 -0
package/server/team-types.ts +52 -0
package/server/telephony/audio-bridge.ts +281 -35
package/server/telephony/audio-recorder.ts +132 -0
package/server/telephony/call-manager.ts +803 -104
package/server/telephony/call-types.ts +67 -1
package/server/telephony/esl-client.ts +319 -0
package/server/telephony/freeswitch-sync.ts +155 -0
package/server/telephony/phone-utils.ts +63 -0
package/server/telephony/telephony-store.ts +9 -8
package/server/url-validator.ts +82 -0
package/server/vault-markdown.ts +317 -0
package/server/vault-migration.ts +121 -0
package/server/vault-store.ts +466 -0
package/server/vault-watcher.ts +59 -0
package/server/vector-store.ts +210 -0
package/server/voice-pipeline/gemini-live-adapter.ts +97 -0
package/server/voice-pipeline/greeting-cache.ts +200 -0
package/server/voice-pipeline/manager.ts +249 -0
package/server/voice-pipeline/pipeline.ts +335 -0
package/server/voice-pipeline/providers/index.ts +47 -0
package/server/voice-pipeline/providers/llm-internal.ts +527 -0
package/server/voice-pipeline/providers/stt-google.ts +157 -0
package/server/voice-pipeline/providers/tts-google.ts +126 -0
package/server/voice-pipeline/types.ts +247 -0
package/server/ws-bridge-types.ts +6 -1
package/dist/assets/AssistantPage-DJ-cMQfb.js +0 -1
package/dist/assets/HelpPage-DMfkzERp.js +0 -1
package/dist/assets/MediaPage-CE5rdvkC.js +0 -1
package/dist/assets/RunsPage-C5BZF5Rx.js +0 -1
package/dist/assets/SettingsPage-DirhjQrJ.js +0 -51
package/dist/assets/SocialMediaPage-DBuM28vD.js +0 -1
package/dist/assets/TelephonyPage-x0VV0fOo.js +0 -1
package/dist/assets/index-C8M_PUmX.css +0 -32
package/dist/assets/sw-register-LSSpj6RU.js +0 -1
package/server/socialmedia/adapters/ayrshare-adapter.ts +0 -169

package/server/voice-pipeline/providers/llm-internal.ts ADDED Viewed

@@ -0,0 +1,527 @@
+// ─── Internal LLM Provider (provider-agnostic streaming + tool use) ──────────
+// Wraps the existing HeyHank provider system but adds:
+//  - multi-turn message arrays (system + user/assistant)
+//  - streaming via SSE for low latency (Anthropic + OpenAI-compatible)
+//  - tool use support (Anthropic Tool Use + OpenAI Function Calling)
+//
+// Provider resolution:
+//   - voicePipeline.llm.provider (explicit, required) → provider-manager.getProviderConfig()
+//   - If the chosen provider has no API key / isn't configured → null (call-time error).
+//
+// Falls back to non-streaming `callInternalAI` if no streaming-capable provider.
+import { callInternalAI } from "../../internal-ai.js";
+import { getProviderConfig } from "../../provider-manager.js";
+import { getProviderById } from "../../provider-registry.js";
+import type {
+  LLMConfig,
+  LLMMessage,
+  LLMProvider,
+  LLMProviderId,
+  LLMStreamCallbacks,
+  LLMToolCall,
+  LLMToolDef,
+  LLMToolResult,
+} from "../types.js";
+// ─── Provider resolution ─────────────────────────────────────────────────────
+const PROVIDER_BASE_URLS: Record<string, string> = {
+  openai: "https://api.openai.com/v1",
+  deepseek: "https://api.deepseek.com/v1",
+  mistral: "https://api.mistral.ai/v1",
+  together: "https://api.together.xyz/v1",
+  openrouter: "https://openrouter.ai/api/v1",
+  xai: "https://api.x.ai/v1",
+  groq: "https://api.groq.com/openai/v1",
+  huggingface: "https://api-inference.huggingface.co/v1",
+  venice: "https://api.venice.ai/api/v1",
+  minimax: "https://api.minimax.chat/v1",
+  moonshot: "https://api.moonshot.cn/v1",
+  qwen: "https://dashscope.aliyuncs.com/compatible-mode/v1",
+  "qwen-alibaba": "https://dashscope.aliyuncs.com/compatible-mode/v1",
+  chutes: "https://api.chutes.ai/v1",
+  zai: "https://open.bigmodel.cn/api/paas/v4",
+};
+const PROVIDER_DEFAULT_MODELS: Record<string, string> = {
+  anthropic: "claude-haiku-4-5-20251001",
+  openai: "gpt-4o-mini",
+  groq: "llama-3.3-70b-versatile",
+  mistral: "mistral-small-latest",
+  deepseek: "deepseek-chat",
+  together: "meta-llama/Llama-3.1-8B-Instruct-Turbo",
+  openrouter: "meta-llama/llama-3.1-8b-instruct:free",
+  xai: "grok-3-mini",
+  qwen: "qwen-turbo",
+};
+interface ResolvedProvider {
+  /** "anthropic" → Anthropic Messages API; everything else → OpenAI-compatible chat/completions */
+  kind: "anthropic" | "openai-compat";
+  providerId: string;
+  apiKey: string;
+  /** For openai-compat: base URL (without trailing slash, no /chat/completions suffix) */
+  baseUrl: string;
+  model: string;
+}
+function resolveProvider(providerId: string): ResolvedProvider | null {
+  return resolveById(providerId);
+}
+function resolveById(id: string): ResolvedProvider | null {
+  const def = getProviderById(id);
+  if (!def) return null;
+  const cfg = getProviderConfig(id);
+  if (!cfg) return null;
+  const secretField = def.envFields.find((f) => f.secret && f.required);
+  const apiKey = secretField ? (cfg.envValues[secretField.key] || "") : "";
+  if (!apiKey && id !== "ollama") return null;
+  const urlField = def.envFields.find((f) => f.key.includes("BASE_URL"));
+  let baseUrl = urlField ? (cfg.envValues[urlField.key] || "") : "";
+  if (!baseUrl) baseUrl = PROVIDER_BASE_URLS[id] || "";
+  const model = cfg.customModel || PROVIDER_DEFAULT_MODELS[id] || def.defaultModel || "";
+  if (id === "anthropic") {
+    return { kind: "anthropic", providerId: id, apiKey, baseUrl: "https://api.anthropic.com/v1", model };
+  }
+  if (!baseUrl || !model) return null;
+  // Strip trailing slash for consistency
+  return { kind: "openai-compat", providerId: id, apiKey, baseUrl: baseUrl.replace(/\/+$/, ""), model };
+}
+// ─── Anthropic streaming with tool use ───────────────────────────────────────
+interface AssistantBlock {
+  type: "text" | "tool_use";
+  text?: string;
+  id?: string;
+  name?: string;
+  inputJson?: string;
+}
+function toAnthropicTools(tools: LLMToolDef[] | undefined): Array<Record<string, unknown>> | undefined {
+  if (!tools || tools.length === 0) return undefined;
+  return tools.map((t) => ({
+    name: t.name,
+    description: t.description,
+    input_schema: t.parameters,
+  }));
+}
+async function streamAnthropicOnce(
+  messages: LLMMessage[],
+  history: Array<{ role: string; content: unknown }>,
+  config: LLMConfig | undefined,
+  provider: ResolvedProvider,
+  onTextDelta: (chunk: string) => void,
+): Promise<{ blocks: AssistantBlock[]; stopReason: string | null; ok: boolean; error?: string }> {
+  const system = messages.find((m) => m.role === "system")?.content;
+  const body: Record<string, unknown> = {
+    model: config?.model || provider.model,
+    max_tokens: config?.maxTokens ?? 512,
+    messages: history,
+    temperature: config?.temperature ?? 0.6,
+    stream: true,
+  };
+  if (system) body.system = system;
+  const tools = toAnthropicTools(config?.tools);
+  if (tools) body.tools = tools;
+  const res = await fetch(`${provider.baseUrl}/messages`, {
+    method: "POST",
+    headers: {
+      "Content-Type": "application/json",
+      "x-api-key": provider.apiKey,
+      "anthropic-version": "2023-06-01",
+    },
+    body: JSON.stringify(body),
+  });
+  if (!res.ok || !res.body) {
+    const errText = res.body ? await res.text() : "";
+    return { blocks: [], stopReason: null, ok: false, error: `Anthropic stream error ${res.status}: ${errText.slice(0, 200)}` };
+  }
+  const blocks: AssistantBlock[] = [];
+  let stopReason: string | null = null;
+  const reader = res.body.getReader();
+  const decoder = new TextDecoder();
+  let buffer = "";
+  try {
+    while (true) {
+      const { value, done } = await reader.read();
+      if (done) break;
+      buffer += decoder.decode(value, { stream: true });
+      let idx;
+      while ((idx = buffer.indexOf("\n\n")) >= 0) {
+        const event = buffer.slice(0, idx);
+        buffer = buffer.slice(idx + 2);
+        const dataLine = event.split("\n").find((l) => l.startsWith("data:"));
+        if (!dataLine) continue;
+        const jsonStr = dataLine.slice(5).trim();
+        if (!jsonStr || jsonStr === "[DONE]") continue;
+        let data: Record<string, unknown>;
+        try { data = JSON.parse(jsonStr); } catch { continue; }
+        const type = data.type as string | undefined;
+        if (type === "content_block_start") {
+          const idxNum = data.index as number;
+          const cb = data.content_block as { type: string; id?: string; name?: string };
+          if (cb.type === "text") blocks[idxNum] = { type: "text", text: "" };
+          else if (cb.type === "tool_use") blocks[idxNum] = { type: "tool_use", id: cb.id, name: cb.name, inputJson: "" };
+        } else if (type === "content_block_delta") {
+          const idxNum = data.index as number;
+          const delta = data.delta as { type: string; text?: string; partial_json?: string };
+          const block = blocks[idxNum];
+          if (!block) continue;
+          if (delta.type === "text_delta" && delta.text) {
+            block.text = (block.text || "") + delta.text;
+            onTextDelta(delta.text);
+          } else if (delta.type === "input_json_delta" && delta.partial_json !== undefined) {
+            block.inputJson = (block.inputJson || "") + delta.partial_json;
+          }
+        } else if (type === "message_delta") {
+          const delta = data.delta as { stop_reason?: string };
+          if (delta.stop_reason) stopReason = delta.stop_reason;
+        }
+      }
+    }
+  } catch (e) {
+    return { blocks, stopReason, ok: false, error: e instanceof Error ? e.message : String(e) };
+  }
+  return { blocks, stopReason, ok: true };
+}
+function anthropicBlocksToContent(blocks: AssistantBlock[]): Array<Record<string, unknown>> {
+  return blocks
+    .filter((b) => b)
+    .map((b) => {
+      if (b.type === "text") return { type: "text", text: b.text || "" };
+      let parsed: Record<string, unknown> = {};
+      try { parsed = b.inputJson ? JSON.parse(b.inputJson) : {}; } catch { /* ignore */ }
+      return { type: "tool_use", id: b.id, name: b.name, input: parsed };
+    });
+}
+function anthropicExtractToolCalls(blocks: AssistantBlock[]): LLMToolCall[] {
+  const calls: LLMToolCall[] = [];
+  for (const b of blocks) {
+    if (!b || b.type !== "tool_use") continue;
+    let args: Record<string, unknown> = {};
+    try { args = b.inputJson ? JSON.parse(b.inputJson) : {}; } catch { /* ignore */ }
+    calls.push({ id: b.id || "", name: b.name || "", args });
+  }
+  return calls;
+}
+async function streamAnthropicWithTools(
+  messages: LLMMessage[],
+  callbacks: LLMStreamCallbacks,
+  config: LLMConfig | undefined,
+  provider: ResolvedProvider,
+): Promise<{ text: string; ok: boolean; error?: string }> {
+  const turns: Array<{ role: string; content: unknown }> = messages
+    .filter((m) => m.role !== "system")
+    .map((m) => ({ role: m.role, content: m.content }));
+  let fullText = "";
+  const maxIterations = 4;
+  for (let iter = 0; iter < maxIterations; iter++) {
+    const result = await streamAnthropicOnce(messages, turns, config, provider, (chunk) => {
+      fullText += chunk;
+      callbacks.onChunk(chunk);
+    });
+    if (!result.ok) return { text: fullText, ok: false, error: result.error };
+    const content = anthropicBlocksToContent(result.blocks);
+    if (content.length > 0) turns.push({ role: "assistant", content });
+    if (result.stopReason !== "tool_use") return { text: fullText, ok: true };
+    const toolCalls = anthropicExtractToolCalls(result.blocks);
+    if (toolCalls.length === 0 || !callbacks.onToolCalls) return { text: fullText, ok: true };
+    let toolResults: LLMToolResult[] = [];
+    try {
+      toolResults = await callbacks.onToolCalls(toolCalls);
+    } catch (e) {
+      console.error("[voice-pipeline] tool handler error:", e);
+      toolResults = toolCalls.map((c) => ({ id: c.id, name: c.name, response: { error: e instanceof Error ? e.message : String(e) } }));
+    }
+    // If the model called `end_call`, stop the loop. The goodbye text has
+    // already been spoken in this iteration — another LLM round would just
+    // produce a second redundant goodbye that gets TTS'd on top.
+    if (toolCalls.some((c) => c.name === "end_call")) {
+      return { text: fullText, ok: true };
+    }
+    turns.push({
+      role: "user",
+      content: toolResults.map((r) => ({
+        type: "tool_result",
+        tool_use_id: r.id,
+        content: typeof r.response === "string" ? r.response : JSON.stringify(r.response),
+      })),
+    });
+  }
+  console.warn("[voice-pipeline] Anthropic tool loop hit max iterations");
+  return { text: fullText, ok: true };
+}
+// ─── OpenAI-compatible streaming with tool calling ───────────────────────────
+interface OpenAIToolCallAccumulator {
+  index: number;
+  id?: string;
+  name?: string;
+  argsJson: string;
+}
+function toOpenAITools(tools: LLMToolDef[] | undefined): Array<Record<string, unknown>> | undefined {
+  if (!tools || tools.length === 0) return undefined;
+  return tools.map((t) => ({
+    type: "function",
+    function: { name: t.name, description: t.description, parameters: t.parameters },
+  }));
+}
+/** Convert LLMMessage[] (with optional tool history) to OpenAI messages */
+function buildOpenAIMessages(messages: LLMMessage[]): Array<Record<string, unknown>> {
+  return messages.map((m) => ({ role: m.role, content: m.content }));
+}
+interface OpenAIStreamResult {
+  text: string;
+  toolCalls: LLMToolCall[];
+  finishReason: string | null;
+  ok: boolean;
+  error?: string;
+}
+async function streamOpenAIOnce(
+  history: Array<Record<string, unknown>>,
+  config: LLMConfig | undefined,
+  provider: ResolvedProvider,
+  onTextDelta: (chunk: string) => void,
+): Promise<OpenAIStreamResult> {
+  const body: Record<string, unknown> = {
+    model: config?.model || provider.model,
+    max_tokens: config?.maxTokens ?? 512,
+    messages: history,
+    temperature: config?.temperature ?? 0.6,
+    stream: true,
+  };
+  const tools = toOpenAITools(config?.tools);
+  if (tools) {
+    body.tools = tools;
+    body.tool_choice = "auto";
+  }
+  const headers: Record<string, string> = { "Content-Type": "application/json" };
+  if (provider.apiKey) headers["Authorization"] = `Bearer ${provider.apiKey}`;
+  const res = await fetch(`${provider.baseUrl}/chat/completions`, {
+    method: "POST",
+    headers,
+    body: JSON.stringify(body),
+  });
+  if (!res.ok || !res.body) {
+    const errText = res.body ? await res.text() : "";
+    return { text: "", toolCalls: [], finishReason: null, ok: false, error: `${provider.providerId} stream error ${res.status}: ${errText.slice(0, 200)}` };
+  }
+  let fullText = "";
+  let finishReason: string | null = null;
+  /** Accumulators keyed by index (OpenAI streams tool_calls in chunks per index) */
+  const toolAcc = new Map<number, OpenAIToolCallAccumulator>();
+  const reader = res.body.getReader();
+  const decoder = new TextDecoder();
+  let buffer = "";
+  try {
+    while (true) {
+      const { value, done } = await reader.read();
+      if (done) break;
+      buffer += decoder.decode(value, { stream: true });
+      let idx;
+      while ((idx = buffer.indexOf("\n")) >= 0) {
+        const line = buffer.slice(0, idx).trim();
+        buffer = buffer.slice(idx + 1);
+        if (!line.startsWith("data:")) continue;
+        const jsonStr = line.slice(5).trim();
+        if (!jsonStr || jsonStr === "[DONE]") continue;
+        let data: Record<string, unknown>;
+        try { data = JSON.parse(jsonStr); } catch { continue; }
+        const choices = data.choices as Array<{
+          delta?: { content?: string; tool_calls?: Array<{ index: number; id?: string; function?: { name?: string; arguments?: string } }> };
+          finish_reason?: string | null;
+        }> | undefined;
+        if (!choices || choices.length === 0) continue;
+        const choice = choices[0];
+        const delta = choice.delta;
+        if (delta?.content) {
+          fullText += delta.content;
+          onTextDelta(delta.content);
+        }
+        if (delta?.tool_calls) {
+          for (const tc of delta.tool_calls) {
+            const acc = toolAcc.get(tc.index) ?? { index: tc.index, argsJson: "" };
+            if (tc.id) acc.id = tc.id;
+            if (tc.function?.name) acc.name = tc.function.name;
+            if (tc.function?.arguments) acc.argsJson += tc.function.arguments;
+            toolAcc.set(tc.index, acc);
+          }
+        }
+        if (choice.finish_reason) finishReason = choice.finish_reason;
+      }
+    }
+  } catch (e) {
+    return { text: fullText, toolCalls: [], finishReason, ok: false, error: e instanceof Error ? e.message : String(e) };
+  }
+  // Materialize tool calls
+  const toolCalls: LLMToolCall[] = [];
+  for (const acc of [...toolAcc.values()].sort((a, b) => a.index - b.index)) {
+    let args: Record<string, unknown> = {};
+    try { args = acc.argsJson ? JSON.parse(acc.argsJson) : {}; } catch { /* keep empty */ }
+    toolCalls.push({ id: acc.id || `call_${acc.index}`, name: acc.name || "", args });
+  }
+  return { text: fullText, toolCalls, finishReason, ok: true };
+}
+async function streamOpenAIWithTools(
+  messages: LLMMessage[],
+  callbacks: LLMStreamCallbacks,
+  config: LLMConfig | undefined,
+  provider: ResolvedProvider,
+): Promise<{ text: string; ok: boolean; error?: string }> {
+  // OpenAI history is a single flat array (system + user/assistant + tool)
+  const history: Array<Record<string, unknown>> = buildOpenAIMessages(messages);
+  let fullText = "";
+  const maxIterations = 4;
+  for (let iter = 0; iter < maxIterations; iter++) {
+    const result = await streamOpenAIOnce(history, config, provider, (chunk) => {
+      fullText += chunk;
+      callbacks.onChunk(chunk);
+    });
+    if (!result.ok) return { text: fullText, ok: false, error: result.error };
+    // Append assistant turn (text + tool_calls) to history
+    const assistantMsg: Record<string, unknown> = { role: "assistant", content: result.text || null };
+    if (result.toolCalls.length > 0) {
+      assistantMsg.tool_calls = result.toolCalls.map((c) => ({
+        id: c.id,
+        type: "function",
+        function: { name: c.name, arguments: JSON.stringify(c.args) },
+      }));
+    }
+    history.push(assistantMsg);
+    if (result.finishReason !== "tool_calls" || result.toolCalls.length === 0 || !callbacks.onToolCalls) {
+      return { text: fullText, ok: true };
+    }
+    let toolResults: LLMToolResult[] = [];
+    try {
+      toolResults = await callbacks.onToolCalls(result.toolCalls);
+    } catch (e) {
+      console.error("[voice-pipeline] tool handler error:", e);
+      toolResults = result.toolCalls.map((c) => ({ id: c.id, name: c.name, response: { error: e instanceof Error ? e.message : String(e) } }));
+    }
+    // Append tool results (one message per tool_call)
+    for (const r of toolResults) {
+      history.push({
+        role: "tool",
+        tool_call_id: r.id,
+        content: typeof r.response === "string" ? r.response : JSON.stringify(r.response),
+      });
+    }
+    // If the model called `end_call`, stop the loop (see Anthropic branch above
+    // for rationale — avoids a second redundant goodbye).
+    if (result.toolCalls.some((c) => c.name === "end_call")) {
+      return { text: fullText, ok: true };
+    }
+  }
+  console.warn(`[voice-pipeline] ${provider.providerId} tool loop hit max iterations`);
+  return { text: fullText, ok: true };
+}
+// ─── Public Provider ─────────────────────────────────────────────────────────
+export class InternalLLMProvider implements LLMProvider {
+  readonly id: LLMProviderId;
+  constructor(providerId: LLMProviderId) {
+    this.id = providerId;
+  }
+  async generate(messages: LLMMessage[], config?: LLMConfig): Promise<{ text: string; ok: boolean; error?: string }> {
+    // One-shot: prefer streaming (collect into a string) for tool support;
+    // fall back to callInternalAI for legacy callers without tools.
+    if (config?.tools && config.tools.length > 0) {
+      let text = "";
+      const r = await this.generateStream(messages, { onChunk: (c) => { text += c; } }, config);
+      return { text: text || r.text, ok: r.ok, error: r.error };
+    }
+    const system = messages.find((m) => m.role === "system")?.content;
+    const turns = messages
+      .filter((m) => m.role !== "system")
+      .map((m) => `${m.role === "user" ? "User" : "Assistant"}: ${m.content}`)
+      .join("\n\n");
+    return await callInternalAI({
+      systemPrompt: system,
+      userPrompt: turns + "\n\nAssistant:",
+      maxTokens: config?.maxTokens ?? 512,
+      temperature: config?.temperature ?? 0.6,
+      timeoutMs: 30_000,
+    });
+  }
+  async generateStream(
+    messages: LLMMessage[],
+    callbacks: LLMStreamCallbacks,
+    config?: LLMConfig,
+  ): Promise<{ text: string; ok: boolean; error?: string }> {
+    const provider = resolveProvider(this.id);
+    if (!provider) {
+      return {
+        text: "",
+        ok: false,
+        error: `Voice-Pipeline Provider "${this.id}" ist nicht konfiguriert. In Settings → Providers den API-Key hinterlegen und aktivieren — oder in Settings → Telephony → Voice Engine einen anderen Provider wählen.`,
+      };
+    }
+    if (provider.kind === "anthropic") {
+      return streamAnthropicWithTools(messages, callbacks, config, provider);
+    }
+    return streamOpenAIWithTools(messages, callbacks, config, provider);
+  }
+}

package/server/voice-pipeline/providers/stt-google.ts ADDED Viewed

@@ -0,0 +1,157 @@
+// ─── Google Cloud STT Provider (streaming) ──────────────────────────────────
+// Streams 8kHz LINEAR16 from FreeSWITCH directly into Cloud Speech-to-Text.
+// Uses the v2 streaming gRPC client for low latency.
+import { v1 as speechV1 } from "@google-cloud/speech";
+import type { STTConfig, STTProvider, STTResult, STTSession } from "../types.js";
+// Re-use the same service account key as Vertex AI (configured in telephony settings)
+function getKeyFile(): string {
+  return process.env.GCP_SERVICE_ACCOUNT_KEY
+    || "/opt/agentplatform/gcp-service-account.json";
+}
+// Google Cloud streaming recognize has a hard 305s limit per stream and the
+// underlying gRPC stream gets destroyed on any transient error. To keep the
+// call alive we auto-restart the stream whenever it ends/errors, unless the
+// session was explicitly closed.
+const STREAM_MAX_AGE_MS = 4 * 60 * 1000; // 4 min, safely below Google's 5 min cap
+class GoogleSTTSession implements STTSession {
+  private stream: ReturnType<speechV1.SpeechClient["streamingRecognize"]> | null = null;
+  private resultHandlers: Array<(r: STTResult) => void> = [];
+  private errorHandlers: Array<(e: Error) => void> = [];
+  private closed = false;
+  private streamStartedAt = 0;
+  private restartTimer: ReturnType<typeof setTimeout> | null = null;
+  private restarting = false;
+  constructor(private client: speechV1.SpeechClient, private config: STTConfig) {
+    this.start();
+  }
+  private start(): void {
+    const request = {
+      config: {
+        encoding: "LINEAR16" as const,
+        sampleRateHertz: this.config.sampleRateHertz,
+        languageCode: this.config.language,
+        enableAutomaticPunctuation: true,
+        // `latest_long` is best for conversational telephony
+        model: "latest_long",
+        useEnhanced: true,
+      },
+      interimResults: this.config.interimResults ?? true,
+      // Single-utterance is FALSE — we want continuous turn-taking
+      singleUtterance: false,
+    };
+    this.streamStartedAt = Date.now();
+    this.restarting = false;
+    this.stream = this.client
+      .streamingRecognize(request)
+      .on("data", (data: {
+        results?: Array<{
+          alternatives?: Array<{ transcript?: string; confidence?: number }>;
+          isFinal?: boolean;
+        }>;
+      }) => {
+        const result = data.results?.[0];
+        const alt = result?.alternatives?.[0];
+        if (!alt?.transcript) return;
+        const out: STTResult = {
+          text: alt.transcript,
+          isFinal: !!result?.isFinal,
+          confidence: alt.confidence,
+        };
+        for (const h of this.resultHandlers) h(out);
+      })
+      .on("error", (err: Error) => {
+        // Log once per stream instance, then restart silently so the call stays live
+        for (const h of this.errorHandlers) h(err);
+        this.scheduleRestart();
+      })
+      .on("end", () => {
+        this.scheduleRestart();
+      });
+  }
+  private scheduleRestart(): void {
+    if (this.closed || this.restarting) return;
+    this.restarting = true;
+    // Destroy the old stream reference so pushAudio() stops trying to write to it
+    const old = this.stream;
+    this.stream = null;
+    try { old?.destroy(); } catch { /* ignore */ }
+    // Small backoff to avoid hammering the API if something is truly broken
+    this.restartTimer = setTimeout(() => {
+      if (this.closed) return;
+      try {
+        this.start();
+      } catch (e) {
+        for (const h of this.errorHandlers) h(e instanceof Error ? e : new Error(String(e)));
+      }
+    }, 150);
+  }
+  pushAudio(pcm: Buffer | Uint8Array): void {
+    if (this.closed) return;
+    // Rotate stream before Google cuts us off at ~5 min
+    if (this.stream && Date.now() - this.streamStartedAt > STREAM_MAX_AGE_MS) {
+      this.scheduleRestart();
+    }
+    const s = this.stream;
+    if (!s || (s as unknown as { destroyed?: boolean }).destroyed) return;
+    try {
+      // The helper client wraps raw audio bytes into { audioContent } itself
+      // via its internal PassThrough transform — writing an object here would
+      // end up double-wrapped and Google rejects it as "Malordered Data".
+      s.write(Buffer.isBuffer(pcm) ? pcm : Buffer.from(pcm));
+    } catch {
+      // Stream was destroyed between the check and the write — recover silently
+      this.scheduleRestart();
+    }
+  }
+  async close(): Promise<void> {
+    if (this.closed) return;
+    this.closed = true;
+    if (this.restartTimer) {
+      clearTimeout(this.restartTimer);
+      this.restartTimer = null;
+    }
+    try {
+      this.stream?.end();
+    } catch {
+      // ignore
+    }
+    this.stream = null;
+  }
+  onResult(handler: (r: STTResult) => void): void {
+    this.resultHandlers.push(handler);
+  }
+  onError(handler: (e: Error) => void): void {
+    this.errorHandlers.push(handler);
+  }
+}
+export class GoogleSTTProvider implements STTProvider {
+  readonly id = "google" as const;
+  private client: speechV1.SpeechClient | null = null;
+  private getClient(): speechV1.SpeechClient {
+    if (!this.client) {
+      this.client = new speechV1.SpeechClient({
+        keyFilename: getKeyFile(),
+      });
+    }
+    return this.client;
+  }
+  async start(config: STTConfig): Promise<STTSession> {
+    return new GoogleSTTSession(this.getClient(), config);
+  }
+}