npm - stagent - Versions diffs - 0.5.0 → 0.6.1 - Mend

stagent 0.5.0 → 0.6.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (256) hide show

package/README.md +8 -8
package/dist/cli.js +146 -2
package/docs/.coverage-gaps.json +21 -0
package/docs/.last-generated +1 -1
package/docs/features/agent-intelligence.md +36 -14
package/docs/features/chat.md +33 -56
package/docs/features/cost-usage.md +14 -10
package/docs/features/dashboard-kanban.md +30 -13
package/docs/features/delivery-channels.md +198 -0
package/docs/features/design-system.md +10 -10
package/docs/features/documents.md +8 -8
package/docs/features/home-workspace.md +20 -15
package/docs/features/inbox-notifications.md +22 -10
package/docs/features/keyboard-navigation.md +11 -11
package/docs/features/monitoring.md +1 -1
package/docs/features/playbook.md +30 -32
package/docs/features/profiles.md +33 -11
package/docs/features/projects.md +2 -2
package/docs/features/provider-runtimes.md +58 -14
package/docs/features/schedules.md +70 -40
package/docs/features/settings.md +74 -46
package/docs/features/shared-components.md +7 -15
package/docs/features/tool-permissions.md +9 -9
package/docs/features/workflows.md +32 -21
package/docs/getting-started.md +33 -9
package/docs/index.md +25 -16
package/docs/journeys/developer.md +124 -207
package/docs/journeys/personal-use.md +70 -79
package/docs/journeys/power-user.md +107 -151
package/docs/journeys/work-use.md +81 -113
package/docs/manifest.json +77 -45
package/docs/superpowers/plans/2026-03-30-finish-in-progress-features.md +547 -0
package/docs/use-cases/agency-operator.md +84 -0
package/docs/use-cases/solo-founder.md +75 -0
package/docs/why-stagent.md +59 -0
package/package.json +10 -3
package/src/app/api/channels/[id]/route.ts +104 -0
package/src/app/api/channels/[id]/test/route.ts +52 -0
package/src/app/api/channels/inbound/slack/route.ts +116 -0
package/src/app/api/channels/inbound/telegram/poll/route.ts +140 -0
package/src/app/api/channels/inbound/telegram/route.ts +87 -0
package/src/app/api/channels/route.ts +72 -0
package/src/app/api/chat/conversations/route.ts +15 -0
package/src/app/api/chat/entities/search/route.ts +46 -31
package/src/app/api/data/clear/route.ts +4 -0
package/src/app/api/data/seed/route.ts +4 -0
package/src/app/api/documents/route.ts +36 -6
package/src/app/api/environment/profiles/suggest/route.ts +19 -3
package/src/app/api/environment/scan/route.ts +8 -1
package/src/app/api/handoffs/[id]/route.ts +76 -0
package/src/app/api/handoffs/route.ts +89 -0
package/src/app/api/memory/route.ts +181 -0
package/src/app/api/profiles/[id]/route.ts +16 -1
package/src/app/api/profiles/[id]/test/route.ts +4 -0
package/src/app/api/profiles/[id]/test-results/route.ts +22 -0
package/src/app/api/profiles/[id]/test-single/route.ts +64 -0
package/src/app/api/profiles/assist/route.ts +35 -0
package/src/app/api/profiles/import-repo/apply-updates/route.ts +123 -0
package/src/app/api/profiles/import-repo/check-updates/route.ts +163 -0
package/src/app/api/profiles/import-repo/confirm/route.ts +118 -0
package/src/app/api/profiles/import-repo/preview/route.ts +107 -0
package/src/app/api/profiles/import-repo/route.ts +29 -0
package/src/app/api/profiles/import-repo/scan/route.ts +25 -0
package/src/app/api/profiles/route.ts +73 -22
package/src/app/api/runtimes/ollama/route.ts +86 -0
package/src/app/api/runtimes/suggest/route.ts +29 -0
package/src/app/api/schedules/[id]/heartbeat-history/route.ts +77 -0
package/src/app/api/schedules/[id]/route.ts +41 -3
package/src/app/api/schedules/parse/route.ts +66 -0
package/src/app/api/schedules/route.ts +71 -12
package/src/app/api/settings/author-default/route.ts +7 -0
package/src/app/api/settings/learning/route.ts +41 -0
package/src/app/api/settings/ollama/route.ts +34 -0
package/src/app/api/settings/providers/route.ts +57 -0
package/src/app/api/settings/routing/route.ts +24 -0
package/src/app/api/settings/web-search/route.ts +28 -0
package/src/app/api/tasks/[id]/execute/route.ts +13 -1
package/src/app/api/tasks/[id]/respond/route.ts +23 -1
package/src/app/documents/page.tsx +3 -0
package/src/app/environment/page.tsx +8 -1
package/src/app/settings/page.tsx +10 -4
package/src/app/workflows/[id]/edit/page.tsx +2 -0
package/src/app/workflows/new/page.tsx +2 -0
package/src/components/chat/chat-command-popover.tsx +22 -19
package/src/components/chat/chat-input.tsx +5 -0
package/src/components/chat/chat-model-selector.tsx +42 -1
package/src/components/chat/chat-shell.tsx +2 -0
package/src/components/dashboard/welcome-landing.tsx +9 -9
package/src/components/environment/artifact-card.tsx +27 -1
package/src/components/environment/environment-dashboard.tsx +50 -2
package/src/components/environment/environment-summary-card.tsx +5 -2
package/src/components/environment/suggested-profiles.tsx +117 -52
package/src/components/handoffs/handoff-approval-card.tsx +159 -0
package/src/components/memory/memory-browser.tsx +315 -0
package/src/components/profiles/learned-context-panel.tsx +4 -4
package/src/components/profiles/profile-assist-panel.tsx +512 -0
package/src/components/profiles/profile-browser.tsx +109 -8
package/src/components/profiles/profile-card.tsx +29 -1
package/src/components/profiles/profile-detail-view.tsx +200 -28
package/src/components/profiles/profile-form-view.tsx +220 -82
package/src/components/profiles/repo-import-wizard.tsx +648 -0
package/src/components/profiles/smoke-test-editor.tsx +106 -0
package/src/components/schedules/schedule-create-sheet.tsx +9 -1
package/src/components/schedules/schedule-form.tsx +348 -9
package/src/components/schedules/schedule-list.tsx +15 -2
package/src/components/settings/auth-method-selector.tsx +7 -1
package/src/components/settings/budget-guardrails-section.tsx +111 -48
package/src/components/settings/channels-section.tsx +526 -0
package/src/components/settings/chat-settings-section.tsx +27 -1
package/src/components/settings/data-management-section.tsx +8 -6
package/src/components/settings/learning-context-section.tsx +124 -0
package/src/components/settings/ollama-section.tsx +270 -0
package/src/components/settings/providers-runtimes-section.tsx +499 -0
package/src/components/settings/web-search-section.tsx +101 -0
package/src/components/shared/tag-input.tsx +156 -0
package/src/components/tasks/kanban-board.tsx +32 -0
package/src/components/tasks/kanban-column.tsx +4 -2
package/src/components/tasks/task-card.tsx +1 -0
package/src/components/tasks/task-chip-bar.tsx +6 -1
package/src/components/tasks/task-create-panel.tsx +55 -5
package/src/components/workflows/workflow-form-view.tsx +38 -3
package/src/hooks/use-chat-autocomplete.ts +24 -26
package/src/hooks/use-project-skills.ts +66 -0
package/src/hooks/use-tag-suggestions.ts +31 -0
package/src/instrumentation.ts +4 -1
package/src/lib/agents/__tests__/claude-agent.test.ts +3 -0
package/src/lib/agents/__tests__/learned-context.test.ts +10 -0
package/src/lib/agents/agentic-loop.ts +235 -0
package/src/lib/agents/browser-mcp.ts +59 -4
package/src/lib/agents/claude-agent.ts +27 -200
package/src/lib/agents/handoff/bus.ts +164 -0
package/src/lib/agents/handoff/governance.ts +47 -0
package/src/lib/agents/handoff/types.ts +16 -0
package/src/lib/agents/learned-context.ts +27 -7
package/src/lib/agents/memory/decay.ts +61 -0
package/src/lib/agents/memory/extractor.ts +181 -0
package/src/lib/agents/memory/retrieval.ts +96 -0
package/src/lib/agents/memory/types.ts +6 -0
package/src/lib/agents/profiles/__tests__/project-profiles.test.ts +119 -0
package/src/lib/agents/profiles/__tests__/registry.test.ts +11 -3
package/src/lib/agents/profiles/builtins/code-reviewer/profile.yaml +2 -2
package/src/lib/agents/profiles/builtins/content-creator/SKILL.md +19 -0
package/src/lib/agents/profiles/builtins/content-creator/profile.yaml +27 -0
package/src/lib/agents/profiles/builtins/customer-support-agent/SKILL.md +19 -0
package/src/lib/agents/profiles/builtins/customer-support-agent/profile.yaml +26 -0
package/src/lib/agents/profiles/builtins/data-analyst/profile.yaml +2 -2
package/src/lib/agents/profiles/builtins/devops-engineer/profile.yaml +2 -2
package/src/lib/agents/profiles/builtins/document-writer/profile.yaml +2 -2
package/src/lib/agents/profiles/builtins/financial-analyst/SKILL.md +19 -0
package/src/lib/agents/profiles/builtins/financial-analyst/profile.yaml +24 -0
package/src/lib/agents/profiles/builtins/general/profile.yaml +2 -2
package/src/lib/agents/profiles/builtins/health-fitness-coach/profile.yaml +2 -2
package/src/lib/agents/profiles/builtins/learning-coach/profile.yaml +2 -2
package/src/lib/agents/profiles/builtins/marketing-strategist/SKILL.md +19 -0
package/src/lib/agents/profiles/builtins/marketing-strategist/profile.yaml +27 -0
package/src/lib/agents/profiles/builtins/operations-coordinator/SKILL.md +19 -0
package/src/lib/agents/profiles/builtins/operations-coordinator/profile.yaml +26 -0
package/src/lib/agents/profiles/builtins/project-manager/profile.yaml +2 -2
package/src/lib/agents/profiles/builtins/researcher/SKILL.md +1 -0
package/src/lib/agents/profiles/builtins/researcher/profile.yaml +2 -2
package/src/lib/agents/profiles/builtins/sales-researcher/SKILL.md +19 -0
package/src/lib/agents/profiles/builtins/sales-researcher/profile.yaml +26 -0
package/src/lib/agents/profiles/builtins/shopping-assistant/SKILL.md +1 -0
package/src/lib/agents/profiles/builtins/shopping-assistant/profile.yaml +2 -2
package/src/lib/agents/profiles/builtins/sweep/profile.yaml +1 -1
package/src/lib/agents/profiles/builtins/technical-writer/profile.yaml +2 -2
package/src/lib/agents/profiles/builtins/travel-planner/SKILL.md +2 -0
package/src/lib/agents/profiles/builtins/travel-planner/profile.yaml +2 -2
package/src/lib/agents/profiles/builtins/wealth-manager/SKILL.md +2 -0
package/src/lib/agents/profiles/builtins/wealth-manager/profile.yaml +2 -2
package/src/lib/agents/profiles/project-profiles.ts +193 -0
package/src/lib/agents/profiles/registry.ts +130 -6
package/src/lib/agents/profiles/types.ts +28 -0
package/src/lib/agents/router.ts +174 -2
package/src/lib/agents/runtime/__tests__/catalog.test.ts +15 -4
package/src/lib/agents/runtime/anthropic-direct.ts +644 -0
package/src/lib/agents/runtime/catalog.ts +57 -2
package/src/lib/agents/runtime/claude.ts +205 -1
package/src/lib/agents/runtime/index.ts +22 -0
package/src/lib/agents/runtime/ollama-adapter.ts +409 -0
package/src/lib/agents/runtime/openai-direct.ts +514 -0
package/src/lib/agents/runtime/profile-assist-types.ts +30 -0
package/src/lib/agents/runtime/types.ts +2 -0
package/src/lib/agents/tool-permissions.ts +203 -0
package/src/lib/channels/gateway.ts +321 -0
package/src/lib/channels/poller.ts +268 -0
package/src/lib/channels/registry.ts +90 -0
package/src/lib/channels/slack-adapter.ts +188 -0
package/src/lib/channels/telegram-adapter.ts +218 -0
package/src/lib/channels/types.ts +75 -0
package/src/lib/channels/webhook-adapter.ts +74 -0
package/src/lib/chat/context-builder.ts +22 -2
package/src/lib/chat/engine.ts +95 -13
package/src/lib/chat/ollama-engine.ts +198 -0
package/src/lib/chat/stagent-tools.ts +106 -20
package/src/lib/chat/tool-catalog.ts +24 -0
package/src/lib/chat/tool-registry.ts +90 -0
package/src/lib/chat/tools/chat-history-tools.ts +4 -4
package/src/lib/chat/tools/document-tools.ts +7 -7
package/src/lib/chat/tools/handoff-tools.ts +70 -0
package/src/lib/chat/tools/notification-tools.ts +4 -4
package/src/lib/chat/tools/profile-tools.ts +3 -3
package/src/lib/chat/tools/project-tools.ts +3 -3
package/src/lib/chat/tools/schedule-tools.ts +29 -13
package/src/lib/chat/tools/settings-tools.ts +2 -2
package/src/lib/chat/tools/task-tools.ts +66 -11
package/src/lib/chat/tools/usage-tools.ts +2 -2
package/src/lib/chat/tools/workflow-tools.ts +8 -8
package/src/lib/chat/types.ts +11 -5
package/src/lib/constants/known-tools.ts +19 -0
package/src/lib/constants/prose-styles.ts +1 -1
package/src/lib/constants/settings.ts +7 -0
package/src/lib/data/channel-bindings.ts +85 -0
package/src/lib/data/clear.ts +22 -0
package/src/lib/data/profile-test-results.ts +48 -0
package/src/lib/data/seed-data/conversations.ts +196 -0
package/src/lib/data/seed-data/learned-context.ts +99 -0
package/src/lib/data/seed-data/notifications.ts +54 -1
package/src/lib/data/seed-data/profile-test-results.ts +96 -0
package/src/lib/data/seed-data/repo-imports.ts +51 -0
package/src/lib/data/seed-data/views.ts +60 -0
package/src/lib/data/seed.ts +51 -0
package/src/lib/db/bootstrap.ts +162 -0
package/src/lib/db/migrations/0013_add_repo_imports.sql +15 -0
package/src/lib/db/migrations/0014_add_linked_profile_id.sql +3 -0
package/src/lib/db/migrations/0015_add_channel_bindings.sql +23 -0
package/src/lib/db/schema.ts +190 -1
package/src/lib/environment/__tests__/auto-scan.test.ts +86 -0
package/src/lib/environment/__tests__/profile-linker.test.ts +187 -0
package/src/lib/environment/auto-scan.ts +48 -0
package/src/lib/environment/data.ts +25 -0
package/src/lib/environment/profile-generator.ts +40 -10
package/src/lib/environment/profile-linker.ts +143 -0
package/src/lib/environment/profile-rules.ts +96 -0
package/src/lib/import/dedup.ts +149 -0
package/src/lib/import/format-adapter.ts +631 -0
package/src/lib/import/github-api.ts +219 -0
package/src/lib/import/repo-scanner.ts +251 -0
package/src/lib/schedules/__tests__/nlp-parser.test.ts +330 -0
package/src/lib/schedules/active-hours.ts +120 -0
package/src/lib/schedules/heartbeat-parser.ts +224 -0
package/src/lib/schedules/heartbeat-prompt.ts +153 -0
package/src/lib/schedules/nlp-parser.ts +357 -0
package/src/lib/schedules/scheduler.ts +218 -3
package/src/lib/settings/__tests__/budget-guardrails.test.ts +39 -1
package/src/lib/settings/helpers.ts +6 -0
package/src/lib/settings/routing.ts +24 -0
package/src/lib/settings/runtime-setup.ts +28 -1
package/src/lib/usage/ledger.ts +2 -1
package/src/lib/validators/__tests__/settings.test.ts +9 -0
package/src/lib/validators/profile.ts +39 -0
package/src/lib/workflows/blueprints/builtins/business-daily-briefing.yaml +102 -0
package/src/lib/workflows/blueprints/builtins/content-marketing-pipeline.yaml +90 -0
package/src/lib/workflows/blueprints/builtins/customer-support-triage.yaml +107 -0
package/src/lib/workflows/blueprints/builtins/financial-reporting.yaml +104 -0
package/src/lib/workflows/blueprints/builtins/lead-research-pipeline.yaml +82 -0

package/src/lib/agents/agentic-loop.ts ADDED Viewed

@@ -0,0 +1,235 @@
+/**
+ * Provider-agnostic agentic loop for direct API runtimes.
+ *
+ * The loop handles turn counting, budget tracking, abort signaling,
+ * and HITL tool permission checks. Provider-specific logic (API calls,
+ * event mapping, tool result formatting) is injected via callbacks.
+ */
+import type { ToolResult } from "@/lib/chat/tool-registry";
+import type { ToolPermissionResponse } from "./tool-permissions";
+// ── Types ────────────────────────────────────────────────────────────
+/** A single tool call extracted from the model response. */
+export interface ToolCall {
+  id: string;
+  name: string;
+  arguments: Record<string, unknown>;
+}
+/** Usage snapshot from a single model turn. */
+export interface TurnUsage {
+  inputTokens?: number;
+  outputTokens?: number;
+  totalTokens?: number;
+  modelId?: string;
+  costUsd?: number;
+}
+/** Events emitted during the loop for SSE streaming. */
+export type AgentStreamEvent =
+  | { type: "status"; phase: "running" | "tool_use" | "thinking"; message?: string }
+  | { type: "delta"; content: string }
+  | { type: "done"; finalText: string }
+  | { type: "error"; message: string };
+/** Result of a single model API call (accumulated from stream). */
+export interface ModelTurnResult {
+  /** Concatenated text output from the model. */
+  text: string;
+  /** Tool calls requested by the model. */
+  toolCalls: ToolCall[];
+  /** Whether the model indicated it is done (end_turn / stop). */
+  isComplete: boolean;
+  /** Whether output was truncated by max_tokens. */
+  needsContinuation: boolean;
+  /** Usage for this turn. */
+  usage: TurnUsage;
+}
+/** Message in the conversation history (provider-agnostic shape). */
+export type LoopMessage = Record<string, unknown>;
+/** Configuration for the agentic loop — provider injects callbacks. */
+export interface AgenticLoopConfig {
+  /**
+   * Call the model API with the current messages. Must stream events
+   * via `emitEvent` and return the accumulated turn result.
+   */
+  callModel: (
+    messages: LoopMessage[],
+    signal: AbortSignal,
+  ) => Promise<ModelTurnResult>;
+  /** Format a tool result for appending to the message history. */
+  formatToolResult: (
+    toolCallId: string,
+    toolName: string,
+    result: ToolResult,
+  ) => LoopMessage;
+  /** Format a continuation message (e.g. after max_tokens truncation). */
+  formatContinuation: () => LoopMessage;
+  /** Execute a Stagent tool by name. */
+  executeTool: (
+    name: string,
+    args: Record<string, unknown>,
+  ) => Promise<ToolResult>;
+  /** HITL permission check. Return allow/deny. */
+  checkPermission: (
+    toolName: string,
+    args: Record<string, unknown>,
+  ) => Promise<ToolPermissionResponse>;
+  /** Emit SSE event for real-time UI streaming. */
+  emitEvent: (event: AgentStreamEvent) => void;
+  /** Maximum model turns before stopping. */
+  maxTurns: number;
+  /** Maximum budget in USD before stopping. */
+  maxBudgetUsd?: number;
+  /** Abort signal for cancellation. */
+  signal: AbortSignal;
+}
+/** Result of the agentic loop. */
+export interface AgenticLoopResult {
+  finalText: string;
+  turnCount: number;
+  totalUsage: TurnUsage;
+  stopReason: "complete" | "max_turns" | "budget_exceeded" | "cancelled" | "error";
+}
+// ── Loop implementation ──────────────────────────────────────────────
+function mergeTurnUsage(total: TurnUsage, turn: TurnUsage): TurnUsage {
+  return {
+    inputTokens: (total.inputTokens ?? 0) + (turn.inputTokens ?? 0),
+    outputTokens: (total.outputTokens ?? 0) + (turn.outputTokens ?? 0),
+    totalTokens: (total.totalTokens ?? 0) + (turn.totalTokens ?? 0),
+    modelId: turn.modelId ?? total.modelId,
+    costUsd: (total.costUsd ?? 0) + (turn.costUsd ?? 0),
+  };
+}
+/**
+ * Run a provider-agnostic agentic loop.
+ *
+ * Repeatedly calls the model, handles tool execution with HITL checks,
+ * and enforces turn/budget limits until the model completes or a limit
+ * is reached.
+ */
+export async function runAgenticLoop(
+  initialMessages: LoopMessage[],
+  config: AgenticLoopConfig,
+): Promise<AgenticLoopResult> {
+  const messages = [...initialMessages];
+  let turnCount = 0;
+  let totalUsage: TurnUsage = {};
+  let lastText = "";
+  while (turnCount < config.maxTurns) {
+    // Check cancellation
+    if (config.signal.aborted) {
+      return { finalText: lastText, turnCount, totalUsage, stopReason: "cancelled" };
+    }
+    // Check budget
+    if (config.maxBudgetUsd && (totalUsage.costUsd ?? 0) >= config.maxBudgetUsd) {
+      config.emitEvent({ type: "error", message: "Budget limit exceeded" });
+      return { finalText: lastText, turnCount, totalUsage, stopReason: "budget_exceeded" };
+    }
+    // Call model
+    turnCount++;
+    let turnResult: ModelTurnResult;
+    try {
+      turnResult = await config.callModel(messages, config.signal);
+    } catch (err) {
+      if (config.signal.aborted) {
+        return { finalText: lastText, turnCount, totalUsage, stopReason: "cancelled" };
+      }
+      const message = err instanceof Error ? err.message : "Model API call failed";
+      config.emitEvent({ type: "error", message });
+      return { finalText: lastText, turnCount, totalUsage, stopReason: "error" };
+    }
+    totalUsage = mergeTurnUsage(totalUsage, turnResult.usage);
+    if (turnResult.text) lastText = turnResult.text;
+    // Handle completion
+    if (turnResult.isComplete && turnResult.toolCalls.length === 0) {
+      config.emitEvent({ type: "done", finalText: lastText });
+      return { finalText: lastText, turnCount, totalUsage, stopReason: "complete" };
+    }
+    // Handle tool calls
+    if (turnResult.toolCalls.length > 0) {
+      for (const toolCall of turnResult.toolCalls) {
+        if (config.signal.aborted) {
+          return { finalText: lastText, turnCount, totalUsage, stopReason: "cancelled" };
+        }
+        config.emitEvent({
+          type: "status",
+          phase: "tool_use",
+          message: toolCall.name,
+        });
+        // HITL permission check
+        const permission = await config.checkPermission(
+          toolCall.name,
+          toolCall.arguments,
+        );
+        let result: ToolResult;
+        if (permission.behavior === "deny") {
+          result = {
+            content: [{ type: "text", text: JSON.stringify({ error: permission.message ?? "Tool denied by user" }) }],
+            isError: true,
+          };
+        } else {
+          try {
+            result = await config.executeTool(
+              toolCall.name,
+              (permission.updatedInput as Record<string, unknown>) ?? toolCall.arguments,
+            );
+          } catch (err) {
+            result = {
+              content: [{ type: "text", text: JSON.stringify({ error: err instanceof Error ? err.message : "Tool execution failed" }) }],
+              isError: true,
+            };
+          }
+        }
+        // Append tool result to messages
+        messages.push(
+          config.formatToolResult(toolCall.id, toolCall.name, result),
+        );
+      }
+      // Continue loop — model needs to process tool results
+      continue;
+    }
+    // Handle max_tokens continuation
+    if (turnResult.needsContinuation) {
+      messages.push(config.formatContinuation());
+      continue;
+    }
+    // Shouldn't reach here — safeguard
+    config.emitEvent({ type: "done", finalText: lastText });
+    return { finalText: lastText, turnCount, totalUsage, stopReason: "complete" };
+  }
+  // Max turns exceeded
+  config.emitEvent({ type: "error", message: `Max turns (${config.maxTurns}) reached` });
+  return { finalText: lastText, turnCount, totalUsage, stopReason: "max_turns" };
+}

package/src/lib/agents/browser-mcp.ts CHANGED Viewed

@@ -1,13 +1,22 @@
 import { getSetting } from "@/lib/settings/helpers";
 import { SETTINGS_KEYS } from "@/lib/constants/settings";
-// ── MCP server config type (matches Claude Agent SDK shape) ──────────
+// ── MCP server config types (matches Claude Agent SDK shape) ─────────
-interface McpServerConfig {
+interface McpStdioConfig {
+  type?: "stdio";
   command: string;
   args: string[];
 }
+interface McpHttpConfig {
+  type: "http";
+  url: string;
+  headers?: Record<string, string>;
+}
+type AnyMcpServerConfig = McpStdioConfig | McpHttpConfig;
 // ── Read-only browser tools — auto-approved in chat & task permission callbacks
 export const BROWSER_READ_ONLY_TOOLS = new Set([
@@ -72,7 +81,7 @@ function parseExtraArgs(config: string | null): string[] {
  *
  * Returns `{}` when neither server is enabled — zero overhead.
  */
-export async function getBrowserMcpServers(): Promise<Record<string, McpServerConfig>> {
+export async function getBrowserMcpServers(): Promise<Record<string, McpStdioConfig>> {
   const [chromeEnabled, playwrightEnabled, chromeConfig, playwrightConfig] =
     await Promise.all([
       getSetting(SETTINGS_KEYS.BROWSER_MCP_CHROME_DEVTOOLS_ENABLED),
@@ -81,7 +90,7 @@ export async function getBrowserMcpServers(): Promise<Record<string, McpServerCo
       getSetting(SETTINGS_KEYS.BROWSER_MCP_PLAYWRIGHT_CONFIG),
     ]);
-  const servers: Record<string, McpServerConfig> = {};
+  const servers: Record<string, McpStdioConfig> = {};
   if (chromeEnabled === "true") {
     const extraArgs = parseExtraArgs(chromeConfig);
@@ -117,3 +126,49 @@ export async function getBrowserAllowedToolPatterns(): Promise<string[]> {
   if (playwrightEnabled === "true") patterns.push("mcp__playwright__*");
   return patterns;
 }
+// ── Exa Search MCP — semantic web search ────────────────────────────
+/** All Exa tools are read-only (search, similarity, content fetch) */
+export const EXA_READ_ONLY_TOOLS = new Set([
+  "mcp__exa__web_search_exa",
+  "mcp__exa__find_similar",
+  "mcp__exa__get_contents",
+]);
+export function isExaTool(toolName: string): boolean {
+  return toolName.startsWith("mcp__exa__");
+}
+export function isExaReadOnly(toolName: string): boolean {
+  return EXA_READ_ONLY_TOOLS.has(toolName);
+}
+/**
+ * Read external MCP server settings from DB and return configs
+ * for any enabled servers. Currently supports Exa Search.
+ *
+ * Returns `{}` when nothing is enabled — zero overhead.
+ */
+export async function getExternalMcpServers(): Promise<Record<string, AnyMcpServerConfig>> {
+  const exaEnabled = await getSetting(SETTINGS_KEYS.EXA_SEARCH_MCP_ENABLED);
+  const servers: Record<string, AnyMcpServerConfig> = {};
+  if (exaEnabled === "true") {
+    servers.exa = { type: "http", url: "https://mcp.exa.ai/mcp" };
+  }
+  return servers;
+}
+/**
+ * Build the allowedTools glob patterns for enabled external MCP servers.
+ */
+export async function getExternalAllowedToolPatterns(): Promise<string[]> {
+  const exaEnabled = await getSetting(SETTINGS_KEYS.EXA_SEARCH_MCP_ENABLED);
+  const patterns: string[] = [];
+  if (exaEnabled === "true") patterns.push("mcp__exa__*");
+  return patterns;
+}

package/src/lib/agents/claude-agent.ts CHANGED Viewed

@@ -1,5 +1,4 @@
 import { query } from "@anthropic-ai/claude-agent-sdk";
-import { z } from "zod";
 import { db } from "@/lib/db";
 import { tasks, projects, agentLogs, notifications } from "@/lib/db/schema";
 import { eq } from "drizzle-orm";
@@ -20,7 +19,7 @@ import { getActiveLearnedContext } from "./learned-context";
 import { getLaunchCwd, getWorkspaceContext } from "@/lib/environment/workspace-context";
 import { analyzeForLearnedPatterns } from "./pattern-extractor";
 import { processSweepResult } from "./sweep";
-import { getBrowserMcpServers } from "./browser-mcp";
+import { getBrowserMcpServers, getExternalMcpServers } from "./browser-mcp";
 import { persistScreenshot, SCREENSHOT_TOOL_NAMES } from "@/lib/screenshots/persist";
 import {
   extractUsageSnapshot,
@@ -30,6 +29,10 @@ import {
   type UsageActivityType,
   type UsageSnapshot,
 } from "@/lib/usage/ledger";
+import {
+  handleToolPermission,
+  clearPermissionCache,
+} from "./tool-permissions";
 /** Typed representation of messages from the Agent SDK stream */
 interface AgentStreamMessage {
@@ -44,7 +47,7 @@ interface AgentStreamMessage {
   result?: unknown;
 }
-interface TaskUsageState extends UsageSnapshot {
+export interface TaskUsageState extends UsageSnapshot {
   activityType: UsageActivityType;
   startedAt: Date;
   taskId: string;
@@ -53,44 +56,7 @@ interface TaskUsageState extends UsageSnapshot {
   scheduleId?: string | null;
 }
-const toolPermissionResponseSchema = z.object({
-  behavior: z.enum(["allow", "deny"]),
-  updatedInput: z.unknown().optional(),
-  message: z.string().optional(),
-});
-type ToolPermissionResponse = z.infer<typeof toolPermissionResponseSchema>;
-const inFlightPermissionRequests = new Map<
-  string,
-  Promise<ToolPermissionResponse>
->();
-const settledPermissionRequests = new Map<string, ToolPermissionResponse>();
-function buildAllowedToolPermissionResponse(
-  input: Record<string, unknown>
-): ToolPermissionResponse {
-  return {
-    behavior: "allow",
-    updatedInput: input,
-  };
-}
-function normalizeToolPermissionResponse(
-  response: ToolPermissionResponse,
-  input: Record<string, unknown>
-): ToolPermissionResponse {
-  if (response.behavior !== "allow" || response.updatedInput !== undefined) {
-    return response;
-  }
-  return {
-    ...response,
-    updatedInput: input,
-  };
-}
-function createTaskUsageState(
+export function createTaskUsageState(
   task: {
     id: string;
     projectId?: string | null;
@@ -117,64 +83,7 @@ function applyUsageSnapshot(state: TaskUsageState, source: unknown) {
   Object.assign(state, mergeUsageSnapshot(state, extractUsageSnapshot(source)));
 }
-function buildPermissionCacheKey(
-  taskId: string,
-  toolName: string,
-  input: Record<string, unknown>
-): string {
-  return `${taskId}::${toolName}::${JSON.stringify(input)}`;
-}
-function clearPermissionCache(taskId: string) {
-  const prefix = `${taskId}::`;
-  for (const key of inFlightPermissionRequests.keys()) {
-    if (key.startsWith(prefix)) {
-      inFlightPermissionRequests.delete(key);
-    }
-  }
-  for (const key of settledPermissionRequests.keys()) {
-    if (key.startsWith(prefix)) {
-      settledPermissionRequests.delete(key);
-    }
-  }
-}
-async function waitForToolPermissionResponse(
-  notificationId: string
-): Promise<ToolPermissionResponse> {
-  const deadline = Date.now() + 55_000;
-  const pollInterval = 1500;
-  while (Date.now() < deadline) {
-    const [notification] = await db
-      .select()
-      .from(notifications)
-      .where(eq(notifications.id, notificationId));
-    if (notification?.response) {
-      try {
-        const parsed = JSON.parse(notification.response);
-        const validated = toolPermissionResponseSchema.safeParse(parsed);
-        if (validated.success) {
-          return validated.data;
-        }
-        console.error("[claude-agent] Invalid permission response shape:", validated.error.message);
-        return { behavior: "deny", message: "Invalid response format" };
-      } catch (err) {
-        console.error("[claude-agent] Failed to parse permission response:", err);
-        return { behavior: "deny", message: "Invalid response format" };
-      }
-    }
-    await new Promise((resolve) => setTimeout(resolve, pollInterval));
-  }
-  return { behavior: "deny", message: "Permission request timed out" };
-}
-async function finalizeTaskUsage(
+export async function finalizeTaskUsage(
   state: TaskUsageState,
   status: "completed" | "failed" | "cancelled"
 ) {
@@ -272,8 +181,9 @@ async function processAgentStream(
       for (const block of message.message.content) {
         if (block.type === "tool_use") {
           // Track screenshot tool_use IDs for result interception
-          if (typeof block.name === "string" && SCREENSHOT_TOOL_NAMES.has(block.name) && typeof block.id === "string") {
-            pendingScreenshotTools.add(block.id);
+          const toolBlock = block as { type: string; id?: string; name?: string; input?: unknown };
+          if (typeof toolBlock.name === "string" && SCREENSHOT_TOOL_NAMES.has(toolBlock.name) && typeof toolBlock.id === "string") {
+            pendingScreenshotTools.add(toolBlock.id);
           }
           await db.insert(agentLogs).values({
             id: crypto.randomUUID(),
@@ -429,7 +339,7 @@ async function processAgentStream(
 // Shared prompt & query context builder (F12: eliminate duplication)
 // ---------------------------------------------------------------------------
-interface TaskQueryContext {
+export interface TaskQueryContext {
   /** User task content — goes into `prompt` */
   userPrompt: string;
   /** System instructions — goes into `options.systemPrompt` */
@@ -444,7 +354,7 @@ interface TaskQueryContext {
   canUseToolPolicy?: CanUseToolPolicy;
 }
-async function buildTaskQueryContext(
+export async function buildTaskQueryContext(
   task: { id: string; title: string; description?: string | null; projectId?: string | null },
   profileId: string
 ): Promise<TaskQueryContext> {
@@ -462,7 +372,7 @@ async function buildTaskQueryContext(
   const outputInstructions = buildTaskOutputInstructions(task.id);
   const learnedCtx = getActiveLearnedContext(profileId);
   const learnedCtxBlock = learnedCtx
-    ? `## Learned Context\nPatterns and insights learned from previous tasks:\n\n${learnedCtx}`
+    ? `## Learned Context\n<learned-context>\n${learnedCtx}\n</learned-context>`
     : "";
   // Resolve working directory: project's workingDirectory > launch cwd
@@ -520,10 +430,13 @@ export async function executeClaudeTask(taskId: string): Promise<void> {
     await prepareTaskOutputDirectory(taskId, { clearExisting: true });
     const ctx = await buildTaskQueryContext(task, agentProfileId);
-    // Merge browser MCP servers when enabled globally
-    const browserServers = await getBrowserMcpServers();
+    // Merge browser + external MCP servers when enabled globally
+    const [browserServers, externalServers] = await Promise.all([
+      getBrowserMcpServers(),
+      getExternalMcpServers(),
+    ]);
     const profileMcpServers = ctx.payload?.mcpServers ?? {};
-    const mergedMcpServers = { ...profileMcpServers, ...browserServers };
+    const mergedMcpServers = { ...profileMcpServers, ...browserServers, ...externalServers };
     const authEnv = await getAuthEnv();
     const response = query({
@@ -630,10 +543,13 @@ export async function resumeClaudeTask(taskId: string): Promise<void> {
     await prepareTaskOutputDirectory(taskId);
     const ctx = await buildTaskQueryContext(task, profileId);
-    // Merge browser MCP servers when enabled globally
-    const browserServers = await getBrowserMcpServers();
+    // Merge browser + external MCP servers when enabled globally
+    const [browserServers, externalServers] = await Promise.all([
+      getBrowserMcpServers(),
+      getExternalMcpServers(),
+    ]);
     const profileMcpServers = ctx.payload?.mcpServers ?? {};
-    const mergedMcpServers = { ...profileMcpServers, ...browserServers };
+    const mergedMcpServers = { ...profileMcpServers, ...browserServers, ...externalServers };
     const authEnv = await getAuthEnv();
     const response = query({
@@ -781,93 +697,4 @@ async function handleExecutionError(
   }
 }
-/**
- * Handle tool permission by inserting a notification and polling for response.
- * Uses database polling pattern — the Inbox UI writes the response.
- */
-async function handleToolPermission(
-  taskId: string,
-  toolName: string,
-  input: Record<string, unknown>,
-  canUseToolPolicy?: CanUseToolPolicy
-): Promise<ToolPermissionResponse> {
-  const isQuestion = toolName === "AskUserQuestion";
-  // Layer 1: Profile-level canUseToolPolicy — fastest check, no I/O
-  if (!isQuestion && canUseToolPolicy) {
-    if (canUseToolPolicy.autoApprove?.includes(toolName)) {
-      return buildAllowedToolPermissionResponse(input);
-    }
-    if (canUseToolPolicy.autoDeny?.includes(toolName)) {
-      return { behavior: "deny", message: `Profile policy denies ${toolName}` };
-    }
-  }
-  // Layer 2: Saved user permissions — skip notification for pre-approved tools
-  if (!isQuestion) {
-    const { isToolAllowed } = await import("@/lib/settings/permissions");
-    if (await isToolAllowed(toolName, input)) {
-      return buildAllowedToolPermissionResponse(input);
-    }
-  }
-  if (!isQuestion) {
-    const cacheKey = buildPermissionCacheKey(taskId, toolName, input);
-    const settledResponse = settledPermissionRequests.get(cacheKey);
-    if (settledResponse) {
-      return normalizeToolPermissionResponse(settledResponse, input);
-    }
-    const pendingRequest = inFlightPermissionRequests.get(cacheKey);
-    if (pendingRequest) {
-      return pendingRequest;
-    }
-    const requestPromise = (async () => {
-      const notificationId = crypto.randomUUID();
-      await db.insert(notifications).values({
-        id: notificationId,
-        taskId,
-        type: "permission_required",
-        title: `Permission required: ${toolName}`,
-        body: JSON.stringify(input).slice(0, 1000),
-        toolName,
-        toolInput: JSON.stringify(input),
-        createdAt: new Date(),
-      });
-      const response = normalizeToolPermissionResponse(
-        await waitForToolPermissionResponse(notificationId),
-        input
-      );
-      settledPermissionRequests.set(cacheKey, response);
-      return response;
-    })();
-    inFlightPermissionRequests.set(cacheKey, requestPromise);
-    try {
-      return await requestPromise;
-    } finally {
-      inFlightPermissionRequests.delete(cacheKey);
-    }
-  }
-  const notificationId = crypto.randomUUID();
-  await db.insert(notifications).values({
-    id: notificationId,
-    taskId,
-    type: isQuestion ? "agent_message" : "permission_required",
-    title: isQuestion
-      ? "Agent has a question"
-      : `Permission required: ${toolName}`,
-    body: JSON.stringify(input).slice(0, 1000),
-    toolName,
-    toolInput: JSON.stringify(input),
-    createdAt: new Date(),
-  });
-  return waitForToolPermissionResponse(notificationId);
-}
+// handleToolPermission and clearPermissionCache imported from ./tool-permissions