npm - @vellumai/assistant - Versions diffs - 0.8.2 → 0.8.3 - Mend

@vellumai/assistant 0.8.2 → 0.8.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (231) hide show

package/ARCHITECTURE.md +11 -12
package/docker-entrypoint.sh +13 -1
package/docker-init-apt-root.sh +79 -6
package/openapi.yaml +336 -21
package/package.json +1 -1
package/src/__tests__/agent-loop-exit-reason.test.ts +272 -0
package/src/__tests__/agent-loop-provider-error-recording.test.ts +195 -0
package/src/__tests__/compactor-tail-resolution.test.ts +107 -1
package/src/__tests__/config-get-vision-flag.test.ts +136 -0
package/src/__tests__/config-loader-backfill.test.ts +115 -18
package/src/__tests__/context-token-estimator.test.ts +30 -65
package/src/__tests__/conversation-agent-loop.test.ts +57 -1
package/src/__tests__/conversation-media-retry.test.ts +19 -8
package/src/__tests__/conversation-runtime-assembly.test.ts +26 -4
package/src/__tests__/date-context.test.ts +45 -0
package/src/__tests__/external-plugin-loader.test.ts +91 -19
package/src/__tests__/guardian-action-no-hardcoded-copy.test.ts +0 -1
package/src/__tests__/guardian-dispatch.test.ts +1 -0
package/src/__tests__/heartbeat-service.test.ts +24 -164
package/src/__tests__/helpers/channel-test-adapter.ts +0 -2
package/src/__tests__/host-app-control-proxy.test.ts +241 -0
package/src/__tests__/host-proxy-preactivation.test.ts +200 -13
package/src/__tests__/injector-background-turn.test.ts +153 -0
package/src/__tests__/injector-chain.test.ts +5 -0
package/src/__tests__/lifecycle-memory-v2-seed.test.ts +9 -2
package/src/__tests__/llm-callsite-catalog.test.ts +25 -0
package/src/__tests__/llm-catalog-parity.test.ts +3 -0
package/src/__tests__/llm-request-log-agent-loop-exit-reason.test.ts +116 -0
package/src/__tests__/llm-request-log-error-payload.test.ts +138 -0
package/src/__tests__/llm-request-log-source-clickhouse.test.ts +2 -0
package/src/__tests__/llm-resolver.test.ts +255 -2
package/src/__tests__/managed-profile-guard.test.ts +10 -0
package/src/__tests__/notification-decision-fallback.test.ts +0 -91
package/src/__tests__/notification-decision-strategy.test.ts +14 -31
package/src/__tests__/notification-deep-link.test.ts +15 -0
package/src/__tests__/notification-guardian-path.test.ts +1 -2
package/src/__tests__/notification-platform-adapter.test.ts +5 -4
package/src/__tests__/notification-telegram-adapter.test.ts +1 -0
package/src/__tests__/notification-vellum-adapter.test.ts +113 -0
package/src/__tests__/openai-provider.test.ts +218 -3
package/src/__tests__/openai-responses-cutover-guard.test.ts +3 -3
package/src/__tests__/openrouter-provider-only.test.ts +51 -3
package/src/__tests__/openrouter-token-estimation.test.ts +34 -25
package/src/__tests__/platform-proxy-context.test.ts +6 -1
package/src/__tests__/plugin-tool-contribution.test.ts +3 -3
package/src/__tests__/plugin-types.test.ts +2 -2
package/src/__tests__/provider-catalog-visibility.test.ts +16 -0
package/src/__tests__/provider-platform-proxy-integration.test.ts +27 -25
package/src/__tests__/secret-routes-platform-proxy.test.ts +1 -1
package/src/__tests__/system-prompt.test.ts +6 -73
package/src/__tests__/workspace-migration-087-memory-router-balanced-profile.test.ts +228 -0
package/src/a2a/__tests__/agent-card.test.ts +98 -0
package/src/a2a/__tests__/e2e-a2a-channel.test.ts +597 -0
package/src/a2a/__tests__/protocol-helpers.test.ts +113 -0
package/src/a2a/__tests__/task-store.test.ts +246 -0
package/src/a2a/agent-card.ts +58 -0
package/src/a2a/feature-gate.ts +8 -0
package/src/a2a/protocol-constants.ts +21 -0
package/src/a2a/protocol-errors.ts +50 -0
package/src/a2a/protocol-types.ts +162 -0
package/src/a2a/task-store.ts +168 -0
package/src/agent/loop.ts +167 -18
package/src/channels/config.ts +9 -0
package/src/channels/types.ts +14 -0
package/src/cli/{__tests__ → commands/__tests__}/notifications.test.ts +201 -28
package/src/cli/commands/__tests__/schedules.test.ts +469 -0
package/src/cli/commands/notifications.ts +65 -35
package/src/cli/commands/plugins.ts +67 -0
package/src/cli/commands/schedules.ts +297 -5
package/src/cli/lib/__tests__/search-plugins.test.ts +261 -0
package/src/cli/lib/install-from-github.ts +8 -9
package/src/cli/lib/search-plugins.ts +163 -0
package/src/cli/program.ts +14 -0
package/src/config/assistant-feature-flags.ts +24 -54
package/src/config/bundled-skills/app-builder/SKILL.md +117 -1
package/src/config/bundled-skills/phone-calls/SKILL.md +1 -1
package/src/config/call-site-defaults.ts +105 -0
package/src/config/feature-flag-registry.json +21 -29
package/src/config/llm-resolver.ts +52 -1
package/src/config/schema.ts +2 -0
package/src/config/schemas/__tests__/memory-v2.test.ts +3 -3
package/src/config/schemas/channels.ts +9 -0
package/src/config/schemas/conversations.ts +10 -0
package/src/config/schemas/heartbeat.ts +14 -0
package/src/config/schemas/llm.ts +1 -3
package/src/config/schemas/memory-retrospective.ts +1 -1
package/src/config/schemas/memory-v2.ts +4 -4
package/src/config/schemas/memory.ts +3 -1
package/src/config/seed-inference-profiles.ts +99 -29
package/src/context/compactor.ts +72 -12
package/src/context/token-estimator.ts +32 -34
package/src/daemon/__tests__/conversation-lifecycle-auto-analyze.test.ts +3 -22
package/src/daemon/conversation-agent-loop-handlers.ts +78 -0
package/src/daemon/conversation-agent-loop.ts +29 -2
package/src/daemon/conversation-runtime-assembly.ts +9 -0
package/src/daemon/conversation.ts +0 -7
package/src/daemon/date-context.ts +40 -0
package/src/daemon/guardian-action-generators.ts +1 -125
package/src/daemon/handlers/__tests__/config-a2a-complete.test.ts +248 -0
package/src/daemon/handlers/__tests__/config-a2a-invite.test.ts +154 -0
package/src/daemon/handlers/__tests__/config-a2a-redeem.test.ts +133 -0
package/src/daemon/handlers/__tests__/config-a2a.test.ts +95 -0
package/src/daemon/handlers/config-a2a.ts +289 -0
package/src/daemon/handlers/conversations.ts +1 -0
package/src/daemon/host-app-control-proxy.ts +69 -18
package/src/daemon/host-proxy-preactivation.ts +85 -18
package/src/daemon/lifecycle.ts +49 -61
package/src/daemon/memory-v2-startup.ts +49 -13
package/src/daemon/message-types/notifications.ts +21 -0
package/src/daemon/pkb-reminder-builder.test.ts +10 -53
package/src/daemon/pkb-reminder-builder.ts +4 -19
package/src/daemon/process-message.ts +3 -0
package/src/daemon/skill-memory-refresh.ts +5 -1
package/src/daemon/wake-target-adapter.ts +2 -0
package/src/export/__tests__/transcript-formatter.test.ts +121 -0
package/src/export/transcript-formatter.ts +54 -20
package/src/heartbeat/__tests__/heartbeat-service.test.ts +44 -0
package/src/heartbeat/heartbeat-service.ts +34 -191
package/src/home/__tests__/feed-types.test.ts +40 -0
package/src/home/feed-types.ts +14 -2
package/src/ipc/cli-client.ts +147 -45
package/src/memory/__tests__/conversation-queries.test.ts +220 -0
package/src/memory/__tests__/memory-retrospective-enqueue.test.ts +2 -50
package/src/memory/__tests__/memory-retrospective-job.test.ts +87 -4
package/src/memory/conversation-queries.ts +87 -1
package/src/memory/conversation-title-service.ts +26 -4
package/src/memory/db-init.ts +6 -0
package/src/memory/graph/__tests__/conversation-graph-memory-v2-routing.test.ts +84 -3
package/src/memory/graph/conversation-graph-memory.ts +18 -6
package/src/memory/graph/tools.ts +6 -37
package/src/memory/invite-store.ts +53 -0
package/src/memory/llm-request-log-source-clickhouse.ts +7 -2
package/src/memory/llm-request-log-store.ts +92 -1
package/src/memory/memory-retrospective-enqueue.ts +1 -20
package/src/memory/memory-retrospective-job.ts +33 -6
package/src/memory/migrations/250-provider-connection-base-url-and-models.ts +28 -0
package/src/memory/migrations/251-a2a-tasks.ts +49 -0
package/src/memory/migrations/252-llm-request-log-agent-loop-exit-reason.ts +32 -0
package/src/memory/migrations/index.ts +3 -0
package/src/memory/migrations/registry.ts +8 -0
package/src/memory/schema/a2a.ts +15 -0
package/src/memory/schema/index.ts +1 -0
package/src/memory/schema/inference.ts +2 -0
package/src/memory/schema/infrastructure.ts +1 -0
package/src/memory/v2/__tests__/activation-store.test.ts +25 -23
package/src/memory/v2/__tests__/cli-command-store.test.ts +404 -0
package/src/memory/v2/__tests__/frontmatter-sweep.test.ts +25 -4
package/src/memory/v2/__tests__/injection.test.ts +190 -3
package/src/memory/v2/__tests__/static-context.test.ts +12 -1
package/src/memory/v2/activation-store.ts +14 -16
package/src/memory/v2/cli-command-content.ts +19 -0
package/src/memory/v2/cli-command-store.ts +304 -0
package/src/memory/v2/frontmatter-sweep.ts +7 -1
package/src/memory/v2/injection.ts +49 -20
package/src/memory/v2/page-index.ts +38 -13
package/src/memory/v2/static-context.ts +4 -4
package/src/memory/v2/types.ts +23 -0
package/src/messaging/providers/a2a/__tests__/deliver.test.ts +274 -0
package/src/messaging/providers/a2a/deliver.ts +156 -0
package/src/messaging/providers/gmail/client.ts +9 -2
package/src/messaging/providers/index.ts +11 -2
package/src/notifications/__tests__/broadcaster.test.ts +203 -0
package/src/notifications/__tests__/decision-engine.test.ts +283 -0
package/src/notifications/__tests__/deterministic-checks.test.ts +286 -0
package/src/notifications/__tests__/emit-signal-home-feed.test.ts +1 -0
package/src/notifications/__tests__/home-feed-side-effect.test.ts +430 -7
package/src/notifications/adapters/macos.ts +12 -2
package/src/notifications/broadcaster.ts +29 -4
package/src/notifications/copy-composer.ts +17 -64
package/src/notifications/decision-engine.ts +111 -44
package/src/notifications/deterministic-checks.ts +96 -0
package/src/notifications/emit-signal.ts +1 -0
package/src/notifications/home-feed-side-effect.ts +85 -6
package/src/notifications/signal.ts +0 -4
package/src/notifications/types.ts +8 -0
package/src/oauth/platform-connection.test.ts +43 -3
package/src/oauth/platform-connection.ts +13 -4
package/src/plugins/defaults/injectors.ts +38 -19
package/src/plugins/external-plugin-loader.ts +82 -10
package/src/plugins/types.ts +16 -7
package/src/prompts/__tests__/system-prompt.test.ts +6 -51
package/src/prompts/__tests__/task-progress-hint-section.test.ts +4 -8
package/src/prompts/system-prompt.ts +0 -8
package/src/prompts/templates/BOOTSTRAP.md +5 -5
package/src/prompts/templates/system-sections.ts +0 -9
package/src/providers/__tests__/inference.test.ts +2 -0
package/src/providers/call-site-routing.ts +24 -6
package/src/providers/connection-resolution.ts +63 -13
package/src/providers/inference/__tests__/adapter-factory-openai-compatible.test.ts +74 -0
package/src/providers/inference/__tests__/connections-openai-compatible.test.ts +175 -0
package/src/providers/inference/__tests__/connections-status-label.test.ts +15 -0
package/src/providers/inference/adapter-factory.ts +9 -20
package/src/providers/inference/auth.ts +12 -0
package/src/providers/inference/backfill.ts +14 -1
package/src/providers/inference/connections.ts +85 -5
package/src/providers/inference/resolve-auth.ts +2 -0
package/src/providers/model-catalog.ts +199 -244
package/src/providers/model-intents.ts +3 -3
package/src/providers/openai/__tests__/chat-completions-provider-reasoning.test.ts +235 -0
package/src/providers/openai/chat-completions-provider.ts +159 -6
package/src/providers/openrouter/client.ts +42 -4
package/src/providers/platform-proxy/constants.ts +3 -4
package/src/providers/provider-catalog-visibility.ts +3 -1
package/src/providers/provider-send-message.ts +27 -12
package/src/providers/registry.ts +30 -1
package/src/runtime/agent-wake.ts +61 -1
package/src/runtime/auth/route-policy.ts +13 -0
package/src/runtime/http-server.ts +7 -16
package/src/runtime/http-types.ts +0 -47
package/src/runtime/routes/__tests__/consolidation-routes.test.ts +258 -0
package/src/runtime/routes/__tests__/conversation-query-routes.test.ts +66 -4
package/src/runtime/routes/__tests__/inference-provider-connection-routes.test.ts +275 -44
package/src/runtime/routes/__tests__/llm-call-sites-routes.test.ts +12 -0
package/src/runtime/routes/channel-availability-routes.ts +5 -0
package/src/runtime/routes/consolidation-routes.ts +100 -0
package/src/runtime/routes/conversation-query-routes.ts +70 -11
package/src/runtime/routes/conversation-routes.ts +7 -0
package/src/runtime/routes/index.ts +2 -0
package/src/runtime/routes/inference-provider-connection-routes.ts +134 -1
package/src/runtime/routes/integrations/a2a.ts +235 -0
package/src/runtime/routes/llm-call-sites-routes.ts +11 -1
package/src/runtime/routes/subagents-routes.ts +41 -0
package/src/subagent/manager.ts +2 -0
package/src/tools/memory/register.ts +1 -9
package/src/tools/registry.ts +2 -2
package/src/tools/types.ts +37 -2
package/src/workspace/migrations/087-memory-router-balanced-profile.ts +91 -0
package/src/workspace/migrations/registry.ts +2 -0
package/src/__tests__/guardian-action-conversation-turn.test.ts +0 -441
package/src/memory/graph/__tests__/remember-description.test.ts +0 -55
package/src/runtime/guardian-action-conversation-turn.ts +0 -99

package/src/__tests__/injector-chain.test.ts CHANGED Viewed

@@ -95,6 +95,7 @@ describe("injector chain", () => {
     expect(names).toEqual([
       "disk-pressure-warning",
       "workspace-context",
+      "background-turn",
       "unified-turn-context",
       "pkb-context",
       "pkb-reminder",
@@ -117,6 +118,9 @@ describe("injector chain", () => {
     expect(byName.get("workspace-context")).toBe(
       DEFAULT_INJECTOR_ORDER.workspaceContext,
     );
+    expect(byName.get("background-turn")).toBe(
+      DEFAULT_INJECTOR_ORDER.backgroundTurn,
+    );
     expect(byName.get("unified-turn-context")).toBe(
       DEFAULT_INJECTOR_ORDER.unifiedTurnContext,
     );
@@ -154,6 +158,7 @@ describe("injector chain", () => {
     expect(names).toEqual([
       "disk-pressure-warning", // 5
       "workspace-context", // 10
+      "background-turn", // 15
       "unified-turn-context", // 20
       "plugin-25", // 25 — slots in
       "pkb-context", // 30

package/src/__tests__/lifecycle-memory-v2-seed.test.ts CHANGED Viewed

@@ -71,6 +71,13 @@ mock.module("../memory/v2/skill-store.js", () => ({
   },
 }));
+// Mock the sibling CLI-command seeder so `rebuildBm25CorpusStatsAndReseedSkills`
+// (which runs both reseeds in parallel) does not invoke the real Qdrant-backed
+// implementation and emit warnings that break the no-warnings assertions below.
+mock.module("../memory/v2/cli-command-store.js", () => ({
+  seedV2CliCommandEntries: async (): Promise<void> => {},
+}));
 mock.module("../memory/v2/qdrant.js", () => ({
   ensureConceptPageCollection: async (): Promise<{ migrated: boolean }> => {
     state.ensureCollectionCallCount += 1;
@@ -312,10 +319,10 @@ describe("rebuildBm25CorpusStatsAndReseedSkills", () => {
     expect(state.warnCalls).toHaveLength(0);
   });
-  test("builds corpus stats but skips skill reseed when v2 is disabled", async () => {
+  test("skips both corpus stats and skill reseed when v2 is disabled", async () => {
     await rebuildBm25CorpusStatsAndReseedSkills(makeConfig(false));
-    expect(state.corpusStatsBuildCount).toBe(1);
+    expect(state.corpusStatsBuildCount).toBe(0);
     expect(state.seedCallCount).toBe(0);
     expect(state.warnCalls).toHaveLength(0);
   });

package/src/__tests__/llm-callsite-catalog.test.ts CHANGED Viewed

@@ -1,5 +1,6 @@
 import { describe, expect, test } from "bun:test";
+import { CALL_SITE_DEFAULTS } from "../config/call-site-defaults.js";
 import { getLLMCallSiteLabel } from "../config/llm-callsite-catalog.js";
 import { CALL_SITE_CATALOG } from "../config/schemas/call-site-catalog.js";
 import { LLMCallSiteEnum, LLMSchema } from "../config/schemas/llm.js";
@@ -50,4 +51,28 @@ describe("LLM call-site catalog", () => {
     });
     expect(parsed.callSites.memoryRouter?.model).toBe("claude-sonnet-4-6");
   });
+  test("CALL_SITE_DEFAULTS covers every LLMCallSite enum value", () => {
+    const defaultIds = new Set(Object.keys(CALL_SITE_DEFAULTS));
+    const missing = LLMCallSiteEnum.options.filter(
+      (id) => !defaultIds.has(id),
+    );
+    expect(missing).toEqual([]);
+  });
+  test("CALL_SITE_DEFAULTS contains no unknown call-site keys", () => {
+    const enumIds = new Set<string>(LLMCallSiteEnum.options);
+    const extra = Object.keys(CALL_SITE_DEFAULTS).filter(
+      (id) => !enumIds.has(id),
+    );
+    expect(extra).toEqual([]);
+  });
+  test("every CALL_SITE_DEFAULTS entry has a profile field", () => {
+    for (const [, config] of Object.entries(CALL_SITE_DEFAULTS)) {
+      expect(config.profile).toBeDefined();
+      expect(typeof config.profile).toBe("string");
+      expect(config.profile!.length).toBeGreaterThan(0);
+    }
+  });
 });

package/src/__tests__/llm-catalog-parity.test.ts CHANGED Viewed

@@ -208,6 +208,9 @@ describe("LLM catalog parity: daemon vs client", () => {
   test("every provider's defaultModel exists in its models list", () => {
     for (const entry of PROVIDER_CATALOG) {
+      // Providers with an empty models list (e.g. openai-compatible) use
+      // per-connection model identifiers instead of a static catalog.
+      if (entry.models.length === 0) continue;
       const found = entry.models.some((m) => m.id === entry.defaultModel);
       expect(
         found,

package/src/__tests__/llm-request-log-agent-loop-exit-reason.test.ts ADDED Viewed

@@ -0,0 +1,116 @@
+/**
+ * Tests for `setAgentLoopExitReasonOnLatestLog` and the
+ * `agentLoopExitReason` field on the LogRow type. The helper stamps the
+ * reason onto the most-recent `llm_request_logs` row for a conversation,
+ * which is how downstream tooling distinguishes "loop kept going" (null)
+ * from "loop exited because X" (specific reason) on a per-row basis.
+ */
+import { beforeEach, describe, expect, mock, test } from "bun:test";
+mock.module("../util/logger.js", () => ({
+  getLogger: () =>
+    new Proxy({} as Record<string, unknown>, {
+      get: () => () => {},
+    }),
+}));
+mock.module("../config/loader.js", () => ({
+  getConfig: () => ({
+    ui: {},
+    model: "test",
+    provider: "test",
+    memory: { enabled: false },
+    rateLimit: { maxRequestsPerMinute: 0 },
+    secretDetection: { enabled: false },
+  }),
+}));
+import { getDb } from "../memory/db-connection.js";
+import { initializeDb } from "../memory/db-init.js";
+import {
+  getRequestLogById,
+  recordRequestLog,
+  setAgentLoopExitReasonOnLatestLog,
+} from "../memory/llm-request-log-store.js";
+import { llmRequestLogs } from "../memory/schema.js";
+initializeDb();
+function resetLogs(): void {
+  const db = getDb();
+  db.delete(llmRequestLogs).run();
+}
+describe("setAgentLoopExitReasonOnLatestLog", () => {
+  beforeEach(resetLogs);
+  test("recordRequestLog leaves agentLoopExitReason NULL", () => {
+    const id = recordRequestLog("conv-1", '{"req":1}', '{"res":1}');
+    const row = getRequestLogById(id);
+    expect(row).not.toBeNull();
+    expect(row!.agentLoopExitReason).toBeNull();
+  });
+  test("stamps the reason onto the most-recent log for the conversation", () => {
+    const first = recordRequestLog("conv-1", '{"req":1}', '{"res":1}');
+    // Ensure createdAt strict ordering — `recordRequestLog` uses
+    // `Date.now()` and bun-sqlite is fast enough that two consecutive
+    // inserts can share a millisecond. Sleep a tick to disambiguate.
+    Bun.sleepSync(2);
+    const second = recordRequestLog("conv-1", '{"req":2}', '{"res":2}');
+    setAgentLoopExitReasonOnLatestLog("conv-1", "no_tool_calls");
+    expect(getRequestLogById(first)?.agentLoopExitReason).toBeNull();
+    expect(getRequestLogById(second)?.agentLoopExitReason).toBe(
+      "no_tool_calls",
+    );
+  });
+  test("scopes the stamp to the given conversation only", () => {
+    const a = recordRequestLog("conv-a", '{"req":1}', '{"res":1}');
+    Bun.sleepSync(2);
+    const b = recordRequestLog("conv-b", '{"req":1}', '{"res":1}');
+    setAgentLoopExitReasonOnLatestLog("conv-a", "yield_to_user");
+    expect(getRequestLogById(a)?.agentLoopExitReason).toBe("yield_to_user");
+    // conv-b is later overall but belongs to a different conversation —
+    // must stay NULL.
+    expect(getRequestLogById(b)?.agentLoopExitReason).toBeNull();
+  });
+  test("no-op when conversation has no logs", () => {
+    expect(() =>
+      setAgentLoopExitReasonOnLatestLog("conv-missing", "error"),
+    ).not.toThrow();
+  });
+  test("does not clobber a previous run's reason when the current run never landed a row", () => {
+    // Previous run: completes, lands a log, gets stamped.
+    const prev = recordRequestLog("conv-1", '{"prev_req":1}', '{"prev_res":1}');
+    setAgentLoopExitReasonOnLatestLog("conv-1", "no_tool_calls");
+    expect(getRequestLogById(prev)?.agentLoopExitReason).toBe("no_tool_calls");
+    // Current run aborts pre-call (or similar) before any LLM call lands.
+    // The helper must NOT overwrite the previous run's row.
+    setAgentLoopExitReasonOnLatestLog("conv-1", "aborted_pre_call");
+    expect(getRequestLogById(prev)?.agentLoopExitReason).toBe("no_tool_calls");
+  });
+  test("stamps the current run's newest row even when a prior row is already stamped", () => {
+    // Prior run already stamped.
+    const prev = recordRequestLog("conv-1", '{"prev_req":1}', '{"prev_res":1}');
+    setAgentLoopExitReasonOnLatestLog("conv-1", "no_tool_calls");
+    // Current run lands a new log, then exits.
+    Bun.sleepSync(2);
+    const current = recordRequestLog("conv-1", '{"cur_req":1}', '{"cur_res":1}');
+    setAgentLoopExitReasonOnLatestLog("conv-1", "yield_to_user");
+    expect(getRequestLogById(prev)?.agentLoopExitReason).toBe("no_tool_calls");
+    expect(getRequestLogById(current)?.agentLoopExitReason).toBe(
+      "yield_to_user",
+    );
+  });
+});

package/src/__tests__/llm-request-log-error-payload.test.ts ADDED Viewed

@@ -0,0 +1,138 @@
+/**
+ * Unit tests for `buildProviderErrorResponsePayload` — the shared serializer
+ * used by `handleProviderError` (daemon) and the wake-path `onEvent` to
+ * record provider-rejected LLM calls in `llm_request_logs`.
+ *
+ * The serializer's job: take an arbitrary thrown `Error`, return a
+ * structured `{ error: {...} }` object whose fields are queryable in the
+ * LLM inspector and that round-trips cleanly through `JSON.stringify`.
+ * The `error` key wrap is load-bearing — it mirrors a successful row's
+ * `usage.rawResponse` shape so an inspector consumer can branch on
+ * `responsePayload.error` vs the success shape without re-parsing.
+ *
+ * Coverage:
+ *  - `ProviderError` with full metadata (provider, statusCode, retryAfterMs).
+ *  - `ProviderError` without optional metadata.
+ *  - Non-provider `AssistantError` (carries `code` but not provider fields).
+ *  - Plain `Error` (degrades to `{name, message}`).
+ *  - Custom `Error` subclass with overridden `name` is preserved.
+ *
+ * Each test stringifies and re-parses the payload so the on-disk shape
+ * (what eventually lands in the `responsePayload` column) is what we
+ * assert on, not the JS object identity.
+ */
+import { describe, expect, test } from "bun:test";
+import { buildProviderErrorResponsePayload } from "../memory/llm-request-log-store.js";
+import {
+  AssistantError,
+  ErrorCode,
+  ProviderError,
+} from "../util/errors.js";
+function persisted(err: Error): { error: Record<string, unknown> } {
+  // Round-trip through JSON to assert on the actual stored shape, not the
+  // in-memory object reference.
+  return JSON.parse(
+    JSON.stringify(buildProviderErrorResponsePayload(err)),
+  );
+}
+describe("buildProviderErrorResponsePayload", () => {
+  test("ProviderError with statusCode + retryAfterMs serializes every queryable field", () => {
+    const err = new ProviderError(
+      "Anthropic API error (429): rate limited",
+      "anthropic",
+      429,
+      { retryAfterMs: 1500 },
+    );
+    const got = persisted(err);
+    expect(got).toEqual({
+      error: {
+        name: "ProviderError",
+        message: "Anthropic API error (429): rate limited",
+        code: ErrorCode.PROVIDER_ERROR,
+        provider: "anthropic",
+        statusCode: 429,
+        retryAfterMs: 1500,
+      },
+    });
+  });
+  test("ProviderError without optional metadata omits statusCode + retryAfterMs", () => {
+    const err = new ProviderError(
+      "Gemini API error: surprise internal state",
+      "gemini",
+    );
+    const got = persisted(err);
+    expect(got).toEqual({
+      error: {
+        name: "ProviderError",
+        message: "Gemini API error: surprise internal state",
+        code: ErrorCode.PROVIDER_ERROR,
+        provider: "gemini",
+      },
+    });
+    // Explicit assertion: omitted fields aren't present as `null` either —
+    // the inspector should be able to test `'statusCode' in error` reliably.
+    expect("statusCode" in got.error).toBe(false);
+    expect("retryAfterMs" in got.error).toBe(false);
+  });
+  test("non-provider AssistantError carries the ErrorCode but no provider fields", () => {
+    // Tool errors / permission denials are technically also AssistantErrors;
+    // we just want to confirm the generic AssistantError branch produces a
+    // sensible row rather than silently degrading to a plain Error shape.
+    const err = new AssistantError(
+      "internal state corrupted",
+      ErrorCode.INTERNAL_ERROR,
+    );
+    const got = persisted(err);
+    expect(got).toEqual({
+      error: {
+        name: "AssistantError",
+        message: "internal state corrupted",
+        code: ErrorCode.INTERNAL_ERROR,
+      },
+    });
+    expect("provider" in got.error).toBe(false);
+  });
+  test("plain Error degrades to {name, message} with no code/provider noise", () => {
+    const err = new Error("connection reset");
+    const got = persisted(err);
+    expect(got).toEqual({
+      error: {
+        name: "Error",
+        message: "connection reset",
+      },
+    });
+    expect("code" in got.error).toBe(false);
+  });
+  test("custom Error subclass with overridden name is preserved", () => {
+    class TimeoutError extends Error {
+      constructor(message: string) {
+        super(message);
+        this.name = "TimeoutError";
+      }
+    }
+    const got = persisted(new TimeoutError("provider timed out after 60s"));
+    expect(got).toEqual({
+      error: {
+        name: "TimeoutError",
+        message: "provider timed out after 60s",
+      },
+    });
+  });
+  test("ProviderError with statusCode 0 is still recorded (not coerced to undefined)", () => {
+    // Defensive: `if (err.statusCode !== undefined)` correctly admits 0.
+    // A raw `if (err.statusCode)` would drop it, so the test guards against
+    // a regression to truthy-checking.
+    const err = new ProviderError("weird provider", "fake", 0);
+    const got = persisted(err);
+    expect(got.error.statusCode).toBe(0);
+  });
+});

package/src/__tests__/llm-request-log-source-clickhouse.test.ts CHANGED Viewed

@@ -83,6 +83,7 @@ const SAMPLE_ROW = {
   response_payload: '{"bar":2}',
   // ClickHouse emits Int64 as a quoted string under JSONEachRow by default.
   created_at: "1778465138786",
+  agent_loop_exit_reason: "no_tool_calls",
 };
 describe("ClickHouseLlmRequestLogSource", () => {
@@ -102,6 +103,7 @@ describe("ClickHouseLlmRequestLogSource", () => {
       requestPayload: '{"foo":1}',
       responsePayload: '{"bar":2}',
       createdAt: 1778465138786,
+      agentLoopExitReason: "no_tool_calls",
     });
   });

package/src/__tests__/llm-resolver.test.ts CHANGED Viewed

@@ -3,7 +3,7 @@ import { describe, expect, test } from "bun:test";
 import { z } from "zod";
 import { resolveCallSiteConfig } from "../config/llm-resolver.js";
-import { LLMSchema } from "../config/schemas/llm.js";
+import { type LLMCallSite, LLMSchema } from "../config/schemas/llm.js";
 const fullDefault = {
   provider: "anthropic" as const,
@@ -369,7 +369,8 @@ describe("resolveCallSiteConfig", () => {
     const resolved = resolveCallSiteConfig("mainAgent", llm, {
       overrideProfile: "nonexistent",
     });
-    // Falls through to default — the missing override contributes nothing.
+    // overrideProfile is set so the shipped default's profile is stripped.
+    // The nonexistent overrideProfile also adds nothing. Falls through to default.
     expect(resolved.effort).toBe("max");
     expect(resolved.model).toBe("claude-opus-4-7");
   });
@@ -536,4 +537,256 @@ describe("resolveCallSiteConfig", () => {
     expect(resolved.maxTokens).toBe(65536);
     expect(resolved.contextWindow.maxInputTokens).toBe(1048576);
   });
+  test("call site with no explicit config falls back to CALL_SITE_DEFAULTS", () => {
+    const llm = LLMSchema.parse({
+      default: fullDefault,
+      profiles: {
+        "cost-optimized": {
+          model: "claude-haiku-4-5-20251001",
+          effort: "low",
+        },
+      },
+    });
+    const resolved = resolveCallSiteConfig("memoryExtraction", llm);
+    expect(resolved.model).toBe("claude-haiku-4-5-20251001");
+    expect(resolved.effort).toBe("low");
+  });
+  test("explicit callSites config overrides CALL_SITE_DEFAULTS", () => {
+    const llm = LLMSchema.parse({
+      default: fullDefault,
+      profiles: {
+        "cost-optimized": {
+          model: "claude-haiku-4-5-20251001",
+          effort: "low",
+        },
+        "quality-optimized": { model: "claude-opus-4-7", effort: "max" },
+      },
+      callSites: {
+        memoryExtraction: { profile: "quality-optimized" },
+      },
+    });
+    const resolved = resolveCallSiteConfig("memoryExtraction", llm);
+    expect(resolved.model).toBe("claude-opus-4-7");
+    expect(resolved.effort).toBe("max");
+  });
+  test("BYOK: disabled managed profile falls back to custom-* user profile", () => {
+    const llm = LLMSchema.parse({
+      default: {
+        ...fullDefault,
+        provider: "openai",
+        model: "gpt-5.5",
+        provider_connection: "openai-personal",
+      },
+      profiles: {
+        "cost-optimized": {
+          status: "disabled",
+          model: "claude-haiku-4-5-20251001",
+          provider: "anthropic",
+          provider_connection: "anthropic-managed",
+        },
+        "custom-cost-optimized": {
+          source: "user",
+          model: "gpt-5.4-nano",
+          provider: "openai",
+          provider_connection: "openai-personal",
+        },
+        "custom-balanced": {
+          source: "user",
+          model: "gpt-5.5",
+          provider: "openai",
+          provider_connection: "openai-personal",
+        },
+      },
+      activeProfile: "custom-balanced",
+    });
+    const resolved = resolveCallSiteConfig("memoryExtraction", llm);
+    expect(resolved.provider).toBe("openai");
+    expect(resolved.model).toBe("gpt-5.4-nano");
+    expect(resolved.provider_connection).toBe("openai-personal");
+  });
+  test("BYOK: strips profile when neither managed nor custom-* is available", () => {
+    const llm = LLMSchema.parse({
+      default: {
+        ...fullDefault,
+        provider: "openai",
+        model: "gpt-5.5",
+        provider_connection: "openai-personal",
+      },
+      profiles: {
+        "cost-optimized": {
+          status: "disabled",
+          model: "claude-haiku-4-5-20251001",
+          provider: "anthropic",
+          provider_connection: "anthropic-managed",
+        },
+        "custom-balanced": {
+          model: "gpt-5.5",
+          provider: "openai",
+          provider_connection: "openai-personal",
+        },
+      },
+      activeProfile: "custom-balanced",
+    });
+    const resolved = resolveCallSiteConfig("memoryExtraction", llm);
+    expect(resolved.provider).toBe("openai");
+    expect(resolved.model).toBe("gpt-5.5");
+    expect(resolved.provider_connection).toBe("openai-personal");
+  });
+  test("BYOK full-workspace: cost-optimized call sites use custom-cost-optimized, balanced use custom-balanced", () => {
+    const byokConfig = LLMSchema.parse({
+      default: {
+        ...fullDefault,
+        provider: "openai",
+        model: "gpt-5.5",
+        provider_connection: "openai-personal",
+      },
+      profiles: {
+        balanced: {
+          status: "disabled",
+          source: "managed",
+          provider: "anthropic",
+          model: "claude-sonnet-4-6",
+          provider_connection: "anthropic-managed",
+        },
+        "cost-optimized": {
+          status: "disabled",
+          source: "managed",
+          provider: "anthropic",
+          model: "claude-haiku-4-5-20251001",
+          provider_connection: "anthropic-managed",
+        },
+        "quality-optimized": {
+          status: "disabled",
+          source: "managed",
+          provider: "anthropic",
+          model: "claude-opus-4-7",
+          provider_connection: "anthropic-managed",
+        },
+        "custom-balanced": {
+          source: "user",
+          provider: "openai",
+          model: "gpt-5.5",
+          provider_connection: "openai-personal",
+        },
+        "custom-cost-optimized": {
+          source: "user",
+          provider: "openai",
+          model: "gpt-5.4-nano",
+          provider_connection: "openai-personal",
+        },
+        "custom-quality-optimized": {
+          source: "user",
+          provider: "openai",
+          model: "gpt-5.5-pro",
+          provider_connection: "openai-personal",
+        },
+      },
+      activeProfile: "custom-balanced",
+    });
+    const callSites: LLMCallSite[] = [
+      "mainAgent", "subagentSpawn", "heartbeatAgent", "filingAgent",
+      "compactionAgent", "analyzeConversation", "callAgent",
+      "memoryExtraction", "memoryConsolidation", "memoryRetrieval",
+      "memoryRouter", "recall", "conversationSummarization",
+      "commitMessage", "conversationStarters", "replySuggestion",
+      "conversationTitle", "identityIntro", "emptyStateGreeting",
+      "notificationDecision", "interactionClassifier", "inference",
+    ];
+    for (const cs of callSites) {
+      const resolved = resolveCallSiteConfig(cs, byokConfig);
+      expect(resolved.provider_connection).not.toBe("anthropic-managed");
+      expect(resolved.provider).toBe("openai");
+    }
+    // Cost-optimized call sites should use the user's nano model
+    const costSite = resolveCallSiteConfig("heartbeatAgent", byokConfig);
+    expect(costSite.model).toBe("gpt-5.4-nano");
+    // Balanced call sites should use the user's balanced model
+    const balancedSite = resolveCallSiteConfig("mainAgent", byokConfig);
+    expect(balancedSite.model).toBe("gpt-5.5");
+  });
+  test("BYOK: tuning overrides from defaults apply on top of custom-* fallback profile", () => {
+    const byokConfig = LLMSchema.parse({
+      default: {
+        ...fullDefault,
+        provider: "openai",
+        model: "gpt-5.5",
+        provider_connection: "openai-personal",
+      },
+      profiles: {
+        "cost-optimized": {
+          status: "disabled",
+          provider: "anthropic",
+          model: "claude-haiku-4-5-20251001",
+          provider_connection: "anthropic-managed",
+        },
+        "custom-cost-optimized": {
+          source: "user",
+          provider: "openai",
+          model: "gpt-5.4-nano",
+          provider_connection: "openai-personal",
+        },
+        "custom-balanced": {
+          provider: "openai",
+          model: "gpt-5.5",
+          provider_connection: "openai-personal",
+        },
+      },
+      activeProfile: "custom-balanced",
+    });
+    const resolved = resolveCallSiteConfig("commitMessage", byokConfig);
+    expect(resolved.provider).toBe("openai");
+    expect(resolved.model).toBe("gpt-5.4-nano");
+    expect(resolved.maxTokens).toBe(120);
+    expect(resolved.effort).toBe("low");
+    expect(resolved.thinking.enabled).toBe(false);
+  });
+  test("overrideProfile wins over CALL_SITE_DEFAULTS profile for non-main call sites", () => {
+    const llm = LLMSchema.parse({
+      default: fullDefault,
+      profiles: {
+        "cost-optimized": { model: "claude-haiku-4-5-20251001", effort: "low" },
+        "quality-optimized": { model: "claude-opus-4-7", effort: "max" },
+      },
+    });
+    const resolved = resolveCallSiteConfig("inference", llm, {
+      overrideProfile: "quality-optimized",
+    });
+    expect(resolved.model).toBe("claude-opus-4-7");
+    expect(resolved.effort).toBe("max");
+  });
+  test("profile with provider but no provider_connection inherits stale default connection (JARVIS-861)", () => {
+    // This test documents the merge behavior that causes JARVIS-861: a profile
+    // overrides `provider` but not `provider_connection`, so the deep merge
+    // inherits a stale connection from the default layer. The fix is in the
+    // dispatch layer (connection-resolution auto-resolves the mismatch).
+    const llm = LLMSchema.parse({
+      default: {
+        ...fullDefault,
+        provider_connection: "anthropic-managed",
+      },
+      profiles: {
+        fireworks: { provider: "fireworks", model: "accounts/fireworks/models/kimi-k2p5" },
+      },
+      activeProfile: "fireworks",
+    });
+    const resolved = resolveCallSiteConfig("mainAgent", llm);
+    expect(resolved.provider).toBe("fireworks");
+    // The merge inherits the stale connection — the dispatch layer handles this.
+    expect(resolved.provider_connection).toBe("anthropic-managed");
+  });
 });

package/src/__tests__/managed-profile-guard.test.ts CHANGED Viewed

@@ -79,6 +79,16 @@ mock.module("../memory/embedding-backend.js", () => ({
   clearEmbeddingBackendCache: () => {},
 }));
+// The replace-profile handler auto-derives `provider_connection` from the
+// first active connection matching the requested provider when the body
+// omits it. That path queries the `provider_connections` table, which the
+// test doesn't migrate — stub it out so the guard logic stays the focus.
+mock.module("../providers/inference/connections.js", () => ({
+  listConnections: () => [],
+  createConnection: () => ({ ok: false, error: { code: "already_exists" } }),
+  PROVIDERS_REQUIRING_BASE_URL_AND_MODELS: new Set(["openai-compatible"]),
+}));
 import { ROUTES } from "../runtime/routes/conversation-query-routes.js";
 import { BadRequestError } from "../runtime/routes/errors.js";