npm - @vellumai/assistant - Versions diffs - 0.8.2 → 0.8.3 - Mend

@vellumai/assistant 0.8.2 → 0.8.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (231) hide show

package/ARCHITECTURE.md +11 -12
package/docker-entrypoint.sh +13 -1
package/docker-init-apt-root.sh +79 -6
package/openapi.yaml +336 -21
package/package.json +1 -1
package/src/__tests__/agent-loop-exit-reason.test.ts +272 -0
package/src/__tests__/agent-loop-provider-error-recording.test.ts +195 -0
package/src/__tests__/compactor-tail-resolution.test.ts +107 -1
package/src/__tests__/config-get-vision-flag.test.ts +136 -0
package/src/__tests__/config-loader-backfill.test.ts +115 -18
package/src/__tests__/context-token-estimator.test.ts +30 -65
package/src/__tests__/conversation-agent-loop.test.ts +57 -1
package/src/__tests__/conversation-media-retry.test.ts +19 -8
package/src/__tests__/conversation-runtime-assembly.test.ts +26 -4
package/src/__tests__/date-context.test.ts +45 -0
package/src/__tests__/external-plugin-loader.test.ts +91 -19
package/src/__tests__/guardian-action-no-hardcoded-copy.test.ts +0 -1
package/src/__tests__/guardian-dispatch.test.ts +1 -0
package/src/__tests__/heartbeat-service.test.ts +24 -164
package/src/__tests__/helpers/channel-test-adapter.ts +0 -2
package/src/__tests__/host-app-control-proxy.test.ts +241 -0
package/src/__tests__/host-proxy-preactivation.test.ts +200 -13
package/src/__tests__/injector-background-turn.test.ts +153 -0
package/src/__tests__/injector-chain.test.ts +5 -0
package/src/__tests__/lifecycle-memory-v2-seed.test.ts +9 -2
package/src/__tests__/llm-callsite-catalog.test.ts +25 -0
package/src/__tests__/llm-catalog-parity.test.ts +3 -0
package/src/__tests__/llm-request-log-agent-loop-exit-reason.test.ts +116 -0
package/src/__tests__/llm-request-log-error-payload.test.ts +138 -0
package/src/__tests__/llm-request-log-source-clickhouse.test.ts +2 -0
package/src/__tests__/llm-resolver.test.ts +255 -2
package/src/__tests__/managed-profile-guard.test.ts +10 -0
package/src/__tests__/notification-decision-fallback.test.ts +0 -91
package/src/__tests__/notification-decision-strategy.test.ts +14 -31
package/src/__tests__/notification-deep-link.test.ts +15 -0
package/src/__tests__/notification-guardian-path.test.ts +1 -2
package/src/__tests__/notification-platform-adapter.test.ts +5 -4
package/src/__tests__/notification-telegram-adapter.test.ts +1 -0
package/src/__tests__/notification-vellum-adapter.test.ts +113 -0
package/src/__tests__/openai-provider.test.ts +218 -3
package/src/__tests__/openai-responses-cutover-guard.test.ts +3 -3
package/src/__tests__/openrouter-provider-only.test.ts +51 -3
package/src/__tests__/openrouter-token-estimation.test.ts +34 -25
package/src/__tests__/platform-proxy-context.test.ts +6 -1
package/src/__tests__/plugin-tool-contribution.test.ts +3 -3
package/src/__tests__/plugin-types.test.ts +2 -2
package/src/__tests__/provider-catalog-visibility.test.ts +16 -0
package/src/__tests__/provider-platform-proxy-integration.test.ts +27 -25
package/src/__tests__/secret-routes-platform-proxy.test.ts +1 -1
package/src/__tests__/system-prompt.test.ts +6 -73
package/src/__tests__/workspace-migration-087-memory-router-balanced-profile.test.ts +228 -0
package/src/a2a/__tests__/agent-card.test.ts +98 -0
package/src/a2a/__tests__/e2e-a2a-channel.test.ts +597 -0
package/src/a2a/__tests__/protocol-helpers.test.ts +113 -0
package/src/a2a/__tests__/task-store.test.ts +246 -0
package/src/a2a/agent-card.ts +58 -0
package/src/a2a/feature-gate.ts +8 -0
package/src/a2a/protocol-constants.ts +21 -0
package/src/a2a/protocol-errors.ts +50 -0
package/src/a2a/protocol-types.ts +162 -0
package/src/a2a/task-store.ts +168 -0
package/src/agent/loop.ts +167 -18
package/src/channels/config.ts +9 -0
package/src/channels/types.ts +14 -0
package/src/cli/{__tests__ → commands/__tests__}/notifications.test.ts +201 -28
package/src/cli/commands/__tests__/schedules.test.ts +469 -0
package/src/cli/commands/notifications.ts +65 -35
package/src/cli/commands/plugins.ts +67 -0
package/src/cli/commands/schedules.ts +297 -5
package/src/cli/lib/__tests__/search-plugins.test.ts +261 -0
package/src/cli/lib/install-from-github.ts +8 -9
package/src/cli/lib/search-plugins.ts +163 -0
package/src/cli/program.ts +14 -0
package/src/config/assistant-feature-flags.ts +24 -54
package/src/config/bundled-skills/app-builder/SKILL.md +117 -1
package/src/config/bundled-skills/phone-calls/SKILL.md +1 -1
package/src/config/call-site-defaults.ts +105 -0
package/src/config/feature-flag-registry.json +21 -29
package/src/config/llm-resolver.ts +52 -1
package/src/config/schema.ts +2 -0
package/src/config/schemas/__tests__/memory-v2.test.ts +3 -3
package/src/config/schemas/channels.ts +9 -0
package/src/config/schemas/conversations.ts +10 -0
package/src/config/schemas/heartbeat.ts +14 -0
package/src/config/schemas/llm.ts +1 -3
package/src/config/schemas/memory-retrospective.ts +1 -1
package/src/config/schemas/memory-v2.ts +4 -4
package/src/config/schemas/memory.ts +3 -1
package/src/config/seed-inference-profiles.ts +99 -29
package/src/context/compactor.ts +72 -12
package/src/context/token-estimator.ts +32 -34
package/src/daemon/__tests__/conversation-lifecycle-auto-analyze.test.ts +3 -22
package/src/daemon/conversation-agent-loop-handlers.ts +78 -0
package/src/daemon/conversation-agent-loop.ts +29 -2
package/src/daemon/conversation-runtime-assembly.ts +9 -0
package/src/daemon/conversation.ts +0 -7
package/src/daemon/date-context.ts +40 -0
package/src/daemon/guardian-action-generators.ts +1 -125
package/src/daemon/handlers/__tests__/config-a2a-complete.test.ts +248 -0
package/src/daemon/handlers/__tests__/config-a2a-invite.test.ts +154 -0
package/src/daemon/handlers/__tests__/config-a2a-redeem.test.ts +133 -0
package/src/daemon/handlers/__tests__/config-a2a.test.ts +95 -0
package/src/daemon/handlers/config-a2a.ts +289 -0
package/src/daemon/handlers/conversations.ts +1 -0
package/src/daemon/host-app-control-proxy.ts +69 -18
package/src/daemon/host-proxy-preactivation.ts +85 -18
package/src/daemon/lifecycle.ts +49 -61
package/src/daemon/memory-v2-startup.ts +49 -13
package/src/daemon/message-types/notifications.ts +21 -0
package/src/daemon/pkb-reminder-builder.test.ts +10 -53
package/src/daemon/pkb-reminder-builder.ts +4 -19
package/src/daemon/process-message.ts +3 -0
package/src/daemon/skill-memory-refresh.ts +5 -1
package/src/daemon/wake-target-adapter.ts +2 -0
package/src/export/__tests__/transcript-formatter.test.ts +121 -0
package/src/export/transcript-formatter.ts +54 -20
package/src/heartbeat/__tests__/heartbeat-service.test.ts +44 -0
package/src/heartbeat/heartbeat-service.ts +34 -191
package/src/home/__tests__/feed-types.test.ts +40 -0
package/src/home/feed-types.ts +14 -2
package/src/ipc/cli-client.ts +147 -45
package/src/memory/__tests__/conversation-queries.test.ts +220 -0
package/src/memory/__tests__/memory-retrospective-enqueue.test.ts +2 -50
package/src/memory/__tests__/memory-retrospective-job.test.ts +87 -4
package/src/memory/conversation-queries.ts +87 -1
package/src/memory/conversation-title-service.ts +26 -4
package/src/memory/db-init.ts +6 -0
package/src/memory/graph/__tests__/conversation-graph-memory-v2-routing.test.ts +84 -3
package/src/memory/graph/conversation-graph-memory.ts +18 -6
package/src/memory/graph/tools.ts +6 -37
package/src/memory/invite-store.ts +53 -0
package/src/memory/llm-request-log-source-clickhouse.ts +7 -2
package/src/memory/llm-request-log-store.ts +92 -1
package/src/memory/memory-retrospective-enqueue.ts +1 -20
package/src/memory/memory-retrospective-job.ts +33 -6
package/src/memory/migrations/250-provider-connection-base-url-and-models.ts +28 -0
package/src/memory/migrations/251-a2a-tasks.ts +49 -0
package/src/memory/migrations/252-llm-request-log-agent-loop-exit-reason.ts +32 -0
package/src/memory/migrations/index.ts +3 -0
package/src/memory/migrations/registry.ts +8 -0
package/src/memory/schema/a2a.ts +15 -0
package/src/memory/schema/index.ts +1 -0
package/src/memory/schema/inference.ts +2 -0
package/src/memory/schema/infrastructure.ts +1 -0
package/src/memory/v2/__tests__/activation-store.test.ts +25 -23
package/src/memory/v2/__tests__/cli-command-store.test.ts +404 -0
package/src/memory/v2/__tests__/frontmatter-sweep.test.ts +25 -4
package/src/memory/v2/__tests__/injection.test.ts +190 -3
package/src/memory/v2/__tests__/static-context.test.ts +12 -1
package/src/memory/v2/activation-store.ts +14 -16
package/src/memory/v2/cli-command-content.ts +19 -0
package/src/memory/v2/cli-command-store.ts +304 -0
package/src/memory/v2/frontmatter-sweep.ts +7 -1
package/src/memory/v2/injection.ts +49 -20
package/src/memory/v2/page-index.ts +38 -13
package/src/memory/v2/static-context.ts +4 -4
package/src/memory/v2/types.ts +23 -0
package/src/messaging/providers/a2a/__tests__/deliver.test.ts +274 -0
package/src/messaging/providers/a2a/deliver.ts +156 -0
package/src/messaging/providers/gmail/client.ts +9 -2
package/src/messaging/providers/index.ts +11 -2
package/src/notifications/__tests__/broadcaster.test.ts +203 -0
package/src/notifications/__tests__/decision-engine.test.ts +283 -0
package/src/notifications/__tests__/deterministic-checks.test.ts +286 -0
package/src/notifications/__tests__/emit-signal-home-feed.test.ts +1 -0
package/src/notifications/__tests__/home-feed-side-effect.test.ts +430 -7
package/src/notifications/adapters/macos.ts +12 -2
package/src/notifications/broadcaster.ts +29 -4
package/src/notifications/copy-composer.ts +17 -64
package/src/notifications/decision-engine.ts +111 -44
package/src/notifications/deterministic-checks.ts +96 -0
package/src/notifications/emit-signal.ts +1 -0
package/src/notifications/home-feed-side-effect.ts +85 -6
package/src/notifications/signal.ts +0 -4
package/src/notifications/types.ts +8 -0
package/src/oauth/platform-connection.test.ts +43 -3
package/src/oauth/platform-connection.ts +13 -4
package/src/plugins/defaults/injectors.ts +38 -19
package/src/plugins/external-plugin-loader.ts +82 -10
package/src/plugins/types.ts +16 -7
package/src/prompts/__tests__/system-prompt.test.ts +6 -51
package/src/prompts/__tests__/task-progress-hint-section.test.ts +4 -8
package/src/prompts/system-prompt.ts +0 -8
package/src/prompts/templates/BOOTSTRAP.md +5 -5
package/src/prompts/templates/system-sections.ts +0 -9
package/src/providers/__tests__/inference.test.ts +2 -0
package/src/providers/call-site-routing.ts +24 -6
package/src/providers/connection-resolution.ts +63 -13
package/src/providers/inference/__tests__/adapter-factory-openai-compatible.test.ts +74 -0
package/src/providers/inference/__tests__/connections-openai-compatible.test.ts +175 -0
package/src/providers/inference/__tests__/connections-status-label.test.ts +15 -0
package/src/providers/inference/adapter-factory.ts +9 -20
package/src/providers/inference/auth.ts +12 -0
package/src/providers/inference/backfill.ts +14 -1
package/src/providers/inference/connections.ts +85 -5
package/src/providers/inference/resolve-auth.ts +2 -0
package/src/providers/model-catalog.ts +199 -244
package/src/providers/model-intents.ts +3 -3
package/src/providers/openai/__tests__/chat-completions-provider-reasoning.test.ts +235 -0
package/src/providers/openai/chat-completions-provider.ts +159 -6
package/src/providers/openrouter/client.ts +42 -4
package/src/providers/platform-proxy/constants.ts +3 -4
package/src/providers/provider-catalog-visibility.ts +3 -1
package/src/providers/provider-send-message.ts +27 -12
package/src/providers/registry.ts +30 -1
package/src/runtime/agent-wake.ts +61 -1
package/src/runtime/auth/route-policy.ts +13 -0
package/src/runtime/http-server.ts +7 -16
package/src/runtime/http-types.ts +0 -47
package/src/runtime/routes/__tests__/consolidation-routes.test.ts +258 -0
package/src/runtime/routes/__tests__/conversation-query-routes.test.ts +66 -4
package/src/runtime/routes/__tests__/inference-provider-connection-routes.test.ts +275 -44
package/src/runtime/routes/__tests__/llm-call-sites-routes.test.ts +12 -0
package/src/runtime/routes/channel-availability-routes.ts +5 -0
package/src/runtime/routes/consolidation-routes.ts +100 -0
package/src/runtime/routes/conversation-query-routes.ts +70 -11
package/src/runtime/routes/conversation-routes.ts +7 -0
package/src/runtime/routes/index.ts +2 -0
package/src/runtime/routes/inference-provider-connection-routes.ts +134 -1
package/src/runtime/routes/integrations/a2a.ts +235 -0
package/src/runtime/routes/llm-call-sites-routes.ts +11 -1
package/src/runtime/routes/subagents-routes.ts +41 -0
package/src/subagent/manager.ts +2 -0
package/src/tools/memory/register.ts +1 -9
package/src/tools/registry.ts +2 -2
package/src/tools/types.ts +37 -2
package/src/workspace/migrations/087-memory-router-balanced-profile.ts +91 -0
package/src/workspace/migrations/registry.ts +2 -0
package/src/__tests__/guardian-action-conversation-turn.test.ts +0 -441
package/src/memory/graph/__tests__/remember-description.test.ts +0 -55
package/src/runtime/guardian-action-conversation-turn.ts +0 -99

package/src/__tests__/openai-provider.test.ts CHANGED Viewed

@@ -21,6 +21,13 @@ interface FakeChunk {
   choices: Array<{
     delta: {
       content?: string | null;
+      reasoning_content?: string | null;
+      reasoning?: string | null;
+      reasoning_details?: Array<{
+        type?: string;
+        summary?: string | null;
+        text?: string | null;
+      }> | null;
       tool_calls?: Array<{
         index: number;
         id?: string;
@@ -209,6 +216,44 @@ function cachedUsageChunk(
   };
 }
+function reasoningChunk(
+  reasoning: string,
+  finish: string | null = null,
+): FakeChunk {
+  return {
+    choices: [
+      { delta: { reasoning_content: reasoning }, finish_reason: finish },
+    ],
+    usage: null,
+    model: "gpt-5.2",
+  };
+}
+// OpenRouter spec uses `delta.reasoning` rather than `delta.reasoning_content`.
+function openRouterReasoningChunk(
+  reasoning: string,
+  finish: string | null = null,
+): FakeChunk {
+  return {
+    choices: [{ delta: { reasoning }, finish_reason: finish }],
+    usage: null,
+    model: "gpt-5.2",
+  };
+}
+// OpenRouter's documented reasoning-summary shape: a `reasoning_details` array
+// with entries tagged `reasoning.summary` / `reasoning.text` / `reasoning.encrypted`.
+function reasoningDetailsChunk(
+  details: Array<{ type?: string; summary?: string; text?: string }>,
+  finish: string | null = null,
+): FakeChunk {
+  return {
+    choices: [{ delta: { reasoning_details: details }, finish_reason: finish }],
+    usage: null,
+    model: "gpt-5.2",
+  };
+}
 // ---------------------------------------------------------------------------
 // Class extraction sanity checks
 // ---------------------------------------------------------------------------
@@ -339,6 +384,153 @@ describe("OpenAIProvider", () => {
     expect(events[1]).toEqual({ type: "text_delta", text: ", world!" });
   });
+  // -----------------------------------------------------------------------
+  // Reasoning content (MiniMax / DeepSeek extension)
+  // -----------------------------------------------------------------------
+  test("parses reasoning_content into thinking block", async () => {
+    fakeChunks = [
+      reasoningChunk("Let me think..."),
+      textChunk("The answer is 42."),
+      usageChunk(10, 20),
+    ];
+    const result = await provider.sendMessage([userMsg("Hi")]);
+    expect(result.content).toHaveLength(2);
+    expect(result.content[0]).toEqual({
+      type: "thinking",
+      thinking: "Let me think...",
+      signature: "",
+    });
+    expect(result.content[1]).toEqual({
+      type: "text",
+      text: "The answer is 42.",
+    });
+    expect(result.usage).toEqual({ inputTokens: 10, outputTokens: 20 });
+  });
+  test("fires thinking_delta events during streaming", async () => {
+    fakeChunks = [
+      reasoningChunk("Let me think..."),
+      textChunk("The answer is 42."),
+      usageChunk(10, 20),
+    ];
+    const events: ProviderEvent[] = [];
+    await provider.sendMessage([userMsg("Hi")], undefined, undefined, {
+      onEvent: (e) => events.push(e),
+    });
+    expect(events).toHaveLength(2);
+    expect(events[0]).toEqual({
+      type: "thinking_delta",
+      thinking: "Let me think...",
+    });
+    expect(events[1]).toEqual({
+      type: "text_delta",
+      text: "The answer is 42.",
+    });
+  });
+  test("reasoning + tool calls orders correctly (thinking → tool_use)", async () => {
+    fakeChunks = [
+      reasoningChunk("Planning..."),
+      ...toolCallChunks([
+        { id: "call_1", name: "file_read", args: '{"path":"/a"}' },
+      ]),
+      usageChunk(10, 30),
+    ];
+    const result = await provider.sendMessage([userMsg("Read /a")]);
+    expect(result.content).toHaveLength(2);
+    expect(result.content[0].type).toBe("thinking");
+    expect(result.content[1].type).toBe("tool_use");
+  });
+  test("no thinking block when reasoning_content is absent", async () => {
+    fakeChunks = [textChunk("Just text"), usageChunk(10, 5)];
+    const result = await provider.sendMessage([userMsg("Hi")]);
+    expect(result.content).toHaveLength(1);
+    expect(result.content[0].type).toBe("text");
+  });
+  test("parses OpenRouter's `delta.reasoning` field into thinking block", async () => {
+    fakeChunks = [
+      openRouterReasoningChunk("Hmm, let me think..."),
+      textChunk("Final answer."),
+      usageChunk(10, 8),
+    ];
+    const events: ProviderEvent[] = [];
+    const result = await provider.sendMessage(
+      [userMsg("Hi")],
+      undefined,
+      undefined,
+      {
+        onEvent: (e) => events.push(e),
+      },
+    );
+    expect(result.content).toHaveLength(2);
+    expect(result.content[0]).toEqual({
+      type: "thinking",
+      thinking: "Hmm, let me think...",
+      signature: "",
+    });
+    expect(result.content[1]).toEqual({ type: "text", text: "Final answer." });
+    expect(events).toContainEqual({
+      type: "thinking_delta",
+      thinking: "Hmm, let me think...",
+    });
+  });
+  test("parses OpenRouter `delta.reasoning_details` summary/text entries and skips encrypted", async () => {
+    fakeChunks = [
+      reasoningDetailsChunk([
+        { type: "reasoning.summary", summary: "Plan step one. " },
+        { type: "reasoning.encrypted", text: "ENCRYPTED_BLOB" },
+        { type: "reasoning.text", text: "Detailed thought." },
+      ]),
+      textChunk("Done."),
+      usageChunk(10, 8),
+    ];
+    const events: ProviderEvent[] = [];
+    const result = await provider.sendMessage(
+      [userMsg("Hi")],
+      undefined,
+      undefined,
+      {
+        onEvent: (e) => events.push(e),
+      },
+    );
+    expect(result.content).toHaveLength(2);
+    expect(result.content[0]).toEqual({
+      type: "thinking",
+      thinking: "Plan step one. Detailed thought.",
+      signature: "",
+    });
+    expect(result.content[1]).toEqual({ type: "text", text: "Done." });
+    expect(events).toContainEqual({
+      type: "thinking_delta",
+      thinking: "Plan step one. ",
+    });
+    expect(events).toContainEqual({
+      type: "thinking_delta",
+      thinking: "Detailed thought.",
+    });
+    // Encrypted blob must never surface as visible thinking.
+    for (const e of events) {
+      if (e.type === "thinking_delta") {
+        expect(e.thinking).not.toContain("ENCRYPTED_BLOB");
+      }
+    }
+  });
   // -----------------------------------------------------------------------
   // System prompt
   // -----------------------------------------------------------------------
@@ -1306,14 +1498,17 @@ describe("OpenRouterProvider reasoning", () => {
     shouldThrow = null;
   });
-  test("sends reasoning.enabled=true when thinking config is present", async () => {
+  test("sends reasoning.enabled=true with default detailed summary when thinking config is present", async () => {
     const provider = new OpenRouterProvider("or-key", "x-ai/grok-4");
     await provider.sendMessage([userMsg("hi")], undefined, undefined, {
       config: { thinking: { type: "adaptive" } },
     });
     expect(lastCreateParams).toBeTruthy();
-    expect(lastCreateParams!.reasoning).toEqual({ enabled: true });
+    expect(lastCreateParams!.reasoning).toEqual({
+      enabled: true,
+      summary: "detailed",
+    });
   });
   test("sends reasoning.enabled=false when thinking is explicitly disabled", async () => {
@@ -1376,7 +1571,10 @@ describe("OpenRouterProvider reasoning", () => {
     await retry.sendMessage([userMsg("hi")], undefined, undefined, {
       config: { thinking: { type: "adaptive" } },
     });
-    expect(lastCreateParams!.reasoning).toEqual({ enabled: true });
+    expect(lastCreateParams!.reasoning).toEqual({
+      enabled: true,
+      summary: "detailed",
+    });
   });
   test("RetryProvider + OpenRouterProvider disables thinking end-to-end", async () => {
@@ -1389,6 +1587,23 @@ describe("OpenRouterProvider reasoning", () => {
     });
     expect(lastCreateParams!.reasoning).toEqual({ enabled: false });
   });
+  test("nests effort under reasoning and omits top-level reasoning_effort", async () => {
+    const provider = new OpenRouterProvider("or-key", "moonshotai/kimi-k2.6");
+    await provider.sendMessage([userMsg("hi")], undefined, undefined, {
+      config: { thinking: { enabled: true }, effort: "max" },
+    });
+    expect(lastCreateParams).toBeTruthy();
+    expect(lastCreateParams!.reasoning).toEqual({
+      enabled: true,
+      effort: "xhigh",
+      summary: "detailed",
+    });
+    // Critical: must NOT also send the OpenAI-native flat field — OpenRouter
+    // rejects requests that carry both forms for reasoning models.
+    expect(lastCreateParams).not.toHaveProperty("reasoning_effort");
+  });
 });
 describe("OpenRouterProvider Anthropic-compatible errors", () => {

package/src/__tests__/openai-responses-cutover-guard.test.ts CHANGED Viewed

@@ -92,9 +92,9 @@ describe("OpenAI Responses API cutover guard", () => {
     // The factory must NOT instantiate OpenAIChatCompletionsProvider or
     // OpenAIProvider (the backward-compatible alias) inside the `openai:`
-    // factory entry. Other entries (e.g. `zai:`, `deepseek:`, `minimax:`)
-    // may legitimately use OpenAIChatCompletionsProvider since that's the
-    // OpenAI Chat Completions transport for third-party endpoints.
+    // factory entry. Other entries (e.g. `openai-compatible:`) may legitimately
+    // use OpenAIChatCompletionsProvider since that's the OpenAI Chat Completions
+    // transport for third-party endpoints.
     const openaiEntryRegion =
       /(?:^|\s)openai\s*:\s*\([^)]*\)\s*=>\s*[\s\S]{0,400}?(?=\}\s*,\s*[a-z-]+\s*:|\}\s*;)/m.exec(
         source,

package/src/__tests__/openrouter-provider-only.test.ts CHANGED Viewed

@@ -116,7 +116,7 @@ describe("OpenRouter provider.only plumbing", () => {
       expect(extras.provider).toBe(undefined);
     });
-    test("still carries reasoning flag alongside provider.only", () => {
+    test("enables thinking with default detailed summary alongside provider.only", () => {
       const provider = new ProbeOpenRouterProvider(
         "fake-key",
         "x-ai/grok-4.20-beta",
@@ -128,12 +128,12 @@ describe("OpenRouter provider.only plumbing", () => {
         },
       });
       expect(extras).toEqual({
-        reasoning: { enabled: true },
+        reasoning: { enabled: true, summary: "detailed" },
         provider: { only: ["xAI"] },
       });
     });
-    test("disabled thinking keeps reasoning disabled alongside provider.only", () => {
+    test("disabled thinking keeps reasoning disabled and omits summary", () => {
       const provider = new ProbeOpenRouterProvider(
         "fake-key",
         "x-ai/grok-4.20-beta",
@@ -149,5 +149,53 @@ describe("OpenRouter provider.only plumbing", () => {
         provider: { only: ["xAI"] },
       });
     });
+    test("nests effort under reasoning and maps `max` to xhigh", () => {
+      const provider = new ProbeOpenRouterProvider(
+        "fake-key",
+        "moonshotai/kimi-k2.6",
+      );
+      const extras = provider.probeExtras({
+        config: {
+          thinking: { enabled: true },
+          effort: "max",
+        },
+      });
+      expect(extras).toEqual({
+        reasoning: { enabled: true, effort: "xhigh", summary: "detailed" },
+      });
+    });
+    test("honors a per-call summary override", () => {
+      const provider = new ProbeOpenRouterProvider(
+        "fake-key",
+        "moonshotai/kimi-k2.6",
+      );
+      const extras = provider.probeExtras({
+        config: {
+          thinking: { enabled: true },
+          openrouter: { reasoning: { summary: "concise" } },
+        },
+      });
+      expect(extras).toEqual({
+        reasoning: { enabled: true, summary: "concise" },
+      });
+    });
+    test("ignores an invalid summary override and falls back to detailed", () => {
+      const provider = new ProbeOpenRouterProvider(
+        "fake-key",
+        "moonshotai/kimi-k2.6",
+      );
+      const extras = provider.probeExtras({
+        config: {
+          thinking: { enabled: true },
+          openrouter: { reasoning: { summary: "verbose" } },
+        },
+      });
+      expect(extras).toEqual({
+        reasoning: { enabled: true, summary: "detailed" },
+      });
+    });
   });
 });

package/src/__tests__/openrouter-token-estimation.test.ts CHANGED Viewed

@@ -5,7 +5,11 @@ import { OpenRouterProvider } from "../providers/openrouter/client.js";
 import type { Message } from "../providers/types.js";
 /** Build a minimal valid PNG header encoding the given dimensions. */
-function makePngBase64(width: number, height: number, paddingBytes = 0): string {
+function makePngBase64(
+  width: number,
+  height: number,
+  paddingBytes = 0,
+): string {
   const header = Buffer.alloc(24);
   header[0] = 0x89;
   header[1] = 0x50;
@@ -41,13 +45,13 @@ describe("OpenRouterProvider token estimation routing", () => {
     expect(provider.tokenEstimationProvider).toBe("openrouter");
   });
-  test("estimatePromptTokens applies Anthropic image scaling when routed via OpenRouter", () => {
+  test("estimatePromptTokens applies dimension-based image scaling when routed via OpenRouter to Anthropic", () => {
     const provider = new OpenRouterProvider(
       "fake-key",
       "anthropic/claude-opus-4-6",
     );
     // 1920x1080 screenshot with ~200 KB of pixel data → base64/4 would be ~65k
-    // tokens; dimension-based Anthropic rules land around 1.6k tokens.
+    // tokens; dimension-based rules land around 1.6k tokens.
     const messages: Message[] = [
       {
         role: "user",
@@ -68,33 +72,38 @@ describe("OpenRouterProvider token estimation routing", () => {
       providerName: provider.tokenEstimationProvider,
     });
-    // Dimension-based estimate should be well under 5k; base64/4 would exceed 50k.
     expect(estimated).toBeLessThan(5_000);
   });
-  test("estimatePromptTokens falls back to base64/4 for non-Anthropic OpenRouter models", () => {
-    const provider = new OpenRouterProvider("fake-key", "x-ai/grok-4.20-beta");
-    const messages: Message[] = [
-      {
-        role: "user",
-        content: [
-          {
-            type: "image",
-            source: {
-              type: "base64",
-              media_type: "image/png",
-              data: makePngBase64(1920, 1080, 200_000),
+  test("estimatePromptTokens applies dimension-based image scaling for non-Anthropic OpenRouter models", () => {
+    // A naive base64/4 estimate on a 1920x1080 screenshot (~200 KB) lands near
+    // 65k tokens and trips spurious compaction long before the real context
+    // window fills. Vision models on OpenRouter — both anthropic/* and
+    // non-Anthropic (Kimi K2.6, Grok, etc.) — must use the dimension-based
+    // formula.
+    for (const model of ["moonshotai/kimi-k2.6", "x-ai/grok-4.20-beta"]) {
+      const provider = new OpenRouterProvider("fake-key", model);
+      const messages: Message[] = [
+        {
+          role: "user",
+          content: [
+            {
+              type: "image",
+              source: {
+                type: "base64",
+                media_type: "image/png",
+                data: makePngBase64(1920, 1080, 200_000),
+              },
             },
-          },
-        ],
-      },
-    ];
+          ],
+        },
+      ];
-    const estimated = estimatePromptTokens(messages, "system", {
-      providerName: provider.tokenEstimationProvider,
-    });
+      const estimated = estimatePromptTokens(messages, "system", {
+        providerName: provider.tokenEstimationProvider,
+      });
-    // Base64/4 heuristic on ~200 KB of image data → far more than 10k tokens.
-    expect(estimated).toBeGreaterThan(50_000);
+      expect(estimated).toBeLessThan(5_000);
+    }
   });
 });

package/src/__tests__/platform-proxy-context.test.ts CHANGED Viewed

@@ -117,8 +117,13 @@ describe("buildManagedBaseUrl", () => {
     );
   });
+  test("returns managed URL for fireworks", async () => {
+    expect(await buildManagedBaseUrl("fireworks")).toBe(
+      "https://platform.example.com/v1/runtime-proxy/fireworks",
+    );
+  });
   test("returns undefined for non-managed providers", async () => {
-    expect(await buildManagedBaseUrl("fireworks")).toBeUndefined();
     expect(await buildManagedBaseUrl("openrouter")).toBeUndefined();
     expect(await buildManagedBaseUrl("ollama")).toBeUndefined();
   });

package/src/__tests__/plugin-tool-contribution.test.ts CHANGED Viewed

@@ -59,7 +59,7 @@ import {
   unregisterPluginTools,
 } from "../tools/registry.js";
 import type {
-  PluginTool,
+  LoadedPluginTool,
   ToolContext,
   ToolExecutionResult,
 } from "../tools/types.js";
@@ -81,8 +81,8 @@ const fakeCtx: DaemonContext = {
 function makeFakeTool(
   name: string,
-  extras: Partial<PluginTool> = {},
-): PluginTool {
+  extras: Partial<LoadedPluginTool> = {},
+): LoadedPluginTool {
   return {
     name,
     description: `Fake ${name}`,

package/src/__tests__/plugin-types.test.ts CHANGED Viewed

@@ -46,7 +46,7 @@ import {
   type ToolResultTruncateResult,
   type TurnContext,
 } from "../plugins/types.js";
-import type { PluginTool } from "../tools/types.js";
+import type { LoadedPluginTool } from "../tools/types.js";
 const sampleTrust: TrustContext = {
   sourceChannel: "vellum",
@@ -207,7 +207,7 @@ describe("plugin core types", () => {
       },
     };
-    const sampleTool: PluginTool = {
+    const sampleTool: LoadedPluginTool = {
       name: "sample-tool",
       description: "Sample plugin tool",
       defaultRiskLevel: RiskLevel.Low,

package/src/__tests__/provider-catalog-visibility.test.ts CHANGED Viewed

@@ -19,6 +19,22 @@ function makeConfig(): AssistantConfig {
 }
 describe("getVisibleProviderCatalog", () => {
+  test("hides openai-compatible endpoints by default", () => {
+    _setOverridesForTesting({});
+    const visible = getVisibleProviderCatalog(makeConfig());
+    expect(visible.find((p) => p.id === "openai-compatible")).toBeUndefined();
+  });
+  test("shows openai-compatible endpoints when its flag is enabled", () => {
+    _setOverridesForTesting({ "openai-compatible-endpoints": true });
+    const visible = getVisibleProviderCatalog(makeConfig());
+    expect(visible.find((p) => p.id === "openai-compatible")).toBeDefined();
+  });
   test("returns the full catalog when all feature flags are enabled", () => {
     const allFlags: Record<string, boolean> = {};
     for (const entry of PROVIDER_CATALOG) {

package/src/__tests__/provider-platform-proxy-integration.test.ts CHANGED Viewed

@@ -113,7 +113,7 @@ const DIRECT_OR_MANAGED_PROVIDER_KEYS: string[] = [
   "fireworks",
   "openrouter",
 ];
-const MANAGED_FALLBACK_PROVIDERS: string[] = ["anthropic", "gemini", "openai"];
+const MANAGED_FALLBACK_PROVIDERS: string[] = ["anthropic", "gemini", "openai", "fireworks"];
 function enableManagedProxy() {
   mockPlatformBaseUrl = PLATFORM_BASE;
@@ -209,20 +209,19 @@ describe("managed proxy integration — credential precedence", () => {
       },
     );
-    test("managed bootstrap registers anthropic, openai, and gemini", async () => {
+    test("managed bootstrap registers anthropic, openai, gemini, and fireworks", async () => {
       enableManagedProxy();
       mockProviderKeys = {};
       await initializeProviders(makeProvidersConfig("anthropic", "test-model"));
       expect(listProviders()).toEqual(
-        expect.arrayContaining(["anthropic", "openai", "gemini"]),
+        expect.arrayContaining(["anthropic", "openai", "gemini", "fireworks"]),
       );
-      expect(listProviders()).toHaveLength(3);
+      expect(listProviders()).toHaveLength(4);
       expect(getProviderRoutingSource("anthropic")).toBe("managed-proxy");
       expect(getProviderRoutingSource("openai")).toBe("managed-proxy");
       expect(getProviderRoutingSource("gemini")).toBe("managed-proxy");
-      for (const p of ["fireworks", "openrouter"]) {
-        expect(getProviderRoutingSource(p)).toBeUndefined();
-      }
+      expect(getProviderRoutingSource("fireworks")).toBe("managed-proxy");
+      expect(getProviderRoutingSource("openrouter")).toBeUndefined();
     });
     test("managed anthropic uses anthropic proxy path", async () => {
@@ -376,7 +375,7 @@ describe("managed proxy integration — credential precedence", () => {
   });
   describe("mixed: some user keys + managed fallback fills gaps", () => {
-    test("user key for anthropic routes direct and managed fallback fills openai and gemini", async () => {
+    test("user key for anthropic routes direct and managed fallback fills openai, gemini, and fireworks", async () => {
       enableManagedProxy();
       setUserKeysFor("anthropic");
       await initializeProviders(makeProvidersConfig("anthropic", "test-model"));
@@ -387,13 +386,13 @@ describe("managed proxy integration — credential precedence", () => {
       expect(getProviderRoutingSource("openai")).toBe("managed-proxy");
       expect(registered).toContain("gemini");
       expect(getProviderRoutingSource("gemini")).toBe("managed-proxy");
-      for (const p of ["fireworks", "openrouter"]) {
-        expect(registered).not.toContain(p);
-        expect(getProviderRoutingSource(p)).toBeUndefined();
-      }
+      expect(registered).toContain("fireworks");
+      expect(getProviderRoutingSource("fireworks")).toBe("managed-proxy");
+      expect(registered).not.toContain("openrouter");
+      expect(getProviderRoutingSource("openrouter")).toBeUndefined();
     });
-    test("user key for openai routes direct while anthropic and gemini still bootstrap via managed proxy", async () => {
+    test("user key for openai routes direct while anthropic, gemini, and fireworks still bootstrap via managed proxy", async () => {
       enableManagedProxy();
       setUserKeysFor("openai");
       await initializeProviders(makeProvidersConfig("openai", "test-model"));
@@ -404,11 +403,10 @@ describe("managed proxy integration — credential precedence", () => {
       expect(getProviderRoutingSource("anthropic")).toBe("managed-proxy");
       expect(registered).toContain("gemini");
       expect(getProviderRoutingSource("gemini")).toBe("managed-proxy");
-      // OpenAI has a user key so it's user-key, not managed-proxy
-      for (const p of ["fireworks", "openrouter"]) {
-        expect(registered).not.toContain(p);
-        expect(getProviderRoutingSource(p)).toBeUndefined();
-      }
+      expect(registered).toContain("fireworks");
+      expect(getProviderRoutingSource("fireworks")).toBe("managed-proxy");
+      expect(registered).not.toContain("openrouter");
+      expect(getProviderRoutingSource("openrouter")).toBeUndefined();
     });
   });
 });
@@ -476,8 +474,8 @@ describe("config mode flip → provider reinit", () => {
 });
 describe("managed proxy integration — constants integrity", () => {
-  test("anthropic, openai, and gemini have metadata with managed=true and a proxyPath", () => {
-    for (const provider of ["anthropic", "openai", "gemini"]) {
+  test("anthropic, openai, gemini, and fireworks have metadata with managed=true and a proxyPath", () => {
+    for (const provider of ["anthropic", "openai", "gemini", "fireworks"]) {
       const meta = PLATFORM_PROVIDER_META[provider];
       expect(meta).toBeDefined();
       expect(meta.managed).toBe(true);
@@ -504,10 +502,14 @@ describe("managed proxy integration — constants integrity", () => {
     );
   });
-  test("fireworks and openrouter are not managed proxy capable", () => {
-    for (const provider of ["fireworks", "openrouter"]) {
-      expect(PLATFORM_PROVIDER_META[provider].managed).toBe(false);
-      expect(PLATFORM_PROVIDER_META[provider].proxyPath).toBeUndefined();
-    }
+  test("fireworks routes through fireworks proxy path", () => {
+    expect(PLATFORM_PROVIDER_META.fireworks.proxyPath).toBe(
+      "/v1/runtime-proxy/fireworks",
+    );
+  });
+  test("openrouter is not managed proxy capable", () => {
+    expect(PLATFORM_PROVIDER_META.openrouter.managed).toBe(false);
+    expect(PLATFORM_PROVIDER_META.openrouter.proxyPath).toBeUndefined();
   });
 });

package/src/__tests__/secret-routes-platform-proxy.test.ts CHANGED Viewed

@@ -12,7 +12,7 @@ let providerRefreshCalls = 0;
 const PLATFORM_BASE_URL = "https://platform.example.com";
 const ASSISTANT_API_KEY_PATH = credentialKey("vellum", "assistant_api_key");
 const PLATFORM_BASE_URL_PATH = credentialKey("vellum", "platform_base_url");
-const MANAGED_PROVIDERS = ["anthropic", "openai", "gemini"] as const;
+const MANAGED_PROVIDERS = ["anthropic", "openai", "gemini", "fireworks"] as const;
 let platformBaseUrlOverride: string | undefined;