npm - @vellumai/assistant - Versions diffs - 0.4.48 → 0.4.49 - Mend

@vellumai/assistant 0.4.48 → 0.4.49

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (252) hide show

package/ARCHITECTURE.md +2 -2
package/README.md +2 -23
package/docs/architecture/integrations.md +45 -41
package/docs/architecture/keychain-broker.md +3 -3
package/docs/runbook-trusted-contacts.md +3 -8
package/hook-templates/debug-prompt-logger/hook.json +1 -1
package/hook-templates/debug-prompt-logger/run.sh +1 -3
package/package.json +1 -1
package/src/__tests__/actor-token-service.test.ts +0 -1
package/src/__tests__/anthropic-provider.test.ts +156 -0
package/src/__tests__/approval-cascade.test.ts +810 -0
package/src/__tests__/approval-primitive.test.ts +0 -1
package/src/__tests__/approval-routes-http.test.ts +2 -0
package/src/__tests__/assistant-attachments.test.ts +12 -34
package/src/__tests__/assistant-feature-flag-guardrails.test.ts +76 -0
package/src/__tests__/assistant-feature-flags-integration.test.ts +0 -1
package/src/__tests__/browser-skill-baseline-tool-payload.test.ts +2 -2
package/src/__tests__/channel-guardian.test.ts +0 -2
package/src/__tests__/channel-readiness-routes.test.ts +15 -6
package/src/__tests__/channel-readiness-service.test.ts +10 -9
package/src/__tests__/checker.test.ts +9 -29
package/src/__tests__/computer-use-skill-manifest-regression.test.ts +1 -1
package/src/__tests__/computer-use-tools.test.ts +2 -19
package/src/__tests__/config-watcher.test.ts +0 -1
package/src/__tests__/confirmation-request-guardian-bridge.test.ts +0 -1
package/src/__tests__/context-image-dimensions.test.ts +332 -0
package/src/__tests__/context-token-estimator.test.ts +196 -13
package/src/__tests__/conversation-attention-store.test.ts +0 -1
package/src/__tests__/conversation-attention-telegram.test.ts +0 -1
package/src/__tests__/conversation-routes-guardian-reply.test.ts +144 -0
package/src/__tests__/conversation-routes-slash-commands.test.ts +1 -0
package/src/__tests__/credential-metadata-store.test.ts +64 -73
package/src/__tests__/credential-security-invariants.test.ts +13 -7
package/src/__tests__/credential-vault-unit.test.ts +280 -49
package/src/__tests__/credential-vault.test.ts +138 -16
package/src/__tests__/credentials-cli.test.ts +71 -0
package/src/__tests__/dynamic-skill-workflow-prompt.test.ts +0 -1
package/src/__tests__/ephemeral-permissions.test.ts +3 -3
package/src/__tests__/gateway-only-guard.test.ts +0 -1
package/src/__tests__/guardian-action-grant-mint-consume.test.ts +0 -1
package/src/__tests__/guardian-decision-primitive-canonical.test.ts +0 -1
package/src/__tests__/guardian-routing-invariants.test.ts +0 -1
package/src/__tests__/guardian-verification-voice-binding.test.ts +0 -1
package/src/__tests__/handlers-user-message-approval-consumption.test.ts +0 -39
package/src/__tests__/heartbeat-service.test.ts +0 -1
package/src/__tests__/host-cu-proxy.test.ts +629 -0
package/src/__tests__/host-shell-tool.test.ts +27 -15
package/src/__tests__/http-user-message-parity.test.ts +1 -0
package/src/__tests__/ingress-url-consistency.test.ts +14 -21
package/src/__tests__/integration-status.test.ts +32 -51
package/src/__tests__/intent-routing.test.ts +0 -1
package/src/__tests__/invite-routes-http.test.ts +10 -9
package/src/__tests__/keychain-broker-client.test.ts +11 -43
package/src/__tests__/notification-routing-intent.test.ts +0 -1
package/src/__tests__/oauth-cli.test.ts +373 -14
package/src/__tests__/oauth-provider-profiles.test.ts +9 -9
package/src/__tests__/oauth-scope-policy.test.ts +4 -6
package/src/__tests__/oauth-store.test.ts +756 -0
package/src/__tests__/onboarding-starter-tasks.test.ts +0 -1
package/src/__tests__/provider-error-scenarios.test.ts +0 -1
package/src/__tests__/provider-streaming.benchmark.test.ts +0 -1
package/src/__tests__/public-ingress-urls.test.ts +15 -21
package/src/__tests__/recording-handler.test.ts +3 -4
package/src/__tests__/registry.test.ts +2 -2
package/src/__tests__/runtime-events-sse.test.ts +55 -7
package/src/__tests__/schedule-store.test.ts +0 -1
package/src/__tests__/scheduler-recurrence.test.ts +0 -1
package/src/__tests__/scoped-approval-grants.test.ts +0 -1
package/src/__tests__/scoped-grant-security-matrix.test.ts +0 -1
package/src/__tests__/secret-ingress-handler.test.ts +0 -1
package/src/__tests__/send-endpoint-busy.test.ts +21 -6
package/src/__tests__/sequence-store.test.ts +0 -1
package/src/__tests__/session-init.benchmark.test.ts +4 -5
package/src/__tests__/skill-include-graph.test.ts +66 -0
package/src/__tests__/skill-load-feature-flag.test.ts +0 -1
package/src/__tests__/skill-load-tool.test.ts +149 -1
package/src/__tests__/skill-projection-feature-flag.test.ts +0 -1
package/src/__tests__/skills-uninstall.test.ts +1 -1
package/src/__tests__/skills.test.ts +3 -3
package/src/__tests__/slack-channel-config.test.ts +67 -3
package/src/__tests__/slack-share-routes.test.ts +17 -19
package/src/__tests__/system-prompt.test.ts +0 -1
package/src/__tests__/telegram-invite-adapter.test.ts +18 -22
package/src/__tests__/terminal-tools.test.ts +4 -3
package/src/__tests__/test-support/computer-use-skill-harness.ts +3 -2
package/src/__tests__/tool-approval-handler.test.ts +0 -1
package/src/__tests__/tool-execution-pipeline.benchmark.test.ts +0 -1
package/src/__tests__/tool-executor-lifecycle-events.test.ts +0 -1
package/src/__tests__/tool-executor-shell-integration.test.ts +0 -1
package/src/__tests__/tool-executor.test.ts +0 -1
package/src/__tests__/tool-grant-request-escalation.test.ts +0 -1
package/src/__tests__/trust-store-pattern-matches.test.ts +29 -0
package/src/__tests__/trust-store.test.ts +1 -22
package/src/__tests__/trusted-contact-approval-notifier.test.ts +0 -1
package/src/__tests__/trusted-contact-inline-approval-integration.test.ts +0 -1
package/src/__tests__/twilio-routes.test.ts +0 -16
package/src/__tests__/verification-control-plane-policy.test.ts +0 -1
package/src/__tests__/voice-scoped-grant-consumer.test.ts +0 -1
package/src/agent/ax-tree-compaction.test.ts +235 -0
package/src/agent/loop.ts +76 -130
package/src/calls/call-domain.ts +1 -6
package/src/calls/relay-server.ts +9 -13
package/src/calls/twilio-config.ts +2 -7
package/src/calls/twilio-routes.ts +1 -2
package/src/calls/voice-ingress-preflight.ts +1 -1
package/src/cli/commands/browser-relay.ts +18 -12
package/src/cli/commands/completions.ts +0 -3
package/src/cli/commands/credentials.ts +101 -15
package/src/cli/commands/oauth/apps.ts +255 -0
package/src/cli/commands/oauth/connections.ts +299 -0
package/src/cli/commands/oauth/index.ts +52 -0
package/src/cli/commands/oauth/providers.ts +242 -0
package/src/cli/commands/skills.ts +4 -338
package/src/cli/program.ts +1 -5
package/src/cli/reference.ts +1 -3
package/src/config/assistant-feature-flags.ts +0 -3
package/src/config/bundled-skills/_shared/CLI_RETRIEVAL_PATTERN.md +1 -1
package/src/config/bundled-skills/computer-use/SKILL.md +3 -6
package/src/config/bundled-skills/computer-use/TOOLS.json +22 -4
package/src/config/bundled-skills/google-calendar/calendar-client.ts +21 -16
package/src/config/bundled-skills/messaging/tools/shared.ts +1 -4
package/src/config/bundled-skills/settings/SKILL.md +1 -1
package/src/config/bundled-skills/settings/TOOLS.json +2 -8
package/src/config/bundled-skills/settings/tools/voice-config-update.ts +5 -33
package/src/config/env-registry.ts +14 -83
package/src/config/env.ts +11 -50
package/src/config/feature-flag-registry.json +16 -16
package/src/config/loader.ts +0 -6
package/src/config/schema.ts +3 -1
package/src/config/skills.ts +21 -2
package/src/context/image-dimensions.ts +229 -0
package/src/context/token-estimator.ts +75 -12
package/src/context/window-manager.ts +49 -10
package/src/daemon/assistant-attachments.ts +1 -13
package/src/daemon/handlers/config-ingress.ts +8 -33
package/src/daemon/handlers/config-slack-channel.ts +49 -46
package/src/daemon/handlers/config-telegram.ts +32 -16
package/src/daemon/handlers/sessions.ts +10 -24
package/src/daemon/handlers/shared.ts +0 -130
package/src/daemon/host-cu-proxy.ts +401 -0
package/src/daemon/lifecycle.ts +36 -68
package/src/daemon/message-protocol.ts +3 -0
package/src/daemon/message-types/computer-use.ts +2 -119
package/src/daemon/message-types/host-cu.ts +19 -0
package/src/daemon/message-types/messages.ts +3 -0
package/src/daemon/server.ts +14 -21
package/src/daemon/session-agent-loop-handlers.ts +2 -0
package/src/daemon/session-attachments.ts +1 -2
package/src/daemon/session-slash.ts +1 -1
package/src/daemon/session-surfaces.ts +40 -28
package/src/daemon/session-tool-setup.ts +2 -9
package/src/daemon/session.ts +138 -15
package/src/daemon/tool-side-effects.ts +2 -8
package/src/daemon/watch-handler.ts +2 -2
package/src/events/tool-metrics-listener.ts +2 -2
package/src/hooks/manager.ts +1 -4
package/src/inbound/public-ingress-urls.ts +7 -7
package/src/logfire.ts +16 -5
package/src/memory/conversation-key-store.ts +21 -0
package/src/memory/db-init.ts +4 -0
package/src/memory/migrations/149-oauth-tables.ts +60 -0
package/src/memory/migrations/index.ts +1 -0
package/src/memory/schema/index.ts +1 -0
package/src/memory/schema/oauth.ts +65 -0
package/src/messaging/provider.ts +4 -4
package/src/messaging/providers/gmail/client.ts +82 -2
package/src/messaging/providers/gmail/people-client.ts +10 -10
package/src/messaging/providers/telegram-bot/adapter.ts +17 -17
package/src/messaging/providers/whatsapp/adapter.ts +11 -8
package/src/messaging/registry.ts +2 -32
package/src/notifications/copy-composer.ts +0 -5
package/src/notifications/signal.ts +4 -5
package/src/oauth/byo-connection.test.ts +126 -25
package/src/oauth/byo-connection.ts +22 -6
package/src/oauth/connect-orchestrator.ts +113 -57
package/src/oauth/connect-types.ts +17 -23
package/src/oauth/connection-resolver.ts +35 -11
package/src/oauth/connection.ts +1 -1
package/src/oauth/manual-token-connection.ts +104 -0
package/src/oauth/oauth-store.ts +496 -0
package/src/oauth/platform-connection.test.ts +29 -0
package/src/oauth/platform-connection.ts +6 -5
package/src/oauth/provider-behaviors.ts +124 -0
package/src/oauth/scope-policy.ts +9 -2
package/src/oauth/seed-providers.ts +161 -0
package/src/oauth/token-persistence.ts +74 -78
package/src/permissions/checker.ts +3 -3
package/src/permissions/defaults.ts +0 -1
package/src/permissions/prompter.ts +10 -1
package/src/permissions/trust-store.ts +13 -0
package/src/prompts/__tests__/build-cli-reference-section.test.ts +3 -1
package/src/prompts/system-prompt.ts +28 -40
package/src/providers/anthropic/client.ts +133 -24
package/src/providers/retry.ts +1 -27
package/src/runtime/auth/route-policy.ts +0 -3
package/src/runtime/channel-reply-delivery.ts +0 -40
package/src/runtime/gateway-client.ts +0 -7
package/src/runtime/http-server.ts +8 -6
package/src/runtime/http-types.ts +2 -2
package/src/runtime/middleware/twilio-validation.ts +1 -11
package/src/runtime/pending-interactions.ts +14 -12
package/src/runtime/routes/channel-delivery-routes.ts +0 -1
package/src/runtime/routes/conversation-routes.ts +73 -19
package/src/runtime/routes/events-routes.ts +21 -11
package/src/runtime/routes/host-cu-routes.ts +97 -0
package/src/runtime/routes/inbound-stages/background-dispatch.ts +12 -111
package/src/runtime/routes/integrations/slack/share.ts +6 -7
package/src/runtime/routes/log-export-routes.ts +126 -8
package/src/runtime/routes/settings-routes.ts +55 -48
package/src/runtime/routes/surface-action-routes.ts +1 -1
package/src/runtime/routes/watch-routes.ts +128 -0
package/src/schedule/integration-status.ts +10 -9
package/src/security/credential-key.ts +0 -156
package/src/security/keychain-broker-client.ts +5 -6
package/src/security/oauth2.ts +1 -1
package/src/security/token-manager.ts +119 -46
package/src/skills/catalog-install.ts +358 -0
package/src/skills/include-graph.ts +32 -0
package/src/telegram/bot-username.ts +2 -3
package/src/tools/browser/network-recorder.ts +1 -1
package/src/tools/browser/network-recording-types.ts +1 -1
package/src/tools/computer-use/definitions.ts +46 -11
package/src/tools/computer-use/registry.ts +4 -5
package/src/tools/credentials/broker.ts +1 -2
package/src/tools/credentials/metadata-store.ts +17 -121
package/src/tools/credentials/vault.ts +94 -167
package/src/tools/registry.ts +2 -7
package/src/tools/skills/load.ts +62 -3
package/src/tools/watch/watch-state.ts +0 -12
package/src/util/logger.ts +7 -41
package/src/util/platform.ts +9 -28
package/src/watcher/providers/google-calendar.ts +2 -1
package/src/__tests__/computer-use-session-compaction.test.ts +0 -143
package/src/__tests__/computer-use-session-lifecycle.test.ts +0 -322
package/src/__tests__/computer-use-session-working-dir.test.ts +0 -166
package/src/__tests__/computer-use-skill-baseline.test.ts +0 -78
package/src/__tests__/computer-use-skill-endstate.test.ts +0 -105
package/src/__tests__/computer-use-skill-lifecycle-cleanup.test.ts +0 -249
package/src/__tests__/ride-shotgun-handler.test.ts +0 -452
package/src/cli/commands/dev.ts +0 -129
package/src/cli/commands/map.ts +0 -391
package/src/cli/commands/oauth.ts +0 -77
package/src/config/bundled-skills/computer-use/tools/computer-use-request-control.ts +0 -16
package/src/daemon/computer-use-session.ts +0 -1026
package/src/daemon/ride-shotgun-handler.ts +0 -569
package/src/oauth/provider-base-urls.ts +0 -21
package/src/oauth/provider-profiles.ts +0 -192
package/src/prompts/computer-use-prompt.ts +0 -98
package/src/runtime/routes/computer-use-routes.ts +0 -641
package/src/runtime/telegram-streaming-delivery.test.ts +0 -729
package/src/runtime/telegram-streaming-delivery.ts +0 -393
package/src/tools/computer-use/request-computer-control.ts +0 -56

package/src/util/platform.ts CHANGED Viewed

@@ -8,13 +8,7 @@ import {
 import { homedir } from "node:os";
 import { join } from "node:path";
-import {
-  getBaseDataDir,
-  getDaemonIosPairing,
-  getDaemonTcpEnabled,
-  getDaemonTcpHost,
-  getDaemonTcpPort,
-} from "../config/env-registry.js";
+import { getBaseDataDir } from "../config/env-registry.js";
 export function isMacOS(): boolean {
   return process.platform === "darwin";
@@ -245,39 +239,30 @@ export function getInterfacesDir(): string {
 /**
  * Returns the TCP port the daemon should listen on for iOS clients.
- * Reads VELLUM_DAEMON_TCP_PORT env var; defaults to 8765.
+ * Hardcoded default: 8765.
  */
 export function getTCPPort(): number {
-  return getDaemonTcpPort();
+  return 8765;
 }
 /**
  * Returns whether the daemon TCP listener should be enabled.
- * Resolution order (first match wins):
- *   1. VELLUM_DAEMON_TCP_ENABLED env var ('true'/'1' → on, 'false'/'0' → off)
- *   2. Presence of the flag file ~/.vellum/tcp-enabled (exists → on)
- *   3. Default: false
+ * Checks for the presence of the flag file ~/.vellum/tcp-enabled.
+ * Default: false.
  *
  * The flag-file check makes it easy to enable TCP in dev without restarting
  * the shell: `touch ~/.vellum/tcp-enabled && kill -USR1 <daemon-pid>`.
- * The macOS CLI (AssistantCli) also sets the env var for bundled-binary deployments.
  */
 export function isTCPEnabled(): boolean {
-  const envValue = getDaemonTcpEnabled();
-  if (envValue !== undefined) return envValue;
   return existsSync(join(getRootDir(), "tcp-enabled"));
 }
 /**
  * Returns the hostname/address for the TCP listener.
- * Resolution order (first match wins):
- *   1. VELLUM_DAEMON_TCP_HOST env var (explicit override)
- *   2. If iOS pairing is enabled: '0.0.0.0' (LAN-accessible)
- *   3. Default: '127.0.0.1' (localhost only)
+ * If iOS pairing is enabled (flag file): '0.0.0.0' (LAN-accessible).
+ * Default: '127.0.0.1' (localhost only).
  */
 export function getTCPHost(): string {
-  const override = getDaemonTcpHost();
-  if (override) return override;
   if (isIOSPairingEnabled()) return "0.0.0.0";
   return "127.0.0.1";
 }
@@ -288,17 +273,13 @@ export function getTCPHost(): string {
  * instead of 127.0.0.1 (localhost only), making the daemon reachable
  * from iOS devices on the same local network.
  *
- * Resolution order (first match wins):
- *   1. VELLUM_DAEMON_IOS_PAIRING env var ('true'/'1' → on, 'false'/'0' → off)
- *   2. Presence of the flag file ~/.vellum/ios-pairing-enabled (exists → on)
- *   3. Default: false
+ * Checks for the presence of the flag file ~/.vellum/ios-pairing-enabled.
+ * Default: false.
  *
  * This is separate from isTCPEnabled() — TCP can be enabled for localhost-only
  * access without exposing the daemon to the LAN.
  */
 export function isIOSPairingEnabled(): boolean {
-  const envValue = getDaemonIosPairing();
-  if (envValue !== undefined) return envValue;
   return existsSync(join(getRootDir(), "ios-pairing-enabled"));
 }

package/src/watcher/providers/google-calendar.ts CHANGED Viewed

@@ -13,7 +13,8 @@ import {
 import type { CalendarEvent } from "../../config/bundled-skills/google-calendar/types.js";
 import type { OAuthConnection } from "../../oauth/connection.js";
 import { resolveOAuthConnection } from "../../oauth/connection-resolver.js";
-import { GOOGLE_CALENDAR_BASE_URL } from "../../oauth/provider-base-urls.js";
+const GOOGLE_CALENDAR_BASE_URL = "https://www.googleapis.com/calendar/v3";
 import { getLogger } from "../../util/logger.js";
 import type {
   FetchResult,

package/src/__tests__/computer-use-session-compaction.test.ts DELETED Viewed

@@ -1,143 +0,0 @@
-import { describe, expect, test } from "bun:test";
-import { ComputerUseSession } from "../daemon/computer-use-session.js";
-import type { Message } from "../providers/types.js";
-/**
- * Helper to create a user message with a tool_result block containing
- * an AX tree wrapped in markers.
- */
-function toolResultMsg(content: string): Message {
-  return {
-    role: "user",
-    content: [
-      {
-        type: "tool_result",
-        tool_use_id: "test-id",
-        content,
-      },
-    ],
-  };
-}
-describe("ComputerUseSession.escapeAxTreeContent", () => {
-  test("escapes a literal closing tag in the content", () => {
-    const input = "some text </ax-tree> more text";
-    const escaped = ComputerUseSession.escapeAxTreeContent(input);
-    expect(escaped).toBe("some text &lt;/ax-tree&gt; more text");
-  });
-  test("escapes multiple occurrences", () => {
-    const input = "</ax-tree> hello </ax-tree>";
-    const escaped = ComputerUseSession.escapeAxTreeContent(input);
-    expect(escaped).toBe("&lt;/ax-tree&gt; hello &lt;/ax-tree&gt;");
-  });
-  test("is case-insensitive", () => {
-    const input = "</AX-TREE> and </Ax-Tree>";
-    const escaped = ComputerUseSession.escapeAxTreeContent(input);
-    expect(escaped).toBe("&lt;/ax-tree&gt; and &lt;/ax-tree&gt;");
-  });
-  test("leaves content without closing tags unchanged", () => {
-    const input = 'Window "My App" [1]\n  Button "OK" [2]';
-    expect(ComputerUseSession.escapeAxTreeContent(input)).toBe(input);
-  });
-});
-describe("ComputerUseSession.compactHistory", () => {
-  test("[experimental] strips old AX trees and keeps the most recent ones", () => {
-    const messages: Message[] = [
-      { role: "assistant", content: [{ type: "text", text: "thinking..." }] },
-      toolResultMsg(
-        '<ax-tree>CURRENT SCREEN STATE:\nWindow "App" [1]</ax-tree>',
-      ),
-      { role: "assistant", content: [{ type: "text", text: "action 1" }] },
-      toolResultMsg(
-        '<ax-tree>CURRENT SCREEN STATE:\nWindow "App" [2]</ax-tree>',
-      ),
-      { role: "assistant", content: [{ type: "text", text: "action 2" }] },
-      toolResultMsg(
-        '<ax-tree>CURRENT SCREEN STATE:\nWindow "App" [3]</ax-tree>',
-      ),
-    ];
-    const compacted = ComputerUseSession.compactHistory(messages);
-    // First AX tree (index 1) should be stripped
-    const firstToolResult = compacted[1].content[0];
-    expect(firstToolResult.type).toBe("tool_result");
-    if (firstToolResult.type === "tool_result") {
-      expect(firstToolResult.content).toContain("<ax_tree_omitted />");
-      expect(firstToolResult.content).not.toContain("<ax-tree>");
-    }
-    // Last two AX trees should be preserved
-    const secondToolResult = compacted[3].content[0];
-    if (secondToolResult.type === "tool_result") {
-      expect(secondToolResult.content).toContain("<ax-tree>");
-    }
-    const thirdToolResult = compacted[5].content[0];
-    if (thirdToolResult.type === "tool_result") {
-      expect(thirdToolResult.content).toContain("<ax-tree>");
-    }
-  });
-  test("[experimental] handles AX tree content containing literal </ax-tree> (escaped)", () => {
-    // Simulate content where the AX tree text includes an escaped closing tag,
-    // e.g. user is viewing XML source code with "</ax-tree>" in it.
-    const escapedContent =
-      '<ax-tree>CURRENT SCREEN STATE:\nTextArea "editor" [1]\n  ' +
-      "Line: &lt;/ax-tree&gt; some xml\n</ax-tree>";
-    const messages: Message[] = [
-      { role: "assistant", content: [{ type: "text", text: "action 0" }] },
-      toolResultMsg(escapedContent),
-      { role: "assistant", content: [{ type: "text", text: "action 1" }] },
-      toolResultMsg(escapedContent),
-      { role: "assistant", content: [{ type: "text", text: "action 2" }] },
-      toolResultMsg(
-        '<ax-tree>CURRENT SCREEN STATE:\nWindow "App" [3]</ax-tree>',
-      ),
-    ];
-    const compacted = ComputerUseSession.compactHistory(messages);
-    // The first message with escaped content should be fully stripped
-    const firstToolResult = compacted[1].content[0];
-    if (firstToolResult.type === "tool_result") {
-      expect(firstToolResult.content).not.toContain("<ax-tree>");
-      expect(firstToolResult.content).toContain("<ax_tree_omitted />");
-    }
-  });
-  test("regex fails on unescaped </ax-tree> inside content (demonstrating the bug)", () => {
-    // This test demonstrates what happens WITHOUT escaping: the regex
-    // only partially removes the AX tree block.
-    const unescapedContent =
-      '<ax-tree>CURRENT SCREEN STATE:\nTextArea "editor" [1]\n  ' +
-      "Line: </ax-tree> some xml leftover\n</ax-tree>";
-    const messages: Message[] = [
-      { role: "assistant", content: [{ type: "text", text: "action 0" }] },
-      toolResultMsg(unescapedContent),
-      { role: "assistant", content: [{ type: "text", text: "action 1" }] },
-      toolResultMsg(unescapedContent),
-      { role: "assistant", content: [{ type: "text", text: "action 2" }] },
-      toolResultMsg(
-        '<ax-tree>CURRENT SCREEN STATE:\nWindow "App" [3]</ax-tree>',
-      ),
-    ];
-    const compacted = ComputerUseSession.compactHistory(messages);
-    // Without escaping, the first tool result has leftover content after
-    // the regex only matched up to the FIRST </ax-tree>.
-    const firstToolResult = compacted[1].content[0];
-    if (firstToolResult.type === "tool_result") {
-      // The non-greedy regex stops at the first </ax-tree>, leaving
-      // " some xml leftover\n</ax-tree>" behind.
-      expect(firstToolResult.content).toContain("some xml leftover");
-    }
-  });
-});

package/src/__tests__/computer-use-session-lifecycle.test.ts DELETED Viewed

@@ -1,322 +0,0 @@
-import { describe, expect, mock, test } from "bun:test";
-// Mock config before importing modules that depend on it.
-// The permissions mode must be 'workspace' so computer-use tools
-// go through normal workspace trust evaluation instead of prompting.
-mock.module("../config/loader.js", () => ({
-  getConfig: () => ({
-    ui: {},
-    provider: "mock-provider",
-    permissions: { mode: "workspace" },
-    apiKeys: {},
-    sandbox: { enabled: false },
-    timeouts: { toolExecutionTimeoutSec: 30, permissionTimeoutSec: 5 },
-    skills: { load: { extraDirs: [] } },
-    secretDetection: { enabled: false },
-    contextWindow: {
-      enabled: true,
-      maxInputTokens: 180000,
-      targetBudgetRatio: 0.3,
-      compactThreshold: 0.8,
-      summaryBudgetRatio: 0.05,
-    },
-  }),
-  invalidateConfigCache: () => {},
-}));
-import { ComputerUseSession } from "../daemon/computer-use-session.js";
-import type {
-  CuObservation,
-  ServerMessage,
-} from "../daemon/message-protocol.js";
-import type { Provider, ProviderResponse } from "../providers/types.js";
-function createProvider(responses: ProviderResponse[]): {
-  provider: Provider;
-  getCalls: () => number;
-} {
-  let calls = 0;
-  const provider: Provider = {
-    name: "mock",
-    async sendMessage() {
-      const response = responses[calls] ?? responses[responses.length - 1];
-      calls++;
-      return response;
-    },
-  };
-  return { provider, getCalls: () => calls };
-}
-describe("ComputerUseSession lifecycle", () => {
-  test("stops provider loop immediately after terminal computer_use_done tool", async () => {
-    const { provider, getCalls } = createProvider([
-      {
-        content: [
-          {
-            type: "tool_use",
-            id: "tu-1",
-            name: "computer_use_done",
-            input: { summary: "Task finished" },
-          },
-        ],
-        model: "mock-model",
-        usage: { inputTokens: 10, outputTokens: 5 },
-        stopReason: "tool_use",
-      },
-      {
-        content: [{ type: "text", text: "This should never be requested" }],
-        model: "mock-model",
-        usage: { inputTokens: 10, outputTokens: 5 },
-        stopReason: "end_turn",
-      },
-    ]);
-    const sentMessages: ServerMessage[] = [];
-    let terminalCalls = 0;
-    const session = new ComputerUseSession(
-      "cu-test-1",
-      "test task",
-      1440,
-      900,
-      provider,
-      (msg) => {
-        sentMessages.push(msg);
-      },
-      "computer_use",
-      () => {
-        terminalCalls++;
-      },
-    );
-    const observation: CuObservation = {
-      type: "cu_observation",
-      sessionId: "cu-test-1",
-      axTree: 'Window "Test" [1]',
-    };
-    await session.handleObservation(observation);
-    // If computer_use_done does not abort the loop, we'd see an extra provider call.
-    expect(getCalls()).toBe(1);
-    expect(session.getState()).toBe("complete");
-    expect(terminalCalls).toBe(1);
-    const completes = sentMessages.filter(
-      (msg): msg is Extract<ServerMessage, { type: "cu_complete" }> =>
-        msg.type === "cu_complete",
-    );
-    expect(completes).toHaveLength(1);
-    expect(completes[0].summary).toBe("Task finished");
-  });
-  test("notifies terminal callback only once on repeated abort calls", () => {
-    const { provider } = createProvider([
-      {
-        content: [{ type: "text", text: "unused" }],
-        model: "mock-model",
-        usage: { inputTokens: 1, outputTokens: 1 },
-        stopReason: "end_turn",
-      },
-    ]);
-    let terminalCalls = 0;
-    const session = new ComputerUseSession(
-      "cu-test-2",
-      "test task",
-      1440,
-      900,
-      provider,
-      () => {},
-      "computer_use",
-      () => {
-        terminalCalls++;
-      },
-    );
-    session.abort();
-    session.abort();
-    expect(terminalCalls).toBe(1);
-    expect(session.getState()).toBe("error");
-  });
-  test("CU session passes exactly 10 computer_use_* tools to the agent loop", async () => {
-    let capturedTools: string[] = [];
-    const provider: Provider = {
-      name: "mock",
-      async sendMessage(_msgs, tools) {
-        capturedTools = (tools ?? []).map((t) => t.name);
-        return {
-          content: [
-            {
-              type: "tool_use",
-              id: "tu-capture",
-              name: "computer_use_done",
-              input: { summary: "Done" },
-            },
-          ],
-          model: "mock-model",
-          usage: { inputTokens: 10, outputTokens: 5 },
-          stopReason: "tool_use",
-        };
-      },
-    };
-    const session = new ComputerUseSession(
-      "cu-tool-capture",
-      "capture tools",
-      1440,
-      900,
-      provider,
-      () => {},
-      "computer_use",
-    );
-    await session.handleObservation({
-      type: "cu_observation",
-      sessionId: "cu-tool-capture",
-      axTree: 'Window "Test" [1]',
-    });
-    const cuTools = capturedTools.filter((n) => n.startsWith("computer_use_"));
-    expect(cuTools).toHaveLength(10);
-    // Assert exact set of expected CU tool names
-    const expectedCuTools = [
-      "computer_use_click",
-      "computer_use_type_text",
-      "computer_use_key",
-      "computer_use_scroll",
-      "computer_use_drag",
-      "computer_use_wait",
-      "computer_use_open_app",
-      "computer_use_run_applescript",
-      "computer_use_done",
-      "computer_use_respond",
-    ];
-    for (const name of expectedCuTools) {
-      expect(cuTools).toContain(name);
-    }
-  });
-  test("computer_use_respond is a terminal tool that completes the session", async () => {
-    const { provider } = createProvider([
-      {
-        content: [
-          {
-            type: "tool_use",
-            id: "tu-respond",
-            name: "computer_use_respond",
-            input: {
-              answer: "The meeting is at 3pm",
-              reasoning: "Found in calendar",
-            },
-          },
-        ],
-        model: "mock-model",
-        usage: { inputTokens: 10, outputTokens: 5 },
-        stopReason: "tool_use",
-      },
-    ]);
-    const sentMessages: ServerMessage[] = [];
-    const session = new ComputerUseSession(
-      "cu-respond-test",
-      "check my schedule",
-      1440,
-      900,
-      provider,
-      (msg) => {
-        sentMessages.push(msg);
-      },
-      "computer_use",
-    );
-    await session.handleObservation({
-      type: "cu_observation",
-      sessionId: "cu-respond-test",
-      axTree: 'Window "Calendar" [1]',
-    });
-    expect(session.getState()).toBe("complete");
-    const completes = sentMessages.filter(
-      (msg): msg is Extract<ServerMessage, { type: "cu_complete" }> =>
-        msg.type === "cu_complete",
-    );
-    expect(completes).toHaveLength(1);
-    expect(completes[0].summary).toBe("The meeting is at 3pm");
-    expect(completes[0].isResponse).toBe(true);
-  });
-  test("default construction preactivates computer-use skill and provides 10 CU tools", async () => {
-    let capturedTools: string[] = [];
-    const provider: Provider = {
-      name: "mock",
-      async sendMessage(_msgs, tools) {
-        capturedTools = (tools ?? []).map((t) => t.name);
-        return {
-          content: [
-            {
-              type: "tool_use",
-              id: "tu-default",
-              name: "computer_use_done",
-              input: { summary: "Done" },
-            },
-          ],
-          model: "mock-model",
-          usage: { inputTokens: 10, outputTokens: 5 },
-          stopReason: "tool_use",
-        };
-      },
-    };
-    // No preactivatedSkillIds passed — defaults to ['computer-use'] via skill projection
-    const session = new ComputerUseSession(
-      "cu-default-projection",
-      "test default projection",
-      1440,
-      900,
-      provider,
-      () => {},
-      "computer_use",
-      undefined,
-    );
-    await session.handleObservation({
-      type: "cu_observation",
-      sessionId: "cu-default-projection",
-      axTree: 'Window "Test" [1]',
-    });
-    const cuTools = capturedTools.filter((n) => n.startsWith("computer_use_"));
-    expect(cuTools).toHaveLength(10);
-  });
-  test("constructor accepts preactivatedSkillIds parameter", () => {
-    const { provider } = createProvider([
-      {
-        content: [{ type: "text", text: "unused" }],
-        model: "mock-model",
-        usage: { inputTokens: 1, outputTokens: 1 },
-        stopReason: "end_turn",
-      },
-    ]);
-    // Should not throw
-    const session = new ComputerUseSession(
-      "cu-preactivated",
-      "test preactivated",
-      1440,
-      900,
-      provider,
-      () => {},
-      "computer_use",
-      undefined,
-      ["computer-use"],
-    );
-    expect(session).toBeDefined();
-  });
-});