npm - @vellumai/assistant - Versions diffs - 0.3.19 → 0.3.21 - Mend

@vellumai/assistant 0.3.19 → 0.3.21

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (199) hide show

package/ARCHITECTURE.md +151 -15
package/Dockerfile +1 -0
package/README.md +40 -4
package/bun.lock +139 -2
package/docs/architecture/integrations.md +7 -11
package/package.json +2 -1
package/src/__tests__/__snapshots__/ipc-snapshot.test.ts.snap +54 -0
package/src/__tests__/approval-primitive.test.ts +540 -0
package/src/__tests__/assistant-feature-flag-guard.test.ts +206 -0
package/src/__tests__/assistant-feature-flag-guardrails.test.ts +198 -0
package/src/__tests__/assistant-feature-flags-integration.test.ts +272 -0
package/src/__tests__/call-controller.test.ts +439 -108
package/src/__tests__/channel-invite-transport.test.ts +264 -0
package/src/__tests__/cli.test.ts +42 -1
package/src/__tests__/config-schema.test.ts +11 -127
package/src/__tests__/config-watcher.test.ts +0 -8
package/src/__tests__/daemon-lifecycle.test.ts +1 -0
package/src/__tests__/daemon-server-session-init.test.ts +8 -2
package/src/__tests__/diff.test.ts +22 -0
package/src/__tests__/guardian-action-copy-generator.test.ts +5 -0
package/src/__tests__/guardian-action-grant-mint-consume.test.ts +300 -32
package/src/__tests__/guardian-action-late-reply.test.ts +546 -1
package/src/__tests__/guardian-actions-endpoint.test.ts +774 -0
package/src/__tests__/guardian-control-plane-policy.test.ts +36 -3
package/src/__tests__/guardian-dispatch.test.ts +124 -0
package/src/__tests__/guardian-grant-minting.test.ts +6 -17
package/src/__tests__/inbound-invite-redemption.test.ts +367 -0
package/src/__tests__/invite-redemption-service.test.ts +306 -0
package/src/__tests__/ipc-snapshot.test.ts +57 -0
package/src/__tests__/notification-decision-fallback.test.ts +88 -0
package/src/__tests__/sandbox-diagnostics.test.ts +6 -249
package/src/__tests__/sandbox-host-parity.test.ts +6 -13
package/src/__tests__/scoped-approval-grants.test.ts +6 -6
package/src/__tests__/scoped-grant-security-matrix.test.ts +5 -4
package/src/__tests__/script-proxy-session-manager.test.ts +1 -19
package/src/__tests__/session-load-history-repair.test.ts +169 -2
package/src/__tests__/session-runtime-assembly.test.ts +33 -5
package/src/__tests__/skill-feature-flags-integration.test.ts +171 -0
package/src/__tests__/skill-feature-flags.test.ts +188 -0
package/src/__tests__/skill-load-feature-flag.test.ts +141 -0
package/src/__tests__/skill-mirror-parity.test.ts +1 -0
package/src/__tests__/skill-projection-feature-flag.test.ts +363 -0
package/src/__tests__/system-prompt.test.ts +1 -1
package/src/__tests__/terminal-sandbox.test.ts +142 -9
package/src/__tests__/terminal-tools.test.ts +2 -93
package/src/__tests__/thread-seed-composer.test.ts +18 -0
package/src/__tests__/tool-approval-handler.test.ts +350 -0
package/src/__tests__/trusted-contact-lifecycle-notifications.test.ts +8 -10
package/src/__tests__/voice-scoped-grant-consumer.test.ts +46 -84
package/src/agent/loop.ts +36 -1
package/src/approvals/approval-primitive.ts +381 -0
package/src/approvals/guardian-decision-primitive.ts +191 -0
package/src/calls/call-controller.ts +252 -209
package/src/calls/call-domain.ts +44 -6
package/src/calls/guardian-dispatch.ts +48 -0
package/src/calls/types.ts +1 -1
package/src/calls/voice-session-bridge.ts +46 -30
package/src/cli/core-commands.ts +0 -4
package/src/cli/mcp.ts +58 -0
package/src/cli.ts +76 -34
package/src/config/__tests__/feature-flag-registry-guard.test.ts +179 -0
package/src/config/assistant-feature-flags.ts +162 -0
package/src/config/bundled-skills/api-mapping/icon.svg +18 -0
package/src/config/bundled-skills/messaging/TOOLS.json +30 -0
package/src/config/bundled-skills/messaging/tools/slack-delete-message.ts +24 -0
package/src/config/bundled-skills/notifications/SKILL.md +1 -1
package/src/config/bundled-skills/reminder/SKILL.md +49 -2
package/src/config/bundled-skills/time-based-actions/SKILL.md +49 -2
package/src/config/bundled-skills/voice-setup/SKILL.md +122 -0
package/src/config/core-schema.ts +1 -1
package/src/config/env-registry.ts +10 -0
package/src/config/feature-flag-registry.json +61 -0
package/src/config/loader.ts +22 -1
package/src/config/mcp-schema.ts +46 -0
package/src/config/sandbox-schema.ts +0 -39
package/src/config/schema.ts +18 -2
package/src/config/skill-state.ts +34 -0
package/src/config/skills-schema.ts +0 -1
package/src/config/skills.ts +9 -0
package/src/config/system-prompt.ts +110 -46
package/src/config/templates/SOUL.md +1 -1
package/src/config/types.ts +19 -1
package/src/config/vellum-skills/catalog.json +1 -1
package/src/config/vellum-skills/guardian-verify-setup/SKILL.md +1 -0
package/src/config/vellum-skills/sms-setup/SKILL.md +1 -1
package/src/config/vellum-skills/telegram-setup/SKILL.md +6 -5
package/src/config/vellum-skills/trusted-contacts/SKILL.md +105 -3
package/src/config/vellum-skills/twilio-setup/SKILL.md +1 -1
package/src/daemon/config-watcher.ts +0 -1
package/src/daemon/daemon-control.ts +1 -1
package/src/daemon/guardian-invite-intent.ts +124 -0
package/src/daemon/handlers/avatar.ts +68 -0
package/src/daemon/handlers/browser.ts +2 -2
package/src/daemon/handlers/guardian-actions.ts +120 -0
package/src/daemon/handlers/index.ts +4 -0
package/src/daemon/handlers/sessions.ts +19 -0
package/src/daemon/handlers/shared.ts +3 -1
package/src/daemon/install-cli-launchers.ts +58 -13
package/src/daemon/ipc-contract/guardian-actions.ts +53 -0
package/src/daemon/ipc-contract/sessions.ts +8 -2
package/src/daemon/ipc-contract/settings.ts +25 -2
package/src/daemon/ipc-contract-inventory.json +10 -0
package/src/daemon/ipc-contract.ts +4 -0
package/src/daemon/lifecycle.ts +14 -2
package/src/daemon/main.ts +1 -0
package/src/daemon/providers-setup.ts +26 -1
package/src/daemon/server.ts +1 -0
package/src/daemon/session-lifecycle.ts +52 -7
package/src/daemon/session-memory.ts +45 -0
package/src/daemon/session-process.ts +258 -432
package/src/daemon/session-runtime-assembly.ts +12 -0
package/src/daemon/session-skill-tools.ts +14 -1
package/src/daemon/session-tool-setup.ts +5 -0
package/src/daemon/session.ts +11 -0
package/src/daemon/shutdown-handlers.ts +11 -0
package/src/daemon/tool-side-effects.ts +35 -9
package/src/index.ts +2 -2
package/src/mcp/client.ts +152 -0
package/src/mcp/manager.ts +139 -0
package/src/memory/conversation-display-order-migration.ts +44 -0
package/src/memory/conversation-queries.ts +2 -0
package/src/memory/conversation-store.ts +91 -0
package/src/memory/db-init.ts +5 -1
package/src/memory/embedding-local.ts +13 -8
package/src/memory/guardian-action-store.ts +125 -2
package/src/memory/ingress-invite-store.ts +95 -1
package/src/memory/migrations/035-guardian-action-supersession.ts +23 -0
package/src/memory/migrations/index.ts +2 -1
package/src/memory/schema.ts +5 -1
package/src/memory/scoped-approval-grants.ts +14 -5
package/src/messaging/providers/slack/client.ts +12 -0
package/src/messaging/providers/slack/types.ts +5 -0
package/src/notifications/decision-engine.ts +49 -12
package/src/notifications/emit-signal.ts +7 -0
package/src/notifications/signal.ts +7 -0
package/src/notifications/thread-seed-composer.ts +2 -1
package/src/runtime/channel-approval-types.ts +16 -6
package/src/runtime/channel-approvals.ts +19 -15
package/src/runtime/channel-invite-transport.ts +85 -0
package/src/runtime/channel-invite-transports/telegram.ts +105 -0
package/src/runtime/guardian-action-grant-minter.ts +92 -35
package/src/runtime/guardian-action-message-composer.ts +30 -0
package/src/runtime/guardian-decision-types.ts +91 -0
package/src/runtime/http-server.ts +23 -1
package/src/runtime/ingress-service.ts +22 -0
package/src/runtime/invite-redemption-service.ts +181 -0
package/src/runtime/invite-redemption-templates.ts +39 -0
package/src/runtime/routes/call-routes.ts +2 -1
package/src/runtime/routes/guardian-action-routes.ts +206 -0
package/src/runtime/routes/guardian-approval-interception.ts +66 -190
package/src/runtime/routes/identity-routes.ts +73 -0
package/src/runtime/routes/inbound-message-handler.ts +486 -394
package/src/runtime/routes/pairing-routes.ts +4 -0
package/src/security/encrypted-store.ts +31 -17
package/src/security/keychain.ts +176 -2
package/src/security/secure-keys.ts +97 -0
package/src/security/tool-approval-digest.ts +1 -1
package/src/tools/browser/browser-execution.ts +2 -2
package/src/tools/browser/browser-manager.ts +46 -32
package/src/tools/browser/browser-screencast.ts +2 -2
package/src/tools/calls/call-start.ts +1 -1
package/src/tools/executor.ts +22 -17
package/src/tools/mcp/mcp-tool-factory.ts +100 -0
package/src/tools/network/script-proxy/session-manager.ts +1 -5
package/src/tools/registry.ts +64 -1
package/src/tools/skills/load.ts +22 -8
package/src/tools/system/avatar-generator.ts +119 -0
package/src/tools/system/navigate-settings.ts +65 -0
package/src/tools/system/open-system-settings.ts +75 -0
package/src/tools/system/voice-config.ts +121 -32
package/src/tools/terminal/backends/native.ts +40 -19
package/src/tools/terminal/backends/types.ts +3 -3
package/src/tools/terminal/parser.ts +1 -1
package/src/tools/terminal/sandbox-diagnostics.ts +6 -87
package/src/tools/terminal/sandbox.ts +1 -12
package/src/tools/terminal/shell.ts +3 -31
package/src/tools/tool-approval-handler.ts +141 -3
package/src/tools/tool-manifest.ts +6 -0
package/src/tools/types.ts +10 -2
package/src/util/diff.ts +36 -13
package/Dockerfile.sandbox +0 -5
package/src/__tests__/doordash-client.test.ts +0 -187
package/src/__tests__/doordash-session.test.ts +0 -154
package/src/__tests__/signup-e2e.test.ts +0 -354
package/src/__tests__/terminal-sandbox-docker.test.ts +0 -1065
package/src/__tests__/terminal-sandbox.integration.test.ts +0 -180
package/src/cli/doordash.ts +0 -1057
package/src/config/bundled-skills/doordash/SKILL.md +0 -163
package/src/config/templates/LOOKS.md +0 -25
package/src/doordash/cart-queries.ts +0 -787
package/src/doordash/client.ts +0 -1016
package/src/doordash/order-queries.ts +0 -85
package/src/doordash/queries.ts +0 -13
package/src/doordash/query-extractor.ts +0 -94
package/src/doordash/search-queries.ts +0 -203
package/src/doordash/session.ts +0 -84
package/src/doordash/store-queries.ts +0 -246
package/src/doordash/types.ts +0 -367
package/src/tools/terminal/backends/docker.ts +0 -379

package/src/__tests__/sandbox-diagnostics.test.ts CHANGED Viewed

@@ -3,14 +3,10 @@ import * as realChildProcess from 'node:child_process';
 import { beforeEach, describe, expect, mock, test } from 'bun:test';
 const execSyncMock = mock((_command: string, _opts?: unknown): unknown => undefined);
-const execFileSyncMock = mock(
-  (_file: string, _args?: readonly string[], _opts?: unknown): unknown => undefined,
-);
 mock.module('node:child_process', () => ({
   ...realChildProcess,
   execSync: execSyncMock,
-  execFileSync: execFileSyncMock,
 }));
 // Mock platform detection — default to macOS
@@ -36,18 +32,8 @@ mock.module('../util/platform.js', () => ({
 // Mock config loader — return a config with sandbox settings
 let mockSandboxConfig: {
   enabled: boolean;
-  backend: 'native' | 'docker';
-  docker: { image: string; cpus: number; memoryMb: number; pidsLimit: number; network: 'none' | 'bridge' };
 } = {
   enabled: true,
-  backend: 'native',
-  docker: {
-    image: 'vellum-sandbox:latest',
-    cpus: 1,
-    memoryMb: 512,
-    pidsLimit: 256,
-    network: 'none',
-  },
 };
 mock.module('../config/loader.js', () => ({
@@ -72,24 +58,13 @@ const { runSandboxDiagnostics } = await import(
 beforeEach(() => {
   execSyncMock.mockReset();
-  execFileSyncMock.mockReset();
   mockIsMacOS = true;
   mockIsLinux = false;
   mockSandboxConfig = {
     enabled: true,
-    backend: 'native',
-    docker: {
-      image: 'vellum-sandbox:latest',
-      cpus: 1,
-      memoryMb: 512,
-      pidsLimit: 256,
-      network: 'none',
-    },
   };
-  // Default: all commands succeed. execSync with encoding returns a string,
-  // so we must return a string to avoid .trim() throwing on undefined.
-  execSyncMock.mockImplementation(() => 'Docker version 24.0.7, build afdd53b');
-  execFileSyncMock.mockImplementation(() => 'ok\n');
+  // Default: all commands succeed.
+  execSyncMock.mockImplementation(() => undefined);
 });
 describe('runSandboxDiagnostics — config reporting', () => {
@@ -103,22 +78,6 @@ describe('runSandboxDiagnostics — config reporting', () => {
     const result = runSandboxDiagnostics();
     expect(result.config.enabled).toBe(false);
   });
-  test('reports configured backend', () => {
-    const result = runSandboxDiagnostics();
-    expect(result.config.backend).toBe('native');
-  });
-  test('reports docker backend when configured', () => {
-    mockSandboxConfig.backend = 'docker';
-    const result = runSandboxDiagnostics();
-    expect(result.config.backend).toBe('docker');
-  });
-  test('reports docker image', () => {
-    const result = runSandboxDiagnostics();
-    expect(result.config.dockerImage).toBe('vellum-sandbox:latest');
-  });
 });
 describe('runSandboxDiagnostics — active backend reason', () => {
@@ -127,12 +86,6 @@ describe('runSandboxDiagnostics — active backend reason', () => {
     expect(result.activeBackendReason).toContain('Native backend');
   });
-  test('explains docker backend selection', () => {
-    mockSandboxConfig.backend = 'docker';
-    const result = runSandboxDiagnostics();
-    expect(result.activeBackendReason).toContain('Docker backend');
-  });
   test('explains when sandbox is disabled', () => {
     mockSandboxConfig.enabled = false;
     const result = runSandboxDiagnostics();
@@ -203,207 +156,11 @@ describe('runSandboxDiagnostics — native backend check (unsupported OS)', () =
   });
 });
-describe('runSandboxDiagnostics — Docker CLI check', () => {
-  test('passes when docker CLI is available', () => {
-    execSyncMock.mockImplementation((cmd: string) => {
-      if (typeof cmd === 'string' && cmd === 'docker --version') {
-        return 'Docker version 24.0.7, build afdd53b';
-      }
-      return undefined;
-    });
-    const result = runSandboxDiagnostics();
-    const cliCheck = result.checks.find((c) => c.label === 'Docker CLI installed');
-    expect(cliCheck).toBeDefined();
-    expect(cliCheck!.ok).toBe(true);
-    expect(cliCheck!.detail).toContain('Docker version');
-  });
-  test('fails when docker CLI is not found', () => {
-    execSyncMock.mockImplementation((cmd: string) => {
-      if (typeof cmd === 'string' && cmd === 'docker --version') {
-        throw new Error('command not found: docker');
-      }
-      return undefined;
-    });
-    const result = runSandboxDiagnostics();
-    const cliCheck = result.checks.find((c) => c.label === 'Docker CLI installed');
-    expect(cliCheck).toBeDefined();
-    expect(cliCheck!.ok).toBe(false);
-    expect(cliCheck!.detail).toContain('not found');
-  });
-});
-describe('runSandboxDiagnostics — Docker daemon check', () => {
-  test('passes when daemon is reachable', () => {
-    const result = runSandboxDiagnostics();
-    const daemonCheck = result.checks.find((c) => c.label === 'Docker daemon running');
-    expect(daemonCheck).toBeDefined();
-    expect(daemonCheck!.ok).toBe(true);
-  });
-  test('fails when daemon is not running', () => {
-    execSyncMock.mockImplementation((cmd: string) => {
-      if (typeof cmd === 'string' && cmd === 'docker info') {
-        throw new Error('Cannot connect to the Docker daemon');
-      }
-      return 'Docker version 24.0.7';
-    });
-    const result = runSandboxDiagnostics();
-    const daemonCheck = result.checks.find((c) => c.label === 'Docker daemon running');
-    expect(daemonCheck).toBeDefined();
-    expect(daemonCheck!.ok).toBe(false);
-  });
-  test('skipped when CLI is not available', () => {
-    execSyncMock.mockImplementation((cmd: string) => {
-      if (typeof cmd === 'string' && cmd.includes('docker')) {
-        throw new Error('command not found');
-      }
-      return undefined;
-    });
-    const result = runSandboxDiagnostics();
-    const daemonCheck = result.checks.find((c) => c.label === 'Docker daemon running');
-    expect(daemonCheck).toBeUndefined();
-  });
-});
-describe('runSandboxDiagnostics — Docker image check', () => {
-  test('passes when image is available locally', () => {
-    const result = runSandboxDiagnostics();
-    const imageCheck = result.checks.find((c) => c.label.includes('Docker image available'));
-    expect(imageCheck).toBeDefined();
-    expect(imageCheck!.ok).toBe(true);
-  });
-  test('fails when image is not available', () => {
-    execFileSyncMock.mockImplementation(
-      (file: string, args?: readonly string[]) => {
-        if (file === 'docker' && Array.isArray(args) && args.includes('inspect')) {
-          throw new Error('No such image');
-        }
-        return 'ok\n';
-      },
-    );
-    const result = runSandboxDiagnostics();
-    const imageCheck = result.checks.find((c) => c.label.includes('Docker image available'));
-    expect(imageCheck).toBeDefined();
-    expect(imageCheck!.ok).toBe(false);
-    expect(imageCheck!.detail).toContain('docker build');
-  });
-  test('includes configured image name in label', () => {
-    mockSandboxConfig.docker.image = 'alpine:3.19';
-    const result = runSandboxDiagnostics();
-    const imageCheck = result.checks.find((c) => c.label.includes('Docker image available'));
-    expect(imageCheck).toBeDefined();
-    expect(imageCheck!.label).toContain('alpine:3.19');
-  });
-  test('skipped when daemon is not running', () => {
-    execSyncMock.mockImplementation((cmd: string) => {
-      if (typeof cmd === 'string' && cmd === 'docker info') {
-        throw new Error('Cannot connect');
-      }
-      return 'Docker version 24.0.7';
-    });
-    const result = runSandboxDiagnostics();
-    const imageCheck = result.checks.find((c) => c.label.includes('Docker image available'));
-    expect(imageCheck).toBeUndefined();
-  });
-});
-describe('runSandboxDiagnostics — Docker mount writable check', () => {
-  test('passes when mount probe succeeds', () => {
-    const result = runSandboxDiagnostics();
-    const mountCheck = result.checks.find((c) => c.label === 'Docker mount writable');
-    expect(mountCheck).toBeDefined();
-    expect(mountCheck!.ok).toBe(true);
-  });
-  test('uses configured image and sandbox working dir for mount probe', () => {
-    mockSandboxConfig.docker.image = 'alpine:3.19';
-    runSandboxDiagnostics();
-    const runCall = execFileSyncMock.mock.calls.find(
-      (call: unknown[]) => call[0] === 'docker' && Array.isArray(call[1]) && call[1].includes('run'),
-    );
-    expect(runCall).toBeDefined();
-    const args = runCall![1] as string[];
-    expect(args).toContain('alpine:3.19');
-    // Mount source should be the sandbox working dir (getSandboxWorkingDir)
-    const mountArg = args.find((a: string) => a.startsWith('type=bind'));
-    expect(mountArg).toContain('/tmp/vellum-test/workspace');
-    // Probe command should be 'test -w /workspace' matching runtime preflight
-    expect(args).toContain('test');
-    expect(args).toContain('-w');
-    expect(args).toContain('/workspace');
-  });
-  test('fails when mount probe errors', () => {
-    execFileSyncMock.mockImplementation(
-      (file: string, args?: readonly string[]) => {
-        if (file === 'docker' && Array.isArray(args) && args.includes('run')) {
-          throw new Error('mount failed');
-        }
-        return undefined;
-      },
-    );
-    const result = runSandboxDiagnostics();
-    const mountCheck = result.checks.find((c) => c.label === 'Docker mount writable');
-    expect(mountCheck).toBeDefined();
-    expect(mountCheck!.ok).toBe(false);
-    expect(mountCheck!.detail).toContain('File Sharing');
-  });
-  test('skipped when daemon is not running', () => {
-    execSyncMock.mockImplementation((cmd: string) => {
-      if (typeof cmd === 'string' && cmd === 'docker info') {
-        throw new Error('Cannot connect');
-      }
-      return 'Docker version 24.0.7';
-    });
-    const result = runSandboxDiagnostics();
-    const mountCheck = result.checks.find((c) => c.label === 'Docker mount writable');
-    expect(mountCheck).toBeUndefined();
-  });
-});
-describe('runSandboxDiagnostics — check cascade', () => {
-  test('Docker daemon, image, and run checks are skipped when CLI is missing', () => {
-    execSyncMock.mockImplementation((cmd: string) => {
-      if (typeof cmd === 'string' && cmd.includes('docker')) {
-        throw new Error('not found');
-      }
-      return undefined;
-    });
-    const result = runSandboxDiagnostics();
-    const labels = result.checks.map((c) => c.label);
-    expect(labels).toContain('Docker CLI installed');
-    expect(labels).not.toContain('Docker daemon running');
-    expect(labels.find((l) => l.includes('Docker image'))).toBeUndefined();
-    expect(labels).not.toContain('Docker mount writable');
-  });
-  test('image and run checks are skipped when daemon is down', () => {
-    execSyncMock.mockImplementation((cmd: string) => {
-      if (typeof cmd === 'string' && cmd === 'docker info') {
-        throw new Error('Cannot connect');
-      }
-      return 'Docker version 24.0.7';
-    });
-    const result = runSandboxDiagnostics();
-    const labels = result.checks.map((c) => c.label);
-    expect(labels).toContain('Docker CLI installed');
-    expect(labels).toContain('Docker daemon running');
-    expect(labels.find((l) => l.includes('Docker image'))).toBeUndefined();
-    expect(labels).not.toContain('Docker mount writable');
-  });
-  test('all Docker checks run when everything works', () => {
+describe('runSandboxDiagnostics — only native checks', () => {
+  test('only includes native backend check', () => {
     const result = runSandboxDiagnostics();
     const labels = result.checks.map((c) => c.label);
-    expect(labels).toContain('Docker CLI installed');
-    expect(labels).toContain('Docker daemon running');
-    expect(labels.find((l) => l.includes('Docker image'))).toBeDefined();
-    expect(labels).toContain('Docker mount writable');
+    expect(labels).toHaveLength(1);
+    expect(labels[0]).toContain('Native sandbox');
   });
 });

package/src/__tests__/sandbox-host-parity.test.ts CHANGED Viewed

@@ -50,7 +50,6 @@ import { formatShellOutput, MAX_OUTPUT_LENGTH } from '../tools/shared/shell-outp
 // Dynamically import modules that depend on the mocked logger
 const { NativeBackend } = await import('../tools/terminal/backends/native.js');
-const { DockerBackend, _resetDockerChecks } = await import('../tools/terminal/backends/docker.js');
 const { wrapCommand } = await import('../tools/terminal/sandbox.js');
 const { ToolError } = await import('../util/errors.js');
@@ -589,7 +588,7 @@ describe('SandboxResult shape consistency across backends', () => {
   });
   test('wrapCommand disabled returns bash with sandboxed=false', () => {
-    const result = wrapCommand('echo hi', '/tmp', { enabled: false, backend: 'native', docker: { image: 'vellum-sandbox:latest', shell: 'bash', cpus: 1, memoryMb: 512, pidsLimit: 256, network: 'none' } });
+    const result = wrapCommand('echo hi', '/tmp', { enabled: false });
     expect(result.command).toBe('bash');
     expect(result.args).toEqual(['-c', '--', 'echo hi']);
@@ -597,7 +596,7 @@ describe('SandboxResult shape consistency across backends', () => {
   });
   test('wrapCommand disabled result has same shape as enabled result', () => {
-    const disabled = wrapCommand('echo hi', '/tmp', { enabled: false, backend: 'native', docker: { image: 'vellum-sandbox:latest', shell: 'bash', cpus: 1, memoryMb: 512, pidsLimit: 256, network: 'none' } });
+    const disabled = wrapCommand('echo hi', '/tmp', { enabled: false });
     // Both must have: command (string), args (string[]), sandboxed (boolean)
     expect(typeof disabled.command).toBe('string');
@@ -859,26 +858,20 @@ describe('Regression: edge cases in shared FileSystemOps', () => {
 });
 // ===========================================================================
-// 9. Docker backend shape parity with native backend
+// 9. NativeBackend shape verification
 // ===========================================================================
-describe('DockerBackend vs NativeBackend: SandboxResult shape parity', () => {
-  test('both backends produce results with command, args, sandboxed fields', () => {
-    // Verify both classes have a wrap method that returns SandboxResult
+describe('NativeBackend: SandboxResult shape', () => {
+  test('NativeBackend has a wrap method', () => {
     const native = new NativeBackend();
     expect(typeof native.wrap).toBe('function');
-    _resetDockerChecks();
-    // DockerBackend requires a real sandbox root for construction
-    const docker = new DockerBackend(realpathSync('/tmp'), undefined, 1000, 1000);
-    expect(typeof docker.wrap).toBe('function');
   });
   test('disabled sandbox returns consistent bash -c -- invocation', () => {
     // Various commands should all be wrapped consistently when disabled
     const commands = ['echo hello', 'ls -la', 'cat /etc/hosts', 'true && false'];
     for (const cmd of commands) {
-      const result = wrapCommand(cmd, '/tmp', { enabled: false, backend: 'native', docker: { image: 'vellum-sandbox:latest', shell: 'bash', cpus: 1, memoryMb: 512, pidsLimit: 256, network: 'none' } });
+      const result = wrapCommand(cmd, '/tmp', { enabled: false });
       expect(result.command).toBe('bash');
       expect(result.args[0]).toBe('-c');
       expect(result.args[1]).toBe('--');

package/src/__tests__/scoped-approval-grants.test.ts CHANGED Viewed

@@ -29,16 +29,16 @@ mock.module('../util/logger.js', () => ({
   truncateForLog: (value: string) => value,
 }));
+import { getDb, initializeDb, resetDb } from '../memory/db.js';
+import { scopedApprovalGrants } from '../memory/schema.js';
 import {
+  _internal,
   type CreateScopedApprovalGrantParams,
-  consumeScopedApprovalGrantByRequestId,
-  consumeScopedApprovalGrantByToolSignature,
-  createScopedApprovalGrant,
   expireScopedApprovalGrants,
   revokeScopedApprovalGrantsForContext,
 } from '../memory/scoped-approval-grants.js';
-import { getDb, initializeDb, resetDb } from '../memory/db.js';
-import { scopedApprovalGrants } from '../memory/schema.js';
+const { consumeScopedApprovalGrantByRequestId, consumeScopedApprovalGrantByToolSignature, createScopedApprovalGrant } = _internal;
 import {
   canonicalJsonSerialize,
   computeToolApprovalDigest,
@@ -389,7 +389,7 @@ describe('scoped-approval-grants / expiry', () => {
   });
   test('already-consumed grants are not affected by expiry sweep', () => {
-    const pastExpiry = new Date(Date.now() - 1_000).toISOString();
+    const _pastExpiry = new Date(Date.now() - 1_000).toISOString();
     createScopedApprovalGrant(
       grantParams({ scopeMode: 'request_id', requestId: 'req-consumed', expiresAt: new Date(Date.now() + 60_000).toISOString() }),
     );

package/src/__tests__/scoped-grant-security-matrix.test.ts CHANGED Viewed

@@ -54,13 +54,14 @@ mock.module('../util/logger.js', () => ({
   truncateForLog: (value: string) => value,
 }));
+import { getDb, initializeDb, resetDb } from '../memory/db.js';
+import { scopedApprovalGrants } from '../memory/schema.js';
 import {
+  _internal,
   type CreateScopedApprovalGrantParams,
-  consumeScopedApprovalGrantByToolSignature,
-  createScopedApprovalGrant,
 } from '../memory/scoped-approval-grants.js';
-import { getDb, initializeDb, resetDb } from '../memory/db.js';
-import { scopedApprovalGrants } from '../memory/schema.js';
+const { consumeScopedApprovalGrantByToolSignature, createScopedApprovalGrant } = _internal;
 import { computeToolApprovalDigest } from '../security/tool-approval-digest.js';
 initializeDb();

package/src/__tests__/script-proxy-session-manager.test.ts CHANGED Viewed

@@ -169,25 +169,7 @@ describe('session-manager', () => {
       expect(() => getSessionEnv(session.id)).toThrow(/not active/);
     });
-    test('returns host.docker.internal URL when dockerMode is true', async () => {
-      const session = createSession(CONV_ID, CRED_IDS);
-      const started = await startSession(session.id);
-      const env = getSessionEnv(session.id, { dockerMode: true });
-      expect(env.HTTP_PROXY).toBe(`http://host.docker.internal:${started.port}`);
-      expect(env.HTTPS_PROXY).toBe(`http://host.docker.internal:${started.port}`);
-    });
-    test('returns 127.0.0.1 URL when dockerMode is false', async () => {
-      const session = createSession(CONV_ID, CRED_IDS);
-      const started = await startSession(session.id);
-      const env = getSessionEnv(session.id, { dockerMode: false });
-      expect(env.HTTP_PROXY).toBe(`http://127.0.0.1:${started.port}`);
-      expect(env.HTTPS_PROXY).toBe(`http://127.0.0.1:${started.port}`);
-    });
-    test('returns 127.0.0.1 URL when no options are passed', async () => {
+    test('returns 127.0.0.1 URL for active session', async () => {
       const session = createSession(CONV_ID, CRED_IDS);
       const started = await startSession(session.id);
       const env = getSessionEnv(session.id);

package/src/__tests__/session-load-history-repair.test.ts CHANGED Viewed

@@ -1,4 +1,4 @@
-import { describe, expect, mock, test } from 'bun:test';
+import { beforeEach, describe, expect, mock, test } from 'bun:test';
 import type { Message } from '../providers/types.js';
@@ -49,14 +49,27 @@ mock.module('../security/secret-allowlist.js', () => ({
 }));
 // Mutable store so each test can configure its own messages
-let mockDbMessages: Array<{ id: string; role: string; content: string }> = [];
+let mockDbMessages: Array<{ id: string; role: string; content: string; metadata?: string | null }> = [];
 let mockConversation: Record<string, unknown> | null = null;
+let nextMockMessageId = 1;
 mock.module('../memory/conversation-store.js', () => ({
   getMessages: () => mockDbMessages,
   getConversation: () => mockConversation,
   createConversation: () => ({ id: 'conv-1' }),
   listConversations: () => [],
+  addMessage: async (_conversationId: string, role: string, content: string, metadata?: Record<string, unknown>) => {
+    const id = `persisted-${nextMockMessageId++}`;
+    mockDbMessages.push({
+      id,
+      role,
+      content,
+      metadata: metadata ? JSON.stringify(metadata) : null,
+    });
+    return { id };
+  },
+  setConversationOriginChannelIfUnset: () => {},
+  setConversationOriginInterfaceIfUnset: () => {},
 }));
 import { Session } from '../daemon/session.js';
@@ -67,6 +80,10 @@ function makeSession(): Session {
 }
 describe('loadFromDb history repair', () => {
+  beforeEach(() => {
+    nextMockMessageId = 1;
+  });
   test('repairs corrupt persisted history: missing tool_result inserted', async () => {
     mockConversation = {
       id: 'conv-1',
@@ -220,4 +237,154 @@ describe('loadFromDb history repair', () => {
     expect(messages).toHaveLength(2);
     expect(messages[1].content).toEqual([{ type: 'text', text: 'Sure' }]);
   });
+  test('untrusted actor load hides guardian-provenance history and context summary', async () => {
+    mockConversation = {
+      id: 'conv-1',
+      contextSummary: 'Sensitive guardian summary',
+      contextCompactedMessageCount: 3,
+      totalInputTokens: 0,
+      totalOutputTokens: 0,
+      totalEstimatedCost: 0,
+    };
+    mockDbMessages = [
+      {
+        id: 'm1',
+        role: 'user',
+        content: JSON.stringify([{ type: 'text', text: 'Guardian secret question' }]),
+        metadata: JSON.stringify({ provenanceActorRole: 'guardian', provenanceSourceChannel: 'telegram' }),
+      },
+      {
+        id: 'm2',
+        role: 'assistant',
+        content: JSON.stringify([{ type: 'text', text: 'Guardian-only answer' }]),
+        metadata: JSON.stringify({ provenanceActorRole: 'guardian', provenanceSourceChannel: 'telegram' }),
+      },
+      {
+        id: 'm3',
+        role: 'user',
+        content: JSON.stringify([{ type: 'text', text: 'Untrusted follow-up' }]),
+        metadata: JSON.stringify({ provenanceActorRole: 'unverified_channel', provenanceSourceChannel: 'telegram' }),
+      },
+      {
+        id: 'm4',
+        role: 'assistant',
+        content: JSON.stringify([{ type: 'text', text: 'Untrusted-safe reply' }]),
+        metadata: JSON.stringify({ provenanceActorRole: 'unverified_channel', provenanceSourceChannel: 'telegram' }),
+      },
+    ];
+    const session = makeSession();
+    session.setGuardianContext({ actorRole: 'unverified_channel', sourceChannel: 'telegram' });
+    await session.loadFromDb();
+    const messages = session.getMessages();
+    expect(messages).toHaveLength(2);
+    expect(messages[0].role).toBe('user');
+    expect(messages[0].content).toEqual([{ type: 'text', text: 'Untrusted follow-up' }]);
+    expect(messages[1].role).toBe('assistant');
+    expect(messages[1].content).toEqual([{ type: 'text', text: 'Untrusted-safe reply' }]);
+  });
+  test('ensureActorScopedHistory reloads when actor role changes', async () => {
+    mockConversation = {
+      id: 'conv-1',
+      contextSummary: null,
+      contextCompactedMessageCount: 0,
+      totalInputTokens: 0,
+      totalOutputTokens: 0,
+      totalEstimatedCost: 0,
+    };
+    mockDbMessages = [
+      {
+        id: 'm1',
+        role: 'user',
+        content: JSON.stringify([{ type: 'text', text: 'Guardian question' }]),
+        metadata: JSON.stringify({ provenanceActorRole: 'guardian', provenanceSourceChannel: 'telegram' }),
+      },
+      {
+        id: 'm2',
+        role: 'assistant',
+        content: JSON.stringify([{ type: 'text', text: 'Guardian answer' }]),
+        metadata: JSON.stringify({ provenanceActorRole: 'guardian', provenanceSourceChannel: 'telegram' }),
+      },
+      {
+        id: 'm3',
+        role: 'user',
+        content: JSON.stringify([{ type: 'text', text: 'Unverified ping' }]),
+        metadata: JSON.stringify({ provenanceActorRole: 'unverified_channel', provenanceSourceChannel: 'telegram' }),
+      },
+      {
+        id: 'm4',
+        role: 'assistant',
+        content: JSON.stringify([{ type: 'text', text: 'Unverified reply' }]),
+        metadata: JSON.stringify({ provenanceActorRole: 'unverified_channel', provenanceSourceChannel: 'telegram' }),
+      },
+    ];
+    const session = makeSession();
+    session.setGuardianContext({ actorRole: 'guardian', sourceChannel: 'telegram' });
+    await session.ensureActorScopedHistory();
+    expect(session.getMessages()).toHaveLength(4);
+    session.setGuardianContext({ actorRole: 'unverified_channel', sourceChannel: 'telegram' });
+    await session.ensureActorScopedHistory();
+    const downgradedMessages = session.getMessages();
+    expect(downgradedMessages).toHaveLength(2);
+    expect(downgradedMessages[0].content).toEqual([{ type: 'text', text: 'Unverified ping' }]);
+    expect(downgradedMessages[1].content).toEqual([{ type: 'text', text: 'Unverified reply' }]);
+  });
+  test('persistUserMessage reloads actor-scoped history before persisting on role switch', async () => {
+    mockConversation = {
+      id: 'conv-1',
+      contextSummary: null,
+      contextCompactedMessageCount: 0,
+      totalInputTokens: 0,
+      totalOutputTokens: 0,
+      totalEstimatedCost: 0,
+    };
+    mockDbMessages = [
+      {
+        id: 'm1',
+        role: 'user',
+        content: JSON.stringify([{ type: 'text', text: 'Guardian-only question' }]),
+        metadata: JSON.stringify({ provenanceActorRole: 'guardian', provenanceSourceChannel: 'telegram' }),
+      },
+      {
+        id: 'm2',
+        role: 'assistant',
+        content: JSON.stringify([{ type: 'text', text: 'Guardian-only answer' }]),
+        metadata: JSON.stringify({ provenanceActorRole: 'guardian', provenanceSourceChannel: 'telegram' }),
+      },
+      {
+        id: 'm3',
+        role: 'user',
+        content: JSON.stringify([{ type: 'text', text: 'Unverified ping' }]),
+        metadata: JSON.stringify({ provenanceActorRole: 'unverified_channel', provenanceSourceChannel: 'telegram' }),
+      },
+      {
+        id: 'm4',
+        role: 'assistant',
+        content: JSON.stringify([{ type: 'text', text: 'Unverified reply' }]),
+        metadata: JSON.stringify({ provenanceActorRole: 'unverified_channel', provenanceSourceChannel: 'telegram' }),
+      },
+    ];
+    const session = makeSession();
+    session.setGuardianContext({ actorRole: 'unverified_channel', sourceChannel: 'telegram' });
+    await session.ensureActorScopedHistory();
+    expect(session.getMessages()).toHaveLength(2);
+    session.setGuardianContext({ actorRole: 'guardian', sourceChannel: 'telegram' });
+    await session.persistUserMessage('Guardian follow-up', []);
+    const messagesAfterPersist = session.getMessages();
+    expect(messagesAfterPersist).toHaveLength(5);
+    expect(messagesAfterPersist[0].content).toEqual([{ type: 'text', text: 'Guardian-only question' }]);
+    expect(messagesAfterPersist[1].content).toEqual([{ type: 'text', text: 'Guardian-only answer' }]);
+    expect(messagesAfterPersist[4].content).toEqual([{ type: 'text', text: 'Guardian follow-up' }]);
+  });
 });