npm - vellum - Versions diffs - 0.2.12 → 0.2.14 - Mend

vellum 0.2.12 → 0.2.14

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (209) hide show

package/README.md +32 -0
package/bun.lock +2 -2
package/docs/skills.md +4 -4
package/package.json +2 -2
package/src/__tests__/__snapshots__/ipc-snapshot.test.ts.snap +213 -3
package/src/__tests__/app-git-history.test.ts +176 -0
package/src/__tests__/app-git-service.test.ts +169 -0
package/src/__tests__/assistant-events-sse-hardening.test.ts +315 -0
package/src/__tests__/browser-skill-baseline-tool-payload.test.ts +8 -8
package/src/__tests__/browser-skill-endstate.test.ts +6 -6
package/src/__tests__/call-bridge.test.ts +105 -13
package/src/__tests__/call-domain.test.ts +163 -0
package/src/__tests__/call-orchestrator.test.ts +171 -0
package/src/__tests__/call-routes-http.test.ts +246 -6
package/src/__tests__/channel-approval-routes.test.ts +438 -0
package/src/__tests__/channel-approval.test.ts +266 -0
package/src/__tests__/channel-approvals.test.ts +393 -0
package/src/__tests__/channel-delivery-store.test.ts +447 -0
package/src/__tests__/checker.test.ts +607 -1048
package/src/__tests__/cli.test.ts +1 -56
package/src/__tests__/config-schema.test.ts +402 -5
package/src/__tests__/conflict-intent-tokenization.test.ts +141 -0
package/src/__tests__/conflict-policy.test.ts +121 -0
package/src/__tests__/conflict-store.test.ts +2 -0
package/src/__tests__/contacts-tools.test.ts +3 -3
package/src/__tests__/contradiction-checker.test.ts +99 -1
package/src/__tests__/credential-security-invariants.test.ts +22 -6
package/src/__tests__/credential-vault-unit.test.ts +780 -0
package/src/__tests__/elevenlabs-client.test.ts +271 -0
package/src/__tests__/ephemeral-permissions.test.ts +73 -23
package/src/__tests__/filesystem-tools.test.ts +579 -0
package/src/__tests__/gateway-only-enforcement.test.ts +114 -4
package/src/__tests__/handlers-add-trust-rule-metadata.test.ts +202 -0
package/src/__tests__/handlers-cu-observation-blob.test.ts +2 -1
package/src/__tests__/handlers-ipc-blob-probe.test.ts +2 -1
package/src/__tests__/handlers-slack-config.test.ts +2 -1
package/src/__tests__/handlers-telegram-config.test.ts +855 -0
package/src/__tests__/handlers-twitter-config.test.ts +141 -1
package/src/__tests__/hooks-runner.test.ts +6 -2
package/src/__tests__/host-file-edit-tool.test.ts +124 -0
package/src/__tests__/host-file-read-tool.test.ts +62 -0
package/src/__tests__/host-file-write-tool.test.ts +59 -0
package/src/__tests__/host-shell-tool.test.ts +251 -0
package/src/__tests__/ingress-reconcile.test.ts +581 -0
package/src/__tests__/ipc-snapshot.test.ts +100 -41
package/src/__tests__/ipc-validate.test.ts +50 -0
package/src/__tests__/key-migration.test.ts +23 -0
package/src/__tests__/memory-regressions.test.ts +99 -0
package/src/__tests__/memory-retrieval.benchmark.test.ts +1 -1
package/src/__tests__/oauth-callback-registry.test.ts +11 -4
package/src/__tests__/playbook-execution.test.ts +502 -0
package/src/__tests__/playbook-tools.test.ts +4 -6
package/src/__tests__/public-ingress-urls.test.ts +34 -0
package/src/__tests__/qdrant-manager.test.ts +267 -0
package/src/__tests__/recurrence-engine-rruleset.test.ts +97 -0
package/src/__tests__/recurrence-engine.test.ts +9 -0
package/src/__tests__/recurrence-types.test.ts +8 -0
package/src/__tests__/registry.test.ts +1 -1
package/src/__tests__/runtime-runs.test.ts +1 -25
package/src/__tests__/schedule-store.test.ts +16 -14
package/src/__tests__/schedule-tools.test.ts +83 -0
package/src/__tests__/scheduler-recurrence.test.ts +111 -10
package/src/__tests__/secret-allowlist.test.ts +18 -17
package/src/__tests__/secret-ingress-handler.test.ts +11 -0
package/src/__tests__/secret-scanner.test.ts +43 -0
package/src/__tests__/session-conflict-gate.test.ts +442 -6
package/src/__tests__/session-init.benchmark.test.ts +3 -0
package/src/__tests__/session-process-bridge.test.ts +242 -0
package/src/__tests__/session-skill-tools.test.ts +1 -1
package/src/__tests__/shell-identity.test.ts +256 -0
package/src/__tests__/skill-projection.benchmark.test.ts +11 -1
package/src/__tests__/subagent-tools.test.ts +637 -54
package/src/__tests__/task-management-tools.test.ts +936 -0
package/src/__tests__/task-runner.test.ts +2 -2
package/src/__tests__/terminal-tools.test.ts +840 -0
package/src/__tests__/tool-executor-shell-integration.test.ts +301 -0
package/src/__tests__/tool-executor.test.ts +85 -151
package/src/__tests__/tool-permission-simulate-handler.test.ts +336 -0
package/src/__tests__/trust-store.test.ts +28 -453
package/src/__tests__/twilio-provider.test.ts +153 -3
package/src/__tests__/twilio-routes-elevenlabs.test.ts +375 -0
package/src/__tests__/twilio-routes-twiml.test.ts +127 -0
package/src/__tests__/twilio-routes.test.ts +17 -262
package/src/__tests__/twitter-auth-handler.test.ts +2 -1
package/src/__tests__/twitter-cli-error-shaping.test.ts +208 -0
package/src/__tests__/twitter-cli-routing.test.ts +252 -0
package/src/__tests__/twitter-oauth-client.test.ts +209 -0
package/src/__tests__/workspace-policy.test.ts +213 -0
package/src/calls/call-bridge.ts +92 -19
package/src/calls/call-domain.ts +157 -5
package/src/calls/call-orchestrator.ts +96 -8
package/src/calls/call-store.ts +6 -0
package/src/calls/elevenlabs-client.ts +97 -0
package/src/calls/elevenlabs-config.ts +31 -0
package/src/calls/twilio-provider.ts +91 -0
package/src/calls/twilio-routes.ts +50 -6
package/src/calls/types.ts +3 -1
package/src/calls/voice-quality.ts +114 -0
package/src/cli/twitter.ts +200 -21
package/src/cli.ts +1 -20
package/src/config/bundled-skills/contacts/tools/contact-merge.ts +52 -4
package/src/config/bundled-skills/contacts/tools/contact-search.ts +55 -4
package/src/config/bundled-skills/contacts/tools/contact-upsert.ts +61 -4
package/src/config/bundled-skills/messaging/SKILL.md +17 -2
package/src/config/bundled-skills/messaging/tools/messaging-reply.ts +4 -1
package/src/config/bundled-skills/messaging/tools/messaging-send.ts +5 -1
package/src/config/bundled-skills/messaging/tools/shared.ts +5 -0
package/src/config/bundled-skills/phone-calls/SKILL.md +207 -19
package/src/config/bundled-skills/playbooks/tools/playbook-create.ts +95 -6
package/src/config/bundled-skills/playbooks/tools/playbook-delete.ts +51 -6
package/src/config/bundled-skills/playbooks/tools/playbook-list.ts +73 -6
package/src/config/bundled-skills/playbooks/tools/playbook-update.ts +110 -6
package/src/config/bundled-skills/public-ingress/SKILL.md +22 -5
package/src/config/bundled-skills/twitter/SKILL.md +103 -17
package/src/config/defaults.ts +26 -2
package/src/config/schema.ts +178 -9
package/src/config/types.ts +3 -0
package/src/config/vellum-skills/telegram-setup/SKILL.md +56 -61
package/src/daemon/assistant-attachments.ts +4 -2
package/src/daemon/handlers/apps.ts +69 -0
package/src/daemon/handlers/config.ts +543 -24
package/src/daemon/handlers/index.ts +1 -0
package/src/daemon/handlers/sessions.ts +22 -6
package/src/daemon/handlers/shared.ts +2 -1
package/src/daemon/handlers/skills.ts +5 -20
package/src/daemon/ipc-contract-inventory.json +28 -0
package/src/daemon/ipc-contract.ts +168 -10
package/src/daemon/ipc-validate.ts +17 -0
package/src/daemon/lifecycle.ts +2 -0
package/src/daemon/server.ts +78 -72
package/src/daemon/session-attachments.ts +1 -1
package/src/daemon/session-conflict-gate.ts +62 -6
package/src/daemon/session-notifiers.ts +1 -1
package/src/daemon/session-process.ts +62 -3
package/src/daemon/session-tool-setup.ts +1 -2
package/src/daemon/tls-certs.ts +189 -0
package/src/daemon/video-thumbnail.ts +5 -3
package/src/hooks/manager.ts +5 -9
package/src/memory/app-git-service.ts +295 -0
package/src/memory/app-store.ts +21 -0
package/src/memory/conflict-intent.ts +47 -4
package/src/memory/conflict-policy.ts +73 -0
package/src/memory/conflict-store.ts +9 -1
package/src/memory/contradiction-checker.ts +28 -0
package/src/memory/conversation-key-store.ts +15 -0
package/src/memory/db.ts +81 -0
package/src/memory/embedding-local.ts +3 -13
package/src/memory/external-conversation-store.ts +234 -0
package/src/memory/job-handlers/conflict.ts +22 -2
package/src/memory/jobs-worker.ts +67 -28
package/src/memory/runs-store.ts +54 -7
package/src/memory/schema.ts +20 -0
package/src/messaging/provider.ts +9 -0
package/src/messaging/providers/telegram-bot/adapter.ts +162 -0
package/src/messaging/providers/telegram-bot/client.ts +104 -0
package/src/messaging/providers/telegram-bot/types.ts +15 -0
package/src/messaging/registry.ts +1 -0
package/src/permissions/checker.ts +48 -44
package/src/permissions/defaults.ts +11 -0
package/src/permissions/prompter.ts +0 -4
package/src/permissions/shell-identity.ts +227 -0
package/src/permissions/trust-store.ts +76 -53
package/src/permissions/types.ts +0 -19
package/src/permissions/workspace-policy.ts +114 -0
package/src/providers/retry.ts +12 -37
package/src/runtime/assistant-event-hub.ts +41 -4
package/src/runtime/channel-approval-parser.ts +60 -0
package/src/runtime/channel-approval-types.ts +71 -0
package/src/runtime/channel-approvals.ts +145 -0
package/src/runtime/gateway-client.ts +16 -0
package/src/runtime/http-server.ts +29 -9
package/src/runtime/routes/call-routes.ts +52 -2
package/src/runtime/routes/channel-routes.ts +296 -16
package/src/runtime/routes/conversation-routes.ts +12 -5
package/src/runtime/routes/events-routes.ts +97 -28
package/src/runtime/routes/run-routes.ts +2 -7
package/src/runtime/run-orchestrator.ts +0 -3
package/src/schedule/recurrence-engine.ts +26 -2
package/src/schedule/recurrence-types.ts +1 -1
package/src/schedule/schedule-store.ts +12 -3
package/src/security/secret-scanner.ts +7 -0
package/src/tasks/ephemeral-permissions.ts +0 -2
package/src/tasks/task-scheduler.ts +2 -1
package/src/tools/calls/call-start.ts +8 -0
package/src/tools/execution-target.ts +21 -0
package/src/tools/execution-timeout.ts +49 -0
package/src/tools/executor.ts +6 -135
package/src/tools/network/web-search.ts +9 -32
package/src/tools/policy-context.ts +29 -0
package/src/tools/schedule/update.ts +8 -1
package/src/tools/terminal/parser.ts +16 -18
package/src/tools/types.ts +4 -11
package/src/twitter/oauth-client.ts +102 -0
package/src/twitter/router.ts +101 -0
package/src/util/debounce.ts +88 -0
package/src/util/network-info.ts +47 -0
package/src/util/platform.ts +29 -4
package/src/util/promise-guard.ts +37 -0
package/src/util/retry.ts +98 -0
package/src/util/truncate.ts +1 -1
package/src/workspace/git-service.ts +129 -112
package/src/tools/contacts/contact-merge.ts +0 -55
package/src/tools/contacts/contact-search.ts +0 -58
package/src/tools/contacts/contact-upsert.ts +0 -64
package/src/tools/playbooks/index.ts +0 -4
package/src/tools/playbooks/playbook-create.ts +0 -96
package/src/tools/playbooks/playbook-delete.ts +0 -52
package/src/tools/playbooks/playbook-list.ts +0 -74
package/src/tools/playbooks/playbook-update.ts +0 -111

package/src/__tests__/call-bridge.test.ts CHANGED Viewed

@@ -101,7 +101,7 @@ import {
   fireCallCompletionNotifier,
 } from '../calls/call-state.js';
 import { CallOrchestrator } from '../calls/call-orchestrator.js';
-import { tryHandlePendingCallAnswer } from '../calls/call-bridge.js';
+import { tryRouteCallMessage } from '../calls/call-bridge.js';
 import * as conversationStore from '../memory/conversation-store.js';
 import type { RelayConnection } from '../calls/relay-server.js';
@@ -177,26 +177,27 @@ describe('call-bridge', () => {
     mockStreamFn.mockImplementation(() => createMockStream(['Hello']));
   });
-  // ── tryHandlePendingCallAnswer ──────────────────────────────────
+  // ── tryRouteCallMessage — answer path ───────────────────────
   test('returns handled:false when no active call exists', async () => {
     ensureConversation('conv-no-call');
-    const result = await tryHandlePendingCallAnswer('conv-no-call', 'some answer');
+    const result = await tryRouteCallMessage('conv-no-call', 'some answer');
     expect(result.handled).toBe(false);
     expect(result.reason).toBe('no_active_call');
   });
-  test('returns handled:false when call exists but no pending question', async () => {
-    ensureConversation('conv-no-question');
+  test('returns instruction_relay_failed (consumed) when call exists but no orchestrator and no pending question', async () => {
+    ensureConversation('conv-no-orch');
     createCallSession({
-      conversationId: 'conv-no-question',
+      conversationId: 'conv-no-orch',
       provider: 'twilio',
       fromNumber: '+15551111111',
       toNumber: '+15552222222',
     });
-    const result = await tryHandlePendingCallAnswer('conv-no-question', 'some answer');
-    expect(result.handled).toBe(false);
-    expect(result.reason).toBe('no_pending_question');
+    const result = await tryRouteCallMessage('conv-no-orch', 'some instruction');
+    expect(result.handled).toBe(true);
+    expect(result.reason).toBe('instruction_relay_failed');
+    expect(result.userFacingText).toBe('Failed to relay instruction to the active call.');
   });
   test('returns handled:false when orchestrator is not found (call still active but no orchestrator)', async () => {
@@ -215,7 +216,7 @@ describe('call-bridge', () => {
     // Create a pending question without an orchestrator
     createPendingQuestion(callSession.id, 'What time?');
-    const result = await tryHandlePendingCallAnswer('conv-ended', 'Too late');
+    const result = await tryRouteCallMessage('conv-ended', 'Too late');
     expect(result.handled).toBe(false);
     expect(result.reason).toBe('orchestrator_not_found');
   });
@@ -231,7 +232,7 @@ describe('call-bridge', () => {
     // Mark the call as completed — getActiveCallSessionForConversation will return null
     updateCallSession(callSession.id, { status: 'completed', endedAt: Date.now() });
-    const result = await tryHandlePendingCallAnswer('conv-completed', 'Too late');
+    const result = await tryRouteCallMessage('conv-completed', 'Too late');
     expect(result.handled).toBe(false);
     expect(result.reason).toBe('no_active_call');
   });
@@ -252,7 +253,7 @@ describe('call-bridge', () => {
     // Create a pending question in the DB but orchestrator is idle, not waiting_on_user
     createPendingQuestion(callSession.id, 'What time?');
-    const result = await tryHandlePendingCallAnswer('conv-not-waiting', 'answer');
+    const result = await tryRouteCallMessage('conv-not-waiting', 'answer');
     expect(result.handled).toBe(false);
     expect(result.reason).toBe('orchestrator_not_waiting');
@@ -284,7 +285,7 @@ describe('call-bridge', () => {
     // Now provide the answer — set up mock for the LLM call after answer
     mockStreamFn.mockImplementation(() => createMockStream(['Great, booking for tomorrow.']));
-    const result = await tryHandlePendingCallAnswer('conv-bridge', 'Tomorrow at noon');
+    const result = await tryRouteCallMessage('conv-bridge', 'Tomorrow at noon');
     expect(result.handled).toBe(true);
     // Wait for the fire-and-forget LLM call
@@ -298,6 +299,97 @@ describe('call-bridge', () => {
     orchestrator.destroy();
   });
+  // ── tryRouteCallMessage — instruction path ────────────────────
+  test('routes instruction to orchestrator when active call exists with no pending question', async () => {
+    ensureConversation('conv-instruct');
+    const callSession = createCallSession({
+      conversationId: 'conv-instruct',
+      provider: 'twilio',
+      fromNumber: '+15551111111',
+      toNumber: '+15552222222',
+    });
+    const relay = createMockRelay();
+    const orchestrator = new CallOrchestrator(callSession.id, relay as unknown as RelayConnection, 'test task');
+    const result = await tryRouteCallMessage('conv-instruct', 'Please ask about pricing');
+    expect(result.handled).toBe(true);
+    expect(result.userFacingText).toBe('Instruction relayed to active call.');
+    // Verify acknowledgement was persisted
+    const msgs = getMessagesForConversation('conv-instruct');
+    const ackMsg = msgs.find((m) => m.content.includes('Instruction relayed'));
+    expect(ackMsg).toBeDefined();
+    expect(ackMsg!.role).toBe('assistant');
+    orchestrator.destroy();
+  });
+  test('prefers answer path over instruction path when pending question exists', async () => {
+    // Setup: trigger ASK_USER to put orchestrator in waiting_on_user state
+    mockStreamFn.mockImplementation(() =>
+      createMockStream(['Hold on. [ASK_USER: Budget range?]']),
+    );
+    ensureConversation('conv-prefer-answer');
+    const callSession = createCallSession({
+      conversationId: 'conv-prefer-answer',
+      provider: 'twilio',
+      fromNumber: '+15551111111',
+      toNumber: '+15552222222',
+    });
+    const relay = createMockRelay();
+    const orchestrator = new CallOrchestrator(callSession.id, relay as unknown as RelayConnection, 'test task');
+    await orchestrator.handleCallerUtterance('What is your budget?');
+    expect(orchestrator.getState()).toBe('waiting_on_user');
+    // Mock the next LLM call
+    mockStreamFn.mockImplementation(() => createMockStream(['Got it, thanks.']));
+    // This should route as answer, not instruction
+    const result = await tryRouteCallMessage('conv-prefer-answer', '$500');
+    expect(result.handled).toBe(true);
+    // Wait for fire-and-forget LLM call
+    await new Promise((r) => setTimeout(r, 50));
+    // Should have answered the pending question, not relayed as instruction
+    const question = getPendingQuestion(callSession.id);
+    expect(question).toBeNull();
+    // No instruction acknowledgement should be persisted
+    const msgs = getMessagesForConversation('conv-prefer-answer');
+    const ackMsg = msgs.find((m) => m.content.includes('Instruction relayed'));
+    expect(ackMsg).toBeUndefined();
+    orchestrator.destroy();
+  });
+  test('instruction relay failure persists notice and is consumed (handled:true)', async () => {
+    ensureConversation('conv-no-orch-instruct');
+    createCallSession({
+      conversationId: 'conv-no-orch-instruct',
+      provider: 'twilio',
+      fromNumber: '+15551111111',
+      toNumber: '+15552222222',
+    });
+    // No orchestrator registered — relay should fail but still be consumed
+    const result = await tryRouteCallMessage('conv-no-orch-instruct', 'Change the topic');
+    expect(result.handled).toBe(true);
+    expect(result.reason).toBe('instruction_relay_failed');
+    expect(result.userFacingText).toBe('Failed to relay instruction to the active call.');
+    // Verify failure notice was persisted in-thread
+    const msgs = getMessagesForConversation('conv-no-orch-instruct');
+    const failMsg = msgs.find((m) => m.content.includes('Failed to relay'));
+    expect(failMsg).toBeDefined();
+    expect(failMsg!.role).toBe('assistant');
+  });
   // ── Call question notifier ──────────────────────────────────────
   test('call question notifier persists assistant message and emits events', () => {

package/src/__tests__/call-domain.test.ts ADDED Viewed

@@ -0,0 +1,163 @@
+/**
+ * Unit tests for caller identity resolution in call-domain.ts.
+ *
+ * Validates the strict implicit-default policy:
+ * - Implicit calls (no explicit mode) always use assistant_number.
+ * - Explicit user_number calls succeed when eligible.
+ * - Explicit user_number calls fail clearly when missing/ineligible.
+ * - Explicit override rejected when allowPerCallOverride=false.
+ */
+import { describe, test, expect, mock } from 'bun:test';
+import { mkdtempSync, realpathSync } from 'node:fs';
+import { tmpdir } from 'node:os';
+import { join } from 'node:path';
+const testDir = realpathSync(mkdtempSync(join(tmpdir(), 'call-domain-test-')));
+mock.module('../util/platform.js', () => ({
+  getRootDir: () => testDir,
+  getDataDir: () => testDir,
+  isMacOS: () => process.platform === 'darwin',
+  isLinux: () => process.platform === 'linux',
+  isWindows: () => process.platform === 'win32',
+  getSocketPath: () => join(testDir, 'test.sock'),
+  getPidPath: () => join(testDir, 'test.pid'),
+  getDbPath: () => join(testDir, 'test.db'),
+  getLogPath: () => join(testDir, 'test.log'),
+  ensureDataDir: () => {},
+}));
+mock.module('../util/logger.js', () => ({
+  getLogger: () => new Proxy({} as Record<string, unknown>, {
+    get: () => () => {},
+  }),
+}));
+mock.module('../calls/twilio-config.js', () => ({
+  getTwilioConfig: () => ({
+    accountSid: 'AC_test',
+    authToken: 'test_token',
+    phoneNumber: '+15550001111',
+    webhookBaseUrl: 'https://test.example.com',
+    wssBaseUrl: 'wss://test.example.com',
+  }),
+}));
+mock.module('../calls/twilio-provider.js', () => ({
+  TwilioConversationRelayProvider: class {
+    async checkCallerIdEligibility(number: string) {
+      // Simulate: +15550002222 is eligible, others are not
+      if (number === '+15550002222') return { eligible: true };
+      return { eligible: false, reason: `${number} is not eligible as a caller ID` };
+    }
+  },
+}));
+mock.module('../security/secure-keys.js', () => ({
+  getSecureKey: () => null,
+}));
+import { resolveCallerIdentity } from '../calls/call-domain.js';
+import type { AssistantConfig } from '../config/types.js';
+function makeConfig(overrides: {
+  allowPerCallOverride?: boolean;
+  userNumber?: string;
+} = {}): AssistantConfig {
+  return {
+    calls: {
+      callerIdentity: {
+        allowPerCallOverride: overrides.allowPerCallOverride ?? true,
+        userNumber: overrides.userNumber,
+      },
+    },
+  } as unknown as AssistantConfig;
+}
+describe('resolveCallerIdentity — strict implicit-default policy', () => {
+  test('implicit call defaults to assistant_number', async () => {
+    const result = await resolveCallerIdentity(makeConfig());
+    expect(result.ok).toBe(true);
+    if (result.ok) {
+      expect(result.mode).toBe('assistant_number');
+      expect(result.fromNumber).toBe('+15550001111');
+      expect(result.source).toBe('implicit_default');
+    }
+  });
+  test('implicit call uses assistant_number even when userNumber is configured', async () => {
+    const result = await resolveCallerIdentity(
+      makeConfig({ userNumber: '+15550002222' }),
+    );
+    expect(result.ok).toBe(true);
+    if (result.ok) {
+      expect(result.mode).toBe('assistant_number');
+      expect(result.fromNumber).toBe('+15550001111');
+      expect(result.source).toBe('implicit_default');
+    }
+  });
+  test('explicit user_number succeeds when eligible', async () => {
+    const result = await resolveCallerIdentity(
+      makeConfig({ userNumber: '+15550002222' }),
+      'user_number',
+    );
+    expect(result.ok).toBe(true);
+    if (result.ok) {
+      expect(result.mode).toBe('user_number');
+      expect(result.fromNumber).toBe('+15550002222');
+      expect(result.source).toBe('user_config');
+    }
+  });
+  test('explicit user_number fails when no user phone configured', async () => {
+    const result = await resolveCallerIdentity(makeConfig(), 'user_number');
+    expect(result.ok).toBe(false);
+    if (!result.ok) {
+      expect(result.error).toContain('user_number');
+      expect(result.error).toContain('user phone number');
+    }
+  });
+  test('explicit user_number fails when number is ineligible', async () => {
+    const result = await resolveCallerIdentity(
+      makeConfig({ userNumber: '+15559999999' }),
+      'user_number',
+    );
+    expect(result.ok).toBe(false);
+    if (!result.ok) {
+      expect(result.error).toContain('not eligible');
+    }
+  });
+  test('explicit override rejected when allowPerCallOverride=false', async () => {
+    const result = await resolveCallerIdentity(
+      makeConfig({ allowPerCallOverride: false, userNumber: '+15550002222' }),
+      'user_number',
+    );
+    expect(result.ok).toBe(false);
+    if (!result.ok) {
+      expect(result.error).toContain('override is disabled');
+    }
+  });
+  test('explicit assistant_number override succeeds when allowed', async () => {
+    const result = await resolveCallerIdentity(makeConfig(), 'assistant_number');
+    expect(result.ok).toBe(true);
+    if (result.ok) {
+      expect(result.mode).toBe('assistant_number');
+      expect(result.source).toBe('per_call_override');
+    }
+  });
+  test('invalid mode returns error', async () => {
+    const result = await resolveCallerIdentity(
+      makeConfig(),
+      'custom_number' as 'assistant_number',
+    );
+    expect(result.ok).toBe(false);
+    if (!result.ok) {
+      expect(result.error).toContain('Invalid callerIdentityMode');
+    }
+  });
+});

package/src/__tests__/call-orchestrator.test.ts CHANGED Viewed

@@ -29,6 +29,8 @@ mock.module('../util/logger.js', () => ({
 // ── Config mock ─────────────────────────────────────────────────────
+let mockCallModel: string | undefined = undefined;
 mock.module('../config/loader.js', () => ({
   getConfig: () => ({
     apiKeys: { anthropic: 'test-key' },
@@ -41,6 +43,7 @@ mock.module('../config/loader.js', () => ({
       silenceTimeoutSeconds: 30,
       disclosure: { enabled: false, text: '' },
       safety: { denyCategories: [] },
+      model: mockCallModel,
     },
   }),
 }));
@@ -97,6 +100,7 @@ import { conversations } from '../memory/schema.js';
 import {
   createCallSession,
   getCallSession,
+  getCallEvents,
   getPendingQuestion,
   updateCallSession,
 } from '../calls/call-store.js';
@@ -192,6 +196,7 @@ function setupOrchestrator(task?: string) {
 describe('call-orchestrator', () => {
   beforeEach(() => {
     resetTables();
+    mockCallModel = undefined;
     // Reset the stream mock to default behaviour
     mockStreamFn.mockImplementation(() => createMockStream(['Hello', ' there']));
   });
@@ -451,4 +456,170 @@ describe('call-orchestrator', () => {
     // Second destroy should not throw
     expect(() => orchestrator.destroy()).not.toThrow();
   });
+  // ── Model override from config ──────────────────────────────────────
+  test('uses default model when calls.model is not set', async () => {
+    mockCallModel = undefined;
+    mockStreamFn.mockImplementation((...args: unknown[]) => {
+      const firstArg = args[0] as { model: string };
+      expect(firstArg.model).toBe('claude-sonnet-4-20250514');
+      return createMockStream(['Default model response.']);
+    });
+    const { orchestrator } = setupOrchestrator();
+    await orchestrator.handleCallerUtterance('Hello');
+    orchestrator.destroy();
+  });
+  test('uses calls.model override from config when set', async () => {
+    mockCallModel = 'claude-haiku-4-5-20251001';
+    mockStreamFn.mockImplementation((...args: unknown[]) => {
+      const firstArg = args[0] as { model: string };
+      expect(firstArg.model).toBe('claude-haiku-4-5-20251001');
+      return createMockStream(['Override model response.']);
+    });
+    const { orchestrator } = setupOrchestrator();
+    await orchestrator.handleCallerUtterance('Hello');
+    orchestrator.destroy();
+  });
+  test('treats empty string calls.model as unset and falls back to default', async () => {
+    mockCallModel = '';
+    mockStreamFn.mockImplementation((...args: unknown[]) => {
+      const firstArg = args[0] as { model: string };
+      expect(firstArg.model).toBe('claude-sonnet-4-20250514');
+      return createMockStream(['Fallback model response.']);
+    });
+    const { orchestrator } = setupOrchestrator();
+    await orchestrator.handleCallerUtterance('Hello');
+    orchestrator.destroy();
+  });
+  test('treats whitespace-only calls.model as unset and falls back to default', async () => {
+    mockCallModel = '   ';
+    mockStreamFn.mockImplementation((...args: unknown[]) => {
+      const firstArg = args[0] as { model: string };
+      expect(firstArg.model).toBe('claude-sonnet-4-20250514');
+      return createMockStream(['Fallback model response.']);
+    });
+    const { orchestrator } = setupOrchestrator();
+    await orchestrator.handleCallerUtterance('Hello');
+    orchestrator.destroy();
+  });
+  // ── handleUserInstruction ─────────────────────────────────────────
+  test('handleUserInstruction: injects instruction marker into conversation history and triggers LLM when idle', async () => {
+    mockStreamFn.mockImplementation((...args: unknown[]) => {
+      const firstArg = args[0] as { messages: Array<{ role: string; content: string }> };
+      const instructionMsg = firstArg.messages.find((m) =>
+        m.role === 'user' && m.content.includes('[USER_INSTRUCTION:'),
+      );
+      expect(instructionMsg).toBeDefined();
+      expect(instructionMsg!.content).toContain('[USER_INSTRUCTION: Ask about their weekend plans]');
+      return createMockStream(['Sure, do you have any weekend plans?']);
+    });
+    const { relay, orchestrator } = setupOrchestrator();
+    await orchestrator.handleUserInstruction('Ask about their weekend plans');
+    // Should have streamed a response since orchestrator was idle
+    const nonEmptyTokens = relay.sentTokens.filter((t) => t.token.length > 0);
+    expect(nonEmptyTokens.length).toBeGreaterThan(0);
+    orchestrator.destroy();
+  });
+  test('handleUserInstruction: does not break existing answer flow', async () => {
+    // Step 1: Caller says something, LLM responds normally
+    mockStreamFn.mockImplementation(() => createMockStream(['Hello! How can I help you today?']));
+    const { session: _session, relay, orchestrator } = setupOrchestrator('Book appointment');
+    await orchestrator.handleCallerUtterance('Hi there');
+    // Step 2: Inject an instruction while idle
+    mockStreamFn.mockImplementation((...args: unknown[]) => {
+      const firstArg = args[0] as { messages: Array<{ role: string; content: string }> };
+      // Verify the history contains both the original exchange and the instruction
+      const messages = firstArg.messages;
+      expect(messages.length).toBeGreaterThanOrEqual(3); // user utterance + assistant response + instruction
+      const instructionMsg = messages.find((m) =>
+        m.role === 'user' && m.content.includes('[USER_INSTRUCTION:'),
+      );
+      expect(instructionMsg).toBeDefined();
+      return createMockStream(['Of course, let me mention the weekend special.']);
+    });
+    await orchestrator.handleUserInstruction('Mention the weekend special');
+    // Step 3: Caller speaks again — the flow should continue normally
+    mockStreamFn.mockImplementation(() =>
+      createMockStream(['Great choice! The weekend special is 20% off.']),
+    );
+    await orchestrator.handleCallerUtterance('Tell me more about that');
+    // Verify state is idle after the normal flow
+    expect(orchestrator.getState()).toBe('idle');
+    // Verify relay received tokens from all exchanges
+    const allText = relay.sentTokens.map((t) => t.token).join('');
+    expect(allText).toContain('Hello');
+    expect(allText).toContain('weekend special');
+    orchestrator.destroy();
+  });
+  test('handleUserInstruction: emits user_instruction_relayed event', async () => {
+    mockStreamFn.mockImplementation(() => createMockStream(['Understood, adjusting approach.']));
+    const { session, orchestrator } = setupOrchestrator();
+    await orchestrator.handleUserInstruction('Be more formal in your tone');
+    const events = getCallEvents(session.id);
+    const instructionEvents = events.filter((e) => e.eventType === 'user_instruction_relayed');
+    expect(instructionEvents.length).toBe(1);
+    const payload = JSON.parse(instructionEvents[0].payloadJson);
+    expect(payload.instruction).toBe('Be more formal in your tone');
+    orchestrator.destroy();
+  });
+  test('handleUserInstruction: does not trigger LLM when orchestrator is not idle', async () => {
+    // First, trigger ASK_USER so orchestrator enters waiting_on_user
+    mockStreamFn.mockImplementation(() =>
+      createMockStream(['Hold on. [ASK_USER: What time?]']),
+    );
+    const { session, orchestrator } = setupOrchestrator();
+    await orchestrator.handleCallerUtterance('I need an appointment');
+    expect(orchestrator.getState()).toBe('waiting_on_user');
+    // Track how many times the stream mock is called
+    let streamCallCount = 0;
+    mockStreamFn.mockImplementation(() => {
+      streamCallCount++;
+      return createMockStream(['Response after instruction.']);
+    });
+    // Inject instruction while in waiting_on_user state
+    await orchestrator.handleUserInstruction('Suggest morning slots');
+    // The LLM should NOT have been triggered since we're not idle
+    expect(streamCallCount).toBe(0);
+    // But the event should still be recorded
+    const events = getCallEvents(session.id);
+    const instructionEvents = events.filter((e) => e.eventType === 'user_instruction_relayed');
+    expect(instructionEvents.length).toBe(1);
+    orchestrator.destroy();
+  });
 });