npm - @vellumai/assistant - Versions diffs - 0.4.48 → 0.4.49 - Mend

@vellumai/assistant 0.4.48 → 0.4.49

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (252) hide show

package/ARCHITECTURE.md +2 -2
package/README.md +2 -23
package/docs/architecture/integrations.md +45 -41
package/docs/architecture/keychain-broker.md +3 -3
package/docs/runbook-trusted-contacts.md +3 -8
package/hook-templates/debug-prompt-logger/hook.json +1 -1
package/hook-templates/debug-prompt-logger/run.sh +1 -3
package/package.json +1 -1
package/src/__tests__/actor-token-service.test.ts +0 -1
package/src/__tests__/anthropic-provider.test.ts +156 -0
package/src/__tests__/approval-cascade.test.ts +810 -0
package/src/__tests__/approval-primitive.test.ts +0 -1
package/src/__tests__/approval-routes-http.test.ts +2 -0
package/src/__tests__/assistant-attachments.test.ts +12 -34
package/src/__tests__/assistant-feature-flag-guardrails.test.ts +76 -0
package/src/__tests__/assistant-feature-flags-integration.test.ts +0 -1
package/src/__tests__/browser-skill-baseline-tool-payload.test.ts +2 -2
package/src/__tests__/channel-guardian.test.ts +0 -2
package/src/__tests__/channel-readiness-routes.test.ts +15 -6
package/src/__tests__/channel-readiness-service.test.ts +10 -9
package/src/__tests__/checker.test.ts +9 -29
package/src/__tests__/computer-use-skill-manifest-regression.test.ts +1 -1
package/src/__tests__/computer-use-tools.test.ts +2 -19
package/src/__tests__/config-watcher.test.ts +0 -1
package/src/__tests__/confirmation-request-guardian-bridge.test.ts +0 -1
package/src/__tests__/context-image-dimensions.test.ts +332 -0
package/src/__tests__/context-token-estimator.test.ts +196 -13
package/src/__tests__/conversation-attention-store.test.ts +0 -1
package/src/__tests__/conversation-attention-telegram.test.ts +0 -1
package/src/__tests__/conversation-routes-guardian-reply.test.ts +144 -0
package/src/__tests__/conversation-routes-slash-commands.test.ts +1 -0
package/src/__tests__/credential-metadata-store.test.ts +64 -73
package/src/__tests__/credential-security-invariants.test.ts +13 -7
package/src/__tests__/credential-vault-unit.test.ts +280 -49
package/src/__tests__/credential-vault.test.ts +138 -16
package/src/__tests__/credentials-cli.test.ts +71 -0
package/src/__tests__/dynamic-skill-workflow-prompt.test.ts +0 -1
package/src/__tests__/ephemeral-permissions.test.ts +3 -3
package/src/__tests__/gateway-only-guard.test.ts +0 -1
package/src/__tests__/guardian-action-grant-mint-consume.test.ts +0 -1
package/src/__tests__/guardian-decision-primitive-canonical.test.ts +0 -1
package/src/__tests__/guardian-routing-invariants.test.ts +0 -1
package/src/__tests__/guardian-verification-voice-binding.test.ts +0 -1
package/src/__tests__/handlers-user-message-approval-consumption.test.ts +0 -39
package/src/__tests__/heartbeat-service.test.ts +0 -1
package/src/__tests__/host-cu-proxy.test.ts +629 -0
package/src/__tests__/host-shell-tool.test.ts +27 -15
package/src/__tests__/http-user-message-parity.test.ts +1 -0
package/src/__tests__/ingress-url-consistency.test.ts +14 -21
package/src/__tests__/integration-status.test.ts +32 -51
package/src/__tests__/intent-routing.test.ts +0 -1
package/src/__tests__/invite-routes-http.test.ts +10 -9
package/src/__tests__/keychain-broker-client.test.ts +11 -43
package/src/__tests__/notification-routing-intent.test.ts +0 -1
package/src/__tests__/oauth-cli.test.ts +373 -14
package/src/__tests__/oauth-provider-profiles.test.ts +9 -9
package/src/__tests__/oauth-scope-policy.test.ts +4 -6
package/src/__tests__/oauth-store.test.ts +756 -0
package/src/__tests__/onboarding-starter-tasks.test.ts +0 -1
package/src/__tests__/provider-error-scenarios.test.ts +0 -1
package/src/__tests__/provider-streaming.benchmark.test.ts +0 -1
package/src/__tests__/public-ingress-urls.test.ts +15 -21
package/src/__tests__/recording-handler.test.ts +3 -4
package/src/__tests__/registry.test.ts +2 -2
package/src/__tests__/runtime-events-sse.test.ts +55 -7
package/src/__tests__/schedule-store.test.ts +0 -1
package/src/__tests__/scheduler-recurrence.test.ts +0 -1
package/src/__tests__/scoped-approval-grants.test.ts +0 -1
package/src/__tests__/scoped-grant-security-matrix.test.ts +0 -1
package/src/__tests__/secret-ingress-handler.test.ts +0 -1
package/src/__tests__/send-endpoint-busy.test.ts +21 -6
package/src/__tests__/sequence-store.test.ts +0 -1
package/src/__tests__/session-init.benchmark.test.ts +4 -5
package/src/__tests__/skill-include-graph.test.ts +66 -0
package/src/__tests__/skill-load-feature-flag.test.ts +0 -1
package/src/__tests__/skill-load-tool.test.ts +149 -1
package/src/__tests__/skill-projection-feature-flag.test.ts +0 -1
package/src/__tests__/skills-uninstall.test.ts +1 -1
package/src/__tests__/skills.test.ts +3 -3
package/src/__tests__/slack-channel-config.test.ts +67 -3
package/src/__tests__/slack-share-routes.test.ts +17 -19
package/src/__tests__/system-prompt.test.ts +0 -1
package/src/__tests__/telegram-invite-adapter.test.ts +18 -22
package/src/__tests__/terminal-tools.test.ts +4 -3
package/src/__tests__/test-support/computer-use-skill-harness.ts +3 -2
package/src/__tests__/tool-approval-handler.test.ts +0 -1
package/src/__tests__/tool-execution-pipeline.benchmark.test.ts +0 -1
package/src/__tests__/tool-executor-lifecycle-events.test.ts +0 -1
package/src/__tests__/tool-executor-shell-integration.test.ts +0 -1
package/src/__tests__/tool-executor.test.ts +0 -1
package/src/__tests__/tool-grant-request-escalation.test.ts +0 -1
package/src/__tests__/trust-store-pattern-matches.test.ts +29 -0
package/src/__tests__/trust-store.test.ts +1 -22
package/src/__tests__/trusted-contact-approval-notifier.test.ts +0 -1
package/src/__tests__/trusted-contact-inline-approval-integration.test.ts +0 -1
package/src/__tests__/twilio-routes.test.ts +0 -16
package/src/__tests__/verification-control-plane-policy.test.ts +0 -1
package/src/__tests__/voice-scoped-grant-consumer.test.ts +0 -1
package/src/agent/ax-tree-compaction.test.ts +235 -0
package/src/agent/loop.ts +76 -130
package/src/calls/call-domain.ts +1 -6
package/src/calls/relay-server.ts +9 -13
package/src/calls/twilio-config.ts +2 -7
package/src/calls/twilio-routes.ts +1 -2
package/src/calls/voice-ingress-preflight.ts +1 -1
package/src/cli/commands/browser-relay.ts +18 -12
package/src/cli/commands/completions.ts +0 -3
package/src/cli/commands/credentials.ts +101 -15
package/src/cli/commands/oauth/apps.ts +255 -0
package/src/cli/commands/oauth/connections.ts +299 -0
package/src/cli/commands/oauth/index.ts +52 -0
package/src/cli/commands/oauth/providers.ts +242 -0
package/src/cli/commands/skills.ts +4 -338
package/src/cli/program.ts +1 -5
package/src/cli/reference.ts +1 -3
package/src/config/assistant-feature-flags.ts +0 -3
package/src/config/bundled-skills/_shared/CLI_RETRIEVAL_PATTERN.md +1 -1
package/src/config/bundled-skills/computer-use/SKILL.md +3 -6
package/src/config/bundled-skills/computer-use/TOOLS.json +22 -4
package/src/config/bundled-skills/google-calendar/calendar-client.ts +21 -16
package/src/config/bundled-skills/messaging/tools/shared.ts +1 -4
package/src/config/bundled-skills/settings/SKILL.md +1 -1
package/src/config/bundled-skills/settings/TOOLS.json +2 -8
package/src/config/bundled-skills/settings/tools/voice-config-update.ts +5 -33
package/src/config/env-registry.ts +14 -83
package/src/config/env.ts +11 -50
package/src/config/feature-flag-registry.json +16 -16
package/src/config/loader.ts +0 -6
package/src/config/schema.ts +3 -1
package/src/config/skills.ts +21 -2
package/src/context/image-dimensions.ts +229 -0
package/src/context/token-estimator.ts +75 -12
package/src/context/window-manager.ts +49 -10
package/src/daemon/assistant-attachments.ts +1 -13
package/src/daemon/handlers/config-ingress.ts +8 -33
package/src/daemon/handlers/config-slack-channel.ts +49 -46
package/src/daemon/handlers/config-telegram.ts +32 -16
package/src/daemon/handlers/sessions.ts +10 -24
package/src/daemon/handlers/shared.ts +0 -130
package/src/daemon/host-cu-proxy.ts +401 -0
package/src/daemon/lifecycle.ts +36 -68
package/src/daemon/message-protocol.ts +3 -0
package/src/daemon/message-types/computer-use.ts +2 -119
package/src/daemon/message-types/host-cu.ts +19 -0
package/src/daemon/message-types/messages.ts +3 -0
package/src/daemon/server.ts +14 -21
package/src/daemon/session-agent-loop-handlers.ts +2 -0
package/src/daemon/session-attachments.ts +1 -2
package/src/daemon/session-slash.ts +1 -1
package/src/daemon/session-surfaces.ts +40 -28
package/src/daemon/session-tool-setup.ts +2 -9
package/src/daemon/session.ts +138 -15
package/src/daemon/tool-side-effects.ts +2 -8
package/src/daemon/watch-handler.ts +2 -2
package/src/events/tool-metrics-listener.ts +2 -2
package/src/hooks/manager.ts +1 -4
package/src/inbound/public-ingress-urls.ts +7 -7
package/src/logfire.ts +16 -5
package/src/memory/conversation-key-store.ts +21 -0
package/src/memory/db-init.ts +4 -0
package/src/memory/migrations/149-oauth-tables.ts +60 -0
package/src/memory/migrations/index.ts +1 -0
package/src/memory/schema/index.ts +1 -0
package/src/memory/schema/oauth.ts +65 -0
package/src/messaging/provider.ts +4 -4
package/src/messaging/providers/gmail/client.ts +82 -2
package/src/messaging/providers/gmail/people-client.ts +10 -10
package/src/messaging/providers/telegram-bot/adapter.ts +17 -17
package/src/messaging/providers/whatsapp/adapter.ts +11 -8
package/src/messaging/registry.ts +2 -32
package/src/notifications/copy-composer.ts +0 -5
package/src/notifications/signal.ts +4 -5
package/src/oauth/byo-connection.test.ts +126 -25
package/src/oauth/byo-connection.ts +22 -6
package/src/oauth/connect-orchestrator.ts +113 -57
package/src/oauth/connect-types.ts +17 -23
package/src/oauth/connection-resolver.ts +35 -11
package/src/oauth/connection.ts +1 -1
package/src/oauth/manual-token-connection.ts +104 -0
package/src/oauth/oauth-store.ts +496 -0
package/src/oauth/platform-connection.test.ts +29 -0
package/src/oauth/platform-connection.ts +6 -5
package/src/oauth/provider-behaviors.ts +124 -0
package/src/oauth/scope-policy.ts +9 -2
package/src/oauth/seed-providers.ts +161 -0
package/src/oauth/token-persistence.ts +74 -78
package/src/permissions/checker.ts +3 -3
package/src/permissions/defaults.ts +0 -1
package/src/permissions/prompter.ts +10 -1
package/src/permissions/trust-store.ts +13 -0
package/src/prompts/__tests__/build-cli-reference-section.test.ts +3 -1
package/src/prompts/system-prompt.ts +28 -40
package/src/providers/anthropic/client.ts +133 -24
package/src/providers/retry.ts +1 -27
package/src/runtime/auth/route-policy.ts +0 -3
package/src/runtime/channel-reply-delivery.ts +0 -40
package/src/runtime/gateway-client.ts +0 -7
package/src/runtime/http-server.ts +8 -6
package/src/runtime/http-types.ts +2 -2
package/src/runtime/middleware/twilio-validation.ts +1 -11
package/src/runtime/pending-interactions.ts +14 -12
package/src/runtime/routes/channel-delivery-routes.ts +0 -1
package/src/runtime/routes/conversation-routes.ts +73 -19
package/src/runtime/routes/events-routes.ts +21 -11
package/src/runtime/routes/host-cu-routes.ts +97 -0
package/src/runtime/routes/inbound-stages/background-dispatch.ts +12 -111
package/src/runtime/routes/integrations/slack/share.ts +6 -7
package/src/runtime/routes/log-export-routes.ts +126 -8
package/src/runtime/routes/settings-routes.ts +55 -48
package/src/runtime/routes/surface-action-routes.ts +1 -1
package/src/runtime/routes/watch-routes.ts +128 -0
package/src/schedule/integration-status.ts +10 -9
package/src/security/credential-key.ts +0 -156
package/src/security/keychain-broker-client.ts +5 -6
package/src/security/oauth2.ts +1 -1
package/src/security/token-manager.ts +119 -46
package/src/skills/catalog-install.ts +358 -0
package/src/skills/include-graph.ts +32 -0
package/src/telegram/bot-username.ts +2 -3
package/src/tools/browser/network-recorder.ts +1 -1
package/src/tools/browser/network-recording-types.ts +1 -1
package/src/tools/computer-use/definitions.ts +46 -11
package/src/tools/computer-use/registry.ts +4 -5
package/src/tools/credentials/broker.ts +1 -2
package/src/tools/credentials/metadata-store.ts +17 -121
package/src/tools/credentials/vault.ts +94 -167
package/src/tools/registry.ts +2 -7
package/src/tools/skills/load.ts +62 -3
package/src/tools/watch/watch-state.ts +0 -12
package/src/util/logger.ts +7 -41
package/src/util/platform.ts +9 -28
package/src/watcher/providers/google-calendar.ts +2 -1
package/src/__tests__/computer-use-session-compaction.test.ts +0 -143
package/src/__tests__/computer-use-session-lifecycle.test.ts +0 -322
package/src/__tests__/computer-use-session-working-dir.test.ts +0 -166
package/src/__tests__/computer-use-skill-baseline.test.ts +0 -78
package/src/__tests__/computer-use-skill-endstate.test.ts +0 -105
package/src/__tests__/computer-use-skill-lifecycle-cleanup.test.ts +0 -249
package/src/__tests__/ride-shotgun-handler.test.ts +0 -452
package/src/cli/commands/dev.ts +0 -129
package/src/cli/commands/map.ts +0 -391
package/src/cli/commands/oauth.ts +0 -77
package/src/config/bundled-skills/computer-use/tools/computer-use-request-control.ts +0 -16
package/src/daemon/computer-use-session.ts +0 -1026
package/src/daemon/ride-shotgun-handler.ts +0 -569
package/src/oauth/provider-base-urls.ts +0 -21
package/src/oauth/provider-profiles.ts +0 -192
package/src/prompts/computer-use-prompt.ts +0 -98
package/src/runtime/routes/computer-use-routes.ts +0 -641
package/src/runtime/telegram-streaming-delivery.test.ts +0 -729
package/src/runtime/telegram-streaming-delivery.ts +0 -393
package/src/tools/computer-use/request-computer-control.ts +0 -56

package/src/runtime/telegram-streaming-delivery.test.ts DELETED Viewed

@@ -1,729 +0,0 @@
-import { afterEach, beforeEach, describe, expect, mock, test } from "bun:test";
-import type { ApprovalUIMetadata } from "./channel-approval-types.js";
-import type { ChannelDeliveryResult } from "./gateway-client.js";
-// ---------------------------------------------------------------------------
-// Mocks
-// ---------------------------------------------------------------------------
-let callCount = 0;
-const mockDeliverChannelReply = mock(
-  async (): Promise<ChannelDeliveryResult> => {
-    callCount++;
-    return { ok: true, messageId: 99 + callCount };
-  },
-);
-mock.module("./gateway-client.js", () => ({
-  deliverChannelReply: mockDeliverChannelReply,
-}));
-mock.module("../util/logger.js", () => ({
-  getLogger: () =>
-    new Proxy({} as Record<string, unknown>, {
-      get: () => () => {},
-    }),
-}));
-import { TelegramStreamingDelivery } from "./telegram-streaming-delivery.js";
-// ---------------------------------------------------------------------------
-// Helpers
-// ---------------------------------------------------------------------------
-type CallArgs = [string, Record<string, unknown>, string];
-/** Extract the payload (second argument) from the Nth mock call. */
-function callPayload(n: number): Record<string, unknown> {
-  const args = mockDeliverChannelReply.mock.calls[n] as unknown as CallArgs;
-  return args[1];
-}
-function createDelivery(): TelegramStreamingDelivery {
-  return new TelegramStreamingDelivery({
-    callbackUrl: "http://test/deliver",
-    chatId: "123",
-    mintBearerToken: () => "test-token",
-  });
-}
-/** Flush all pending microtasks / promise callbacks. */
-async function flushPromises(): Promise<void> {
-  // Multiple rounds to handle chained .then() callbacks
-  for (let i = 0; i < 10; i++) {
-    await new Promise((resolve) => setTimeout(resolve, 0));
-  }
-}
-// ---------------------------------------------------------------------------
-// Tests
-// ---------------------------------------------------------------------------
-describe("TelegramStreamingDelivery", () => {
-  beforeEach(() => {
-    callCount = 0;
-    mockDeliverChannelReply.mockReset();
-    mockDeliverChannelReply.mockImplementation(
-      async (): Promise<ChannelDeliveryResult> => {
-        callCount++;
-        return { ok: true, messageId: 99 + callCount };
-      },
-    );
-  });
-  afterEach(() => {
-    mockDeliverChannelReply.mockReset();
-  });
-  // ── Test 1: initial send when buffer reaches MIN_INITIAL_CHARS ──────
-  test("sends initial message when buffer reaches MIN_INITIAL_CHARS", async () => {
-    const delivery = createDelivery();
-    // MIN_INITIAL_CHARS is 20; send 25 chars
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "a".repeat(25),
-    });
-    await flushPromises();
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(1);
-    const payload = callPayload(0);
-    expect(payload.text).toBe("a".repeat(25));
-    // Initial send should NOT have a messageId (it's a new message)
-    expect(payload.messageId).toBeUndefined();
-  });
-  // ── Test 2: edits message with accumulated text on finish() ─────────
-  test("edits message with accumulated text on finish()", async () => {
-    const delivery = createDelivery();
-    // First: send enough to trigger initial send
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "a".repeat(25),
-    });
-    await flushPromises();
-    // Then add more text and finish
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "b".repeat(10),
-    });
-    await delivery.finish();
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(2);
-    // First call: new message (no messageId)
-    const firstPayload = callPayload(0);
-    expect(firstPayload.messageId).toBeUndefined();
-    // Second call: edit (with messageId from first call)
-    const secondPayload = callPayload(1);
-    expect(secondPayload.messageId).toBe(100); // first call returns messageId: 100
-    expect(secondPayload.text).toBe("a".repeat(25) + "b".repeat(10));
-  });
-  // ── Test 3: sends remainder as new message when messageId missing ───
-  test("sends remainder as new message when messageId is missing", async () => {
-    // First call: no messageId in response; second call: with messageId
-    mockDeliverChannelReply.mockReset();
-    let localCallCount = 0;
-    mockDeliverChannelReply.mockImplementation(
-      async (): Promise<ChannelDeliveryResult> => {
-        localCallCount++;
-        if (localCallCount === 1) return { ok: true }; // no messageId
-        return { ok: true, messageId: 200 };
-      },
-    );
-    const delivery = createDelivery();
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "a".repeat(25),
-    });
-    await flushPromises();
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "b".repeat(10),
-    });
-    await delivery.finish();
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(2);
-    // The initial text was already delivered (just without a messageId),
-    // so the second call should contain only the remainder (buffer text)
-    const secondPayload = callPayload(1);
-    expect(secondPayload.text).toBe("b".repeat(10));
-    // It's sent as a new message (no messageId in payload) since the first
-    // call didn't return one
-    expect(secondPayload.messageId).toBeUndefined();
-  });
-  // ── Test 4: sends full text when initial send fails ─────────────────
-  test("sends full text when initial send fails", async () => {
-    mockDeliverChannelReply.mockReset();
-    let localCallCount = 0;
-    mockDeliverChannelReply.mockImplementation(
-      async (): Promise<ChannelDeliveryResult> => {
-        localCallCount++;
-        if (localCallCount === 1) throw new Error("Network error");
-        return { ok: true, messageId: 300 };
-      },
-    );
-    const delivery = createDelivery();
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "a".repeat(25),
-    });
-    await flushPromises();
-    // The initial send failed; buffer should be restored
-    await delivery.finish();
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(2);
-    // The finish() call should send the complete accumulated text
-    const secondPayload = callPayload(1);
-    expect(secondPayload.text).toBe("a".repeat(25));
-    expect(delivery.finishSucceeded).toBe(true);
-  });
-  // ── Test 5: tool_use_start between text segments produces single message ─
-  test("tool_use_start between text segments produces single message", async () => {
-    const delivery = createDelivery();
-    // Send enough text to trigger initial message (>= MIN_INITIAL_CHARS=20)
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "Yeah, still here! ", // 18 chars
-    });
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "aa", // Push past 20 chars
-    });
-    await flushPromises();
-    // Initial message sent
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(1);
-    const initialPayload = callPayload(0);
-    expect(initialPayload.messageId).toBeUndefined(); // new message
-    // tool_use_start — should NOT finalize/reset message state
-    delivery.onEvent({
-      type: "tool_use_start",
-      toolName: "memory_recall",
-      input: {},
-    });
-    await flushPromises();
-    // More text after the tool call
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "What do you need?",
-    });
-    await delivery.finish();
-    // The final edit should be to the SAME message (same messageId),
-    // containing the full combined text
-    const lastCallIndex = mockDeliverChannelReply.mock.calls.length - 1;
-    const lastPayload = callPayload(lastCallIndex);
-    expect(lastPayload.messageId).toBe(100); // same messageId as initial
-    expect(lastPayload.text).toBe("Yeah, still here! aaWhat do you need?");
-  });
-  // ── Test 5b: multiple tool calls between text segments ──────────────
-  test("multiple tool calls between text segments produce single message", async () => {
-    const delivery = createDelivery();
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "a".repeat(25),
-    });
-    await flushPromises();
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(1);
-    // Two consecutive tool calls
-    delivery.onEvent({ type: "tool_use_start", toolName: "tool1", input: {} });
-    delivery.onEvent({ type: "tool_use_start", toolName: "tool2", input: {} });
-    // More text after both tool calls
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "b".repeat(10),
-    });
-    await delivery.finish();
-    // All text should be in the same message
-    const lastCallIndex = mockDeliverChannelReply.mock.calls.length - 1;
-    const lastPayload = callPayload(lastCallIndex);
-    expect(lastPayload.messageId).toBe(100);
-    expect(lastPayload.text).toBe("a".repeat(25) + "b".repeat(10));
-  });
-  // ── Test 5c: tool_use_start before any text is a no-op ─────────────
-  test("tool_use_start before any text is a no-op", async () => {
-    const delivery = createDelivery();
-    delivery.onEvent({
-      type: "tool_use_start",
-      toolName: "init_tool",
-      input: {},
-    });
-    await flushPromises();
-    // No messages should have been sent
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(0);
-    // Subsequent text should work normally
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "a".repeat(25),
-    });
-    await flushPromises();
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(1);
-    await delivery.finish();
-    expect(delivery.finishSucceeded).toBe(true);
-  });
-  // ── Test 5d: tool_use_start at end of response finalizes on finish ──
-  test("tool_use_start at end of response finalizes on finish", async () => {
-    const delivery = createDelivery();
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "a".repeat(25),
-    });
-    await flushPromises();
-    delivery.onEvent({
-      type: "tool_use_start",
-      toolName: "final_tool",
-      input: {},
-    });
-    await delivery.finish();
-    // The text should have been delivered via the initial message + a final edit
-    expect(delivery.finishSucceeded).toBe(true);
-    expect(delivery.hasDeliveredText).toBe(true);
-  });
-  // ── Test 5e: text exceeding max length after tool pause splits at length boundary ─
-  test("text exceeding max length after tool pause splits at length boundary", async () => {
-    const delivery = createDelivery();
-    // Send ~3900 chars
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "a".repeat(3900),
-    });
-    await flushPromises();
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(1);
-    // Tool call (should not split)
-    delivery.onEvent({ type: "tool_use_start", toolName: "lookup", input: {} });
-    // Send 200 more chars (total 4100 > 4000 limit)
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "b".repeat(200),
-    });
-    await delivery.finish();
-    await flushPromises();
-    // Should have split at 4000-char boundary:
-    // 1. Initial message (3900 chars)
-    // 2. Edit at boundary (4000 chars)
-    // 3. Overflow new message (100 chars)
-    const calls = mockDeliverChannelReply.mock.calls.length;
-    expect(calls).toBe(3);
-    // Edit at boundary
-    const editPayload = callPayload(1);
-    expect((editPayload.text as string).length).toBe(4000);
-    expect(editPayload.messageId).toBeDefined();
-    // Overflow as new message
-    const overflowPayload = callPayload(2);
-    expect((overflowPayload.text as string).length).toBe(100);
-    expect(overflowPayload.messageId).toBeUndefined();
-  });
-  // ── Test 5f: preserves below-threshold text across tool_use_start ───
-  test("preserves below-threshold text across tool_use_start", async () => {
-    const delivery = createDelivery();
-    // Send text below MIN_INITIAL_CHARS threshold
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "Hi! ", // 4 chars, well below 20
-    });
-    await flushPromises();
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(0); // not sent yet
-    // tool_use_start
-    delivery.onEvent({
-      type: "tool_use_start",
-      toolName: "memory_recall",
-      input: {},
-    });
-    await flushPromises();
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(0); // still not sent
-    // More text after tool (enough to trigger initial send when combined)
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "What can I help with?", // 21 chars, combined = 25 >= 20
-    });
-    await flushPromises();
-    // Should have sent initial message with ALL text (pre-tool + post-tool)
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(1);
-    const payload = callPayload(0);
-    expect(payload.text).toBe("Hi! What can I help with?");
-    await delivery.finish();
-    expect(delivery.finishSucceeded).toBe(true);
-  });
-  // ── Test 5g: delivers below-threshold text when tool_use_start is followed by finish ─
-  test("delivers below-threshold text when tool_use_start is followed by finish", async () => {
-    const delivery = createDelivery();
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "Hi!", // 3 chars
-    });
-    delivery.onEvent({
-      type: "tool_use_start",
-      toolName: "lookup",
-      input: {},
-    });
-    await delivery.finish();
-    // The "Hi!" should have been sent as a new message during finish
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(1);
-    const payload = callPayload(0);
-    expect(payload.text).toBe("Hi!");
-    expect(delivery.finishSucceeded).toBe(true);
-  });
-  // ── Test 5h: no-messageId response doesn't cause duplicate messages on continued deltas ─
-  test("no-messageId response doesn't cause duplicate messages on continued deltas", async () => {
-    // Simulate the exact bug from the screenshot: initial send succeeds
-    // without messageId, then more deltas create overlapping new messages
-    mockDeliverChannelReply.mockReset();
-    mockDeliverChannelReply.mockImplementation(
-      async (): Promise<ChannelDeliveryResult> => {
-        // All sends return no messageId (simulates gateway omitting it)
-        return { ok: true };
-      },
-    );
-    const delivery = createDelivery();
-    // First batch: triggers sendInitialMessage (>= 20 chars)
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "Alright, hit me with something",
-    });
-    await flushPromises();
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(1);
-    expect(callPayload(0).text).toBe("Alright, hit me with something");
-    // More deltas arrive — should NOT trigger another sendInitialMessage
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: " longer and let's see if it comes through as one",
-    });
-    await flushPromises();
-    // Still only 1 call — text accumulates in buffer
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(1);
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: " message now!",
-    });
-    await delivery.finish();
-    // finish() should send the remainder as a single new message
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(2);
-    const finishPayload = callPayload(1);
-    expect(finishPayload.text).toBe(
-      " longer and let's see if it comes through as one message now!",
-    );
-    expect(finishPayload.messageId).toBeUndefined();
-    expect(delivery.finishSucceeded).toBe(true);
-  });
-  // ── Test 5i: combined threshold accounts for pre-tool currentMessageText ─
-  test("combined threshold accounts for pre-tool currentMessageText", async () => {
-    const delivery = createDelivery();
-    // Send 15 chars (below 20 threshold)
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "Hello, world!! ", // 15 chars
-    });
-    await flushPromises();
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(0);
-    // tool_use_start moves 15 chars to currentMessageText
-    delivery.onEvent({
-      type: "tool_use_start",
-      toolName: "lookup",
-      input: {},
-    });
-    // Send only 6 more chars — buffer alone (6) < 20, but combined (21) >= 20
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "Great!",
-    });
-    await flushPromises();
-    // Should have triggered initial send with combined text
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(1);
-    expect(callPayload(0).text).toBe("Hello, world!! Great!");
-    await delivery.finish();
-    expect(delivery.finishSucceeded).toBe(true);
-  });
-  // ── Test 5j: no-messageId + tool_use_start + finish delivers post-tool text ─
-  test("no-messageId + tool_use_start + finish delivers post-tool text", async () => {
-    // Scenario from Devin review: initial send succeeds without messageId,
-    // more deltas arrive, tool_use_start fires, finish() must deliver post-tool text.
-    mockDeliverChannelReply.mockReset();
-    let localCallCount = 0;
-    mockDeliverChannelReply.mockImplementation(
-      async (): Promise<ChannelDeliveryResult> => {
-        localCallCount++;
-        if (localCallCount === 1) return { ok: true }; // no messageId
-        return { ok: true, messageId: 400 };
-      },
-    );
-    const delivery = createDelivery();
-    // Step 1: initial send (>= 20 chars), succeeds without messageId
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "a".repeat(25),
-    });
-    await flushPromises();
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(1);
-    // Step 2: more deltas arrive — stuck in buffer (onTextDelta skips both branches)
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "post-tool text",
-    });
-    await flushPromises();
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(1); // no new call
-    // Step 3: tool_use_start — buffer should NOT be moved to currentMessageText
-    delivery.onEvent({
-      type: "tool_use_start",
-      toolName: "some_tool",
-      input: {},
-    });
-    // Step 4: finish() — should deliver the post-tool text as a new message
-    await delivery.finish();
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(2);
-    const secondPayload = callPayload(1);
-    expect(secondPayload.text).toBe("post-tool text");
-    expect(secondPayload.messageId).toBeUndefined(); // new message, not edit
-    expect(delivery.finishSucceeded).toBe(true);
-  });
-  // ── Test 5k: no-messageId + finish with approval sends approval as new message ─
-  test("no-messageId + finish with approval sends approval as new message", async () => {
-    // Scenario from Codex review: initial send succeeds without messageId,
-    // no additional buffer, but finish(approval) must still deliver approval buttons.
-    mockDeliverChannelReply.mockReset();
-    mockDeliverChannelReply.mockImplementation(
-      async (): Promise<ChannelDeliveryResult> => {
-        return { ok: true }; // no messageId
-      },
-    );
-    const delivery = createDelivery();
-    // Initial send succeeds without messageId
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "a".repeat(25),
-    });
-    await flushPromises();
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(1);
-    // finish() with approval — approval must not be silently dropped
-    const approval: ApprovalUIMetadata = {
-      requestId: "test-req",
-      actions: [{ id: "approve_once", label: "Approve" }],
-      plainTextFallback: "Reply APPROVE or REJECT",
-    };
-    await delivery.finish(approval);
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(2);
-    const secondPayload = callPayload(1);
-    // Approval buttons sent as a new message
-    expect(secondPayload.approval).toEqual(approval);
-    expect(secondPayload.messageId).toBeUndefined();
-    expect(delivery.finishSucceeded).toBe(true);
-  });
-  // ── Test 5l: no-messageId + buffer + finish with approval delivers both ─
-  test("no-messageId + buffer + finish with approval delivers both text and approval", async () => {
-    // Combined scenario: no-messageId initial send, buffered text, and approval buttons.
-    mockDeliverChannelReply.mockReset();
-    let localCallCount = 0;
-    mockDeliverChannelReply.mockImplementation(
-      async (): Promise<ChannelDeliveryResult> => {
-        localCallCount++;
-        if (localCallCount === 1) return { ok: true }; // no messageId
-        return { ok: true, messageId: 500 };
-      },
-    );
-    const delivery = createDelivery();
-    // Initial send succeeds without messageId
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "a".repeat(25),
-    });
-    await flushPromises();
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(1);
-    // More deltas arrive
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "remainder",
-    });
-    // finish() with approval — should deliver buffer text + approval together
-    const approval: ApprovalUIMetadata = {
-      requestId: "test-req",
-      actions: [{ id: "approve_once", label: "Approve" }],
-      plainTextFallback: "Reply APPROVE or REJECT",
-    };
-    await delivery.finish(approval);
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(2);
-    const secondPayload = callPayload(1);
-    expect(secondPayload.text).toBe("remainder");
-    expect(secondPayload.approval).toEqual(approval);
-    expect(secondPayload.messageId).toBeUndefined();
-    expect(delivery.finishSucceeded).toBe(true);
-  });
-  // ── Test 6: skips final edit when text hasn't changed ───────────────
-  test("skips final edit when text hasn't changed", async () => {
-    const delivery = createDelivery();
-    // Feed exactly MIN_INITIAL_CHARS (20) to trigger initial send
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "a".repeat(20),
-    });
-    await flushPromises();
-    // Initial send should have fired
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(1);
-    // Call finish() with no additional text
-    await delivery.finish();
-    // Should NOT have made a second call since text hasn't changed
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(1);
-    expect(delivery.finishSucceeded).toBe(true);
-  });
-  // ── Test 7: splits message at TELEGRAM_MAX_TEXT_LEN boundary ────────
-  test("splits message at TELEGRAM_MAX_TEXT_LEN boundary", async () => {
-    const delivery = createDelivery();
-    // Send initial chunk to start a message (>= 20 chars)
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "a".repeat(25),
-    });
-    await flushPromises();
-    // Initial send fired
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(1);
-    // Now send enough to exceed TELEGRAM_MAX_TEXT_LEN (4000) when combined
-    // with the initial 25 chars. The edit is throttled, so the buffer
-    // accumulates until finish() flushes it. finish() has its own overflow
-    // handling that splits at the 4000-char boundary.
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "b".repeat(4500),
-    });
-    // Call finish() to flush — this triggers the overflow split in finish()
-    await delivery.finish();
-    await flushPromises();
-    // finish() should have: (1) edited the current message with up to 4000
-    // chars, then (2) sent the overflow as a new message.
-    // Total calls: 1 (initial) + 1 (edit at boundary) + 1 (overflow new message) = 3
-    expect(mockDeliverChannelReply.mock.calls.length).toBe(3);
-    // The second call (edit at boundary) should have text of length 4000
-    const editPayload = callPayload(1);
-    expect((editPayload.text as string).length).toBe(4000);
-    expect(editPayload.messageId).toBeDefined();
-    // The third call (overflow) should be a new message (no messageId in payload)
-    const overflowPayload = callPayload(2);
-    expect(overflowPayload.messageId).toBeUndefined();
-    // Overflow should contain the remainder: 25 + 4500 - 4000 = 525 chars
-    expect((overflowPayload.text as string).length).toBe(525);
-    expect(delivery.finishSucceeded).toBe(true);
-  });
-  // ── Test 8: ignores events after finish() is called ─────────────────
-  test("ignores events after finish() is called", async () => {
-    const delivery = createDelivery();
-    // Send initial text to trigger a message
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "a".repeat(25),
-    });
-    await flushPromises();
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(1);
-    // Finish
-    await delivery.finish();
-    const callsAfterFinish = mockDeliverChannelReply.mock.calls.length;
-    // Now send more events -- they should be ignored
-    delivery.onEvent({
-      type: "assistant_text_delta",
-      text: "ignored text",
-    });
-    delivery.onEvent({
-      type: "tool_use_start",
-      toolName: "ignored_tool",
-      input: {},
-    });
-    await flushPromises();
-    // No additional calls should have been made
-    expect(mockDeliverChannelReply).toHaveBeenCalledTimes(callsAfterFinish);
-  });
-});