npm - discoclaw - Versions diffs - 1.2.4 → 2.0.0 - Mend

discoclaw 1.2.4 → 2.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (87) hide show

package/.context/voice.md +30 -2
package/.env.example +7 -3
package/.env.example.full +13 -32
package/README.md +1 -1
package/dist/cli/dashboard.js +7 -1
package/dist/cli/dashboard.test.js +0 -4
package/dist/cli/init-wizard.js +4 -8
package/dist/cli/init-wizard.test.js +4 -10
package/dist/config.js +5 -38
package/dist/config.test.js +8 -72
package/dist/cron/executor.js +72 -1
package/dist/dashboard/api/metrics.js +7 -0
package/dist/dashboard/api/metrics.test.js +16 -0
package/dist/dashboard/api/traces.js +14 -0
package/dist/dashboard/api/traces.test.js +40 -0
package/dist/dashboard/page.js +187 -8
package/dist/dashboard/server.js +82 -19
package/dist/dashboard/server.test.js +123 -10
package/dist/discord/actions.js +112 -6
package/dist/discord/actions.test.js +117 -1
package/dist/discord/deferred-runner.js +306 -219
package/dist/discord/help-command.js +1 -1
package/dist/discord/message-coordinator.js +4 -36
package/dist/discord/models-command.js +1 -1
package/dist/discord/reaction-handler.js +83 -5
package/dist/discord/reaction-handler.test.js +55 -0
package/dist/discord/verify-push.js +31 -36
package/dist/discord/verify-push.test.js +34 -6
package/dist/discord/voice-command.js +1 -31
package/dist/discord/voice-command.test.js +21 -259
package/dist/discord/voice-status-command.js +3 -22
package/dist/discord/voice-status-command.test.js +16 -124
package/dist/discord-followup.test.js +133 -0
package/dist/health/config-doctor.js +5 -27
package/dist/health/config-doctor.test.js +1 -4
package/dist/index.js +15 -28
package/dist/observability/trace-store.js +56 -0
package/dist/observability/trace-utils.js +31 -0
package/dist/runtime/codex-cli.js +3 -2
package/dist/runtime/codex-cli.test.js +33 -0
package/dist/runtime/model-tiers.js +1 -1
package/dist/runtime/model-tiers.test.js +9 -0
package/dist/runtime/openai-tool-schemas.js +17 -0
package/dist/runtime-overrides.js +2 -3
package/dist/runtime-overrides.test.js +27 -193
package/dist/tasks/store.js +10 -6
package/dist/tasks/store.test.js +44 -0
package/dist/tasks/task-action-executor.test.js +162 -50
package/dist/tasks/task-action-mutations.js +22 -2
package/dist/tasks/task-action-read-ops.js +7 -1
package/dist/tasks/task-action-runner-types.js +19 -1
package/dist/voice/audio-pipeline.js +183 -96
package/dist/voice/audio-receiver.js +8 -0
package/dist/voice/audio-receiver.test.js +16 -0
package/dist/voice/conversation-buffer.js +16 -6
package/dist/voice/providers/gemini-live-provider.js +481 -0
package/dist/voice/providers/gemini-live-provider.test.js +834 -0
package/dist/voice/providers/gemini-live-responder.js +267 -0
package/dist/voice/providers/gemini-live-responder.test.js +615 -0
package/dist/voice/providers/gemini-live-token-estimator.js +100 -0
package/dist/voice/providers/gemini-live-token-estimator.test.js +160 -0
package/dist/voice/providers/gemini-live-types.js +32 -0
package/dist/voice/providers/gemini-tool-mapper.js +91 -0
package/dist/voice/providers/gemini-tool-mapper.test.js +253 -0
package/dist/voice/providers/index.js +3 -0
package/dist/voice/voice-prompt-builder.js +26 -17
package/dist/voice/voice-prompt-builder.test.js +16 -1
package/docs/configuration.md +4 -9
package/docs/official-docs.md +6 -9
package/docs/runtime-switching.md +1 -1
package/package.json +1 -1
package/dist/voice/audio-pipeline.test.js +0 -619
package/dist/voice/stt-deepgram.js +0 -154
package/dist/voice/stt-deepgram.test.js +0 -275
package/dist/voice/stt-factory.js +0 -42
package/dist/voice/stt-factory.test.js +0 -45
package/dist/voice/stt-openai.js +0 -156
package/dist/voice/stt-openai.test.js +0 -281
package/dist/voice/tts-cartesia.js +0 -169
package/dist/voice/tts-cartesia.test.js +0 -228
package/dist/voice/tts-deepgram.js +0 -84
package/dist/voice/tts-deepgram.test.js +0 -220
package/dist/voice/tts-factory.js +0 -52
package/dist/voice/tts-factory.test.js +0 -53
package/dist/voice/tts-openai.js +0 -70
package/dist/voice/tts-openai.test.js +0 -138
package/dist/voice/types.test.js +0 -84

package/dist/voice/providers/gemini-live-provider.test.js ADDED Viewed

@@ -0,0 +1,834 @@
+import { describe, it, expect, vi, beforeEach } from 'vitest';
+import { EventEmitter } from 'node:events';
+import { GeminiLiveProvider, } from './gemini-live-provider.js';
+// ---------------------------------------------------------------------------
+// Mock WebSocket (ws-library style: EventEmitter with readyState)
+// ---------------------------------------------------------------------------
+class MockWebSocket extends EventEmitter {
+    static OPEN = 1;
+    static CLOSED = 3;
+    url;
+    readyState = MockWebSocket.OPEN;
+    sent = [];
+    constructor(url) {
+        super();
+        this.url = url;
+        // Auto-open on next microtask so callers can attach handlers
+        queueMicrotask(() => this.emit('open'));
+    }
+    send(data) {
+        this.sent.push(data);
+    }
+    close(code, reason) {
+        this.readyState = MockWebSocket.CLOSED;
+        // Real WebSocket emits 'close' after close() — fire on next microtask
+        queueMicrotask(() => this.emit('close', code ?? 1000, Buffer.from(reason ?? '')));
+    }
+    // Test helpers
+    _receiveMessage(data) {
+        this.emit('message', JSON.stringify(data));
+    }
+    _triggerClose(code = 1006) {
+        this.readyState = MockWebSocket.CLOSED;
+        this.emit('close', code, Buffer.from(''));
+    }
+    _triggerError(msg = 'test error') {
+        this.emit('error', new Error(msg));
+    }
+}
+// ---------------------------------------------------------------------------
+// Helpers
+// ---------------------------------------------------------------------------
+function createLogger() {
+    return { info: vi.fn(), warn: vi.fn(), error: vi.fn() };
+}
+let lastCreatedWs = null;
+function mockWsFactory(url) {
+    const ws = new MockWebSocket(url);
+    lastCreatedWs = ws;
+    return ws;
+}
+// eslint-disable-next-line @typescript-eslint/no-explicit-any
+const typedWsFactory = mockWsFactory;
+function makeProvider(overrides = {}) {
+    return new GeminiLiveProvider({
+        apiKey: overrides.apiKey ?? 'test-key',
+        log: overrides.log ?? createLogger(),
+        wsFactory: typedWsFactory,
+        ...overrides,
+    });
+}
+/** Simulate a successful setup by sending setupComplete after connect. */
+async function connectWithSetup(provider) {
+    const connectPromise = provider.connect();
+    // Wait for microtask to open WS and send setup
+    await new Promise((r) => setTimeout(r, 5));
+    lastCreatedWs._receiveMessage({ setupComplete: {} });
+    await connectPromise;
+    return lastCreatedWs;
+}
+function collectEvents(provider) {
+    const events = [];
+    provider.onEvent((e) => events.push(e));
+    return events;
+}
+// ---------------------------------------------------------------------------
+// Tests
+// ---------------------------------------------------------------------------
+beforeEach(() => {
+    vi.clearAllMocks();
+    lastCreatedWs = null;
+});
+describe('GeminiLiveProvider', () => {
+    // -----------------------------------------------------------------------
+    // Connection & setup
+    // -----------------------------------------------------------------------
+    it('connects with correct URL containing API key', async () => {
+        const provider = makeProvider({ apiKey: 'my-api-key' });
+        await connectWithSetup(provider);
+        expect(lastCreatedWs).not.toBeNull();
+        const url = new URL(lastCreatedWs.url);
+        expect(url.protocol).toBe('wss:');
+        expect(url.hostname).toBe('generativelanguage.googleapis.com');
+        expect(url.searchParams.get('key')).toBe('my-api-key');
+    });
+    it('sends setup message with the 3.1 model, compression, and transcription config on open', async () => {
+        const provider = makeProvider();
+        await connectWithSetup(provider);
+        const setupMsg = JSON.parse(lastCreatedWs.sent[0]);
+        expect(setupMsg.setup).toBeDefined();
+        expect(setupMsg.setup.model).toBe('models/gemini-3.1-flash-live-preview');
+        expect(setupMsg.setup.generationConfig.responseModalities).toEqual(['AUDIO']);
+        expect(setupMsg.setup.contextWindowCompression).toEqual({
+            slidingWindow: {},
+        });
+        expect(setupMsg.setup.realtimeInputConfig).toEqual({
+            activityHandling: 'START_OF_ACTIVITY_INTERRUPTS',
+        });
+        expect(setupMsg.setup.inputAudioTranscription).toEqual({});
+        expect(setupMsg.setup.outputAudioTranscription).toEqual({});
+    });
+    it('sends custom model, systemInstruction, and voiceName in setup', async () => {
+        const provider = makeProvider({
+            model: 'gemini-2.0-flash-exp',
+            systemInstruction: 'You are a helpful assistant.',
+            voiceName: 'Kore',
+            responseModalities: ['AUDIO', 'TEXT'],
+        });
+        await connectWithSetup(provider);
+        const setupMsg = JSON.parse(lastCreatedWs.sent[0]);
+        expect(setupMsg.setup.model).toBe('models/gemini-2.0-flash-exp');
+        expect(setupMsg.setup.systemInstruction).toEqual({
+            parts: [{ text: 'You are a helpful assistant.' }],
+        });
+        expect(setupMsg.setup.generationConfig.responseModalities).toEqual(['AUDIO', 'TEXT']);
+        expect(setupMsg.setup.generationConfig.speechConfig).toEqual({
+            voiceConfig: { prebuiltVoiceConfig: { voiceName: 'Kore' } },
+        });
+    });
+    it('includes historyConfig when initialHistoryInClientContent is enabled', async () => {
+        const provider = makeProvider({ initialHistoryInClientContent: true });
+        await connectWithSetup(provider);
+        const setupMsg = JSON.parse(lastCreatedWs.sent[0]);
+        expect(setupMsg.setup.historyConfig).toEqual({
+            initialHistoryInClientContent: true,
+        });
+    });
+    it('includes tools in setup message when provided', async () => {
+        const tools = {
+            functionDeclarations: [
+                { name: 'web_search', description: 'Search the web.', parameters: { type: 'OBJECT', properties: { query: { type: 'STRING' } }, required: ['query'] } },
+            ],
+        };
+        const provider = makeProvider({ tools });
+        await connectWithSetup(provider);
+        const setupMsg = JSON.parse(lastCreatedWs.sent[0]);
+        expect(setupMsg.setup.tools).toEqual([tools]);
+    });
+    it('omits tools from setup message when not provided', async () => {
+        const provider = makeProvider();
+        await connectWithSetup(provider);
+        const setupMsg = JSON.parse(lastCreatedWs.sent[0]);
+        expect(setupMsg.setup.tools).toBeUndefined();
+    });
+    it('transitions to open state after setupComplete', async () => {
+        const provider = makeProvider();
+        const events = collectEvents(provider);
+        expect(provider.state).toBe('idle');
+        await connectWithSetup(provider);
+        expect(provider.state).toBe('open');
+        expect(events).toContainEqual({ type: 'setup_complete' });
+    });
+    it('connect is idempotent when already connected', async () => {
+        const provider = makeProvider();
+        await connectWithSetup(provider);
+        const ws1 = lastCreatedWs;
+        // Second connect should be a no-op
+        await provider.connect();
+        expect(lastCreatedWs).toBe(ws1);
+    });
+    // -----------------------------------------------------------------------
+    // Sending audio
+    // -----------------------------------------------------------------------
+    it('sendAudio sends base64-encoded PCM as realtimeInput', async () => {
+        const provider = makeProvider();
+        await connectWithSetup(provider);
+        const pcm = Buffer.from([0x01, 0x02, 0x03, 0x04]);
+        provider.sendAudio(pcm);
+        // sent[0] is setup, sent[1] is the audio
+        const msg = JSON.parse(lastCreatedWs.sent[1]);
+        expect(msg.realtimeInput).toBeDefined();
+        expect(msg.realtimeInput.audio).toBeDefined();
+        expect(msg.realtimeInput.audio.mimeType).toBe('audio/pcm;rate=16000');
+        expect(msg.realtimeInput.audio.data).toBe(pcm.toString('base64'));
+    });
+    it('sendAudio throws when not connected', () => {
+        const provider = makeProvider();
+        expect(() => provider.sendAudio(Buffer.from([1]))).toThrow('Cannot sendAudio before connect()');
+    });
+    it('sendAudioStreamEnd sends realtimeInput audioStreamEnd', async () => {
+        const provider = makeProvider();
+        await connectWithSetup(provider);
+        provider.sendAudioStreamEnd();
+        const msg = JSON.parse(lastCreatedWs.sent[1]);
+        expect(msg.realtimeInput).toEqual({ audioStreamEnd: true });
+    });
+    // -----------------------------------------------------------------------
+    // Sending text
+    // -----------------------------------------------------------------------
+    it('sendText sends realtimeInput text for the default 3.1 live model', async () => {
+        const provider = makeProvider();
+        await connectWithSetup(provider);
+        provider.sendText('Hello there');
+        const msg = JSON.parse(lastCreatedWs.sent[1]);
+        expect(msg.realtimeInput).toEqual({ text: 'Hello there' });
+    });
+    it('sendText preserves clientContent for explicit 2.5 live models', async () => {
+        const provider = makeProvider({ model: 'gemini-2.5-flash-live-preview' });
+        await connectWithSetup(provider);
+        provider.sendText('Hello there');
+        const msg = JSON.parse(lastCreatedWs.sent[1]);
+        expect(msg.clientContent).toBeDefined();
+        expect(msg.clientContent.turns).toEqual([
+            { role: 'user', parts: [{ text: 'Hello there' }] },
+        ]);
+        expect(msg.clientContent.turnComplete).toBe(true);
+    });
+    it('sendText throws when not connected', () => {
+        const provider = makeProvider();
+        expect(() => provider.sendText('hello')).toThrow('Cannot sendText before connect()');
+    });
+    it('sendInitialHistory sends clientContent turns without completing the turn', async () => {
+        const provider = makeProvider({ initialHistoryInClientContent: true });
+        await connectWithSetup(provider);
+        provider.sendInitialHistory([
+            { role: 'user', parts: [{ text: 'Earlier user question' }] },
+            { role: 'model', parts: [{ text: 'Earlier model answer' }] },
+        ]);
+        const msg = JSON.parse(lastCreatedWs.sent[1]);
+        expect(msg.clientContent).toEqual({
+            turns: [
+                { role: 'user', parts: [{ text: 'Earlier user question' }] },
+                { role: 'model', parts: [{ text: 'Earlier model answer' }] },
+            ],
+            turnComplete: false,
+        });
+    });
+    it('sendInitialHistory throws when not connected', () => {
+        const provider = makeProvider();
+        expect(() => provider.sendInitialHistory([
+            { role: 'user', parts: [{ text: 'hello' }] },
+        ])).toThrow('Cannot sendInitialHistory before connect()');
+    });
+    // -----------------------------------------------------------------------
+    // Sending tool responses
+    // -----------------------------------------------------------------------
+    it('sendToolResponse sends functionResponses message', async () => {
+        const provider = makeProvider();
+        collectEvents(provider);
+        await connectWithSetup(provider);
+        // Simulate server sending tool calls so the IDs are registered as in-flight
+        lastCreatedWs._receiveMessage({
+            toolCall: {
+                functionCalls: [
+                    { id: 'call-1', name: 'bash', args: {} },
+                    { id: 'call-2', name: 'read_file', args: {} },
+                ],
+            },
+        });
+        provider.sendToolResponse([
+            { id: 'call-1', name: 'bash', output: '{"result":"ok"}', scheduling: 'INTERRUPT' },
+            { id: 'call-2', name: 'read_file', output: 'done', scheduling: 'SILENT' },
+        ]);
+        // sent[0] is setup, sent[1] is the tool response
+        const msg = JSON.parse(lastCreatedWs.sent[1]);
+        expect(msg.toolResponse).toBeDefined();
+        expect(msg.toolResponse.functionResponses).toEqual([
+            { id: 'call-1', name: 'bash', response: { result: '{"result":"ok"}', scheduling: 'INTERRUPT' } },
+            { id: 'call-2', name: 'read_file', response: { result: 'done', scheduling: 'SILENT' } },
+        ]);
+    });
+    it('sendToolResponse drops stale responses not in-flight', async () => {
+        const log = createLogger();
+        const provider = makeProvider({ log });
+        collectEvents(provider);
+        await connectWithSetup(provider);
+        // Send response without any tool call — should be silently dropped
+        provider.sendToolResponse([
+            { id: 'stale-1', name: 'bash', output: 'old result' },
+        ]);
+        // No message sent beyond the setup
+        expect(lastCreatedWs.sent).toHaveLength(1);
+        expect(log.warn).toHaveBeenCalledWith({ id: 'stale-1' }, 'Gemini Live: dropping stale tool response (not in-flight)');
+    });
+    it('sendToolResponse throws when not connected', () => {
+        const provider = makeProvider();
+        expect(() => provider.sendToolResponse([{ id: 'x', name: 'bash', output: 'y' }])).toThrow('Cannot sendToolResponse before connect()');
+    });
+    // -----------------------------------------------------------------------
+    // Receiving events
+    // -----------------------------------------------------------------------
+    it('emits audio events from serverContent with inlineData', async () => {
+        const provider = makeProvider();
+        const events = collectEvents(provider);
+        await connectWithSetup(provider);
+        const audioBytes = Buffer.from([10, 20, 30]);
+        lastCreatedWs._receiveMessage({
+            serverContent: {
+                modelTurn: {
+                    parts: [{ inlineData: { data: audioBytes.toString('base64') } }],
+                },
+            },
+        });
+        const audioEvents = events.filter((e) => e.type === 'audio');
+        expect(audioEvents).toHaveLength(1);
+        expect([...audioEvents[0].data]).toEqual([10, 20, 30]);
+    });
+    it('emits text events from serverContent', async () => {
+        const provider = makeProvider();
+        const events = collectEvents(provider);
+        await connectWithSetup(provider);
+        lastCreatedWs._receiveMessage({
+            serverContent: {
+                modelTurn: {
+                    parts: [{ text: 'Hello world' }],
+                },
+            },
+        });
+        const textEvents = events.filter((e) => e.type === 'text');
+        expect(textEvents).toHaveLength(1);
+        expect(textEvents[0].text).toBe('Hello world');
+    });
+    it('emits turn_complete event', async () => {
+        const provider = makeProvider();
+        const events = collectEvents(provider);
+        await connectWithSetup(provider);
+        lastCreatedWs._receiveMessage({
+            serverContent: { turnComplete: true },
+        });
+        expect(events).toContainEqual({ type: 'turn_complete' });
+    });
+    it('emits interrupted event', async () => {
+        const provider = makeProvider();
+        const events = collectEvents(provider);
+        await connectWithSetup(provider);
+        lastCreatedWs._receiveMessage({
+            serverContent: { interrupted: true },
+        });
+        expect(events).toContainEqual({ type: 'interrupted' });
+    });
+    it('does not drop turnComplete or transcription when interrupted is present in the same serverContent', async () => {
+        const provider = makeProvider();
+        const events = collectEvents(provider);
+        await connectWithSetup(provider);
+        lastCreatedWs._receiveMessage({
+            serverContent: {
+                interrupted: true,
+                turnComplete: true,
+                outputTranscription: { text: 'partial reply' },
+            },
+        });
+        expect(events).toContainEqual({ type: 'interrupted' });
+        expect(events).toContainEqual({ type: 'turn_complete' });
+        expect(events).toContainEqual({ type: 'text', text: 'partial reply' });
+    });
+    it('emits input_transcript event from serverContent with inputTranscription', async () => {
+        const provider = makeProvider();
+        const events = collectEvents(provider);
+        await connectWithSetup(provider);
+        lastCreatedWs._receiveMessage({
+            serverContent: {
+                inputTranscription: { text: 'Hello from the user' },
+            },
+        });
+        const transcriptEvents = events.filter((e) => e.type === 'input_transcript');
+        expect(transcriptEvents).toHaveLength(1);
+        expect(transcriptEvents[0].text).toBe('Hello from the user');
+    });
+    it('ignores empty inputTranscription in serverContent', async () => {
+        const provider = makeProvider();
+        const events = collectEvents(provider);
+        await connectWithSetup(provider);
+        lastCreatedWs._receiveMessage({
+            serverContent: {
+                inputTranscription: { text: '' },
+            },
+        });
+        const transcriptEvents = events.filter((e) => e.type === 'input_transcript');
+        expect(transcriptEvents).toHaveLength(0);
+    });
+    it('emits text event from serverContent outputTranscription', async () => {
+        const provider = makeProvider();
+        const events = collectEvents(provider);
+        await connectWithSetup(provider);
+        lastCreatedWs._receiveMessage({
+            serverContent: {
+                outputTranscription: { text: 'Hello from Gemini audio' },
+            },
+        });
+        const textEvents = events.filter((e) => e.type === 'text');
+        expect(textEvents).toHaveLength(1);
+        expect(textEvents[0].text).toBe('Hello from Gemini audio');
+    });
+    it('emits error event from server error message', async () => {
+        const provider = makeProvider();
+        const events = collectEvents(provider);
+        await connectWithSetup(provider);
+        lastCreatedWs._receiveMessage({
+            error: { message: 'Rate limit exceeded', code: 429 },
+        });
+        const errorEvents = events.filter((e) => e.type === 'error');
+        expect(errorEvents).toHaveLength(1);
+        expect(errorEvents[0].error).toBe('Rate limit exceeded');
+    });
+    it('emits tool_call events from server toolCall message', async () => {
+        const provider = makeProvider();
+        const events = collectEvents(provider);
+        await connectWithSetup(provider);
+        lastCreatedWs._receiveMessage({
+            toolCall: {
+                functionCalls: [
+                    { id: 'fc-1', name: 'web_search', args: { query: 'hello' } },
+                    { id: 'fc-2', name: 'read_file', args: { file_path: '/tmp/x' } },
+                ],
+            },
+        });
+        const toolEvents = events.filter((e) => e.type === 'tool_call');
+        expect(toolEvents).toHaveLength(1);
+        const tc = toolEvents[0];
+        expect(tc.functionCalls).toHaveLength(2);
+        expect(tc.functionCalls[0]).toEqual({ id: 'fc-1', name: 'web_search', args: { query: 'hello' } });
+        expect(tc.functionCalls[1]).toEqual({ id: 'fc-2', name: 'read_file', args: { file_path: '/tmp/x' } });
+    });
+    it('ignores toolCall messages with empty functionCalls', async () => {
+        const provider = makeProvider();
+        const events = collectEvents(provider);
+        await connectWithSetup(provider);
+        lastCreatedWs._receiveMessage({ toolCall: { functionCalls: [] } });
+        const toolEvents = events.filter((e) => e.type === 'tool_call');
+        expect(toolEvents).toHaveLength(0);
+    });
+    it('handles mixed audio and text parts in a single message', async () => {
+        const provider = makeProvider();
+        const events = collectEvents(provider);
+        await connectWithSetup(provider);
+        const audioBytes = Buffer.from([1, 2]);
+        lastCreatedWs._receiveMessage({
+            serverContent: {
+                modelTurn: {
+                    parts: [
+                        { inlineData: { data: audioBytes.toString('base64') } },
+                        { text: 'transcript' },
+                    ],
+                },
+            },
+        });
+        const audioEvents = events.filter((e) => e.type === 'audio');
+        const textEvents = events.filter((e) => e.type === 'text');
+        expect(audioEvents).toHaveLength(1);
+        expect(textEvents).toHaveLength(1);
+    });
+    it('logs unrecognized message shapes', async () => {
+        const log = createLogger();
+        const provider = makeProvider({ log });
+        await connectWithSetup(provider);
+        lastCreatedWs._receiveMessage({ unknownField: true });
+        expect(log.warn).toHaveBeenCalledWith({ keys: 'unknownField' }, 'Gemini Live: unrecognized message');
+    });
+    // -----------------------------------------------------------------------
+    // Disconnect
+    // -----------------------------------------------------------------------
+    it('disconnect closes the WebSocket and transitions to stopped', async () => {
+        const provider = makeProvider();
+        await connectWithSetup(provider);
+        const ws = lastCreatedWs;
+        await provider.disconnect();
+        expect(ws.readyState).toBe(MockWebSocket.CLOSED);
+        expect(provider.state).toBe('stopped');
+    });
+    it('double disconnect is idempotent', async () => {
+        const provider = makeProvider();
+        await connectWithSetup(provider);
+        await provider.disconnect();
+        await provider.disconnect(); // should not throw
+        expect(provider.state).toBe('stopped');
+    });
+    it('disconnect during connect rejects the connect promise', async () => {
+        const provider = makeProvider();
+        const connectPromise = provider.connect();
+        // Wait for WS to open and enter setup state
+        await new Promise((r) => setTimeout(r, 5));
+        expect(provider.state).toBe('setup');
+        // Disconnect while setup is in progress
+        await provider.disconnect();
+        // The connect promise should reject, not hang
+        await expect(connectPromise).rejects.toThrow('disconnect() called');
+        expect(provider.state).toBe('stopped');
+    });
+    it('sendAudio after disconnect throws', async () => {
+        const provider = makeProvider();
+        await connectWithSetup(provider);
+        await provider.disconnect();
+        expect(() => provider.sendAudio(Buffer.from([1]))).toThrow('Cannot sendAudio before connect()');
+    });
+    // -----------------------------------------------------------------------
+    // Reconnection
+    // -----------------------------------------------------------------------
+    it('resets retry counter after successful reconnect so long-lived sessions survive', async () => {
+        vi.useFakeTimers();
+        const log = createLogger();
+        const provider = makeProvider({ log });
+        // Initial connect
+        const connectP = provider.connect();
+        await vi.advanceTimersByTimeAsync(0);
+        lastCreatedWs._receiveMessage({ setupComplete: {} });
+        await connectP;
+        // Simulate 5 successive drop-then-reconnect cycles — each should succeed
+        // because the retry counter resets after each successful reconnect.
+        for (let i = 0; i < 5; i++) {
+            lastCreatedWs._triggerClose(1006);
+            // First retry delay is always 500ms (retryCount goes 0→1, backoff = 500 * 2^0)
+            await vi.advanceTimersByTimeAsync(500);
+            await vi.advanceTimersByTimeAsync(0);
+            lastCreatedWs._receiveMessage({ setupComplete: {} });
+            expect(provider.state).toBe('open');
+        }
+        // All 5 reconnects succeeded — provider is still alive
+        expect(log.error).not.toHaveBeenCalled();
+        vi.useRealTimers();
+    });
+    it('exhausts retries when consecutive reconnect attempts fail', async () => {
+        vi.useFakeTimers();
+        const log = createLogger();
+        // Factory that produces websockets which open but never complete setup
+        let closeCount = 0;
+        function failingWsFactory(url) {
+            const ws = new MockWebSocket(url);
+            lastCreatedWs = ws;
+            // After the first successful connect, make all subsequent WS connections
+            // close immediately after open (simulating persistent failure)
+            if (closeCount > 0) {
+                const origEmit = ws.emit.bind(ws);
+                ws.emit = function (event, ...args) {
+                    origEmit(event, ...args);
+                    if (event === 'open') {
+                        queueMicrotask(() => ws._triggerClose(1006));
+                    }
+                    return true;
+                };
+            }
+            return ws;
+        }
+        const provider = new GeminiLiveProvider({
+            apiKey: 'key',
+            log,
+            // eslint-disable-next-line @typescript-eslint/no-explicit-any
+            wsFactory: failingWsFactory,
+        });
+        // Initial connect succeeds
+        const connectP = provider.connect();
+        await vi.advanceTimersByTimeAsync(0);
+        lastCreatedWs._receiveMessage({ setupComplete: {} });
+        await connectP;
+        // Trigger first unexpected close — all subsequent reconnects will fail
+        closeCount = 1;
+        lastCreatedWs._triggerClose(1006);
+        // Exhaust all 3 retries (500ms, 1000ms, 2000ms)
+        for (const delay of [500, 1000, 2000]) {
+            await vi.advanceTimersByTimeAsync(delay);
+            await vi.advanceTimersByTimeAsync(0);
+            await vi.advanceTimersByTimeAsync(0);
+        }
+        expect(provider.state).toBe('stopped');
+        expect(vi.mocked(log.error).mock.calls.some((c) => typeof c[1] === 'string' && c[1].includes('exhausted'))).toBe(true);
+        vi.useRealTimers();
+    });
+    it('does not reconnect after explicit disconnect', async () => {
+        vi.useFakeTimers();
+        const log = createLogger();
+        const provider = makeProvider({ log });
+        const connectP = provider.connect();
+        await vi.advanceTimersByTimeAsync(0);
+        lastCreatedWs._receiveMessage({ setupComplete: {} });
+        await connectP;
+        await provider.disconnect();
+        // Trigger close — should be a no-op since state is 'stopped'
+        lastCreatedWs._triggerClose(1006);
+        await vi.advanceTimersByTimeAsync(5000);
+        expect(log.warn).not.toHaveBeenCalled();
+        vi.useRealTimers();
+    });
+    // -----------------------------------------------------------------------
+    // Session resume handle
+    // -----------------------------------------------------------------------
+    it('captures session resume handle from server and includes it on reconnect', async () => {
+        vi.useFakeTimers();
+        const provider = makeProvider();
+        // Initial connect
+        const connectP = provider.connect();
+        await vi.advanceTimersByTimeAsync(0);
+        lastCreatedWs._receiveMessage({ setupComplete: {} });
+        await connectP;
+        // Server sends a session resumption update
+        lastCreatedWs._receiveMessage({
+            sessionResumptionUpdate: { newHandle: 'resume-token-abc' },
+        });
+        // Trigger unexpected close — should reconnect with resume handle
+        lastCreatedWs._triggerClose(1006);
+        await vi.advanceTimersByTimeAsync(500);
+        await vi.advanceTimersByTimeAsync(0);
+        // Check the setup message on reconnect includes the resume handle
+        const reconnectSetup = JSON.parse(lastCreatedWs.sent[0]);
+        expect(reconnectSetup.setup.sessionResumption).toEqual({
+            handle: 'resume-token-abc',
+        });
+        lastCreatedWs._receiveMessage({ setupComplete: {} });
+        vi.useRealTimers();
+    });
+    it('does not include sessionResumption on first connect', async () => {
+        const provider = makeProvider();
+        await connectWithSetup(provider);
+        const setupMsg = JSON.parse(lastCreatedWs.sent[0]);
+        expect(setupMsg.setup.sessionResumption).toBeUndefined();
+    });
+    // -----------------------------------------------------------------------
+    // Token estimation and threshold warnings
+    // -----------------------------------------------------------------------
+    describe('token estimation', () => {
+        it('emits token_warning at warn threshold via sendText', async () => {
+            const provider = makeProvider({ tokenBudget: { warnAt: 2, compressAt: 1000 } });
+            const events = collectEvents(provider);
+            await connectWithSetup(provider);
+            // 8 chars -> ceil(8/4) = 2 tokens -> crosses warn threshold
+            provider.sendText('12345678');
+            const warnings = events.filter((e) => e.type === 'token_warning');
+            expect(warnings).toHaveLength(1);
+            expect(warnings[0]).toMatchObject({ type: 'token_warning', threshold: 'warn' });
+        });
+        it('emits token_warning only once per threshold crossing', async () => {
+            const provider = makeProvider({ tokenBudget: { warnAt: 2, compressAt: 1000 } });
+            const events = collectEvents(provider);
+            await connectWithSetup(provider);
+            provider.sendText('12345678'); // crosses warn
+            provider.sendText('more text'); // still above warn, but already emitted
+            const warnings = events.filter((e) => e.type === 'token_warning');
+            expect(warnings).toHaveLength(1);
+        });
+        it('emits compress threshold and triggers proactive rotation', async () => {
+            vi.useFakeTimers();
+            const provider = makeProvider({ tokenBudget: { warnAt: 1, compressAt: 3 } });
+            const events = collectEvents(provider);
+            const connectP = provider.connect();
+            await vi.advanceTimersByTimeAsync(0);
+            lastCreatedWs._receiveMessage({ setupComplete: {} });
+            await connectP;
+            // 12 chars -> ceil(12/4) = 3 tokens -> crosses compress
+            provider.sendText('123456789012');
+            const warnings = events.filter((e) => e.type === 'token_warning');
+            expect(warnings.some((w) => w.threshold === 'compress')).toBe(true);
+            // Compress threshold should trigger session_rotating via graceful reconnect
+            const rotations = events.filter((e) => e.type === 'session_rotating');
+            expect(rotations).toHaveLength(1);
+            vi.useRealTimers();
+        });
+        it('tracks audio token usage via sendAudio', async () => {
+            const provider = makeProvider({ tokenBudget: { warnAt: 20, compressAt: 1000 } });
+            const events = collectEvents(provider);
+            await connectWithSetup(provider);
+            // 32000 bytes of 16kHz PCM = 1 second = 25 tokens -> crosses warn at 20
+            provider.sendAudio(Buffer.alloc(32_000));
+            const warnings = events.filter((e) => e.type === 'token_warning');
+            expect(warnings).toHaveLength(1);
+            expect(warnings[0]).toMatchObject({ type: 'token_warning', threshold: 'warn' });
+        });
+        it('tracks output audio and text tokens from server messages', async () => {
+            const provider = makeProvider({ tokenBudget: { warnAt: 20, compressAt: 1000 } });
+            const events = collectEvents(provider);
+            await connectWithSetup(provider);
+            // Server sends 48000 bytes of output audio (24kHz, 1 second = 25 tokens)
+            const audioBytes = Buffer.alloc(48_000);
+            lastCreatedWs._receiveMessage({
+                serverContent: {
+                    modelTurn: {
+                        parts: [{ inlineData: { data: audioBytes.toString('base64') } }],
+                    },
+                },
+            });
+            const warnings = events.filter((e) => e.type === 'token_warning');
+            expect(warnings).toHaveLength(1);
+        });
+    });
+    // -----------------------------------------------------------------------
+    // Connection failure
+    // -----------------------------------------------------------------------
+    it('rejects connect() if WebSocket closes during setup', async () => {
+        function failWsFactory(url) {
+            const ws = new MockWebSocket(url);
+            // Override auto-open: open then immediately close before setup completes
+            const origEmit = ws.emit.bind(ws);
+            ws.emit = function (event, ...args) {
+                origEmit(event, ...args);
+                if (event === 'open') {
+                    queueMicrotask(() => ws._triggerClose(1006));
+                }
+                return true;
+            };
+            lastCreatedWs = ws;
+            return ws;
+        }
+        const provider = new GeminiLiveProvider({
+            apiKey: 'key',
+            log: createLogger(),
+            // eslint-disable-next-line @typescript-eslint/no-explicit-any
+            wsFactory: failWsFactory,
+        });
+        await expect(provider.connect()).rejects.toThrow('closed during connect');
+    });
+    // -----------------------------------------------------------------------
+    // WebSocket error handling
+    // -----------------------------------------------------------------------
+    it('logs WebSocket errors without crashing', async () => {
+        const log = createLogger();
+        const provider = makeProvider({ log });
+        await connectWithSetup(provider);
+        lastCreatedWs._triggerError('connection reset');
+        expect(log.error).toHaveBeenCalledWith({ err: 'connection reset' }, 'Gemini Live WebSocket error');
+    });
+    it('handles malformed JSON messages gracefully', async () => {
+        const log = createLogger();
+        const provider = makeProvider({ log });
+        await connectWithSetup(provider);
+        // Send raw invalid JSON
+        lastCreatedWs.emit('message', 'not json at all');
+        expect(log.error).toHaveBeenCalled();
+        const errorCall = vi.mocked(log.error).mock.calls.find((c) => typeof c[1] === 'string' && c[1].includes('Failed to parse'));
+        expect(errorCall).toBeDefined();
+    });
+    // -----------------------------------------------------------------------
+    // Session rotation
+    // -----------------------------------------------------------------------
+    describe('session rotation', () => {
+        it('fires at configured threshold and triggers reconnect', async () => {
+            vi.useFakeTimers();
+            const provider = makeProvider({ sessionRotationMs: 5000 });
+            const events = collectEvents(provider);
+            const connectP = provider.connect();
+            await vi.advanceTimersByTimeAsync(0);
+            lastCreatedWs._receiveMessage({ setupComplete: {} });
+            await connectP;
+            // Advance to just before threshold — no rotation yet
+            await vi.advanceTimersByTimeAsync(4999);
+            expect(events.filter((e) => e.type === 'session_rotating')).toHaveLength(0);
+            // Advance past threshold — rotation fires, closes WS
+            await vi.advanceTimersByTimeAsync(1);
+            expect(events.filter((e) => e.type === 'session_rotating')).toHaveLength(1);
+            // The WS close triggers reconnect
+            await vi.advanceTimersByTimeAsync(0); // microtask for MockWebSocket close event
+            await vi.advanceTimersByTimeAsync(500); // reconnect backoff
+            await vi.advanceTimersByTimeAsync(0); // microtask for new WS open
+            // Complete the reconnect
+            lastCreatedWs._receiveMessage({ setupComplete: {} });
+            expect(provider.state).toBe('open');
+            expect(events.filter((e) => e.type === 'reconnected')).toHaveLength(1);
+            vi.useRealTimers();
+        });
+        it('resets timer after successful reconnect (survives multiple rotations)', async () => {
+            vi.useFakeTimers();
+            const provider = makeProvider({ sessionRotationMs: 3000 });
+            const events = collectEvents(provider);
+            const connectP = provider.connect();
+            await vi.advanceTimersByTimeAsync(0);
+            lastCreatedWs._receiveMessage({ setupComplete: {} });
+            await connectP;
+            for (let i = 0; i < 3; i++) {
+                // Wait for rotation
+                await vi.advanceTimersByTimeAsync(3000);
+                // Process close microtask + reconnect backoff + open microtask
+                await vi.advanceTimersByTimeAsync(0);
+                await vi.advanceTimersByTimeAsync(500);
+                await vi.advanceTimersByTimeAsync(0);
+                lastCreatedWs._receiveMessage({ setupComplete: {} });
+                expect(provider.state).toBe('open');
+            }
+            expect(events.filter((e) => e.type === 'session_rotating')).toHaveLength(3);
+            expect(events.filter((e) => e.type === 'reconnected')).toHaveLength(3);
+            vi.useRealTimers();
+        });
+        it('cancels timer on explicit disconnect', async () => {
+            vi.useFakeTimers();
+            const provider = makeProvider({ sessionRotationMs: 5000 });
+            const events = collectEvents(provider);
+            const connectP = provider.connect();
+            await vi.advanceTimersByTimeAsync(0);
+            lastCreatedWs._receiveMessage({ setupComplete: {} });
+            await connectP;
+            await provider.disconnect();
+            // Advance well past the threshold — no rotation should fire
+            await vi.advanceTimersByTimeAsync(10000);
+            expect(events.filter((e) => e.type === 'session_rotating')).toHaveLength(0);
+            vi.useRealTimers();
+        });
+        it('rotation with a long-expired resume handle falls through to fresh session', async () => {
+            vi.useFakeTimers();
+            // Use a rotation threshold longer than the resume handle TTL (2h)
+            // so the handle expires before rotation fires.
+            const provider = makeProvider({ sessionRotationMs: 7_300_000 });
+            const connectP = provider.connect();
+            await vi.advanceTimersByTimeAsync(0);
+            lastCreatedWs._receiveMessage({ setupComplete: {} });
+            await connectP;
+            // Server sends a resume handle
+            lastCreatedWs._receiveMessage({
+                sessionResumptionUpdate: { newHandle: 'handle-xyz' },
+            });
+            // Advance past the resume handle TTL (2h) but before rotation threshold
+            await vi.advanceTimersByTimeAsync(7_210_000);
+            // Now advance to rotation threshold
+            await vi.advanceTimersByTimeAsync(90_000);
+            // Process close microtask + reconnect backoff + open microtask
+            await vi.advanceTimersByTimeAsync(0);
+            await vi.advanceTimersByTimeAsync(500);
+            await vi.advanceTimersByTimeAsync(0);
+            // The reconnect setup should NOT include the expired handle
+            const reconnectSetup = JSON.parse(lastCreatedWs.sent[0]);
+            expect(reconnectSetup.setup.sessionResumption).toBeUndefined();
+            lastCreatedWs._receiveMessage({ setupComplete: {} });
+            expect(provider.state).toBe('open');
+            vi.useRealTimers();
+        });
+        it('disables rotation when threshold is 0', async () => {
+            vi.useFakeTimers();
+            const provider = makeProvider({ sessionRotationMs: 0 });
+            const events = collectEvents(provider);
+            const connectP = provider.connect();
+            await vi.advanceTimersByTimeAsync(0);
+            lastCreatedWs._receiveMessage({ setupComplete: {} });
+            await connectP;
+            // Advance well past default threshold — no rotation
+            await vi.advanceTimersByTimeAsync(900_000);
+            expect(events.filter((e) => e.type === 'session_rotating')).toHaveLength(0);
+            expect(provider.state).toBe('open');
+            vi.useRealTimers();
+        });
+    });
+});