npm - @livekit/agents - Versions diffs - 1.0.46 → 1.0.48 - Mend

@livekit/agents 1.0.46 → 1.0.48

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (228) hide show

package/dist/beta/index.cjs +29 -0
package/dist/beta/index.cjs.map +1 -0
package/dist/beta/index.d.cts +2 -0
package/dist/beta/index.d.ts +2 -0
package/dist/beta/index.d.ts.map +1 -0
package/dist/beta/index.js +7 -0
package/dist/beta/index.js.map +1 -0
package/dist/beta/workflows/index.cjs +29 -0
package/dist/beta/workflows/index.cjs.map +1 -0
package/dist/beta/workflows/index.d.cts +2 -0
package/dist/beta/workflows/index.d.ts +2 -0
package/dist/beta/workflows/index.d.ts.map +1 -0
package/dist/beta/workflows/index.js +7 -0
package/dist/beta/workflows/index.js.map +1 -0
package/dist/beta/workflows/task_group.cjs +162 -0
package/dist/beta/workflows/task_group.cjs.map +1 -0
package/dist/beta/workflows/task_group.d.cts +32 -0
package/dist/beta/workflows/task_group.d.ts +32 -0
package/dist/beta/workflows/task_group.d.ts.map +1 -0
package/dist/beta/workflows/task_group.js +138 -0
package/dist/beta/workflows/task_group.js.map +1 -0
package/dist/cli.cjs +14 -20
package/dist/cli.cjs.map +1 -1
package/dist/cli.d.ts.map +1 -1
package/dist/cli.js +14 -20
package/dist/cli.js.map +1 -1
package/dist/index.cjs +3 -0
package/dist/index.cjs.map +1 -1
package/dist/index.d.cts +2 -1
package/dist/index.d.ts +2 -1
package/dist/index.d.ts.map +1 -1
package/dist/index.js +2 -0
package/dist/index.js.map +1 -1
package/dist/inference/api_protos.d.cts +59 -59
package/dist/inference/api_protos.d.ts +59 -59
package/dist/ipc/job_proc_lazy_main.cjs +14 -5
package/dist/ipc/job_proc_lazy_main.cjs.map +1 -1
package/dist/ipc/job_proc_lazy_main.js +14 -5
package/dist/ipc/job_proc_lazy_main.js.map +1 -1
package/dist/llm/chat_context.cjs +108 -1
package/dist/llm/chat_context.cjs.map +1 -1
package/dist/llm/chat_context.d.cts +14 -1
package/dist/llm/chat_context.d.ts +14 -1
package/dist/llm/chat_context.d.ts.map +1 -1
package/dist/llm/chat_context.js +108 -1
package/dist/llm/chat_context.js.map +1 -1
package/dist/llm/chat_context.test.cjs +43 -0
package/dist/llm/chat_context.test.cjs.map +1 -1
package/dist/llm/chat_context.test.js +43 -0
package/dist/llm/chat_context.test.js.map +1 -1
package/dist/llm/index.cjs +2 -0
package/dist/llm/index.cjs.map +1 -1
package/dist/llm/index.d.cts +1 -1
package/dist/llm/index.d.ts +1 -1
package/dist/llm/index.d.ts.map +1 -1
package/dist/llm/index.js +3 -1
package/dist/llm/index.js.map +1 -1
package/dist/llm/provider_format/index.cjs +2 -0
package/dist/llm/provider_format/index.cjs.map +1 -1
package/dist/llm/provider_format/index.d.cts +2 -2
package/dist/llm/provider_format/index.d.ts +2 -2
package/dist/llm/provider_format/index.d.ts.map +1 -1
package/dist/llm/provider_format/index.js +6 -1
package/dist/llm/provider_format/index.js.map +1 -1
package/dist/llm/provider_format/openai.cjs +82 -2
package/dist/llm/provider_format/openai.cjs.map +1 -1
package/dist/llm/provider_format/openai.d.cts +1 -0
package/dist/llm/provider_format/openai.d.ts +1 -0
package/dist/llm/provider_format/openai.d.ts.map +1 -1
package/dist/llm/provider_format/openai.js +80 -1
package/dist/llm/provider_format/openai.js.map +1 -1
package/dist/llm/provider_format/openai.test.cjs +326 -0
package/dist/llm/provider_format/openai.test.cjs.map +1 -1
package/dist/llm/provider_format/openai.test.js +327 -1
package/dist/llm/provider_format/openai.test.js.map +1 -1
package/dist/llm/provider_format/utils.cjs +4 -3
package/dist/llm/provider_format/utils.cjs.map +1 -1
package/dist/llm/provider_format/utils.d.ts.map +1 -1
package/dist/llm/provider_format/utils.js +4 -3
package/dist/llm/provider_format/utils.js.map +1 -1
package/dist/llm/realtime.cjs.map +1 -1
package/dist/llm/realtime.d.cts +1 -0
package/dist/llm/realtime.d.ts +1 -0
package/dist/llm/realtime.d.ts.map +1 -1
package/dist/llm/realtime.js.map +1 -1
package/dist/llm/tool_context.cjs +7 -0
package/dist/llm/tool_context.cjs.map +1 -1
package/dist/llm/tool_context.d.cts +10 -2
package/dist/llm/tool_context.d.ts +10 -2
package/dist/llm/tool_context.d.ts.map +1 -1
package/dist/llm/tool_context.js +6 -0
package/dist/llm/tool_context.js.map +1 -1
package/dist/log.cjs +5 -2
package/dist/log.cjs.map +1 -1
package/dist/log.d.ts.map +1 -1
package/dist/log.js +5 -2
package/dist/log.js.map +1 -1
package/dist/stream/deferred_stream.cjs +15 -6
package/dist/stream/deferred_stream.cjs.map +1 -1
package/dist/stream/deferred_stream.d.ts.map +1 -1
package/dist/stream/deferred_stream.js +15 -6
package/dist/stream/deferred_stream.js.map +1 -1
package/dist/utils.cjs +32 -2
package/dist/utils.cjs.map +1 -1
package/dist/utils.d.cts +7 -0
package/dist/utils.d.ts +7 -0
package/dist/utils.d.ts.map +1 -1
package/dist/utils.js +32 -2
package/dist/utils.js.map +1 -1
package/dist/utils.test.cjs +71 -0
package/dist/utils.test.cjs.map +1 -1
package/dist/utils.test.js +71 -0
package/dist/utils.test.js.map +1 -1
package/dist/version.cjs +1 -1
package/dist/version.cjs.map +1 -1
package/dist/version.d.cts +1 -1
package/dist/version.d.ts +1 -1
package/dist/version.d.ts.map +1 -1
package/dist/version.js +1 -1
package/dist/version.js.map +1 -1
package/dist/voice/agent.cjs +153 -12
package/dist/voice/agent.cjs.map +1 -1
package/dist/voice/agent.d.cts +30 -4
package/dist/voice/agent.d.ts +30 -4
package/dist/voice/agent.d.ts.map +1 -1
package/dist/voice/agent.js +149 -11
package/dist/voice/agent.js.map +1 -1
package/dist/voice/agent.test.cjs +120 -0
package/dist/voice/agent.test.cjs.map +1 -1
package/dist/voice/agent.test.js +122 -2
package/dist/voice/agent.test.js.map +1 -1
package/dist/voice/agent_activity.cjs +406 -298
package/dist/voice/agent_activity.cjs.map +1 -1
package/dist/voice/agent_activity.d.cts +41 -7
package/dist/voice/agent_activity.d.ts +41 -7
package/dist/voice/agent_activity.d.ts.map +1 -1
package/dist/voice/agent_activity.js +407 -294
package/dist/voice/agent_activity.js.map +1 -1
package/dist/voice/agent_session.cjs +140 -40
package/dist/voice/agent_session.cjs.map +1 -1
package/dist/voice/agent_session.d.cts +19 -7
package/dist/voice/agent_session.d.ts +19 -7
package/dist/voice/agent_session.d.ts.map +1 -1
package/dist/voice/agent_session.js +137 -37
package/dist/voice/agent_session.js.map +1 -1
package/dist/voice/audio_recognition.cjs +4 -0
package/dist/voice/audio_recognition.cjs.map +1 -1
package/dist/voice/audio_recognition.d.ts.map +1 -1
package/dist/voice/audio_recognition.js +4 -0
package/dist/voice/audio_recognition.js.map +1 -1
package/dist/voice/generation.cjs +39 -19
package/dist/voice/generation.cjs.map +1 -1
package/dist/voice/generation.d.ts.map +1 -1
package/dist/voice/generation.js +44 -20
package/dist/voice/generation.js.map +1 -1
package/dist/voice/index.cjs +2 -0
package/dist/voice/index.cjs.map +1 -1
package/dist/voice/index.d.cts +1 -1
package/dist/voice/index.d.ts +1 -1
package/dist/voice/index.d.ts.map +1 -1
package/dist/voice/index.js +2 -1
package/dist/voice/index.js.map +1 -1
package/dist/voice/room_io/room_io.cjs +11 -2
package/dist/voice/room_io/room_io.cjs.map +1 -1
package/dist/voice/room_io/room_io.d.ts.map +1 -1
package/dist/voice/room_io/room_io.js +12 -3
package/dist/voice/room_io/room_io.js.map +1 -1
package/dist/voice/speech_handle.cjs +7 -1
package/dist/voice/speech_handle.cjs.map +1 -1
package/dist/voice/speech_handle.d.cts +2 -0
package/dist/voice/speech_handle.d.ts +2 -0
package/dist/voice/speech_handle.d.ts.map +1 -1
package/dist/voice/speech_handle.js +8 -2
package/dist/voice/speech_handle.js.map +1 -1
package/dist/voice/testing/fake_llm.cjs +127 -0
package/dist/voice/testing/fake_llm.cjs.map +1 -0
package/dist/voice/testing/fake_llm.d.cts +30 -0
package/dist/voice/testing/fake_llm.d.ts +30 -0
package/dist/voice/testing/fake_llm.d.ts.map +1 -0
package/dist/voice/testing/fake_llm.js +103 -0
package/dist/voice/testing/fake_llm.js.map +1 -0
package/dist/voice/testing/index.cjs +3 -0
package/dist/voice/testing/index.cjs.map +1 -1
package/dist/voice/testing/index.d.cts +1 -0
package/dist/voice/testing/index.d.ts +1 -0
package/dist/voice/testing/index.d.ts.map +1 -1
package/dist/voice/testing/index.js +2 -0
package/dist/voice/testing/index.js.map +1 -1
package/dist/voice/testing/run_result.cjs +66 -15
package/dist/voice/testing/run_result.cjs.map +1 -1
package/dist/voice/testing/run_result.d.cts +14 -3
package/dist/voice/testing/run_result.d.ts +14 -3
package/dist/voice/testing/run_result.d.ts.map +1 -1
package/dist/voice/testing/run_result.js +66 -15
package/dist/voice/testing/run_result.js.map +1 -1
package/package.json +1 -1
package/src/beta/index.ts +9 -0
package/src/beta/workflows/index.ts +9 -0
package/src/beta/workflows/task_group.ts +194 -0
package/src/cli.ts +20 -33
package/src/index.ts +2 -1
package/src/ipc/job_proc_lazy_main.ts +16 -5
package/src/llm/chat_context.test.ts +48 -0
package/src/llm/chat_context.ts +158 -0
package/src/llm/index.ts +1 -0
package/src/llm/provider_format/index.ts +7 -2
package/src/llm/provider_format/openai.test.ts +385 -1
package/src/llm/provider_format/openai.ts +103 -0
package/src/llm/provider_format/utils.ts +6 -4
package/src/llm/realtime.ts +1 -0
package/src/llm/tool_context.ts +14 -0
package/src/log.ts +5 -2
package/src/stream/deferred_stream.ts +17 -6
package/src/utils.test.ts +87 -0
package/src/utils.ts +41 -2
package/src/version.ts +1 -1
package/src/voice/agent.test.ts +140 -2
package/src/voice/agent.ts +200 -10
package/src/voice/agent_activity.ts +466 -290
package/src/voice/agent_session.ts +178 -40
package/src/voice/audio_recognition.ts +4 -0
package/src/voice/generation.ts +52 -23
package/src/voice/index.ts +1 -1
package/src/voice/room_io/room_io.ts +14 -3
package/src/voice/speech_handle.ts +9 -2
package/src/voice/testing/fake_llm.ts +138 -0
package/src/voice/testing/index.ts +2 -0
package/src/voice/testing/run_result.ts +81 -23

package/src/llm/provider_format/openai.test.ts CHANGED Viewed

@@ -11,7 +11,7 @@ import {
   FunctionCallOutput,
 } from '../chat_context.js';
 import { serializeImage } from '../utils.js';
-import { toChatCtx } from './openai.js';
+import { toChatCtx, toResponsesChatCtx } from './openai.js';
 // Mock the serializeImage function
 vi.mock('../utils.js', () => ({
@@ -673,3 +673,387 @@ describe('toChatCtx', () => {
     ]);
   });
 });
+describe('toResponsesChatCtx', () => {
+  const serializeImageMock = vi.mocked(serializeImage);
+  initializeLogger({ level: 'silent', pretty: false });
+  beforeEach(async () => {
+    vi.clearAllMocks();
+  });
+  it('should convert simple text messages', async () => {
+    const ctx = ChatContext.empty();
+    ctx.addMessage({ role: 'user', content: 'Hello' });
+    ctx.addMessage({ role: 'assistant', content: 'Hi there!' });
+    const result = await toResponsesChatCtx(ctx);
+    expect(result).toHaveLength(2);
+    expect(result[0]).toEqual({ role: 'user', content: 'Hello' });
+    expect(result[1]).toEqual({ role: 'assistant', content: 'Hi there!' });
+  });
+  it('should handle system messages', async () => {
+    const ctx = ChatContext.empty();
+    ctx.addMessage({ role: 'system', content: 'You are a helpful assistant' });
+    ctx.addMessage({ role: 'user', content: 'Hello' });
+    const result = await toResponsesChatCtx(ctx);
+    expect(result).toHaveLength(2);
+    expect(result[0]).toEqual({ role: 'system', content: 'You are a helpful assistant' });
+    expect(result[1]).toEqual({ role: 'user', content: 'Hello' });
+  });
+  it('should handle multi-line text content', async () => {
+    const ctx = ChatContext.empty();
+    ctx.addMessage({ role: 'user', content: ['Line 1', 'Line 2', 'Line 3'] });
+    const result = await toResponsesChatCtx(ctx);
+    expect(result).toHaveLength(1);
+    expect(result[0]).toEqual({ role: 'user', content: 'Line 1\nLine 2\nLine 3' });
+  });
+  it('should convert images to input_image format with external URL', async () => {
+    serializeImageMock.mockResolvedValue({
+      inferenceDetail: 'high',
+      externalUrl: 'https://example.com/image.jpg',
+    });
+    const ctx = ChatContext.empty();
+    ctx.addMessage({
+      role: 'user',
+      content: [
+        {
+          id: 'img1',
+          type: 'image_content',
+          image: 'https://example.com/image.jpg',
+          inferenceDetail: 'high',
+          _cache: {},
+        },
+      ],
+    });
+    const result = await toResponsesChatCtx(ctx);
+    expect(result).toEqual([
+      {
+        role: 'user',
+        content: [
+          {
+            type: 'input_image',
+            image_url: 'https://example.com/image.jpg',
+            detail: 'high',
+          },
+        ],
+      },
+    ]);
+  });
+  it('should convert images to input_image format with base64 data', async () => {
+    serializeImageMock.mockResolvedValue({
+      inferenceDetail: 'auto',
+      mimeType: 'image/png',
+      base64Data: 'iVBORw0KGgoAAAANSUhEUgAAAAEAAAAB',
+    });
+    const ctx = ChatContext.empty();
+    ctx.addMessage({
+      role: 'user',
+      content: [
+        {
+          id: 'img1',
+          type: 'image_content',
+          image: 'data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAAAAB',
+          inferenceDetail: 'auto',
+          _cache: {},
+        },
+      ],
+    });
+    const result = await toResponsesChatCtx(ctx);
+    expect(result).toEqual([
+      {
+        role: 'user',
+        content: [
+          {
+            type: 'input_image',
+            image_url: 'data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAAAAB',
+            detail: 'auto',
+          },
+        ],
+      },
+    ]);
+  });
+  it('should handle mixed content with text and image using input_text', async () => {
+    serializeImageMock.mockResolvedValue({
+      inferenceDetail: 'high',
+      externalUrl: 'https://example.com/image.jpg',
+    });
+    const ctx = ChatContext.empty();
+    ctx.addMessage({
+      role: 'user',
+      content: [
+        'Check this out:',
+        {
+          id: 'img1',
+          type: 'image_content',
+          image: 'https://example.com/image.jpg',
+          inferenceDetail: 'high',
+          _cache: {},
+        },
+      ],
+    });
+    const result = await toResponsesChatCtx(ctx);
+    expect(result).toEqual([
+      {
+        role: 'user',
+        content: [
+          {
+            type: 'input_image',
+            image_url: 'https://example.com/image.jpg',
+            detail: 'high',
+          },
+          { type: 'input_text', text: 'Check this out:' },
+        ],
+      },
+    ]);
+  });
+  it('should handle tool calls as top-level function_call items', async () => {
+    const ctx = ChatContext.empty();
+    const msg = ctx.addMessage({ role: 'assistant', content: 'Let me help you.' });
+    const toolCall = FunctionCall.create({
+      id: msg.id + '/tool_1',
+      callId: 'call_123',
+      name: 'get_weather',
+      args: '{"location": "Paris"}',
+    });
+    const toolOutput = FunctionCallOutput.create({
+      callId: 'call_123',
+      output: '{"temperature": 20}',
+      isError: false,
+    });
+    ctx.insert([toolCall, toolOutput]);
+    const result = await toResponsesChatCtx(ctx);
+    expect(result).toEqual([
+      { role: 'assistant', content: 'Let me help you.' },
+      {
+        type: 'function_call',
+        call_id: 'call_123',
+        name: 'get_weather',
+        arguments: '{"location": "Paris"}',
+      },
+      {
+        type: 'function_call_output',
+        call_id: 'call_123',
+        output: '{"temperature": 20}',
+      },
+    ]);
+  });
+  it('should handle tool calls without an accompanying message', async () => {
+    const ctx = ChatContext.empty();
+    const toolCall = new FunctionCall({
+      id: 'func_1',
+      callId: 'call_456',
+      name: 'calculate',
+      args: '{"a": 5, "b": 3}',
+    });
+    const toolOutput = new FunctionCallOutput({
+      callId: 'call_456',
+      output: '{"result": 8}',
+      isError: false,
+    });
+    ctx.insert([toolCall, toolOutput]);
+    const result = await toResponsesChatCtx(ctx);
+    expect(result).toEqual([
+      {
+        type: 'function_call',
+        call_id: 'call_456',
+        name: 'calculate',
+        arguments: '{"a": 5, "b": 3}',
+      },
+      {
+        type: 'function_call_output',
+        call_id: 'call_456',
+        output: '{"result": 8}',
+      },
+    ]);
+  });
+  it('should handle multiple tool calls as separate function_call items', async () => {
+    const ctx = ChatContext.empty();
+    const msg = ctx.addMessage({ role: 'assistant', content: "I'll check both." });
+    const toolCall1 = new FunctionCall({
+      id: msg.id + '/tool_1',
+      callId: 'call_1',
+      name: 'get_weather',
+      args: '{"location": "NYC"}',
+    });
+    const toolCall2 = new FunctionCall({
+      id: msg.id + '/tool_2',
+      callId: 'call_2',
+      name: 'get_weather',
+      args: '{"location": "LA"}',
+    });
+    const toolOutput1 = new FunctionCallOutput({
+      callId: 'call_1',
+      output: '{"temperature": 65}',
+      isError: false,
+    });
+    const toolOutput2 = new FunctionCallOutput({
+      callId: 'call_2',
+      output: '{"temperature": 78}',
+      isError: false,
+    });
+    ctx.insert([toolCall1, toolCall2, toolOutput1, toolOutput2]);
+    const result = await toResponsesChatCtx(ctx);
+    expect(result).toEqual([
+      { role: 'assistant', content: "I'll check both." },
+      {
+        type: 'function_call',
+        call_id: 'call_1',
+        name: 'get_weather',
+        arguments: '{"location": "NYC"}',
+      },
+      {
+        type: 'function_call',
+        call_id: 'call_2',
+        name: 'get_weather',
+        arguments: '{"location": "LA"}',
+      },
+      {
+        type: 'function_call_output',
+        call_id: 'call_1',
+        output: '{"temperature": 65}',
+      },
+      {
+        type: 'function_call_output',
+        call_id: 'call_2',
+        output: '{"temperature": 78}',
+      },
+    ]);
+  });
+  it('should skip empty groups', async () => {
+    const ctx = ChatContext.empty();
+    ctx.addMessage({ role: 'user', content: 'Hello', createdAt: 1000 });
+    const orphanOutput = new FunctionCallOutput({
+      callId: 'orphan_call',
+      output: 'This should be ignored',
+      isError: false,
+      createdAt: 2000,
+    });
+    ctx.insert(orphanOutput);
+    ctx.addMessage({ role: 'assistant', content: 'Hi!', createdAt: 3000 });
+    const result = await toResponsesChatCtx(ctx);
+    expect(result).toHaveLength(2);
+    expect(result).toContainEqual({ role: 'user', content: 'Hello' });
+    expect(result).toContainEqual({ role: 'assistant', content: 'Hi!' });
+  });
+  it('should filter out agent handoff items', async () => {
+    const ctx = ChatContext.empty();
+    ctx.addMessage({ role: 'user', content: 'Hello' });
+    ctx.insert(new AgentHandoffItem({ oldAgentId: 'agent_1', newAgentId: 'agent_2' }));
+    ctx.addMessage({ role: 'assistant', content: 'Hi there!' });
+    const result = await toResponsesChatCtx(ctx);
+    expect(result).toEqual([
+      { role: 'user', content: 'Hello' },
+      { role: 'assistant', content: 'Hi there!' },
+    ]);
+  });
+  it('should cache serialized images', async () => {
+    serializeImageMock.mockResolvedValue({
+      inferenceDetail: 'high',
+      mimeType: 'image/png',
+      base64Data: 'cached-data',
+    });
+    const imageContent = {
+      id: 'img1',
+      type: 'image_content' as const,
+      image: 'https://example.com/image.jpg',
+      inferenceDetail: 'high' as const,
+      _cache: {},
+    };
+    const ctx = ChatContext.empty();
+    ctx.addMessage({ role: 'user', content: [imageContent] });
+    await toResponsesChatCtx(ctx);
+    await toResponsesChatCtx(ctx);
+    expect(serializeImageMock).toHaveBeenCalledTimes(1);
+    expect(imageContent._cache).toHaveProperty('serialized_image');
+  });
+  it('should throw error for unsupported content type', async () => {
+    const ctx = ChatContext.empty();
+    ctx.addMessage({
+      role: 'user',
+      content: [
+        {
+          type: 'audio_content',
+          frame: [],
+        },
+      ],
+    });
+    await expect(toResponsesChatCtx(ctx)).rejects.toThrow(
+      'Unsupported content type: audio_content',
+    );
+  });
+  it('should throw error when serialized image has no data', async () => {
+    serializeImageMock.mockResolvedValue({
+      inferenceDetail: 'high',
+      // No base64Data or externalUrl
+    });
+    const ctx = ChatContext.empty();
+    ctx.addMessage({
+      role: 'user',
+      content: [
+        {
+          id: 'img1',
+          type: 'image_content',
+          image: 'invalid-image',
+          inferenceDetail: 'high',
+          _cache: {},
+        },
+      ],
+    });
+    await expect(toResponsesChatCtx(ctx)).rejects.toThrow('Serialized image has no data bytes');
+  });
+});

package/src/llm/provider_format/openai.ts CHANGED Viewed

@@ -144,3 +144,106 @@ async function toImageContent(content: ImageContent) {
     },
   };
 }
+async function toResponsesImageContent(content: ImageContent) {
+  const cacheKey = 'serialized_image';
+  let serialized: SerializedImage;
+  if (content._cache[cacheKey] === undefined) {
+    serialized = await serializeImage(content);
+    content._cache[cacheKey] = serialized;
+  }
+  serialized = content._cache[cacheKey];
+  if (serialized.externalUrl) {
+    return {
+      type: 'input_image' as const,
+      image_url: serialized.externalUrl,
+      detail: serialized.inferenceDetail,
+    };
+  }
+  if (serialized.base64Data === undefined) {
+    throw new Error('Serialized image has no data bytes');
+  }
+  return {
+    type: 'input_image' as const,
+    image_url: `data:${serialized.mimeType};base64,${serialized.base64Data}`,
+    detail: serialized.inferenceDetail,
+  };
+}
+export async function toResponsesChatCtx(
+  chatCtx: ChatContext,
+  // eslint-disable-next-line @typescript-eslint/no-unused-vars
+  injectDummyUserMessage: boolean = true,
+) {
+  const itemGroups = groupToolCalls(chatCtx);
+  const messages: Record<string, any>[] = []; // eslint-disable-line @typescript-eslint/no-explicit-any
+  for (const group of itemGroups) {
+    if (group.isEmpty) continue;
+    if (group.message) {
+      messages.push(await toResponsesChatItem(group.message));
+    }
+    for (const toolCall of group.toolCalls) {
+      messages.push({
+        type: 'function_call',
+        call_id: toolCall.callId,
+        name: toolCall.name,
+        arguments: toolCall.args,
+      });
+    }
+    for (const toolOutput of group.toolOutputs) {
+      messages.push(await toResponsesChatItem(toolOutput));
+    }
+  }
+  return messages;
+}
+async function toResponsesChatItem(item: ChatItem) {
+  if (item.type === 'message') {
+    const listContent: Record<string, any>[] = []; // eslint-disable-line @typescript-eslint/no-explicit-any
+    let textContent = '';
+    for (const content of item.content) {
+      if (typeof content === 'string') {
+        if (textContent) textContent += '\n';
+        textContent += content;
+      } else if (content.type === 'image_content') {
+        listContent.push(await toResponsesImageContent(content));
+      } else {
+        throw new Error(`Unsupported content type: ${content.type}`);
+      }
+    }
+    const content =
+      listContent.length == 0
+        ? textContent
+        : textContent.length == 0
+          ? listContent
+          : [...listContent, { type: 'input_text', text: textContent }];
+    return { role: item.role, content };
+  } else if (item.type === 'function_call') {
+    return {
+      type: 'function_call',
+      call_id: item.callId,
+      name: item.name,
+      arguments: item.args,
+    };
+  } else if (item.type === 'function_call_output') {
+    return {
+      type: 'function_call_output',
+      call_id: item.callId,
+      output: item.output,
+    };
+  }
+  throw new Error(`Unsupported item type: ${item['type']}`);
+}

package/src/llm/provider_format/utils.ts CHANGED Viewed

@@ -56,12 +56,14 @@ class ChatItemGroup {
   }
   removeInvalidToolCalls() {
-    if (this.toolCalls.length === this.toolOutputs.length) {
-      return;
-    }
     const toolCallIds = new Set(this.toolCalls.map((call) => call.callId));
     const toolOutputIds = new Set(this.toolOutputs.map((output) => output.callId));
+    const sameIds =
+      toolCallIds.size === toolOutputIds.size &&
+      [...toolCallIds].every((id) => toolOutputIds.has(id));
+    if (this.toolCalls.length === this.toolOutputs.length && sameIds) {
+      return;
+    }
     // intersection of tool call ids and tool output ids
     const validCallIds = intersection(toolCallIds, toolOutputIds);

package/src/llm/realtime.ts CHANGED Viewed

@@ -48,6 +48,7 @@ export interface RealtimeCapabilities {
   userTranscription: boolean;
   autoToolReplyGeneration: boolean;
   audioOutput: boolean;
+  manualFunctionCalls: boolean;
 }
 export interface InputTranscriptionCompleted {

package/src/llm/tool_context.ts CHANGED Viewed

@@ -80,6 +80,13 @@ export class ToolError extends Error {
   }
 }
+export const ToolFlag = {
+  NONE: 0,
+  IGNORE_ON_ENTER: 1 << 0,
+} as const;
+export type ToolFlag = (typeof ToolFlag)[keyof typeof ToolFlag];
 export interface AgentHandoff {
   /**
    * The agent to handoff to.
@@ -178,6 +185,8 @@ export interface FunctionTool<
    */
   execute: ToolExecuteFunction<Parameters, UserData, Result>;
+  flags: number;
   [FUNCTION_TOOL_SYMBOL]: true;
 }
@@ -242,10 +251,12 @@ export function tool<
   description,
   parameters,
   execute,
+  flags,
 }: {
   description: string;
   parameters: Schema;
   execute: ToolExecuteFunction<InferToolInput<Schema>, UserData, Result>;
+  flags?: number;
 }): FunctionTool<InferToolInput<Schema>, UserData, Result>;
 /**
@@ -254,10 +265,12 @@ export function tool<
 export function tool<UserData = UnknownUserData, Result = unknown>({
   description,
   execute,
+  flags,
 }: {
   description: string;
   parameters?: never;
   execute: ToolExecuteFunction<Record<string, never>, UserData, Result>;
+  flags?: number;
 }): FunctionTool<Record<string, never>, UserData, Result>;
 /**
@@ -295,6 +308,7 @@ export function tool(tool: any): any {
       description: tool.description,
       parameters,
       execute: tool.execute,
+      flags: tool.flags ?? ToolFlag.NONE,
       [TOOL_SYMBOL]: true,
       [FUNCTION_TOOL_SYMBOL]: true,
     };

package/src/log.ts CHANGED Viewed

@@ -44,7 +44,7 @@ export const log = () => {
 export const initializeLogger = ({ pretty, level }: LoggerOptions) => {
   globals[LOGGER_OPTIONS_KEY] = { pretty, level };
   globals[LOGGER_KEY] = pino(
-    { level: level || 'info' },
+    { level: level || 'info', serializers: { error: pino.stdSerializers.err } },
     pretty ? pinoPretty({ colorize: true }) : process.stdout,
   );
 };
@@ -90,5 +90,8 @@ export const enableOtelLogging = () => {
     { stream: new OtelDestination(), level: 'debug' },
   ];
-  globals[LOGGER_KEY] = pino({ level: logLevel }, multistream(streams));
+  globals[LOGGER_KEY] = pino(
+    { level: logLevel, serializers: { error: pino.stdSerializers.err } },
+    multistream(streams),
+  );
 };

package/src/stream/deferred_stream.ts CHANGED Viewed

@@ -59,16 +59,17 @@ export class DeferredReadableStream<T> {
       throw new Error('Stream source already set');
     }
-    this.sourceReader = source.getReader();
-    this.pump();
+    const sourceReader = source.getReader();
+    this.sourceReader = sourceReader;
+    void this.pump(sourceReader);
   }
-  private async pump() {
+  private async pump(sourceReader: ReadableStreamDefaultReader<T>) {
     let sourceError: unknown;
     try {
       while (true) {
-        const { done, value } = await this.sourceReader!.read();
+        const { done, value } = await sourceReader.read();
         if (done) break;
         await this.writer.write(value);
       }
@@ -81,7 +82,7 @@ export class DeferredReadableStream<T> {
       // any other error from source will be propagated to the consumer
       if (sourceError) {
         try {
-          this.writer.abort(sourceError);
+          await this.writer.abort(sourceError);
         } catch (e) {
           // ignore if writer is already closed
         }
@@ -118,10 +119,20 @@ export class DeferredReadableStream<T> {
       return;
     }
+    const sourceReader = this.sourceReader!;
+    // Clear source first so future setSource() calls can reattach cleanly.
+    this.sourceReader = undefined;
     // release lock will make any pending read() throw TypeError
     // which are expected, and we intentionally catch those error
     // using isStreamReaderReleaseError
     // this will unblock any pending read() inside the async for loop
-    this.sourceReader!.releaseLock();
+    try {
+      sourceReader.releaseLock();
+    } catch (e) {
+      if (!isStreamReaderReleaseError(e)) {
+        throw e;
+      }
+    }
   }
 }