npm - @librechat/agents - Versions diffs - 3.1.85 → 3.1.87 - Mend

@librechat/agents 3.1.85 → 3.1.87

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (166) hide show

package/README.md +69 -0
package/dist/cjs/agents/AgentContext.cjs +7 -2
package/dist/cjs/agents/AgentContext.cjs.map +1 -1
package/dist/cjs/events.cjs +23 -0
package/dist/cjs/events.cjs.map +1 -1
package/dist/cjs/graphs/Graph.cjs +133 -18
package/dist/cjs/graphs/Graph.cjs.map +1 -1
package/dist/cjs/graphs/MultiAgentGraph.cjs +1 -1
package/dist/cjs/graphs/MultiAgentGraph.cjs.map +1 -1
package/dist/cjs/llm/anthropic/index.cjs +251 -53
package/dist/cjs/llm/anthropic/index.cjs.map +1 -1
package/dist/cjs/llm/init.cjs +1 -5
package/dist/cjs/llm/init.cjs.map +1 -1
package/dist/cjs/llm/openai/index.cjs +113 -24
package/dist/cjs/llm/openai/index.cjs.map +1 -1
package/dist/cjs/llm/openai/utils/index.cjs.map +1 -1
package/dist/cjs/llm/openrouter/index.cjs +3 -1
package/dist/cjs/llm/openrouter/index.cjs.map +1 -1
package/dist/cjs/main.cjs +18 -5
package/dist/cjs/main.cjs.map +1 -1
package/dist/cjs/openai/index.cjs +253 -0
package/dist/cjs/openai/index.cjs.map +1 -0
package/dist/cjs/responses/index.cjs +448 -0
package/dist/cjs/responses/index.cjs.map +1 -0
package/dist/cjs/run.cjs +108 -7
package/dist/cjs/run.cjs.map +1 -1
package/dist/cjs/session/AgentSession.cjs +1057 -0
package/dist/cjs/session/AgentSession.cjs.map +1 -0
package/dist/cjs/session/JsonlSessionStore.cjs +425 -0
package/dist/cjs/session/JsonlSessionStore.cjs.map +1 -0
package/dist/cjs/session/handlers.cjs +221 -0
package/dist/cjs/session/handlers.cjs.map +1 -0
package/dist/cjs/session/ids.cjs +22 -0
package/dist/cjs/session/ids.cjs.map +1 -0
package/dist/cjs/session/messageSerialization.cjs +179 -0
package/dist/cjs/session/messageSerialization.cjs.map +1 -0
package/dist/cjs/stream.cjs +472 -11
package/dist/cjs/stream.cjs.map +1 -1
package/dist/cjs/summarization/node.cjs +1 -1
package/dist/cjs/summarization/node.cjs.map +1 -1
package/dist/cjs/tools/ToolNode.cjs +177 -59
package/dist/cjs/tools/ToolNode.cjs.map +1 -1
package/dist/cjs/tools/eagerEventExecution.cjs +113 -0
package/dist/cjs/tools/eagerEventExecution.cjs.map +1 -0
package/dist/cjs/tools/handlers.cjs +1 -1
package/dist/cjs/tools/handlers.cjs.map +1 -1
package/dist/cjs/tools/streamedToolCallSeals.cjs +42 -0
package/dist/cjs/tools/streamedToolCallSeals.cjs.map +1 -0
package/dist/esm/agents/AgentContext.mjs +7 -2
package/dist/esm/agents/AgentContext.mjs.map +1 -1
package/dist/esm/events.mjs +23 -1
package/dist/esm/events.mjs.map +1 -1
package/dist/esm/graphs/Graph.mjs +133 -18
package/dist/esm/graphs/Graph.mjs.map +1 -1
package/dist/esm/graphs/MultiAgentGraph.mjs +1 -1
package/dist/esm/graphs/MultiAgentGraph.mjs.map +1 -1
package/dist/esm/llm/anthropic/index.mjs +251 -53
package/dist/esm/llm/anthropic/index.mjs.map +1 -1
package/dist/esm/llm/init.mjs +1 -5
package/dist/esm/llm/init.mjs.map +1 -1
package/dist/esm/llm/openai/index.mjs +113 -25
package/dist/esm/llm/openai/index.mjs.map +1 -1
package/dist/esm/llm/openai/utils/index.mjs.map +1 -1
package/dist/esm/llm/openrouter/index.mjs +4 -2
package/dist/esm/llm/openrouter/index.mjs.map +1 -1
package/dist/esm/main.mjs +5 -1
package/dist/esm/main.mjs.map +1 -1
package/dist/esm/openai/index.mjs +246 -0
package/dist/esm/openai/index.mjs.map +1 -0
package/dist/esm/responses/index.mjs +440 -0
package/dist/esm/responses/index.mjs.map +1 -0
package/dist/esm/run.mjs +108 -7
package/dist/esm/run.mjs.map +1 -1
package/dist/esm/session/AgentSession.mjs +1054 -0
package/dist/esm/session/AgentSession.mjs.map +1 -0
package/dist/esm/session/JsonlSessionStore.mjs +422 -0
package/dist/esm/session/JsonlSessionStore.mjs.map +1 -0
package/dist/esm/session/handlers.mjs +219 -0
package/dist/esm/session/handlers.mjs.map +1 -0
package/dist/esm/session/ids.mjs +17 -0
package/dist/esm/session/ids.mjs.map +1 -0
package/dist/esm/session/messageSerialization.mjs +173 -0
package/dist/esm/session/messageSerialization.mjs.map +1 -0
package/dist/esm/stream.mjs +473 -12
package/dist/esm/stream.mjs.map +1 -1
package/dist/esm/summarization/node.mjs +1 -1
package/dist/esm/summarization/node.mjs.map +1 -1
package/dist/esm/tools/ToolNode.mjs +177 -59
package/dist/esm/tools/ToolNode.mjs.map +1 -1
package/dist/esm/tools/eagerEventExecution.mjs +107 -0
package/dist/esm/tools/eagerEventExecution.mjs.map +1 -0
package/dist/esm/tools/handlers.mjs +1 -1
package/dist/esm/tools/handlers.mjs.map +1 -1
package/dist/esm/tools/streamedToolCallSeals.mjs +36 -0
package/dist/esm/tools/streamedToolCallSeals.mjs.map +1 -0
package/dist/types/events.d.ts +1 -0
package/dist/types/graphs/Graph.d.ts +24 -9
package/dist/types/index.d.ts +1 -0
package/dist/types/llm/openai/index.d.ts +1 -0
package/dist/types/openai/index.d.ts +75 -0
package/dist/types/responses/index.d.ts +97 -0
package/dist/types/run.d.ts +2 -0
package/dist/types/session/AgentSession.d.ts +32 -0
package/dist/types/session/JsonlSessionStore.d.ts +67 -0
package/dist/types/session/handlers.d.ts +8 -0
package/dist/types/session/ids.d.ts +4 -0
package/dist/types/session/index.d.ts +5 -0
package/dist/types/session/messageSerialization.d.ts +7 -0
package/dist/types/session/types.d.ts +191 -0
package/dist/types/tools/ToolNode.d.ts +12 -1
package/dist/types/tools/eagerEventExecution.d.ts +23 -0
package/dist/types/tools/streamedToolCallSeals.d.ts +13 -0
package/dist/types/types/hitl.d.ts +4 -0
package/dist/types/types/run.d.ts +11 -1
package/dist/types/types/tools.d.ts +36 -0
package/package.json +19 -2
package/src/__tests__/stream.eagerEventExecution.test.ts +2458 -0
package/src/agents/AgentContext.ts +7 -2
package/src/agents/__tests__/AgentContext.test.ts +254 -5
package/src/events.ts +29 -0
package/src/graphs/Graph.ts +224 -50
package/src/graphs/MultiAgentGraph.ts +1 -1
package/src/graphs/__tests__/composition.smoke.test.ts +30 -0
package/src/index.ts +3 -0
package/src/llm/anthropic/index.ts +356 -84
package/src/llm/anthropic/llm.spec.ts +64 -0
package/src/llm/custom-chat-models.smoke.test.ts +175 -4
package/src/llm/openai/contentBlocks.test.ts +35 -0
package/src/llm/openai/deepseek.test.ts +201 -2
package/src/llm/openai/index.ts +171 -26
package/src/llm/openai/utils/index.ts +22 -0
package/src/llm/openrouter/index.ts +4 -2
package/src/openai/__tests__/openai.test.ts +337 -0
package/src/openai/index.ts +404 -0
package/src/responses/__tests__/responses.test.ts +652 -0
package/src/responses/index.ts +677 -0
package/src/run.ts +158 -8
package/src/scripts/compare_pi_vs_ours.ts +592 -173
package/src/scripts/session_live.ts +548 -0
package/src/session/AgentSession.ts +1432 -0
package/src/session/JsonlSessionStore.ts +572 -0
package/src/session/__tests__/JsonlSessionStore.test.ts +1410 -0
package/src/session/__tests__/handlers.test.ts +161 -0
package/src/session/handlers.ts +272 -0
package/src/session/ids.ts +17 -0
package/src/session/index.ts +44 -0
package/src/session/messageSerialization.ts +207 -0
package/src/session/types.ts +275 -0
package/src/specs/custom-event-await.test.ts +89 -0
package/src/specs/summarization.test.ts +1 -1
package/src/stream.ts +755 -48
package/src/summarization/node.ts +1 -1
package/src/tools/ToolNode.ts +299 -126
package/src/tools/__tests__/ToolNode.eagerEventExecution.test.ts +373 -0
package/src/tools/__tests__/handlers.test.ts +2 -1
package/src/tools/__tests__/hitl.test.ts +206 -110
package/src/tools/eagerEventExecution.ts +153 -0
package/src/tools/handlers.ts +8 -4
package/src/tools/streamedToolCallSeals.ts +57 -0
package/src/types/hitl.ts +4 -0
package/src/types/run.ts +11 -0
package/src/types/tools.ts +36 -0
package/dist/cjs/llm/text.cjs +0 -69
package/dist/cjs/llm/text.cjs.map +0 -1
package/dist/esm/llm/text.mjs +0 -67
package/dist/esm/llm/text.mjs.map +0 -1

package/src/llm/openai/index.ts CHANGED Viewed

@@ -35,11 +35,13 @@ import type { ChatGeneration, ChatResult } from '@langchain/core/outputs';
 import type { ChatXAIInput } from '@langchain/xai';
 import type * as t from '@langchain/openai';
 import { isReasoningModel, _convertMessagesToOpenAIParams } from './utils';
-import { sleep } from '@/utils';
 // eslint-disable-next-line @typescript-eslint/explicit-function-return-type
 const iife = <T>(fn: () => T) => fn();
+const STREAM_CHUNK_MIN_SIZE = 4;
+const STREAM_BOUNDARIES = new Set([' ', '.', ',', '!', '?', ';', ':']);
 export function isHeaders(headers: unknown): headers is Headers {
   return (
     typeof Headers !== 'undefined' &&
@@ -403,18 +405,160 @@ function getCustomOpenAIClientOptions(
   return requestOptions;
 }
-async function* delayStreamChunks<T>(
-  chunks: AsyncGenerator<T>,
-  delay?: number
-): AsyncGenerator<T> {
+function findStreamChunkBoundary(text: string, minSize: number): number {
+  if (minSize >= text.length) {
+    return text.length;
+  }
+  for (let position = minSize; position < text.length; position++) {
+    if (STREAM_BOUNDARIES.has(text[position])) {
+      return position + 1;
+    }
+  }
+  return text.length;
+}
+function splitStreamToken(text: string): string[] {
+  const chunks: string[] = [];
+  let currentIndex = 0;
+  while (currentIndex < text.length) {
+    const remainingText = text.slice(currentIndex);
+    const chunkSize = findStreamChunkBoundary(
+      remainingText,
+      STREAM_CHUNK_MIN_SIZE
+    );
+    chunks.push(text.slice(currentIndex, currentIndex + chunkSize));
+    currentIndex += chunkSize;
+  }
+  return chunks;
+}
+function splitTextGenerationChunk(
+  chunk: ChatGenerationChunk
+): ChatGenerationChunk[] {
+  const { message } = chunk;
+  if (
+    !chunk.text ||
+    !(message instanceof AIMessageChunk) ||
+    typeof message.content !== 'string' ||
+    message.content !== chunk.text ||
+    chunk.generationInfo?.logprobs != null ||
+    chunk.generationInfo?.finish_reason != null
+  ) {
+    return [chunk];
+  }
+  const tokenChunks = splitStreamToken(chunk.text);
+  if (tokenChunks.length <= 1) {
+    return [chunk];
+  }
+  let emittedUsage = false;
+  return tokenChunks.map((token) => {
+    const usageMetadata =
+      emittedUsage && message.usage_metadata != null
+        ? undefined
+        : message.usage_metadata;
+    if (message.usage_metadata != null && !emittedUsage) {
+      emittedUsage = true;
+    }
+    return new ChatGenerationChunk({
+      text: token,
+      generationInfo: chunk.generationInfo,
+      message: new AIMessageChunk(
+        Object.assign({}, message, {
+          content: token,
+          usage_metadata: usageMetadata,
+        })
+      ),
+    });
+  });
+}
+export async function emitStreamChunkCallback(
+  chunk: ChatGenerationChunk,
+  runManager?: CallbackManagerForLLMRun
+): Promise<void> {
+  await runManager?.handleLLMNewToken(
+    chunk.text,
+    getStreamChunkTokenIndices(chunk),
+    undefined,
+    undefined,
+    undefined,
+    { chunk }
+  );
+}
+function getStreamChunkTokenIndices(
+  chunk: ChatGenerationChunk
+): { prompt: number; completion: number } | undefined {
+  const prompt = chunk.generationInfo?.prompt;
+  const completion = chunk.generationInfo?.completion;
+  if (typeof prompt === 'number' && typeof completion === 'number') {
+    return { prompt, completion };
+  }
+  return undefined;
+}
+async function* delayStreamChunks(
+  chunks: AsyncGenerator<ChatGenerationChunk>,
+  delay?: number,
+  signal?: AbortSignal,
+  runManager?: CallbackManagerForLLMRun
+): AsyncGenerator<ChatGenerationChunk> {
+  let lastYieldedAt: number | undefined;
   for await (const chunk of chunks) {
-    yield chunk;
-    if (delay != null) {
-      await sleep(delay);
+    const outputChunks =
+      delay != null && delay > 0 ? splitTextGenerationChunk(chunk) : [chunk];
+    for (const outputChunk of outputChunks) {
+      signal?.throwIfAborted();
+      if (delay != null && delay > 0 && lastYieldedAt != null) {
+        const timeSinceLastYield = Date.now() - lastYieldedAt;
+        const timeToWait = Math.max(0, delay - timeSinceLastYield);
+        if (timeToWait > 0) {
+          await sleepWithAbort(timeToWait, signal);
+        }
+      }
+      signal?.throwIfAborted();
+      lastYieldedAt = Date.now();
+      await emitStreamChunkCallback(outputChunk, runManager);
+      signal?.throwIfAborted();
+      yield outputChunk;
     }
   }
 }
+async function sleepWithAbort(
+  delay: number,
+  signal?: AbortSignal
+): Promise<void> {
+  if (delay <= 0) {
+    return;
+  }
+  signal?.throwIfAborted();
+  await new Promise<void>((resolve, reject) => {
+    const timeout = setTimeout(() => {
+      signal?.removeEventListener('abort', onAbort);
+      resolve();
+    }, delay);
+    const onAbort = (): void => {
+      clearTimeout(timeout);
+      signal?.removeEventListener('abort', onAbort);
+      reject(signal?.reason ?? new Error('AbortError: User aborted request.'));
+    };
+    signal?.addEventListener('abort', onAbort, { once: true });
+    if (signal?.aborted === true) {
+      onAbort();
+    }
+  });
+}
 function createAbortHandler(controller: AbortController): () => void {
   return function (): void {
     controller.abort();
@@ -468,7 +612,7 @@ export class CustomOpenAIClient extends OpenAIClient {
     this.abortHandler = handler;
     if (signal) signal.addEventListener('abort', handler, { once: true });
-    const timeout = setTimeout(() => handler, ms);
+    const timeout = setTimeout(handler, ms);
     const fetchOptions = {
       signal: controller.signal as AbortSignal,
@@ -503,7 +647,7 @@ export class CustomAzureOpenAIClient extends AzureOpenAIClient {
     this.abortHandler = handler;
     if (signal) signal.addEventListener('abort', handler, { once: true });
-    const timeout = setTimeout(() => handler, ms);
+    const timeout = setTimeout(handler, ms);
     const fetchOptions = {
       signal: controller.signal as AbortSignal,
@@ -1184,8 +1328,10 @@ export class ChatOpenAI extends OriginalChatOpenAI<t.ChatOpenAICallOptions> {
     runManager?: CallbackManagerForLLMRun
   ): AsyncGenerator<ChatGenerationChunk> {
     yield* delayStreamChunks(
-      super._streamResponseChunks(messages, options, runManager),
-      this._lc_stream_delay
+      super._streamResponseChunks(messages, options, undefined),
+      this._lc_stream_delay,
+      options.signal,
+      runManager
     );
   }
 }
@@ -1294,8 +1440,10 @@ export class AzureChatOpenAI extends OriginalAzureChatOpenAI {
     runManager?: CallbackManagerForLLMRun
   ): AsyncGenerator<ChatGenerationChunk> {
     yield* delayStreamChunks(
-      super._streamResponseChunks(messages, options, runManager),
-      this._lc_stream_delay
+      super._streamResponseChunks(messages, options, undefined),
+      this._lc_stream_delay,
+      options.signal,
+      runManager
     );
   }
 }
@@ -1425,8 +1573,10 @@ export class ChatDeepSeek extends OriginalChatDeepSeek {
     runManager?: CallbackManagerForLLMRun
   ): AsyncGenerator<ChatGenerationChunk> {
     yield* delayStreamChunks(
-      this._streamResponseChunksWithReasoning(messages, options, runManager),
-      this._lc_stream_delay
+      this._streamResponseChunksWithReasoning(messages, options, undefined),
+      this._lc_stream_delay,
+      options.signal,
+      runManager
     );
   }
@@ -1767,14 +1917,7 @@ export class ChatDeepSeek extends OriginalChatDeepSeek {
   protected _getDeepSeekTokenIndices(
     chunk: ChatGenerationChunk
   ): { prompt: number; completion: number } | undefined {
-    const prompt = chunk.generationInfo?.prompt;
-    const completion = chunk.generationInfo?.completion;
-    if (typeof prompt === 'number' && typeof completion === 'number') {
-      return { prompt, completion };
-    }
-    return undefined;
+    return getStreamChunkTokenIndices(chunk);
   }
   protected _getDeepSeekPartialTagSplitIndex(
@@ -1891,8 +2034,10 @@ export class ChatXAI extends OriginalChatXAI {
     runManager?: CallbackManagerForLLMRun
   ): AsyncGenerator<ChatGenerationChunk> {
     yield* delayStreamChunks(
-      super._streamResponseChunks(messages, options, runManager),
-      this._lc_stream_delay
+      super._streamResponseChunks(messages, options, undefined),
+      this._lc_stream_delay,
+      options.signal,
+      runManager
     );
   }
 }

package/src/llm/openai/utils/index.ts CHANGED Viewed

@@ -38,6 +38,11 @@ import type {
   ChatOpenAIReasoningSummary,
 } from '@langchain/openai';
 import { toLangChainContent } from '@/messages/langchain';
+import {
+  STREAMED_TOOL_CALL_SEAL_METADATA_KEY,
+  STREAMED_TOOL_CALL_ADAPTER_METADATA_KEY,
+  OPENAI_RESPONSES_STREAMED_TOOL_CALL_ADAPTER,
+} from '@/tools/streamedToolCallSeals';
 export type { OpenAICallOptions, OpenAIChatInput };
@@ -948,6 +953,8 @@ export function _convertOpenAIResponsesDeltaToBaseMessageChunk(
     chunk.type === 'response.output_item.added' &&
     chunk.item.type === 'function_call'
   ) {
+    response_metadata[STREAMED_TOOL_CALL_ADAPTER_METADATA_KEY] =
+      OPENAI_RESPONSES_STREAMED_TOOL_CALL_ADAPTER;
     tool_call_chunks.push({
       type: 'tool_call_chunk',
       name: chunk.item.name,
@@ -988,11 +995,26 @@ export function _convertOpenAIResponsesDeltaToBaseMessageChunk(
       if (key !== 'id') response_metadata[key] = value;
     }
   } else if (chunk.type === 'response.function_call_arguments.delta') {
+    response_metadata[STREAMED_TOOL_CALL_ADAPTER_METADATA_KEY] =
+      OPENAI_RESPONSES_STREAMED_TOOL_CALL_ADAPTER;
     tool_call_chunks.push({
       type: 'tool_call_chunk',
       args: chunk.delta,
       index: chunk.output_index,
     });
+  } else if (chunk.type === 'response.function_call_arguments.done') {
+    response_metadata[STREAMED_TOOL_CALL_ADAPTER_METADATA_KEY] =
+      OPENAI_RESPONSES_STREAMED_TOOL_CALL_ADAPTER;
+    response_metadata[STREAMED_TOOL_CALL_SEAL_METADATA_KEY] = {
+      kind: 'single',
+      index: chunk.output_index,
+    };
+    tool_call_chunks.push({
+      type: 'tool_call_chunk',
+      name: chunk.name,
+      args: chunk.arguments,
+      index: chunk.output_index,
+    });
   } else if (
     chunk.type === 'response.web_search_call.completed' ||
     chunk.type === 'response.file_search_call.completed'

package/src/llm/openrouter/index.ts CHANGED Viewed

@@ -1,4 +1,4 @@
-import { ChatOpenAI } from '@/llm/openai';
+import { ChatOpenAI, emitStreamChunkCallback } from '@/llm/openai';
 import type { BaseMessage } from '@langchain/core/messages';
 import type { ChatGenerationChunk } from '@langchain/core/outputs';
 import type { CallbackManagerForLLMRun } from '@langchain/core/callbacks/manager';
@@ -237,7 +237,7 @@ export class ChatOpenRouter extends ChatOpenAI {
     for await (const generationChunk of super._streamResponseChunks(
       messages,
       options,
-      runManager
+      undefined
     )) {
       let currentReasoningText = '';
       const reasoningDetails = getReasoningDetails(
@@ -283,11 +283,13 @@ export class ChatOpenRouter extends ChatOpenAI {
         } else {
           delete generationChunk.message.additional_kwargs.reasoning_details;
         }
+        await emitStreamChunkCallback(generationChunk, runManager);
         yield generationChunk;
         continue;
       }
       delete generationChunk.message.additional_kwargs.reasoning_details;
+      await emitStreamChunkCallback(generationChunk, runManager);
       yield generationChunk;
     }
   }

package/src/openai/__tests__/openai.test.ts ADDED Viewed

@@ -0,0 +1,337 @@
+import { GraphEvents } from '@/common';
+import {
+  createChatCompletionChunk,
+  createOpenAIHandlers,
+  createOpenAIStreamTracker,
+  sendOpenAIFinalChunk,
+} from '@/openai';
+import type * as t from '@/types';
+describe('OpenAI-compatible adapters', () => {
+  it('creates chunks and streams message deltas as SSE data', async () => {
+    const writes: string[] = [];
+    const handlers = createOpenAIHandlers({
+      writer: { write: (data) => void writes.push(data) },
+      context: { requestId: 'chatcmpl_1', model: 'agent', created: 1 },
+      tracker: createOpenAIStreamTracker(),
+    });
+    await handlers[GraphEvents.ON_MESSAGE_DELTA].handle(
+      GraphEvents.ON_MESSAGE_DELTA,
+      {
+        id: 'msg',
+        delta: { content: [{ type: 'text', text: 'hello' }] },
+      } satisfies t.MessageDeltaEvent
+    );
+    expect(writes).toHaveLength(2);
+    expect(writes[0]).toContain('"role":"assistant"');
+    expect(writes[1]).toContain('"content":"hello"');
+  });
+  it('sends a final usage chunk and done marker', async () => {
+    const writes: string[] = [];
+    const tracker = createOpenAIStreamTracker();
+    tracker.usage.promptTokens = 3;
+    tracker.usage.completionTokens = 5;
+    await sendOpenAIFinalChunk({
+      writer: { write: (data) => void writes.push(data) },
+      context: { requestId: 'chatcmpl_2', model: 'agent', created: 1 },
+      tracker,
+    });
+    expect(writes).toHaveLength(4);
+    expect(writes[0]).toContain('"role":"assistant"');
+    expect(writes[1]).toContain('"finish_reason":"stop"');
+    expect(writes[1]).not.toContain('"usage"');
+    expect(writes[2]).toContain('"choices":[]');
+    expect(writes[2]).toContain('"total_tokens":8');
+    expect(writes[3]).toBe('data: [DONE]\n\n');
+  });
+  it('uses tool_calls finish reason after streaming tool deltas', async () => {
+    const writes: string[] = [];
+    const tracker = createOpenAIStreamTracker();
+    const handlers = createOpenAIHandlers({
+      writer: { write: (data) => void writes.push(data) },
+      context: { requestId: 'chatcmpl_tools', model: 'agent', created: 1 },
+      tracker,
+    });
+    await handlers[GraphEvents.ON_RUN_STEP_DELTA].handle(
+      GraphEvents.ON_RUN_STEP_DELTA,
+      {
+        id: 'step_1',
+        delta: {
+          type: 'tool_calls',
+          tool_calls: [
+            {
+              index: 0,
+              id: 'call_1',
+              name: 'search',
+              args: '{"query":"sessions"}',
+            },
+          ],
+        },
+      } as t.RunStepDeltaEvent
+    );
+    await sendOpenAIFinalChunk({
+      writer: { write: (data) => void writes.push(data) },
+      context: { requestId: 'chatcmpl_tools', model: 'agent', created: 1 },
+      tracker,
+    });
+    expect(writes[0]).toContain('"role":"assistant"');
+    expect(writes[1]).toContain('"tool_calls"');
+    expect(writes.at(-3)).toContain('"finish_reason":"tool_calls"');
+    expect(writes.at(-2)).toContain('"choices":[]');
+  });
+  it('uses stop finish reason when assistant text follows tool calls', async () => {
+    const writes: string[] = [];
+    const tracker = createOpenAIStreamTracker();
+    const handlers = createOpenAIHandlers({
+      writer: { write: (data) => void writes.push(data) },
+      context: { requestId: 'chatcmpl_tools_done', model: 'agent', created: 1 },
+      tracker,
+    });
+    await handlers[GraphEvents.ON_RUN_STEP_DELTA].handle(
+      GraphEvents.ON_RUN_STEP_DELTA,
+      {
+        id: 'step_1',
+        delta: {
+          type: 'tool_calls',
+          tool_calls: [{ index: 0, id: 'call_1', name: 'search' }],
+        },
+      } as t.RunStepDeltaEvent
+    );
+    await handlers[GraphEvents.ON_MESSAGE_DELTA].handle(
+      GraphEvents.ON_MESSAGE_DELTA,
+      {
+        id: 'msg',
+        delta: { content: [{ type: 'text', text: 'done' }] },
+      } satisfies t.MessageDeltaEvent
+    );
+    await handlers[GraphEvents.ON_RUN_STEP_DELTA].handle(
+      GraphEvents.ON_RUN_STEP_DELTA,
+      {
+        id: 'step_1',
+        delta: {
+          type: 'tool_calls',
+          tool_calls: [{ index: 0, id: 'call_1', name: 'search' }],
+        },
+      } as t.RunStepDeltaEvent
+    );
+    await sendOpenAIFinalChunk({
+      writer: { write: (data) => void writes.push(data) },
+      context: { requestId: 'chatcmpl_tools_done', model: 'agent', created: 1 },
+      tracker,
+    });
+    expect(writes.at(-3)).toContain('"finish_reason":"stop"');
+    expect(writes.at(-2)).toContain('"choices":[]');
+  });
+  it('scopes tool-call argument state by run step', async () => {
+    const writes: string[] = [];
+    const tracker = createOpenAIStreamTracker();
+    const handlers = createOpenAIHandlers({
+      writer: { write: (data) => void writes.push(data) },
+      context: { requestId: 'chatcmpl_step_tools', model: 'agent', created: 1 },
+      tracker,
+    });
+    await handlers[GraphEvents.ON_RUN_STEP_DELTA].handle(
+      GraphEvents.ON_RUN_STEP_DELTA,
+      {
+        id: 'step_1',
+        delta: {
+          type: 'tool_calls',
+          tool_calls: [
+            {
+              index: 0,
+              id: 'call_1',
+              name: 'search',
+              args: '{"query":"first"}',
+            },
+          ],
+        },
+      } as t.RunStepDeltaEvent
+    );
+    await handlers[GraphEvents.ON_RUN_STEP_DELTA].handle(
+      GraphEvents.ON_RUN_STEP_DELTA,
+      {
+        id: 'step_2',
+        delta: {
+          type: 'tool_calls',
+          tool_calls: [
+            {
+              index: 0,
+              id: 'call_2',
+              name: 'search',
+              args: '{"query":"second"}',
+            },
+          ],
+        },
+      } as t.RunStepDeltaEvent
+    );
+    const toolCallDeltas = writes
+      .map(
+        (data) =>
+          JSON.parse(data.slice(6)) as {
+            choices: Array<{
+              delta: {
+                tool_calls?: Array<{
+                  id?: string;
+                  function?: { name?: string; arguments?: string };
+                }>;
+              };
+            }>;
+          }
+      )
+      .flatMap((chunk) => chunk.choices[0].delta.tool_calls ?? []);
+    expect(toolCallDeltas).toHaveLength(2);
+    expect(toolCallDeltas[1]).toMatchObject({
+      id: 'call_2',
+      function: { name: 'search', arguments: '{"query":"second"}' },
+    });
+    expect(tracker.toolCalls.get(0)?.function.arguments).toBe(
+      '{"query":"second"}'
+    );
+  });
+  it('streams completed tool-call run steps without deltas', async () => {
+    const writes: string[] = [];
+    const tracker = createOpenAIStreamTracker();
+    const handlers = createOpenAIHandlers({
+      writer: { write: (data) => void writes.push(data) },
+      context: {
+        requestId: 'chatcmpl_complete_tools',
+        model: 'agent',
+        created: 1,
+      },
+      tracker,
+    });
+    await handlers[GraphEvents.ON_RUN_STEP].handle(GraphEvents.ON_RUN_STEP, {
+      id: 'step_complete',
+      index: 2,
+      type: 'tool_calls',
+      stepDetails: {
+        type: 'tool_calls',
+        tool_calls: [
+          {
+            id: 'call_complete',
+            type: 'function',
+            function: {
+              name: 'search',
+              arguments: { query: 'sessions' },
+            },
+          },
+        ],
+      },
+    } as t.RunStep);
+    await sendOpenAIFinalChunk({
+      writer: { write: (data) => void writes.push(data) },
+      context: {
+        requestId: 'chatcmpl_complete_tools',
+        model: 'agent',
+        created: 1,
+      },
+      tracker,
+    });
+    expect(writes[0]).toContain('"role":"assistant"');
+    expect(writes[1]).toContain('"tool_calls"');
+    expect(writes[1]).toContain('"id":"call_complete"');
+    expect(writes[1]).toContain('"name":"search"');
+    expect(writes[1]).toContain('"{\\"query\\":\\"sessions\\"}"');
+    expect(writes.at(-3)).toContain('"finish_reason":"tool_calls"');
+    expect(writes.at(-2)).toContain('"choices":[]');
+  });
+  it('tracks partial usage metadata without NaN totals', async () => {
+    const tracker = createOpenAIStreamTracker();
+    const handlers = createOpenAIHandlers({
+      writer: { write: jest.fn() },
+      context: { requestId: 'chatcmpl_usage', model: 'agent', created: 1 },
+      tracker,
+    });
+    await handlers[GraphEvents.CHAT_MODEL_END].handle(
+      GraphEvents.CHAT_MODEL_END,
+      {
+        output: { usage_metadata: { input_tokens: 3 } },
+      } as t.ModelEndData
+    );
+    await handlers[GraphEvents.CHAT_MODEL_END].handle(
+      GraphEvents.CHAT_MODEL_END,
+      {
+        output: { usage_metadata: { output_tokens: 5 } },
+      } as t.ModelEndData
+    );
+    expect(tracker.usage.promptTokens).toBe(3);
+    expect(tracker.usage.completionTokens).toBe(5);
+  });
+  it('includes reasoning token usage in the final chunk', async () => {
+    const writes: string[] = [];
+    const tracker = createOpenAIStreamTracker();
+    const handlers = createOpenAIHandlers({
+      writer: { write: (data) => void writes.push(data) },
+      context: {
+        requestId: 'chatcmpl_reasoning_usage',
+        model: 'agent',
+        created: 1,
+      },
+      tracker,
+    });
+    await handlers[GraphEvents.CHAT_MODEL_END].handle(
+      GraphEvents.CHAT_MODEL_END,
+      {
+        output: {
+          usage_metadata: {
+            input_tokens: 3,
+            output_tokens: 5,
+            output_token_details: { reasoning: 2 },
+          },
+        },
+      } as t.ModelEndData
+    );
+    await sendOpenAIFinalChunk({
+      writer: { write: (data) => void writes.push(data) },
+      context: {
+        requestId: 'chatcmpl_reasoning_usage',
+        model: 'agent',
+        created: 1,
+      },
+      tracker,
+    });
+    expect(writes.at(-2)).toContain('"choices":[]');
+    expect(writes.at(-2)).toContain(
+      '"completion_tokens_details":{"reasoning_tokens":2}'
+    );
+  });
+  it('builds a chat completion chunk without transport dependencies', () => {
+    expect(
+      createChatCompletionChunk(
+        { requestId: 'chatcmpl_3', model: 'agent', created: 1 },
+        { content: 'x' }
+      )
+    ).toEqual({
+      id: 'chatcmpl_3',
+      object: 'chat.completion.chunk',
+      created: 1,
+      model: 'agent',
+      choices: [{ index: 0, delta: { content: 'x' }, finish_reason: null }],
+    });
+  });
+});