npm - @cloudbase/ai - Versions diffs - 2.8.20-beta.0 → 2.8.22-beta.0 - Mend

@cloudbase/ai 2.8.20-beta.0 → 2.8.22-beta.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (106) hide show

package/dist/cjs/AI.d.ts +27 -0
package/dist/cjs/AI.js +154 -0
package/dist/cjs/index.d.ts +13 -38
package/dist/cjs/index.js +9 -73
package/dist/cjs/models/Ark/index.d.ts +4 -18
package/dist/cjs/models/Ark/index.js +45 -82
package/dist/cjs/models/Ark/type.d.ts +52 -19
package/dist/cjs/models/Ark/type.js +1 -1
package/dist/cjs/models/DashScope/index.d.ts +4 -18
package/dist/cjs/models/DashScope/index.js +45 -82
package/dist/cjs/models/DashScope/type.d.ts +55 -24
package/dist/cjs/models/DashScope/type.js +1 -1
package/dist/cjs/models/HunYuan/index.d.ts +4 -19
package/dist/cjs/models/HunYuan/index.js +47 -107
package/dist/cjs/models/HunYuan/type.d.ts +68 -48
package/dist/cjs/models/HunYuan/type.js +1 -1
package/dist/cjs/models/HunYuan/util.d.ts +4 -0
package/dist/cjs/models/HunYuan/util.js +58 -0
package/dist/cjs/models/HunYuanBeta/index.d.ts +4 -19
package/dist/cjs/models/HunYuanBeta/index.js +42 -110
package/dist/cjs/models/Moonshot/index.d.ts +4 -18
package/dist/cjs/models/Moonshot/index.js +45 -82
package/dist/cjs/models/Moonshot/type.d.ts +63 -9
package/dist/cjs/models/Moonshot/type.js +1 -1
package/dist/cjs/models/Yi/index.d.ts +4 -18
package/dist/cjs/models/Yi/index.js +48 -82
package/dist/cjs/models/Yi/type.d.ts +41 -15
package/dist/cjs/models/Yi/type.js +1 -1
package/dist/cjs/models/ZhiPu/index.d.ts +4 -18
package/dist/cjs/models/ZhiPu/index.js +59 -87
package/dist/cjs/models/ZhiPu/type.d.ts +19 -19
package/dist/cjs/models/ZhiPu/type.js +1 -1
package/dist/cjs/models/index.d.ts +16 -15
package/dist/cjs/models/index.js +26 -23
package/dist/cjs/models/model.d.ts +38 -0
package/dist/cjs/models/model.js +481 -0
package/dist/cjs/type.d.ts +76 -15
package/dist/cjs/type.js +6 -12
package/dist/cjs/utils.d.ts +9 -1
package/dist/cjs/utils.js +46 -2
package/dist/esm/AI.d.ts +27 -0
package/dist/esm/AI.js +128 -0
package/dist/esm/index.d.ts +13 -38
package/dist/esm/index.js +4 -70
package/dist/esm/models/Ark/index.d.ts +4 -18
package/dist/esm/models/Ark/index.js +45 -82
package/dist/esm/models/Ark/type.d.ts +52 -19
package/dist/esm/models/Ark/type.js +1 -1
package/dist/esm/models/DashScope/index.d.ts +4 -18
package/dist/esm/models/DashScope/index.js +45 -82
package/dist/esm/models/DashScope/type.d.ts +55 -24
package/dist/esm/models/DashScope/type.js +1 -1
package/dist/esm/models/HunYuan/index.d.ts +4 -19
package/dist/esm/models/HunYuan/index.js +47 -107
package/dist/esm/models/HunYuan/type.d.ts +68 -48
package/dist/esm/models/HunYuan/type.js +1 -1
package/dist/esm/models/HunYuan/util.d.ts +4 -0
package/dist/esm/models/HunYuan/util.js +53 -0
package/dist/esm/models/HunYuanBeta/index.d.ts +4 -19
package/dist/esm/models/HunYuanBeta/index.js +42 -110
package/dist/esm/models/Moonshot/index.d.ts +4 -18
package/dist/esm/models/Moonshot/index.js +45 -82
package/dist/esm/models/Moonshot/type.d.ts +63 -9
package/dist/esm/models/Moonshot/type.js +1 -1
package/dist/esm/models/Yi/index.d.ts +4 -18
package/dist/esm/models/Yi/index.js +48 -82
package/dist/esm/models/Yi/type.d.ts +41 -15
package/dist/esm/models/Yi/type.js +1 -1
package/dist/esm/models/ZhiPu/index.d.ts +4 -18
package/dist/esm/models/ZhiPu/index.js +59 -87
package/dist/esm/models/ZhiPu/type.d.ts +19 -19
package/dist/esm/models/ZhiPu/type.js +1 -1
package/dist/esm/models/index.d.ts +16 -15
package/dist/esm/models/index.js +17 -16
package/dist/esm/models/model.d.ts +38 -0
package/dist/esm/models/model.js +478 -0
package/dist/esm/type.d.ts +76 -15
package/dist/esm/type.js +5 -11
package/dist/esm/utils.d.ts +9 -1
package/dist/esm/utils.js +41 -1
package/package.json +3 -3
package/src/AI.ts +77 -0
package/src/index.ts +3 -60
package/src/models/Ark/index.ts +52 -54
package/src/models/Ark/type.ts +60 -19
package/src/models/DashScope/index.ts +56 -55
package/src/models/DashScope/type.ts +63 -21
package/src/models/HunYuan/index.ts +44 -67
package/src/models/HunYuan/type.ts +68 -46
package/src/models/HunYuan/util.ts +59 -0
package/src/models/HunYuanBeta/index.ts +41 -75
package/src/models/Moonshot/index.ts +52 -54
package/src/models/Moonshot/type.ts +61 -7
package/src/models/Yi/index.ts +59 -55
package/src/models/Yi/type.ts +47 -19
package/src/models/ZhiPu/index.ts +60 -52
package/src/models/ZhiPu/type.ts +20 -9
package/src/models/index.ts +25 -15
package/src/models/model.ts +415 -0
package/src/type.ts +100 -13
package/src/utils.ts +53 -1
package/dist/cjs/models/HunYuanBeta/type.d.ts +0 -52
package/dist/cjs/models/HunYuanBeta/type.js +0 -3
package/dist/esm/models/HunYuanBeta/type.d.ts +0 -52
package/dist/esm/models/HunYuanBeta/type.js +0 -2
package/src/models/HunYuanBeta/type.ts +0 -61

package/src/models/ZhiPu/index.ts CHANGED Viewed

@@ -1,15 +1,45 @@
-import { type ParsedEvent } from '../../eventsource_parser'
 import {
   createAsyncIterable,
   TransformStream,
-  TextDecoderStream,
-  createEventSourceParserTransformStream,
   toPolyfillReadable,
+  intoStandardStream,
+  isToolCallAssistantMessage,
 } from '../../utils'
-import type { ZhiPuGenerateTextOutput, ZhiPuStreamTextOutput } from './type'
-import type { ChatModel, StreamTextResult, ModelReq, BaseChatModelInput } from '../../type'
+import type { ZhiPuGenerateTextOutput, ZhiPuInputData, ZhiPuStreamTextOutput } from './type'
+import type {
+  ModelReq,
+  BaseChatModelInput,
+  SimpleChatModel,
+  DoStreamOutput,
+  BaseDoStreamOutputChunk,
+  DoGenerateOutput,
+} from '../../type'
-export class ZhiPuModel implements ChatModel {
+function processInput(input: BaseChatModelInput): ZhiPuInputData {
+  const { messages, model, temperature, tool_choice, tools, top_p } = input
+  const processToolChoice = () => {
+    if (tool_choice && tool_choice !== 'auto') {
+      console.warn('`tool_choice` is not \'auto\'')
+    }
+    return tool_choice as any
+  }
+  return {
+    ...input,
+    messages,
+    model,
+    temperature,
+    tool_choice: processToolChoice(),
+    tools: tools?.map(tool => ({
+      ...tool,
+      function: { ...tool.function, parameters: JSON.parse(tool.function.parameters) },
+    })),
+    top_p,
+  }
+}
+export class ZhiPuSimpleModel implements SimpleChatModel {
   public subUrl = 'zhipu/api/paas/v4/chat/completions'
   constructor(private req: ModelReq, public baseUrl: string, subUrl?: string) {
     if (subUrl != null) {
@@ -21,7 +51,8 @@ export class ZhiPuModel implements ChatModel {
     return `${this.baseUrl}/${this.subUrl}`
   }
-  async generateText(data: BaseChatModelInput) {
+  public async doGenerate(_data: BaseChatModelInput): Promise<DoGenerateOutput> {
+    const data = processInput(_data)
     const res = (await this.req({
       url: this.url,
       data: {
@@ -30,14 +61,13 @@ export class ZhiPuModel implements ChatModel {
       },
       stream: false,
     })) as ZhiPuGenerateTextOutput
-    return {
-      text: (res?.choices?.[0]?.message?.content as string) ?? '',
-      rawResponse: res,
-    }
+    return { ...res, rawResponse: res }
   }
-  async streamText(data: BaseChatModelInput) {
-    const stream = await this.req({
+  public async doStream(_data: BaseChatModelInput): Promise<DoStreamOutput> {
+    const data = processInput(_data)
+    let isToolCall: null | boolean = null
+    const _stream = await this.req({
       url: this.url,
       data: {
         ...data,
@@ -45,50 +75,28 @@ export class ZhiPuModel implements ChatModel {
       },
       stream: true,
     })
-    return new ZhiPuModelStreamResult(stream)
-  }
-}
-class ZhiPuModelStreamResult implements StreamTextResult {
-  private _eventSourceStream: ReadableStream<ParsedEvent>
-  constructor(_stream: ReadableStream<Uint8Array>) {
     const stream = toPolyfillReadable(_stream) as typeof _stream
-    this._eventSourceStream = stream
-      .pipeThrough(new TextDecoderStream())
-      .pipeThrough(createEventSourceParserTransformStream())
-  }
-  private get teeedStream() {
-    const [s1, s2] = this._eventSourceStream.tee()
-    this._eventSourceStream = s2
-    return s1
-  }
-  get eventSourceStream() {
-    return createAsyncIterable(this.teeedStream)
-  }
-  get dataStream() {
-    return createAsyncIterable(this.eventSourceStream.pipeThrough(new TransformStream<ParsedEvent, ZhiPuStreamTextOutput>({
+    const zhipuStream = intoStandardStream<ZhiPuStreamTextOutput>(stream)
+    const streamWithRaw = zhipuStream.pipeThrough(new TransformStream<ZhiPuStreamTextOutput, BaseDoStreamOutputChunk & { rawResponse?: any }>({
       transform(chunk, controller) {
-        try {
-          const data = JSON.parse(chunk.data) as ZhiPuStreamTextOutput
-          controller.enqueue(data)
-        } catch (e) {
-          if (chunk.data !== '[DONE]') {
-            console.warn('Error when transforming event source data to json', e)
+        const newChoices = chunk.choices.map((choice) => {
+          const message = choice.delta
+          if (isToolCall == null) isToolCall = isToolCallAssistantMessage(message)
+          if (isToolCall) {
+            return {
+              ...choice,
+              finish_reason: 'tool_calls' as const,
+              delta: message,
+            }
           }
-        }
+          return choice
+        })
+        const newChunk = { ...chunk, choices: newChoices }
+        controller.enqueue({ ...newChunk, rawResponse: chunk })
       },
-    }),),)
-  }
+    }),)
-  get textStream() {
-    return createAsyncIterable(this.dataStream.pipeThrough(new TransformStream<ZhiPuStreamTextOutput, string>({
-      transform(chunk, controller) {
-        controller.enqueue(chunk?.choices?.[0]?.delta?.content ?? '')
-      },
-    }),),)
+    return createAsyncIterable(streamWithRaw)
   }
 }

package/src/models/ZhiPu/type.ts CHANGED Viewed

@@ -1,3 +1,5 @@
+import { ChatModelMessage } from '../../type'
 type SystemMessage = {
   role: 'system'
   content: string
@@ -13,8 +15,8 @@ type AssistantMessage = {
   content?: string
   tool_calls?: Array<{
     id: string
-    type: 'web_search' | 'retrieval' | 'function'
-    function?: { name: string; auguments: string }
+    type: string
+    function?: { name: string; arguments: string }
   }>
 }
@@ -36,25 +38,34 @@ export type ZhiPuInputData = {
   max_tokens?: number
   stop?: Array<string>
   tools?: Array<{
-    type: 'web_search' | 'retrieval' | 'function'
+    type: string
     function: { name: string; description: string; parameters: object }
-    retrieval: { knowledge_id: string; prompt_template?: string; parameters: object }
-    web_search: { enable?: boolean; search_query?: string; search_result?: boolean }
   }>
   tool_choice?: 'auto'
   user_id?: string
 }
-// todo: more precise
 export type ZhiPuGenerateTextOutput = {
   choices?: Array<{
-    message?: { content?: string }
+    finish_reason?: 'stop' | 'tool_calls' | 'length' | 'sensitive' | 'network_error'
+    message?: ChatModelMessage
   }>
+  usage?: {
+    completion_tokens: number
+    prompt_tokens: number
+    total_tokens: number
+  }
 }
-// todo: more precise
 export type ZhiPuStreamTextOutput = {
   choices?: Array<{
-    delta?: { content?: string }
+    index: number
+    finish_reason?: 'stop' | 'tool_calls' | 'length' | 'sensitive' | 'network_error'
+    delta?: ChatModelMessage
   }>
+  usage?: {
+    completion_tokens: number
+    prompt_tokens: number
+    total_tokens: number
+  }
 }

package/src/models/index.ts CHANGED Viewed

@@ -1,19 +1,29 @@
-import { HunYuanModel } from './HunYuan'
-import { ArkModel } from './Ark'
-import { DashScopeModel } from './DashScope'
-import { YiModel } from './Yi'
-import { MoonshotModel } from './Moonshot'
-import { ZhiPuModel } from './ZhiPu'
-import { HunYuanBetaModel } from './HunYuanBeta'
+import { ZhiPuSimpleModel } from './ZhiPu/index'
+import { HunYuanBetaSimpleModel } from './HunYuanBeta/index'
+import { HunYuanSimpleModel } from './HunYuan/index'
+import { ArkSimpleModel } from './Ark/index'
+import { DSSimpleModel } from './DashScope/index'
+import { YiSimpleModel } from './Yi/index'
+import { MoonshotSimpleModel } from './Moonshot/index'
 export const MODELS = {
-  hunyuan: HunYuanModel,
-  'hunyuan-beta': HunYuanBetaModel,
-  ark: ArkModel,
-  dashscope: DashScopeModel,
-  '01-ai': YiModel,
-  moonshot: MoonshotModel,
-  zhipu: ZhiPuModel,
+  hunyuan: HunYuanSimpleModel,
+  'hunyuan-beta': HunYuanBetaSimpleModel,
+  ark: ArkSimpleModel,
+  dashscope: DSSimpleModel,
+  '01-ai': YiSimpleModel,
+  moonshot: MoonshotSimpleModel,
+  zhipu: ZhiPuSimpleModel,
 }
-export { HunYuanModel, HunYuanBetaModel, ArkModel, DashScopeModel, YiModel, MoonshotModel, ZhiPuModel }
+export {
+  ZhiPuSimpleModel,
+  HunYuanBetaSimpleModel,
+  HunYuanSimpleModel,
+  ArkSimpleModel,
+  DSSimpleModel,
+  YiSimpleModel,
+  MoonshotSimpleModel,
+}
+export { ReactModel, toolMap } from './model'

package/src/models/model.ts ADDED Viewed

@@ -0,0 +1,415 @@
+import {
+  createAsyncIterable,
+  TransformStream,
+  createPromise,
+  isToolCallAssistantMessage,
+  functionToolToModelTool,
+} from '../utils'
+import {
+  BaseChatModelInput,
+  BaseDoStreamOutputChunk,
+  DoStreamOutput,
+  DoGenerateOutput,
+  SimpleChatModel,
+  ToolCall,
+  ChatModelMessage,
+  AsyncIterableReadableStream,
+  Usage,
+  ToolCallAssistantMessage,
+  ModelTool,
+  FunctionTool,
+} from '../type'
+type ReactModelInput = ReactProps & Omit<BaseChatModelInput, 'tools'> & { tools?: Array<ModelTool | FunctionTool> }
+interface IOnStepFinish {
+  messages: Array<ChatModelMessage>
+  text?: string
+  toolCall?: ToolCall
+  toolResult?: unknown
+  finishReason?: string
+  stepUsage?: Usage
+  totalUsage?: Usage
+}
+interface ReactProps {
+  maxSteps?: number
+  onStepFinish?: (prop: IOnStepFinish) => unknown
+  abortSignal?: AbortSignal // TODO: 实现 abortSignal
+}
+function processInput(obj: ReactModelInput): [ReactProps, BaseChatModelInput] {
+  const { onStepFinish, abortSignal, maxSteps, ...b } = obj
+  if (maxSteps != null && maxSteps < 1) {
+    throw new Error('`maxSteps` muse be greater than 0.')
+  }
+  return [
+    { onStepFinish, abortSignal, maxSteps },
+    {
+      ...b,
+      tools: b.tools?.map((tool) => {
+        if ('fn' in tool) {
+          return functionToolToModelTool(tool)
+        }
+        return tool
+      }),
+    },
+  ]
+}
+export class ReactModel {
+  constructor(private model: SimpleChatModel) {}
+  public async generateText(_input: ReactModelInput): Promise<{
+    text: string
+    messages: Array<ChatModelMessage>
+    usage: Usage
+    rawResponses: Array<unknown>
+    error?: any
+  }> {
+    const rawResponses = []
+    const totalUsage: Usage = { completion_tokens: 0, prompt_tokens: 0, total_tokens: 0 }
+    const [{ onStepFinish, maxSteps = 10 }, input] = processInput(_input)
+    const doGenerate = () => this.model.doGenerate(input) // 后续代码会直接对 input.messages 原地修改，这里一直用同一个对象就行
+    let currentRes = await doGenerate()
+    let currentStep = 1
+    currentRes.rawResponse && rawResponses.push(currentRes.rawResponse)
+    let toolCall: ToolCall | null = null
+    // TODO: 一次对话有多个 tool call? 目前没有这种现象，暂时不处理
+    while (currentStep < maxSteps && (toolCall = getToolCallFromGenerate(currentRes)) != null) {
+      const stepUsage = createSolidUsage(currentRes.usage)
+      addToUsage(totalUsage, stepUsage)
+      // 当判断需要工具调用时
+      try {
+        const toolCallResult = await callTool(toolCall) // 调用
+        const choice = currentRes.choices[0] // getToolCallFromGenerate 保证了 choice 肯定存在
+        await onStepFinish?.({
+          finishReason: choice.finish_reason,
+          messages: input.messages.slice(),
+          text: choice.message.content,
+          toolCall,
+          toolResult: toolCallResult,
+          stepUsage,
+          totalUsage: Object.assign({}, totalUsage),
+        })
+        pushNewMessages(input.messages, choice.message as ToolCallAssistantMessage, toolCallResult) // 用调用结果修改最新的消息
+        currentRes = await doGenerate() // 循环对话
+        currentRes.rawResponse && rawResponses.push(currentRes.rawResponse)
+        currentStep += 1
+      } catch (e) {
+        return {
+          text: '',
+          messages: input.messages,
+          usage: totalUsage,
+          error: e,
+          rawResponses,
+        }
+      }
+    }
+    const lastChoice = currentRes?.choices?.[0]
+    const lastMessage = lastChoice?.message
+    const text = lastMessage?.content ?? ''
+    const messages = lastMessage ? [...input.messages, lastMessage] : input.messages
+    const stepUsage = createSolidUsage(currentRes.usage)
+    addToUsage(totalUsage, stepUsage)
+    await onStepFinish?.({
+      finishReason: lastChoice.finish_reason,
+      messages: messages.slice(),
+      text,
+      toolCall: getToolCallFromGenerate(currentRes),
+      toolResult: null,
+      stepUsage,
+      totalUsage: Object.assign({}, totalUsage),
+    })
+    return {
+      text,
+      messages,
+      usage: totalUsage,
+      rawResponses,
+    }
+  }
+  public async streamText(_input: ReactModelInput): Promise<{
+    dataStream: DoStreamOutput
+    textStream: AsyncIterableReadableStream<string>
+    messages: Promise<Array<ChatModelMessage>>
+    usage: Promise<Usage>
+    error?: any
+  }> {
+    const totalUsage: Usage = { completion_tokens: 0, prompt_tokens: 0, total_tokens: 0 }
+    const [{ onStepFinish, maxSteps = 10 }, input] = processInput(_input)
+    const doStream = () => this.model.doStream(input) // 后续代码会直接对 input.messages 原地修改，这里一直用同一个对象就行
+    let currentRes = await doStream()
+    const currentStep = 1
+    let readResult: { message: ToolCallAssistantMessage; usage: Usage } | null = null
+    const readCurrentStream = () => {
+      const [oldStream, newStream] = currentRes.tee()
+      currentRes = createAsyncIterable(oldStream)
+      return readFunctionCallStream(newStream)
+    }
+    // TODO: 一次对话有多个 tool call? 目前没有这种现象，暂时不处理
+    // 这里和 generateText 不太一样，除了解析出 toolCall 外，还需要从流中构造出其他完整的信息
+    while (currentStep < maxSteps && (readResult = await readCurrentStream()) != null) {
+      const { message: assistantMessage, usage: stepUsage } = readResult
+      addToUsage(totalUsage, stepUsage)
+      // 当判断需要工具调用时
+      const toolCall = assistantMessage.tool_calls?.[0] // 这个 toolCall 一定存在
+      try {
+        const toolCallResult = await callTool(toolCall) // 调用
+        await onStepFinish?.({
+          finishReason: 'tool_calls',
+          messages: input.messages.slice(),
+          text: assistantMessage.content,
+          toolCall,
+          toolResult: toolCallResult,
+          stepUsage,
+          totalUsage: Object.assign({}, totalUsage),
+        })
+        pushNewMessages(input.messages, assistantMessage, toolCallResult) // 用调用结果修改最新的消息
+        currentRes = await doStream() // 循环对话
+      } catch (e) {
+        const [s1, s2] = currentRes.tee()
+        return {
+          messages: Promise.resolve(input.messages),
+          dataStream: createAsyncIterable(s1),
+          textStream: createAsyncIterable(s2.pipeThrough(new TransformStream({
+            transform(chunk, controller) {
+              const str = chunk?.choices?.[0]?.delta?.content
+              if (typeof str === 'string') controller.enqueue(str)
+            },
+          }),),),
+          usage: Promise.resolve(totalUsage),
+          error: e,
+        }
+      }
+    }
+    /**
+     * 最后返回时，有几种情况：
+     * 1. 没超 maxStep 无工具调用
+     * 2. 超了 maxStep 有工具调用
+     * 3. 超了 maxStep 无工具调用
+     * never. 没超 maxStep，有工具调用，这时候会进到上面的 while 循环 block 中处理
+     *
+     * 其中 1. 3. 可以合并，没有工具调用就应该直接返回，无论 maxStep
+     *
+     * 所以合并为：
+     * 1. 无工具调用
+     * 2. 有工具调用，但是超过 maxStep
+     *
+     * 这两种情况都没进到 while 循环 block 中处理
+     * 我们需要 a. 塞 message b. 算 Usage c. 调用 onStepFinish
+     */
+    readResult = await readCurrentStream()
+    if (readResult) {
+      // 情况 2 有工具调用，但是超过 maxStep
+      const { message, usage } = readResult
+      addToUsage(totalUsage, usage)
+      const messages = [...input.messages, message]
+      onStepFinish({
+        messages: messages.slice(),
+        finishReason: 'tool_call',
+        stepUsage: usage,
+        text: message.content,
+        toolCall: message.tool_calls[0],
+        totalUsage: Object.assign({}, totalUsage),
+      })
+      const [s1, s2] = currentRes.tee()
+      return {
+        messages: Promise.resolve([...input.messages, message]),
+        dataStream: createAsyncIterable(s1),
+        textStream: createAsyncIterable(s2.pipeThrough(new TransformStream({
+          transform(chunk, controller) {
+            const str = chunk?.choices?.[0]?.delta?.content
+            if (typeof str === 'string') controller.enqueue(str)
+          },
+        }),),),
+        usage: Promise.resolve(totalUsage),
+      }
+    }
+    // 情况 1 无工具调用
+    const messagePromise = createPromise<Array<ChatModelMessage>>()
+    const usagePromise = createPromise<Usage>()
+    const message: ChatModelMessage = {
+      role: 'assistant',
+      content: '',
+    }
+    let finishReason = ''
+    const stepUsage: Usage = { completion_tokens: 0, prompt_tokens: 0, total_tokens: 0 }
+    const originStream = currentRes.pipeThrough(new TransformStream({
+      transform(chunk, controller) {
+        // 不改变 chunk 内容，只是拦截下内容拼最后的结果
+        const content = chunk?.choices?.[0]?.delta?.content
+        if (typeof content === 'string') {
+          message.content += content
+        }
+        const reason = chunk?.choices?.[0]?.finish_reason
+        if (reason) finishReason = reason
+        // TODO: 不同大模型的 stream usage 格式不一样，后续可能要调整.
+        // hunyuan 每个 chunk 都会有 usage，逐步增加，以最后一个的为准;
+        // zhipu 最后 chunk 会有 usage;
+        if (chunk?.usage?.completion_tokens) stepUsage.completion_tokens = chunk.usage.completion_tokens
+        if (chunk?.usage?.prompt_tokens) stepUsage.prompt_tokens = chunk.usage.prompt_tokens
+        if (chunk?.usage?.total_tokens) stepUsage.total_tokens = chunk.usage.total_tokens
+        controller.enqueue(chunk)
+      },
+      flush() {
+        messagePromise.res([...input.messages, message])
+        addToUsage(totalUsage, stepUsage)
+        usagePromise.res(Object.assign({}, totalUsage))
+        onStepFinish?.({
+          messages: [...input.messages, message],
+          finishReason,
+          text: message.content,
+          stepUsage,
+          totalUsage: Object.assign({}, totalUsage),
+        })
+      },
+    }),)
+    const [s1, s2] = originStream.tee()
+    return {
+      messages: messagePromise.promise,
+      dataStream: createAsyncIterable(s1),
+      textStream: createAsyncIterable(s2.pipeThrough(new TransformStream({
+        transform(chunk, controller) {
+          const content = chunk?.choices?.[0]?.delta?.content
+          if (typeof content === 'string') {
+            controller.enqueue(content)
+          }
+        },
+      }),),),
+      usage: usagePromise.promise,
+    }
+  }
+}
+function getToolCallFromGenerate(output: DoGenerateOutput) {
+  const choice = output?.choices?.[0]
+  if (!choice) return null
+  const { finish_reason, message } = choice
+  if (finish_reason !== 'tool_calls') return null
+  if (!message) return null
+  if (!isToolCallAssistantMessage(message)) return null
+  return message.tool_calls[0]
+}
+function pushNewMessages(
+  messages: Array<ChatModelMessage>,
+  assistantMessage: ToolCallAssistantMessage,
+  toolCallResult: unknown,
+) {
+  messages.push(assistantMessage, {
+    role: 'tool',
+    tool_call_id: assistantMessage.tool_calls[0].id,
+    content: JSON.stringify(toolCallResult),
+  })
+}
+async function readFunctionCallStream(stream: ReadableStream<BaseDoStreamOutputChunk>,): Promise<{ message: ToolCallAssistantMessage; usage: Usage } | null> {
+  const stepUsage: Usage = { completion_tokens: 0, prompt_tokens: 0, total_tokens: 0 }
+  const aStream = createAsyncIterable(stream)
+  const retToolCall: ToolCall = {
+    id: '',
+    function: {
+      name: '',
+      arguments: '',
+    },
+    type: '',
+  }
+  const retMessage: ToolCallAssistantMessage = {
+    role: 'assistant',
+    content: '',
+    tool_calls: [retToolCall],
+  }
+  for await (const chunk of aStream) {
+    const choice = chunk?.choices[0]
+    if (!choice) return null
+    const { finish_reason, delta } = choice
+    if (finish_reason !== 'tool_calls') return null
+    if (!delta) continue
+    if (delta.content) retMessage.content += delta.content
+    if (!('tool_calls' in delta)) continue
+    const toolCall = delta?.tool_calls?.[0]
+    if (toolCall?.id) retToolCall.id = toolCall.id
+    if (toolCall?.type) retToolCall.type = toolCall.type
+    if (toolCall?.function?.name) retToolCall.function.name = toolCall.function.name
+    if (toolCall?.function?.arguments) retToolCall.function.arguments += toolCall.function.arguments
+    // TODO: 不同大模型的 stream usage 格式不一样，后续可能要调整.
+    // hunyuan 每个 chunk 都会有 usage，逐步增加，以最后一个的为准;
+    // zhipu 最后 chunk 会有 usage;
+    if (chunk?.usage?.completion_tokens) stepUsage.completion_tokens = chunk.usage.completion_tokens
+    if (chunk?.usage?.prompt_tokens) stepUsage.prompt_tokens = chunk.usage.prompt_tokens
+    if (chunk?.usage?.total_tokens) stepUsage.total_tokens = chunk.usage.total_tokens
+  }
+  return {
+    message: retMessage,
+    usage: stepUsage,
+  }
+}
+export const toolMap = new Map<string, CallableFunction>()
+function callTool(toolCall: ToolCall) {
+  return toolMap.get(toolCall.function.name)(JSON.parse(toolCall.function.arguments))
+}
+function createSolidUsage(usage?: Partial<Usage>): Usage {
+  return {
+    completion_tokens: usage?.completion_tokens ?? 0,
+    prompt_tokens: usage?.prompt_tokens ?? 0,
+    total_tokens: usage?.total_tokens ?? 0,
+  }
+}
+function addToUsage(targetUsage: Usage, sourceUsage: Usage) {
+  targetUsage.completion_tokens += sourceUsage.completion_tokens
+  targetUsage.prompt_tokens += sourceUsage.prompt_tokens
+  targetUsage.total_tokens += sourceUsage.total_tokens
+}