npm - @ai-sdk/openai - Versions diffs - 2.0.11 → 2.0.13 - Mend

@ai-sdk/openai 2.0.11 → 2.0.13

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (14) hide show

package/CHANGELOG.md +18 -0
package/dist/index.d.mts +2 -0
package/dist/index.d.ts +2 -0
package/dist/index.js +106 -28
package/dist/index.js.map +1 -1
package/dist/index.mjs +106 -28
package/dist/index.mjs.map +1 -1
package/dist/internal/index.d.mts +2 -0
package/dist/internal/index.d.ts +2 -0
package/dist/internal/index.js +106 -28
package/dist/internal/index.js.map +1 -1
package/dist/internal/index.mjs +106 -28
package/dist/internal/index.mjs.map +1 -1
package/package.json +2 -2

package/dist/internal/index.d.mts CHANGED Viewed

@@ -233,6 +233,7 @@ declare const openaiResponsesProviderOptionsSchema: z.ZodObject<{
     include: z.ZodOptional<z.ZodNullable<z.ZodArray<z.ZodEnum<{
         "reasoning.encrypted_content": "reasoning.encrypted_content";
         "file_search_call.results": "file_search_call.results";
+        "message.output_text.logprobs": "message.output_text.logprobs";
     }>>>>;
     textVerbosity: z.ZodOptional<z.ZodNullable<z.ZodEnum<{
         low: "low";
@@ -241,6 +242,7 @@ declare const openaiResponsesProviderOptionsSchema: z.ZodObject<{
     }>>>;
     promptCacheKey: z.ZodOptional<z.ZodNullable<z.ZodString>>;
     safetyIdentifier: z.ZodOptional<z.ZodNullable<z.ZodString>>;
+    logprobs: z.ZodOptional<z.ZodUnion<readonly [z.ZodBoolean, z.ZodNumber]>>;
 }, z.core.$strip>;
 type OpenAIResponsesProviderOptions = z.infer<typeof openaiResponsesProviderOptionsSchema>;

package/dist/internal/index.d.ts CHANGED Viewed

@@ -233,6 +233,7 @@ declare const openaiResponsesProviderOptionsSchema: z.ZodObject<{
     include: z.ZodOptional<z.ZodNullable<z.ZodArray<z.ZodEnum<{
         "reasoning.encrypted_content": "reasoning.encrypted_content";
         "file_search_call.results": "file_search_call.results";
+        "message.output_text.logprobs": "message.output_text.logprobs";
     }>>>>;
     textVerbosity: z.ZodOptional<z.ZodNullable<z.ZodEnum<{
         low: "low";
@@ -241,6 +242,7 @@ declare const openaiResponsesProviderOptionsSchema: z.ZodObject<{
     }>>>;
     promptCacheKey: z.ZodOptional<z.ZodNullable<z.ZodString>>;
     safetyIdentifier: z.ZodOptional<z.ZodNullable<z.ZodString>>;
+    logprobs: z.ZodOptional<z.ZodUnion<readonly [z.ZodBoolean, z.ZodNumber]>>;
 }, z.core.$strip>;
 type OpenAIResponsesProviderOptions = z.infer<typeof openaiResponsesProviderOptionsSchema>;

package/dist/internal/index.js CHANGED Viewed

@@ -1143,13 +1143,13 @@ var openaiChatChunkSchema = import_v45.z.union([
   openaiErrorDataSchema
 ]);
 function isReasoningModel(modelId) {
-  return modelId.startsWith("o") || modelId.startsWith("gpt-5");
+  return (modelId.startsWith("o") || modelId.startsWith("gpt-5")) && !modelId.startsWith("gpt-5-chat");
 }
 function supportsFlexProcessing(modelId) {
-  return modelId.startsWith("o3") || modelId.startsWith("o4-mini") || modelId.startsWith("gpt-5");
+  return modelId.startsWith("o3") || modelId.startsWith("o4-mini") || modelId.startsWith("gpt-5") && !modelId.startsWith("gpt-5-chat");
 }
 function supportsPriorityProcessing(modelId) {
-  return modelId.startsWith("gpt-4") || modelId.startsWith("gpt-5-mini") || modelId.startsWith("gpt-5") && !modelId.startsWith("gpt-5-nano") || modelId.startsWith("o3") || modelId.startsWith("o4-mini");
+  return modelId.startsWith("gpt-4") || modelId.startsWith("gpt-5-mini") || modelId.startsWith("gpt-5") && !modelId.startsWith("gpt-5-nano") && !modelId.startsWith("gpt-5-chat") || modelId.startsWith("o3") || modelId.startsWith("o4-mini");
 }
 function getSystemMessageMode(modelId) {
   var _a, _b;
@@ -1920,6 +1920,8 @@ var OpenAITranscriptionModel = class {
         include: openAIOptions.include,
         language: openAIOptions.language,
         prompt: openAIOptions.prompt,
+        response_format: "verbose_json",
+        // always use verbose_json to get segments
         temperature: openAIOptions.temperature,
         timestamp_granularities: openAIOptions.timestampGranularities
       };
@@ -1935,7 +1937,7 @@ var OpenAITranscriptionModel = class {
     };
   }
   async doGenerate(options) {
-    var _a, _b, _c, _d, _e, _f;
+    var _a, _b, _c, _d, _e, _f, _g, _h;
     const currentDate = (_c = (_b = (_a = this.config._internal) == null ? void 0 : _a.currentDate) == null ? void 0 : _b.call(_a)) != null ? _c : /* @__PURE__ */ new Date();
     const { formData, warnings } = await this.getArgs(options);
     const {
@@ -1959,13 +1961,17 @@ var OpenAITranscriptionModel = class {
     const language = response.language != null && response.language in languageMap ? languageMap[response.language] : void 0;
     return {
       text: response.text,
-      segments: (_e = (_d = response.words) == null ? void 0 : _d.map((word) => ({
+      segments: (_g = (_f = (_d = response.segments) == null ? void 0 : _d.map((segment) => ({
+        text: segment.text,
+        startSecond: segment.start,
+        endSecond: segment.end
+      }))) != null ? _f : (_e = response.words) == null ? void 0 : _e.map((word) => ({
         text: word.word,
         startSecond: word.start,
         endSecond: word.end
-      }))) != null ? _e : [],
+      }))) != null ? _g : [],
       language,
-      durationInSeconds: (_f = response.duration) != null ? _f : void 0,
+      durationInSeconds: (_h = response.duration) != null ? _h : void 0,
       warnings,
       response: {
         timestamp: currentDate,
@@ -1986,6 +1992,20 @@ var openaiTranscriptionResponseSchema = import_v412.z.object({
       start: import_v412.z.number(),
       end: import_v412.z.number()
     })
+  ).nullish(),
+  segments: import_v412.z.array(
+    import_v412.z.object({
+      id: import_v412.z.number(),
+      seek: import_v412.z.number(),
+      start: import_v412.z.number(),
+      end: import_v412.z.number(),
+      text: import_v412.z.string(),
+      tokens: import_v412.z.array(import_v412.z.number()),
+      temperature: import_v412.z.number(),
+      avg_logprob: import_v412.z.number(),
+      compression_ratio: import_v412.z.number(),
+      no_speech_prob: import_v412.z.number()
+    })
   ).nullish()
 });
@@ -2426,6 +2446,19 @@ function prepareResponsesTools({
 }
 // src/responses/openai-responses-language-model.ts
+var TOP_LOGPROBS_MAX = 20;
+var LOGPROBS_SCHEMA = import_v416.z.array(
+  import_v416.z.object({
+    token: import_v416.z.string(),
+    logprob: import_v416.z.number(),
+    top_logprobs: import_v416.z.array(
+      import_v416.z.object({
+        token: import_v416.z.string(),
+        logprob: import_v416.z.number()
+      })
+    )
+  })
+);
 var OpenAIResponsesLanguageModel = class {
   constructor(modelId, config) {
     this.specificationVersion = "v2";
@@ -2489,6 +2522,8 @@ var OpenAIResponsesLanguageModel = class {
       schema: openaiResponsesProviderOptionsSchema
     });
     const strictJsonSchema = (_a = openaiOptions == null ? void 0 : openaiOptions.strictJsonSchema) != null ? _a : false;
+    const topLogprobs = typeof (openaiOptions == null ? void 0 : openaiOptions.logprobs) === "number" ? openaiOptions == null ? void 0 : openaiOptions.logprobs : (openaiOptions == null ? void 0 : openaiOptions.logprobs) === true ? TOP_LOGPROBS_MAX : void 0;
+    const openaiOptionsInclude = topLogprobs ? Array.isArray(openaiOptions == null ? void 0 : openaiOptions.include) ? [...openaiOptions == null ? void 0 : openaiOptions.include, "message.output_text.logprobs"] : ["message.output_text.logprobs"] : openaiOptions == null ? void 0 : openaiOptions.include;
     const baseArgs = {
       model: this.modelId,
       input: messages,
@@ -2519,9 +2554,10 @@ var OpenAIResponsesLanguageModel = class {
       user: openaiOptions == null ? void 0 : openaiOptions.user,
       instructions: openaiOptions == null ? void 0 : openaiOptions.instructions,
       service_tier: openaiOptions == null ? void 0 : openaiOptions.serviceTier,
-      include: openaiOptions == null ? void 0 : openaiOptions.include,
+      include: openaiOptionsInclude,
       prompt_cache_key: openaiOptions == null ? void 0 : openaiOptions.promptCacheKey,
       safety_identifier: openaiOptions == null ? void 0 : openaiOptions.safetyIdentifier,
+      top_logprobs: topLogprobs,
       // model-specific settings:
       ...modelConfig.isReasoningModel && ((openaiOptions == null ? void 0 : openaiOptions.reasoningEffort) != null || (openaiOptions == null ? void 0 : openaiOptions.reasoningSummary) != null) && {
         reasoning: {
@@ -2605,7 +2641,7 @@ var OpenAIResponsesLanguageModel = class {
     };
   }
   async doGenerate(options) {
-    var _a, _b, _c, _d, _e, _f, _g, _h, _i;
+    var _a, _b, _c, _d, _e, _f, _g, _h, _i, _j, _k;
     const { args: body, warnings } = await this.getArgs(options);
     const url = this.config.url({
       path: "/responses",
@@ -2639,6 +2675,7 @@ var OpenAIResponsesLanguageModel = class {
                   import_v416.z.object({
                     type: import_v416.z.literal("output_text"),
                     text: import_v416.z.string(),
+                    logprobs: LOGPROBS_SCHEMA.nullish(),
                     annotations: import_v416.z.array(
                       import_v416.z.object({
                         type: import_v416.z.literal("url_citation"),
@@ -2716,6 +2753,7 @@ var OpenAIResponsesLanguageModel = class {
       });
     }
     const content = [];
+    const logprobs = [];
     for (const part of response.output) {
       switch (part.type) {
         case "reasoning": {
@@ -2738,6 +2776,9 @@ var OpenAIResponsesLanguageModel = class {
         }
         case "message": {
           for (const contentPart of part.content) {
+            if (((_c = (_b = options.providerOptions) == null ? void 0 : _b.openai) == null ? void 0 : _c.logprobs) && contentPart.logprobs) {
+              logprobs.push(contentPart.logprobs);
+            }
             content.push({
               type: "text",
               text: contentPart.text,
@@ -2751,7 +2792,7 @@ var OpenAIResponsesLanguageModel = class {
               content.push({
                 type: "source",
                 sourceType: "url",
-                id: (_d = (_c = (_b = this.config).generateId) == null ? void 0 : _c.call(_b)) != null ? _d : (0, import_provider_utils14.generateId)(),
+                id: (_f = (_e = (_d = this.config).generateId) == null ? void 0 : _e.call(_d)) != null ? _f : (0, import_provider_utils14.generateId)(),
                 url: annotation.url,
                 title: annotation.title
               });
@@ -2834,18 +2875,24 @@ var OpenAIResponsesLanguageModel = class {
         }
       }
     }
+    const providerMetadata = {
+      openai: { responseId: response.id }
+    };
+    if (logprobs.length > 0) {
+      providerMetadata.openai.logprobs = logprobs;
+    }
     return {
       content,
       finishReason: mapOpenAIResponseFinishReason({
-        finishReason: (_e = response.incomplete_details) == null ? void 0 : _e.reason,
+        finishReason: (_g = response.incomplete_details) == null ? void 0 : _g.reason,
         hasToolCalls: content.some((part) => part.type === "tool-call")
       }),
       usage: {
         inputTokens: response.usage.input_tokens,
         outputTokens: response.usage.output_tokens,
         totalTokens: response.usage.input_tokens + response.usage.output_tokens,
-        reasoningTokens: (_g = (_f = response.usage.output_tokens_details) == null ? void 0 : _f.reasoning_tokens) != null ? _g : void 0,
-        cachedInputTokens: (_i = (_h = response.usage.input_tokens_details) == null ? void 0 : _h.cached_tokens) != null ? _i : void 0
+        reasoningTokens: (_i = (_h = response.usage.output_tokens_details) == null ? void 0 : _h.reasoning_tokens) != null ? _i : void 0,
+        cachedInputTokens: (_k = (_j = response.usage.input_tokens_details) == null ? void 0 : _j.cached_tokens) != null ? _k : void 0
       },
       request: { body },
       response: {
@@ -2855,11 +2902,7 @@ var OpenAIResponsesLanguageModel = class {
         headers: responseHeaders,
         body: rawResponse
       },
-      providerMetadata: {
-        openai: {
-          responseId: response.id
-        }
-      },
+      providerMetadata,
       warnings
     };
   }
@@ -2889,6 +2932,7 @@ var OpenAIResponsesLanguageModel = class {
       outputTokens: void 0,
       totalTokens: void 0
     };
+    const logprobs = [];
     let responseId = null;
     const ongoingToolCalls = {};
     let hasToolCalls = false;
@@ -3114,6 +3158,9 @@ var OpenAIResponsesLanguageModel = class {
                 id: value.item_id,
                 delta: value.delta
               });
+              if (value.logprobs) {
+                logprobs.push(value.logprobs);
+              }
             } else if (isResponseReasoningSummaryPartAddedChunk(value)) {
               if (value.summary_index > 0) {
                 (_c = activeReasoning[value.item_id]) == null ? void 0 : _c.summaryParts.push(
@@ -3164,15 +3211,19 @@ var OpenAIResponsesLanguageModel = class {
             }
           },
           flush(controller) {
+            const providerMetadata = {
+              openai: {
+                responseId
+              }
+            };
+            if (logprobs.length > 0) {
+              providerMetadata.openai.logprobs = logprobs;
+            }
             controller.enqueue({
               type: "finish",
               finishReason,
               usage,
-              providerMetadata: {
-                openai: {
-                  responseId
-                }
-              }
+              providerMetadata
             });
           }
         })
@@ -3191,7 +3242,8 @@ var usageSchema2 = import_v416.z.object({
 var textDeltaChunkSchema = import_v416.z.object({
   type: import_v416.z.literal("response.output_text.delta"),
   item_id: import_v416.z.string(),
-  delta: import_v416.z.string()
+  delta: import_v416.z.string(),
+  logprobs: LOGPROBS_SCHEMA.nullish()
 });
 var errorChunkSchema = import_v416.z.object({
   type: import_v416.z.literal("error"),
@@ -3388,6 +3440,13 @@ function isErrorChunk(chunk) {
   return chunk.type === "error";
 }
 function getResponsesModelConfig(modelId) {
+  if (modelId.startsWith("gpt-5-chat")) {
+    return {
+      isReasoningModel: false,
+      systemMessageMode: "system",
+      requiredAutoTruncation: false
+    };
+  }
   if (modelId.startsWith("o") || modelId.startsWith("gpt-5") || modelId.startsWith("codex-") || modelId.startsWith("computer-use")) {
     if (modelId.startsWith("o1-mini") || modelId.startsWith("o1-preview")) {
       return {
@@ -3409,10 +3468,10 @@ function getResponsesModelConfig(modelId) {
   };
 }
 function supportsFlexProcessing2(modelId) {
-  return modelId.startsWith("o3") || modelId.startsWith("o4-mini") || modelId.startsWith("gpt-5");
+  return modelId.startsWith("o3") || modelId.startsWith("o4-mini") || modelId.startsWith("gpt-5") && !modelId.startsWith("gpt-5-chat");
 }
 function supportsPriorityProcessing2(modelId) {
-  return modelId.startsWith("gpt-4") || modelId.startsWith("gpt-5-mini") || modelId.startsWith("gpt-5") && !modelId.startsWith("gpt-5-nano") || modelId.startsWith("o3") || modelId.startsWith("o4-mini");
+  return modelId.startsWith("gpt-4") || modelId.startsWith("gpt-5-mini") || modelId.startsWith("gpt-5") && !modelId.startsWith("gpt-5-nano") && !modelId.startsWith("gpt-5-chat") || modelId.startsWith("o3") || modelId.startsWith("o4-mini");
 }
 var openaiResponsesProviderOptionsSchema = import_v416.z.object({
   metadata: import_v416.z.any().nullish(),
@@ -3425,10 +3484,29 @@ var openaiResponsesProviderOptionsSchema = import_v416.z.object({
   instructions: import_v416.z.string().nullish(),
   reasoningSummary: import_v416.z.string().nullish(),
   serviceTier: import_v416.z.enum(["auto", "flex", "priority"]).nullish(),
-  include: import_v416.z.array(import_v416.z.enum(["reasoning.encrypted_content", "file_search_call.results"])).nullish(),
+  include: import_v416.z.array(
+    import_v416.z.enum([
+      "reasoning.encrypted_content",
+      "file_search_call.results",
+      "message.output_text.logprobs"
+    ])
+  ).nullish(),
   textVerbosity: import_v416.z.enum(["low", "medium", "high"]).nullish(),
   promptCacheKey: import_v416.z.string().nullish(),
-  safetyIdentifier: import_v416.z.string().nullish()
+  safetyIdentifier: import_v416.z.string().nullish(),
+  /**
+   * Return the log probabilities of the tokens.
+   *
+   * Setting to true will return the log probabilities of the tokens that
+   * were generated.
+   *
+   * Setting to a number will return the log probabilities of the top n
+   * tokens that were generated.
+   *
+   * @see https://platform.openai.com/docs/api-reference/responses/create
+   * @see https://cookbook.openai.com/examples/using_logprobs
+   */
+  logprobs: import_v416.z.union([import_v416.z.boolean(), import_v416.z.number().min(1).max(TOP_LOGPROBS_MAX)]).optional()
 });
 // Annotate the CommonJS export names for ESM import in node:
 0 && (module.exports = {