npm - @ai-sdk/openai - Versions diffs - 2.0.0-alpha.10 → 2.0.0-alpha.12 - Mend

@ai-sdk/openai 2.0.0-alpha.10 → 2.0.0-alpha.12

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (14) hide show

package/CHANGELOG.md +19 -0
package/dist/index.d.mts +3 -0
package/dist/index.d.ts +3 -0
package/dist/index.js +61 -2
package/dist/index.js.map +1 -1
package/dist/index.mjs +61 -2
package/dist/index.mjs.map +1 -1
package/dist/internal/index.d.mts +12 -0
package/dist/internal/index.d.ts +12 -0
package/dist/internal/index.js +61 -2
package/dist/internal/index.js.map +1 -1
package/dist/internal/index.mjs +61 -2
package/dist/internal/index.mjs.map +1 -1
package/package.json +3 -3

package/CHANGELOG.md CHANGED Viewed

@@ -1,5 +1,24 @@
 # @ai-sdk/openai
+## 2.0.0-alpha.12
+### Patch Changes
+- 2f542fa: Add reasoning-part-finish parts for reasoning models in the responses API
+- e2aceaf: feat: add raw chunk support
+- Updated dependencies [e2aceaf]
+  - @ai-sdk/provider@2.0.0-alpha.12
+  - @ai-sdk/provider-utils@3.0.0-alpha.12
+## 2.0.0-alpha.11
+### Patch Changes
+- 8d12da5: feat(provider/openai): add serviceTier option for flex processing
+- Updated dependencies [c1e6647]
+  - @ai-sdk/provider@2.0.0-alpha.11
+  - @ai-sdk/provider-utils@3.0.0-alpha.11
 ## 2.0.0-alpha.10
 ### Patch Changes

package/dist/index.d.mts CHANGED Viewed

@@ -164,12 +164,14 @@ declare const openaiResponsesProviderOptionsSchema: z.ZodObject<{
     strictSchemas: z.ZodOptional<z.ZodNullable<z.ZodBoolean>>;
     instructions: z.ZodOptional<z.ZodNullable<z.ZodString>>;
     reasoningSummary: z.ZodOptional<z.ZodNullable<z.ZodString>>;
+    serviceTier: z.ZodOptional<z.ZodNullable<z.ZodEnum<["auto", "flex"]>>>;
 }, "strip", z.ZodTypeAny, {
     user?: string | null | undefined;
     parallelToolCalls?: boolean | null | undefined;
     reasoningEffort?: string | null | undefined;
     store?: boolean | null | undefined;
     metadata?: any;
+    serviceTier?: "auto" | "flex" | null | undefined;
     previousResponseId?: string | null | undefined;
     strictSchemas?: boolean | null | undefined;
     instructions?: string | null | undefined;
@@ -180,6 +182,7 @@ declare const openaiResponsesProviderOptionsSchema: z.ZodObject<{
     reasoningEffort?: string | null | undefined;
     store?: boolean | null | undefined;
     metadata?: any;
+    serviceTier?: "auto" | "flex" | null | undefined;
     previousResponseId?: string | null | undefined;
     strictSchemas?: boolean | null | undefined;
     instructions?: string | null | undefined;

package/dist/index.d.ts CHANGED Viewed

@@ -164,12 +164,14 @@ declare const openaiResponsesProviderOptionsSchema: z.ZodObject<{
     strictSchemas: z.ZodOptional<z.ZodNullable<z.ZodBoolean>>;
     instructions: z.ZodOptional<z.ZodNullable<z.ZodString>>;
     reasoningSummary: z.ZodOptional<z.ZodNullable<z.ZodString>>;
+    serviceTier: z.ZodOptional<z.ZodNullable<z.ZodEnum<["auto", "flex"]>>>;
 }, "strip", z.ZodTypeAny, {
     user?: string | null | undefined;
     parallelToolCalls?: boolean | null | undefined;
     reasoningEffort?: string | null | undefined;
     store?: boolean | null | undefined;
     metadata?: any;
+    serviceTier?: "auto" | "flex" | null | undefined;
     previousResponseId?: string | null | undefined;
     strictSchemas?: boolean | null | undefined;
     instructions?: string | null | undefined;
@@ -180,6 +182,7 @@ declare const openaiResponsesProviderOptionsSchema: z.ZodObject<{
     reasoningEffort?: string | null | undefined;
     store?: boolean | null | undefined;
     metadata?: any;
+    serviceTier?: "auto" | "flex" | null | undefined;
     previousResponseId?: string | null | undefined;
     strictSchemas?: boolean | null | undefined;
     instructions?: string | null | undefined;

package/dist/index.js CHANGED Viewed

@@ -282,7 +282,14 @@ var openaiProviderOptions = import_zod.z.object({
    *
    * @default true
    */
-  structuredOutputs: import_zod.z.boolean().optional()
+  structuredOutputs: import_zod.z.boolean().optional(),
+  /**
+   * Service tier for the request. Set to 'flex' for 50% cheaper processing
+   * at the cost of increased latency. Only available for o3 and o4-mini models.
+   *
+   * @default 'auto'
+   */
+  serviceTier: import_zod.z.enum(["auto", "flex"]).optional()
 });
 // src/openai-error.ts
@@ -453,6 +460,7 @@ var OpenAIChatLanguageModel = class {
       metadata: openaiOptions.metadata,
       prediction: openaiOptions.prediction,
       reasoning_effort: openaiOptions.reasoningEffort,
+      service_tier: openaiOptions.serviceTier,
       // messages:
       messages
     };
@@ -526,6 +534,14 @@ var OpenAIChatLanguageModel = class {
         });
       }
     }
+    if (openaiOptions.serviceTier === "flex" && !supportsFlexProcessing(this.modelId)) {
+      warnings.push({
+        type: "unsupported-setting",
+        setting: "serviceTier",
+        details: "flex processing is only available for o3 and o4-mini models"
+      });
+      baseArgs.service_tier = void 0;
+    }
     const {
       tools: openaiTools2,
       toolChoice: openaiToolChoice,
@@ -652,6 +668,9 @@ var OpenAIChatLanguageModel = class {
           },
           transform(chunk, controller) {
             var _a, _b, _c, _d, _e, _f, _g, _h, _i, _j, _k, _l, _m, _n, _o, _p, _q, _r, _s, _t, _u, _v, _w, _x;
+            if (options.includeRawChunks) {
+              controller.enqueue({ type: "raw", rawValue: chunk.rawValue });
+            }
             if (!chunk.success) {
               finishReason = "error";
               controller.enqueue({ type: "error", error: chunk.error });
@@ -897,6 +916,9 @@ var openaiChatChunkSchema = import_zod3.z.union([
 function isReasoningModel(modelId) {
   return modelId.startsWith("o");
 }
+function supportsFlexProcessing(modelId) {
+  return modelId.startsWith("o3") || modelId.startsWith("o4-mini");
+}
 function getSystemMessageMode(modelId) {
   var _a, _b;
   if (!isReasoningModel(modelId)) {
@@ -1228,6 +1250,9 @@ var OpenAICompletionLanguageModel = class {
             controller.enqueue({ type: "stream-start", warnings });
           },
           transform(chunk, controller) {
+            if (options.includeRawChunks) {
+              controller.enqueue({ type: "raw", rawValue: chunk.rawValue });
+            }
             if (!chunk.success) {
               finishReason = "error";
               controller.enqueue({ type: "error", error: chunk.error });
@@ -2012,6 +2037,7 @@ var OpenAIResponsesLanguageModel = class {
       store: openaiOptions == null ? void 0 : openaiOptions.store,
       user: openaiOptions == null ? void 0 : openaiOptions.user,
       instructions: openaiOptions == null ? void 0 : openaiOptions.instructions,
+      service_tier: openaiOptions == null ? void 0 : openaiOptions.serviceTier,
       // model-specific settings:
       ...modelConfig.isReasoningModel && ((openaiOptions == null ? void 0 : openaiOptions.reasoningEffort) != null || (openaiOptions == null ? void 0 : openaiOptions.reasoningSummary) != null) && {
         reasoning: {
@@ -2045,6 +2071,14 @@ var OpenAIResponsesLanguageModel = class {
         });
       }
     }
+    if ((openaiOptions == null ? void 0 : openaiOptions.serviceTier) === "flex" && !supportsFlexProcessing2(this.modelId)) {
+      warnings.push({
+        type: "unsupported-setting",
+        setting: "serviceTier",
+        details: "flex processing is only available for o3 and o4-mini models"
+      });
+      delete baseArgs.service_tier;
+    }
     const {
       tools: openaiTools2,
       toolChoice: openaiToolChoice,
@@ -2232,6 +2266,7 @@ var OpenAIResponsesLanguageModel = class {
     let responseId = null;
     const ongoingToolCalls = {};
     let hasToolCalls = false;
+    let lastReasoningSummaryIndex = null;
     return {
       stream: response.pipeThrough(
         new TransformStream({
@@ -2240,6 +2275,9 @@ var OpenAIResponsesLanguageModel = class {
           },
           transform(chunk, controller) {
             var _a, _b, _c, _d, _e, _f, _g, _h;
+            if (options.includeRawChunks) {
+              controller.enqueue({ type: "raw", rawValue: chunk.rawValue });
+            }
             if (!chunk.success) {
               finishReason = "error";
               controller.enqueue({ type: "error", error: chunk.error });
@@ -2285,10 +2323,16 @@ var OpenAIResponsesLanguageModel = class {
                 text: value.delta
               });
             } else if (isResponseReasoningSummaryTextDeltaChunk(value)) {
+              if (lastReasoningSummaryIndex !== null && value.summary_index !== lastReasoningSummaryIndex) {
+                controller.enqueue({ type: "reasoning-part-finish" });
+              }
+              lastReasoningSummaryIndex = value.summary_index;
               controller.enqueue({
                 type: "reasoning",
                 text: value.delta
               });
+            } else if (isResponseReasoningSummaryPartDoneChunk(value)) {
+              controller.enqueue({ type: "reasoning-part-finish" });
             } else if (isResponseOutputItemDoneChunk(value) && value.item.type === "function_call") {
               ongoingToolCalls[value.output_index] = void 0;
               hasToolCalls = true;
@@ -2417,6 +2461,13 @@ var responseReasoningSummaryTextDeltaSchema = import_zod12.z.object({
   summary_index: import_zod12.z.number(),
   delta: import_zod12.z.string()
 });
+var responseReasoningSummaryPartDoneSchema = import_zod12.z.object({
+  type: import_zod12.z.literal("response.reasoning_summary_part.done"),
+  item_id: import_zod12.z.string(),
+  output_index: import_zod12.z.number(),
+  summary_index: import_zod12.z.number(),
+  part: import_zod12.z.unknown().nullish()
+});
 var openaiResponsesChunkSchema = import_zod12.z.union([
   textDeltaChunkSchema,
   responseFinishedChunkSchema,
@@ -2426,6 +2477,7 @@ var openaiResponsesChunkSchema = import_zod12.z.union([
   responseOutputItemAddedSchema,
   responseAnnotationAddedSchema,
   responseReasoningSummaryTextDeltaSchema,
+  responseReasoningSummaryPartDoneSchema,
   import_zod12.z.object({ type: import_zod12.z.string() }).passthrough()
   // fallback for unknown chunks
 ]);
@@ -2453,6 +2505,9 @@ function isResponseAnnotationAddedChunk(chunk) {
 function isResponseReasoningSummaryTextDeltaChunk(chunk) {
   return chunk.type === "response.reasoning_summary_text.delta";
 }
+function isResponseReasoningSummaryPartDoneChunk(chunk) {
+  return chunk.type === "response.reasoning_summary_part.done";
+}
 function getResponsesModelConfig(modelId) {
   if (modelId.startsWith("o")) {
     if (modelId.startsWith("o1-mini") || modelId.startsWith("o1-preview")) {
@@ -2474,6 +2529,9 @@ function getResponsesModelConfig(modelId) {
     requiredAutoTruncation: false
   };
 }
+function supportsFlexProcessing2(modelId) {
+  return modelId.startsWith("o3") || modelId.startsWith("o4-mini");
+}
 var openaiResponsesProviderOptionsSchema = import_zod12.z.object({
   metadata: import_zod12.z.any().nullish(),
   parallelToolCalls: import_zod12.z.boolean().nullish(),
@@ -2483,7 +2541,8 @@ var openaiResponsesProviderOptionsSchema = import_zod12.z.object({
   reasoningEffort: import_zod12.z.string().nullish(),
   strictSchemas: import_zod12.z.boolean().nullish(),
   instructions: import_zod12.z.string().nullish(),
-  reasoningSummary: import_zod12.z.string().nullish()
+  reasoningSummary: import_zod12.z.string().nullish(),
+  serviceTier: import_zod12.z.enum(["auto", "flex"]).nullish()
 });
 // src/openai-speech-model.ts