npm - @ai-sdk/openai - Versions diffs - 1.3.7 → 1.3.9 - Mend

@ai-sdk/openai 1.3.7 → 1.3.9

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (14) hide show

package/CHANGELOG.md +19 -0
package/dist/index.d.mts +7 -1
package/dist/index.d.ts +7 -1
package/dist/index.js +297 -115
package/dist/index.js.map +1 -1
package/dist/index.mjs +295 -107
package/dist/index.mjs.map +1 -1
package/internal/dist/index.d.mts +67 -2
package/internal/dist/index.d.ts +67 -2
package/internal/dist/index.js +286 -110
package/internal/dist/index.js.map +1 -1
package/internal/dist/index.mjs +286 -105
package/internal/dist/index.mjs.map +1 -1
package/package.json +3 -3

package/CHANGELOG.md CHANGED Viewed

@@ -1,5 +1,24 @@
 # @ai-sdk/openai
+## 1.3.9
+### Patch Changes
+- 013faa8: core (ai): change transcription model mimeType to mediaType
+- 013faa8: fix (provider/openai): increase transcription model resilience
+- Updated dependencies [013faa8]
+  - @ai-sdk/provider@1.1.2
+  - @ai-sdk/provider-utils@2.2.6
+## 1.3.8
+### Patch Changes
+- c21fa6d: feat: add transcription with experimental_transcribe
+- Updated dependencies [c21fa6d]
+  - @ai-sdk/provider-utils@2.2.5
+  - @ai-sdk/provider@1.1.1
 ## 1.3.7
 ### Patch Changes

package/dist/index.d.mts CHANGED Viewed

@@ -1,4 +1,4 @@
-import { LanguageModelV1, ProviderV1, EmbeddingModelV1, ImageModelV1 } from '@ai-sdk/provider';
+import { LanguageModelV1, ProviderV1, EmbeddingModelV1, ImageModelV1, TranscriptionModelV1 } from '@ai-sdk/provider';
 import { FetchFunction } from '@ai-sdk/provider-utils';
 import { z } from 'zod';
@@ -179,6 +179,8 @@ interface OpenAIImageSettings {
     maxImagesPerCall?: number;
 }
+type OpenAITranscriptionModelId = 'whisper-1' | 'gpt-4o-mini-transcribe' | 'gpt-4o-transcribe' | (string & {});
 type OpenAIResponsesModelId = 'o1' | 'o1-2024-12-17' | 'o1-mini' | 'o1-mini-2024-09-12' | 'o1-preview' | 'o1-preview-2024-09-12' | 'o3-mini' | 'o3-mini-2025-01-31' | 'gpt-4o' | 'gpt-4o-2024-05-13' | 'gpt-4o-2024-08-06' | 'gpt-4o-2024-11-20' | 'gpt-4o-mini' | 'gpt-4o-mini-2024-07-18' | 'gpt-4-turbo' | 'gpt-4-turbo-2024-04-09' | 'gpt-4-turbo-preview' | 'gpt-4-0125-preview' | 'gpt-4-1106-preview' | 'gpt-4' | 'gpt-4-0613' | 'gpt-4.5-preview' | 'gpt-4.5-preview-2025-02-27' | 'gpt-3.5-turbo-0125' | 'gpt-3.5-turbo' | 'gpt-3.5-turbo-1106' | 'chatgpt-4o-latest' | (string & {});
 declare const WebSearchPreviewParameters: z.ZodObject<{}, "strip", z.ZodTypeAny, {}, {}>;
@@ -244,6 +246,10 @@ interface OpenAIProvider extends ProviderV1 {
      */
     imageModel(modelId: OpenAIImageModelId, settings?: OpenAIImageSettings): ImageModelV1;
     /**
+  Creates a model for transcription.
+     */
+    transcription(modelId: OpenAITranscriptionModelId): TranscriptionModelV1;
+    /**
   OpenAI-specific tools.
      */
     tools: typeof openaiTools;

package/dist/index.d.ts CHANGED Viewed

@@ -1,4 +1,4 @@
-import { LanguageModelV1, ProviderV1, EmbeddingModelV1, ImageModelV1 } from '@ai-sdk/provider';
+import { LanguageModelV1, ProviderV1, EmbeddingModelV1, ImageModelV1, TranscriptionModelV1 } from '@ai-sdk/provider';
 import { FetchFunction } from '@ai-sdk/provider-utils';
 import { z } from 'zod';
@@ -179,6 +179,8 @@ interface OpenAIImageSettings {
     maxImagesPerCall?: number;
 }
+type OpenAITranscriptionModelId = 'whisper-1' | 'gpt-4o-mini-transcribe' | 'gpt-4o-transcribe' | (string & {});
 type OpenAIResponsesModelId = 'o1' | 'o1-2024-12-17' | 'o1-mini' | 'o1-mini-2024-09-12' | 'o1-preview' | 'o1-preview-2024-09-12' | 'o3-mini' | 'o3-mini-2025-01-31' | 'gpt-4o' | 'gpt-4o-2024-05-13' | 'gpt-4o-2024-08-06' | 'gpt-4o-2024-11-20' | 'gpt-4o-mini' | 'gpt-4o-mini-2024-07-18' | 'gpt-4-turbo' | 'gpt-4-turbo-2024-04-09' | 'gpt-4-turbo-preview' | 'gpt-4-0125-preview' | 'gpt-4-1106-preview' | 'gpt-4' | 'gpt-4-0613' | 'gpt-4.5-preview' | 'gpt-4.5-preview-2025-02-27' | 'gpt-3.5-turbo-0125' | 'gpt-3.5-turbo' | 'gpt-3.5-turbo-1106' | 'chatgpt-4o-latest' | (string & {});
 declare const WebSearchPreviewParameters: z.ZodObject<{}, "strip", z.ZodTypeAny, {}, {}>;
@@ -244,6 +246,10 @@ interface OpenAIProvider extends ProviderV1 {
      */
     imageModel(modelId: OpenAIImageModelId, settings?: OpenAIImageSettings): ImageModelV1;
     /**
+  Creates a model for transcription.
+     */
+    transcription(modelId: OpenAITranscriptionModelId): TranscriptionModelV1;
+    /**
   OpenAI-specific tools.
      */
     tools: typeof openaiTools;

package/dist/index.js CHANGED Viewed

@@ -26,7 +26,7 @@ __export(src_exports, {
 module.exports = __toCommonJS(src_exports);
 // src/openai-provider.ts
-var import_provider_utils9 = require("@ai-sdk/provider-utils");
+var import_provider_utils10 = require("@ai-sdk/provider-utils");
 // src/openai-chat-language-model.ts
 var import_provider3 = require("@ai-sdk/provider");
@@ -1601,13 +1601,187 @@ var openaiImageResponseSchema = import_zod5.z.object({
   data: import_zod5.z.array(import_zod5.z.object({ b64_json: import_zod5.z.string() }))
 });
-// src/responses/openai-responses-language-model.ts
-var import_provider_utils8 = require("@ai-sdk/provider-utils");
+// src/openai-transcription-model.ts
+var import_provider_utils7 = require("@ai-sdk/provider-utils");
 var import_zod6 = require("zod");
+var OpenAIProviderOptionsSchema = import_zod6.z.object({
+  include: import_zod6.z.array(import_zod6.z.string()).optional().describe(
+    "Additional information to include in the transcription response."
+  ),
+  language: import_zod6.z.string().optional().describe("The language of the input audio in ISO-639-1 format."),
+  prompt: import_zod6.z.string().optional().describe(
+    "An optional text to guide the model's style or continue a previous audio segment."
+  ),
+  temperature: import_zod6.z.number().min(0).max(1).optional().default(0).describe("The sampling temperature, between 0 and 1."),
+  timestampGranularities: import_zod6.z.array(import_zod6.z.enum(["word", "segment"])).optional().default(["segment"]).describe(
+    "The timestamp granularities to populate for this transcription."
+  )
+});
+var languageMap = {
+  afrikaans: "af",
+  arabic: "ar",
+  armenian: "hy",
+  azerbaijani: "az",
+  belarusian: "be",
+  bosnian: "bs",
+  bulgarian: "bg",
+  catalan: "ca",
+  chinese: "zh",
+  croatian: "hr",
+  czech: "cs",
+  danish: "da",
+  dutch: "nl",
+  english: "en",
+  estonian: "et",
+  finnish: "fi",
+  french: "fr",
+  galician: "gl",
+  german: "de",
+  greek: "el",
+  hebrew: "he",
+  hindi: "hi",
+  hungarian: "hu",
+  icelandic: "is",
+  indonesian: "id",
+  italian: "it",
+  japanese: "ja",
+  kannada: "kn",
+  kazakh: "kk",
+  korean: "ko",
+  latvian: "lv",
+  lithuanian: "lt",
+  macedonian: "mk",
+  malay: "ms",
+  marathi: "mr",
+  maori: "mi",
+  nepali: "ne",
+  norwegian: "no",
+  persian: "fa",
+  polish: "pl",
+  portuguese: "pt",
+  romanian: "ro",
+  russian: "ru",
+  serbian: "sr",
+  slovak: "sk",
+  slovenian: "sl",
+  spanish: "es",
+  swahili: "sw",
+  swedish: "sv",
+  tagalog: "tl",
+  tamil: "ta",
+  thai: "th",
+  turkish: "tr",
+  ukrainian: "uk",
+  urdu: "ur",
+  vietnamese: "vi",
+  welsh: "cy"
+};
+var OpenAITranscriptionModel = class {
+  constructor(modelId, config) {
+    this.modelId = modelId;
+    this.config = config;
+    this.specificationVersion = "v1";
+  }
+  get provider() {
+    return this.config.provider;
+  }
+  getArgs({
+    audio,
+    mediaType,
+    providerOptions
+  }) {
+    const warnings = [];
+    const openAIOptions = (0, import_provider_utils7.parseProviderOptions)({
+      provider: "openai",
+      providerOptions,
+      schema: OpenAIProviderOptionsSchema
+    });
+    const formData = new FormData();
+    const blob = audio instanceof Uint8Array ? new Blob([audio]) : new Blob([(0, import_provider_utils7.convertBase64ToUint8Array)(audio)]);
+    formData.append("model", this.modelId);
+    formData.append("file", new File([blob], "audio", { type: mediaType }));
+    if (openAIOptions) {
+      const transcriptionModelOptions = {
+        include: openAIOptions.include,
+        language: openAIOptions.language,
+        prompt: openAIOptions.prompt,
+        temperature: openAIOptions.temperature,
+        timestamp_granularities: openAIOptions.timestampGranularities
+      };
+      for (const key in transcriptionModelOptions) {
+        const value = transcriptionModelOptions[key];
+        if (value !== void 0) {
+          formData.append(key, value);
+        }
+      }
+    }
+    return {
+      formData,
+      warnings
+    };
+  }
+  async doGenerate(options) {
+    var _a, _b, _c, _d, _e, _f;
+    const currentDate = (_c = (_b = (_a = this.config._internal) == null ? void 0 : _a.currentDate) == null ? void 0 : _b.call(_a)) != null ? _c : /* @__PURE__ */ new Date();
+    const { formData, warnings } = this.getArgs(options);
+    const {
+      value: response,
+      responseHeaders,
+      rawValue: rawResponse
+    } = await (0, import_provider_utils7.postFormDataToApi)({
+      url: this.config.url({
+        path: "/audio/transcriptions",
+        modelId: this.modelId
+      }),
+      headers: (0, import_provider_utils7.combineHeaders)(this.config.headers(), options.headers),
+      formData,
+      failedResponseHandler: openaiFailedResponseHandler,
+      successfulResponseHandler: (0, import_provider_utils7.createJsonResponseHandler)(
+        openaiTranscriptionResponseSchema
+      ),
+      abortSignal: options.abortSignal,
+      fetch: this.config.fetch
+    });
+    const language = response.language != null && response.language in languageMap ? languageMap[response.language] : void 0;
+    return {
+      text: response.text,
+      segments: (_e = (_d = response.words) == null ? void 0 : _d.map((word) => ({
+        text: word.word,
+        startSecond: word.start,
+        endSecond: word.end
+      }))) != null ? _e : [],
+      language,
+      durationInSeconds: (_f = response.duration) != null ? _f : void 0,
+      warnings,
+      response: {
+        timestamp: currentDate,
+        modelId: this.modelId,
+        headers: responseHeaders,
+        body: rawResponse
+      }
+    };
+  }
+};
+var openaiTranscriptionResponseSchema = import_zod6.z.object({
+  text: import_zod6.z.string(),
+  language: import_zod6.z.string().nullish(),
+  duration: import_zod6.z.number().nullish(),
+  words: import_zod6.z.array(
+    import_zod6.z.object({
+      word: import_zod6.z.string(),
+      start: import_zod6.z.number(),
+      end: import_zod6.z.number()
+    })
+  ).nullish()
+});
+// src/responses/openai-responses-language-model.ts
+var import_provider_utils9 = require("@ai-sdk/provider-utils");
+var import_zod7 = require("zod");
 // src/responses/convert-to-openai-responses-messages.ts
 var import_provider7 = require("@ai-sdk/provider");
-var import_provider_utils7 = require("@ai-sdk/provider-utils");
+var import_provider_utils8 = require("@ai-sdk/provider-utils");
 function convertToOpenAIResponsesMessages({
   prompt,
   systemMessageMode
@@ -1654,7 +1828,7 @@ function convertToOpenAIResponsesMessages({
               case "image": {
                 return {
                   type: "input_image",
-                  image_url: part.image instanceof URL ? part.image.toString() : `data:${(_a = part.mimeType) != null ? _a : "image/jpeg"};base64,${(0, import_provider_utils7.convertUint8ArrayToBase64)(part.image)}`,
+                  image_url: part.image instanceof URL ? part.image.toString() : `data:${(_a = part.mimeType) != null ? _a : "image/jpeg"};base64,${(0, import_provider_utils8.convertUint8ArrayToBase64)(part.image)}`,
                   // OpenAI specific extension: image detail
                   detail: (_c = (_b = part.providerMetadata) == null ? void 0 : _b.openai) == null ? void 0 : _c.imageDetail
                 };
@@ -1890,7 +2064,7 @@ var OpenAIResponsesLanguageModel = class {
       systemMessageMode: modelConfig.systemMessageMode
     });
     warnings.push(...messageWarnings);
-    const openaiOptions = (0, import_provider_utils8.parseProviderOptions)({
+    const openaiOptions = (0, import_provider_utils9.parseProviderOptions)({
       provider: "openai",
       providerOptions: providerMetadata,
       schema: openaiResponsesProviderOptionsSchema
@@ -2010,58 +2184,58 @@ var OpenAIResponsesLanguageModel = class {
       responseHeaders,
       value: response,
       rawValue: rawResponse
-    } = await (0, import_provider_utils8.postJsonToApi)({
+    } = await (0, import_provider_utils9.postJsonToApi)({
       url: this.config.url({
         path: "/responses",
         modelId: this.modelId
       }),
-      headers: (0, import_provider_utils8.combineHeaders)(this.config.headers(), options.headers),
+      headers: (0, import_provider_utils9.combineHeaders)(this.config.headers(), options.headers),
       body,
       failedResponseHandler: openaiFailedResponseHandler,
-      successfulResponseHandler: (0, import_provider_utils8.createJsonResponseHandler)(
-        import_zod6.z.object({
-          id: import_zod6.z.string(),
-          created_at: import_zod6.z.number(),
-          model: import_zod6.z.string(),
-          output: import_zod6.z.array(
-            import_zod6.z.discriminatedUnion("type", [
-              import_zod6.z.object({
-                type: import_zod6.z.literal("message"),
-                role: import_zod6.z.literal("assistant"),
-                content: import_zod6.z.array(
-                  import_zod6.z.object({
-                    type: import_zod6.z.literal("output_text"),
-                    text: import_zod6.z.string(),
-                    annotations: import_zod6.z.array(
-                      import_zod6.z.object({
-                        type: import_zod6.z.literal("url_citation"),
-                        start_index: import_zod6.z.number(),
-                        end_index: import_zod6.z.number(),
-                        url: import_zod6.z.string(),
-                        title: import_zod6.z.string()
+      successfulResponseHandler: (0, import_provider_utils9.createJsonResponseHandler)(
+        import_zod7.z.object({
+          id: import_zod7.z.string(),
+          created_at: import_zod7.z.number(),
+          model: import_zod7.z.string(),
+          output: import_zod7.z.array(
+            import_zod7.z.discriminatedUnion("type", [
+              import_zod7.z.object({
+                type: import_zod7.z.literal("message"),
+                role: import_zod7.z.literal("assistant"),
+                content: import_zod7.z.array(
+                  import_zod7.z.object({
+                    type: import_zod7.z.literal("output_text"),
+                    text: import_zod7.z.string(),
+                    annotations: import_zod7.z.array(
+                      import_zod7.z.object({
+                        type: import_zod7.z.literal("url_citation"),
+                        start_index: import_zod7.z.number(),
+                        end_index: import_zod7.z.number(),
+                        url: import_zod7.z.string(),
+                        title: import_zod7.z.string()
                       })
                     )
                   })
                 )
               }),
-              import_zod6.z.object({
-                type: import_zod6.z.literal("function_call"),
-                call_id: import_zod6.z.string(),
-                name: import_zod6.z.string(),
-                arguments: import_zod6.z.string()
+              import_zod7.z.object({
+                type: import_zod7.z.literal("function_call"),
+                call_id: import_zod7.z.string(),
+                name: import_zod7.z.string(),
+                arguments: import_zod7.z.string()
               }),
-              import_zod6.z.object({
-                type: import_zod6.z.literal("web_search_call")
+              import_zod7.z.object({
+                type: import_zod7.z.literal("web_search_call")
               }),
-              import_zod6.z.object({
-                type: import_zod6.z.literal("computer_call")
+              import_zod7.z.object({
+                type: import_zod7.z.literal("computer_call")
               }),
-              import_zod6.z.object({
-                type: import_zod6.z.literal("reasoning")
+              import_zod7.z.object({
+                type: import_zod7.z.literal("reasoning")
               })
             ])
           ),
-          incomplete_details: import_zod6.z.object({ reason: import_zod6.z.string() }).nullable(),
+          incomplete_details: import_zod7.z.object({ reason: import_zod7.z.string() }).nullable(),
           usage: usageSchema
         })
       ),
@@ -2082,7 +2256,7 @@ var OpenAIResponsesLanguageModel = class {
           var _a2, _b2, _c2;
           return {
             sourceType: "url",
-            id: (_c2 = (_b2 = (_a2 = this.config).generateId) == null ? void 0 : _b2.call(_a2)) != null ? _c2 : (0, import_provider_utils8.generateId)(),
+            id: (_c2 = (_b2 = (_a2 = this.config).generateId) == null ? void 0 : _b2.call(_a2)) != null ? _c2 : (0, import_provider_utils9.generateId)(),
             url: annotation.url,
             title: annotation.title
           };
@@ -2125,18 +2299,18 @@ var OpenAIResponsesLanguageModel = class {
   }
   async doStream(options) {
     const { args: body, warnings } = this.getArgs(options);
-    const { responseHeaders, value: response } = await (0, import_provider_utils8.postJsonToApi)({
+    const { responseHeaders, value: response } = await (0, import_provider_utils9.postJsonToApi)({
       url: this.config.url({
         path: "/responses",
         modelId: this.modelId
       }),
-      headers: (0, import_provider_utils8.combineHeaders)(this.config.headers(), options.headers),
+      headers: (0, import_provider_utils9.combineHeaders)(this.config.headers(), options.headers),
       body: {
         ...body,
         stream: true
       },
       failedResponseHandler: openaiFailedResponseHandler,
-      successfulResponseHandler: (0, import_provider_utils8.createEventSourceResponseHandler)(
+      successfulResponseHandler: (0, import_provider_utils9.createEventSourceResponseHandler)(
         openaiResponsesChunkSchema
       ),
       abortSignal: options.abortSignal,
@@ -2224,7 +2398,7 @@ var OpenAIResponsesLanguageModel = class {
                 type: "source",
                 source: {
                   sourceType: "url",
-                  id: (_h = (_g = (_f = self.config).generateId) == null ? void 0 : _g.call(_f)) != null ? _h : (0, import_provider_utils8.generateId)(),
+                  id: (_h = (_g = (_f = self.config).generateId) == null ? void 0 : _g.call(_f)) != null ? _h : (0, import_provider_utils9.generateId)(),
                   url: value.annotation.url,
                   title: value.annotation.title
                 }
@@ -2259,79 +2433,79 @@ var OpenAIResponsesLanguageModel = class {
     };
   }
 };
-var usageSchema = import_zod6.z.object({
-  input_tokens: import_zod6.z.number(),
-  input_tokens_details: import_zod6.z.object({ cached_tokens: import_zod6.z.number().nullish() }).nullish(),
-  output_tokens: import_zod6.z.number(),
-  output_tokens_details: import_zod6.z.object({ reasoning_tokens: import_zod6.z.number().nullish() }).nullish()
+var usageSchema = import_zod7.z.object({
+  input_tokens: import_zod7.z.number(),
+  input_tokens_details: import_zod7.z.object({ cached_tokens: import_zod7.z.number().nullish() }).nullish(),
+  output_tokens: import_zod7.z.number(),
+  output_tokens_details: import_zod7.z.object({ reasoning_tokens: import_zod7.z.number().nullish() }).nullish()
 });
-var textDeltaChunkSchema = import_zod6.z.object({
-  type: import_zod6.z.literal("response.output_text.delta"),
-  delta: import_zod6.z.string()
+var textDeltaChunkSchema = import_zod7.z.object({
+  type: import_zod7.z.literal("response.output_text.delta"),
+  delta: import_zod7.z.string()
 });
-var responseFinishedChunkSchema = import_zod6.z.object({
-  type: import_zod6.z.enum(["response.completed", "response.incomplete"]),
-  response: import_zod6.z.object({
-    incomplete_details: import_zod6.z.object({ reason: import_zod6.z.string() }).nullish(),
+var responseFinishedChunkSchema = import_zod7.z.object({
+  type: import_zod7.z.enum(["response.completed", "response.incomplete"]),
+  response: import_zod7.z.object({
+    incomplete_details: import_zod7.z.object({ reason: import_zod7.z.string() }).nullish(),
     usage: usageSchema
   })
 });
-var responseCreatedChunkSchema = import_zod6.z.object({
-  type: import_zod6.z.literal("response.created"),
-  response: import_zod6.z.object({
-    id: import_zod6.z.string(),
-    created_at: import_zod6.z.number(),
-    model: import_zod6.z.string()
+var responseCreatedChunkSchema = import_zod7.z.object({
+  type: import_zod7.z.literal("response.created"),
+  response: import_zod7.z.object({
+    id: import_zod7.z.string(),
+    created_at: import_zod7.z.number(),
+    model: import_zod7.z.string()
   })
 });
-var responseOutputItemDoneSchema = import_zod6.z.object({
-  type: import_zod6.z.literal("response.output_item.done"),
-  output_index: import_zod6.z.number(),
-  item: import_zod6.z.discriminatedUnion("type", [
-    import_zod6.z.object({
-      type: import_zod6.z.literal("message")
+var responseOutputItemDoneSchema = import_zod7.z.object({
+  type: import_zod7.z.literal("response.output_item.done"),
+  output_index: import_zod7.z.number(),
+  item: import_zod7.z.discriminatedUnion("type", [
+    import_zod7.z.object({
+      type: import_zod7.z.literal("message")
     }),
-    import_zod6.z.object({
-      type: import_zod6.z.literal("function_call"),
-      id: import_zod6.z.string(),
-      call_id: import_zod6.z.string(),
-      name: import_zod6.z.string(),
-      arguments: import_zod6.z.string(),
-      status: import_zod6.z.literal("completed")
+    import_zod7.z.object({
+      type: import_zod7.z.literal("function_call"),
+      id: import_zod7.z.string(),
+      call_id: import_zod7.z.string(),
+      name: import_zod7.z.string(),
+      arguments: import_zod7.z.string(),
+      status: import_zod7.z.literal("completed")
     })
   ])
 });
-var responseFunctionCallArgumentsDeltaSchema = import_zod6.z.object({
-  type: import_zod6.z.literal("response.function_call_arguments.delta"),
-  item_id: import_zod6.z.string(),
-  output_index: import_zod6.z.number(),
-  delta: import_zod6.z.string()
+var responseFunctionCallArgumentsDeltaSchema = import_zod7.z.object({
+  type: import_zod7.z.literal("response.function_call_arguments.delta"),
+  item_id: import_zod7.z.string(),
+  output_index: import_zod7.z.number(),
+  delta: import_zod7.z.string()
 });
-var responseOutputItemAddedSchema = import_zod6.z.object({
-  type: import_zod6.z.literal("response.output_item.added"),
-  output_index: import_zod6.z.number(),
-  item: import_zod6.z.discriminatedUnion("type", [
-    import_zod6.z.object({
-      type: import_zod6.z.literal("message")
+var responseOutputItemAddedSchema = import_zod7.z.object({
+  type: import_zod7.z.literal("response.output_item.added"),
+  output_index: import_zod7.z.number(),
+  item: import_zod7.z.discriminatedUnion("type", [
+    import_zod7.z.object({
+      type: import_zod7.z.literal("message")
     }),
-    import_zod6.z.object({
-      type: import_zod6.z.literal("function_call"),
-      id: import_zod6.z.string(),
-      call_id: import_zod6.z.string(),
-      name: import_zod6.z.string(),
-      arguments: import_zod6.z.string()
+    import_zod7.z.object({
+      type: import_zod7.z.literal("function_call"),
+      id: import_zod7.z.string(),
+      call_id: import_zod7.z.string(),
+      name: import_zod7.z.string(),
+      arguments: import_zod7.z.string()
     })
   ])
 });
-var responseAnnotationAddedSchema = import_zod6.z.object({
-  type: import_zod6.z.literal("response.output_text.annotation.added"),
-  annotation: import_zod6.z.object({
-    type: import_zod6.z.literal("url_citation"),
-    url: import_zod6.z.string(),
-    title: import_zod6.z.string()
+var responseAnnotationAddedSchema = import_zod7.z.object({
+  type: import_zod7.z.literal("response.output_text.annotation.added"),
+  annotation: import_zod7.z.object({
+    type: import_zod7.z.literal("url_citation"),
+    url: import_zod7.z.string(),
+    title: import_zod7.z.string()
   })
 });
-var openaiResponsesChunkSchema = import_zod6.z.union([
+var openaiResponsesChunkSchema = import_zod7.z.union([
   textDeltaChunkSchema,
   responseFinishedChunkSchema,
   responseCreatedChunkSchema,
@@ -2339,7 +2513,7 @@ var openaiResponsesChunkSchema = import_zod6.z.union([
   responseFunctionCallArgumentsDeltaSchema,
   responseOutputItemAddedSchema,
   responseAnnotationAddedSchema,
-  import_zod6.z.object({ type: import_zod6.z.string() }).passthrough()
+  import_zod7.z.object({ type: import_zod7.z.string() }).passthrough()
   // fallback for unknown chunks
 ]);
 function isTextDeltaChunk(chunk) {
@@ -2384,20 +2558,20 @@ function getResponsesModelConfig(modelId) {
     requiredAutoTruncation: false
   };
 }
-var openaiResponsesProviderOptionsSchema = import_zod6.z.object({
-  metadata: import_zod6.z.any().nullish(),
-  parallelToolCalls: import_zod6.z.boolean().nullish(),
-  previousResponseId: import_zod6.z.string().nullish(),
-  store: import_zod6.z.boolean().nullish(),
-  user: import_zod6.z.string().nullish(),
-  reasoningEffort: import_zod6.z.string().nullish(),
-  strictSchemas: import_zod6.z.boolean().nullish(),
-  instructions: import_zod6.z.string().nullish()
+var openaiResponsesProviderOptionsSchema = import_zod7.z.object({
+  metadata: import_zod7.z.any().nullish(),
+  parallelToolCalls: import_zod7.z.boolean().nullish(),
+  previousResponseId: import_zod7.z.string().nullish(),
+  store: import_zod7.z.boolean().nullish(),
+  user: import_zod7.z.string().nullish(),
+  reasoningEffort: import_zod7.z.string().nullish(),
+  strictSchemas: import_zod7.z.boolean().nullish(),
+  instructions: import_zod7.z.string().nullish()
 });
 // src/openai-tools.ts
-var import_zod7 = require("zod");
-var WebSearchPreviewParameters = import_zod7.z.object({});
+var import_zod8 = require("zod");
+var WebSearchPreviewParameters = import_zod8.z.object({});
 function webSearchPreviewTool({
   searchContextSize,
   userLocation
@@ -2419,11 +2593,11 @@ var openaiTools = {
 // src/openai-provider.ts
 function createOpenAI(options = {}) {
   var _a, _b, _c;
-  const baseURL = (_a = (0, import_provider_utils9.withoutTrailingSlash)(options.baseURL)) != null ? _a : "https://api.openai.com/v1";
+  const baseURL = (_a = (0, import_provider_utils10.withoutTrailingSlash)(options.baseURL)) != null ? _a : "https://api.openai.com/v1";
   const compatibility = (_b = options.compatibility) != null ? _b : "compatible";
   const providerName = (_c = options.name) != null ? _c : "openai";
   const getHeaders = () => ({
-    Authorization: `Bearer ${(0, import_provider_utils9.loadApiKey)({
+    Authorization: `Bearer ${(0, import_provider_utils10.loadApiKey)({
       apiKey: options.apiKey,
       environmentVariableName: "OPENAI_API_KEY",
       description: "OpenAI"
@@ -2458,6 +2632,12 @@ function createOpenAI(options = {}) {
     headers: getHeaders,
     fetch: options.fetch
   });
+  const createTranscriptionModel = (modelId) => new OpenAITranscriptionModel(modelId, {
+    provider: `${providerName}.transcription`,
+    url: ({ path }) => `${baseURL}${path}`,
+    headers: getHeaders,
+    fetch: options.fetch
+  });
   const createLanguageModel = (modelId, settings) => {
     if (new.target) {
       throw new Error(
@@ -2492,6 +2672,8 @@ function createOpenAI(options = {}) {
   provider.textEmbeddingModel = createEmbeddingModel;
   provider.image = createImageModel;
   provider.imageModel = createImageModel;
+  provider.transcription = createTranscriptionModel;
+  provider.transcriptionModel = createTranscriptionModel;
   provider.tools = openaiTools;
   return provider;
 }