npm - sarvam-ai-sdk - Versions diffs - 0.1.5-beta → 0.2.0-beta - Mend

sarvam-ai-sdk 0.1.5-beta → 0.2.0-beta

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (6) hide show

package/README.md CHANGED Viewed

@@ -1,7 +1,6 @@
-# Package
 # AI SDK - Sarvam Provider
-The **[Sarvam provider](https://v4.ai-sdk.dev/providers/ai-sdk-providers/sarvam)** for the [AI SDK](https://v4.ai-sdk.dev/docs)
+The **[Sarvam provider](https://v5.ai-sdk.dev/providers/ai-sdk-providers/sarvam)** for the [AI SDK](https://v5.ai-sdk.dev/docs)
 contains language model support for the Sarvam chat completion, Text-to-Speech and Speech-to-Text APIs.
 ## Setup
@@ -9,11 +8,11 @@ contains language model support for the Sarvam chat completion, Text-to-Speech a
 The **[Sarvam](http://sarvam.ai)** provider is available in the `sarvam-ai-sdk` module. You can install it with
 ```bash
-npm i sarvam-ai-sdk ai@4
+npm i sarvam-ai-sdk ai@5
 ```
 > [!WARNING]
-> This package only works with Vercel AI-SDK v4, not latest v6. Make sure to install `ai@4` in your project.
+> This package only works with Vercel AI-SDK v5, not v6 or latest v7. Make sure to install `ai@5` in your project.
 ## Provider Instance
@@ -168,8 +167,8 @@ const result = await generateText({
   tools: {
     weather: tool({
       description: "Get the weather in a location",
-      parameters: z.object({
-        location: z.string().describe("The location to get the weather for"),
+      inputSchema: z.object({
+		location: z.string(),
       }),
       execute: async ({ location }) => ({
         location,
@@ -184,9 +183,6 @@ const result = await generateText({
 console.log(result.toolResults);
 ```
-> [!WARNING]
-> Old `sarvam-m` models isn't trained on native tool calling feature (aka JSON mode). So we recommend using latest models.
 ## Generate JSON object
 ```ts
@@ -196,6 +192,8 @@ import { generateObject } from 'ai';
 const { object } = await generateObject({
   model: sarvam("sarvam-30b"),
+  schemaName: "Recipe",
+  schemaDescription: "A recipe with a name, ingredients and steps",
   schema: z.object({
     recipe: z.object({
       name: z.string(),
@@ -209,9 +207,6 @@ const { object } = await generateObject({
 console.log(object);
 ```
-> [!WARNING]
-> Old `sarvam-m` models isn't trained on native JSON object generation. So we recommend using latest models.
 ## All APIs
 ```ts
@@ -243,4 +238,4 @@ sarvam.speechTranslation("saaras:v3");
 ## Documentation
-Please check out the **[Sarvam provider documentation](https://v4.ai-sdk.dev/providers/ai-sdk-providers/sarvam)** and **[Sarvam API documentation](https://docs.sarvam.ai)** for more information.
+Please check out the **[Sarvam provider documentation](https://v5.ai-sdk.dev/providers/ai-sdk-providers/sarvam)** and **[Sarvam API documentation](https://docs.sarvam.ai)** for more information.

package/dist/index.d.mts CHANGED Viewed

@@ -1,5 +1,5 @@
 import { FetchFunction } from "@ai-sdk/provider-utils";
-import { LanguageModelV1, SpeechModelV1, TranscriptionModelV1 } from "@ai-sdk/provider";
+import { LanguageModelV2, SpeechModelV2, TranscriptionModelV2 } from "@ai-sdk/provider";
 import z$1, { z } from "zod";
 //#region src/config.d.ts
@@ -8,9 +8,34 @@ import z$1, { z } from "zod";
  * Specifies the language in BCP-47 format.
  */
 type SarvamLanguageCode = z.infer<typeof SarvamLanguageCodeSchema>;
-declare const SarvamLanguageCodeSchema: z.ZodEnum<["hi-IN", "bn-IN", "kn-IN", "ml-IN", "mr-IN", "od-IN", "pa-IN", "ta-IN", "te-IN", "en-IN", "gu-IN"]>;
+declare const SarvamLanguageCodeSchema: z.ZodEnum<{
+  "hi-IN": "hi-IN";
+  "bn-IN": "bn-IN";
+  "kn-IN": "kn-IN";
+  "ml-IN": "ml-IN";
+  "mr-IN": "mr-IN";
+  "od-IN": "od-IN";
+  "pa-IN": "pa-IN";
+  "ta-IN": "ta-IN";
+  "te-IN": "te-IN";
+  "en-IN": "en-IN";
+  "gu-IN": "gu-IN";
+}>;
 type MoreSarvamLanguageCode = z.infer<typeof MoreSarvamLanguageCodeSchema>;
-declare const MoreSarvamLanguageCodeSchema: z.ZodEnum<["as-IN", "ur-IN", "ne-IN", "kok-IN", "ks-IN", "sd-IN", "sa-IN", "sat-IN", "mni-IN", "brx-IN", "mai-IN", "doi-IN"]>;
+declare const MoreSarvamLanguageCodeSchema: z.ZodEnum<{
+  "as-IN": "as-IN";
+  "ur-IN": "ur-IN";
+  "ne-IN": "ne-IN";
+  "kok-IN": "kok-IN";
+  "ks-IN": "ks-IN";
+  "sd-IN": "sd-IN";
+  "sa-IN": "sa-IN";
+  "sat-IN": "sat-IN";
+  "mni-IN": "mni-IN";
+  "brx-IN": "brx-IN";
+  "mai-IN": "mai-IN";
+  "doi-IN": "doi-IN";
+}>;
 interface SarvamProviderSettings {
   /**
    * URL for the Sarvam API calls.
@@ -60,6 +85,34 @@ type ChatSettings = {
   n?: number;
 };
 //#endregion
+//#region src/stt/utils.d.ts
+declare const input_audio_codec: z$1.ZodEnum<{
+  mp3: "mp3";
+  opus: "opus";
+  flac: "flac";
+  aac: "aac";
+  wav: "wav";
+  "x-wav": "x-wav";
+  wave: "wave";
+  mpeg: "mpeg";
+  mpeg3: "mpeg3";
+  "x-mp3": "x-mp3";
+  "x-mpeg-3": "x-mpeg-3";
+  "x-aac": "x-aac";
+  aiff: "aiff";
+  "x-aiff": "x-aiff";
+  ogg: "ogg";
+  "x-flac": "x-flac";
+  mp4: "mp4";
+  "x-m4a": "x-m4a";
+  amr: "amr";
+  "x-ms-wma": "x-ms-wma";
+  webm: "webm";
+  pcm_s16le: "pcm_s16le";
+  pcm_l16: "pcm_l16";
+  pcm_raw: "pcm_raw";
+}>;
+//#endregion
 //#region src/stt/speech-translation-settings.d.ts
 /**
  * Specifies the speech generation model to use.
@@ -68,13 +121,6 @@ type ChatSettings = {
  * - `saaras:v3`: Translation model that translates audio from any spoken Indic language to English, with improved accuracy and support for more languages.
  */
 type SpeechTranslationModelId = "saaras:v3" | "saaras:v2.5" | (string & {});
-declare const speechTranslationSettingsSchema: z$1.ZodObject<{
-  input_audio_codec: z$1.ZodEnum<["wav", "x-wav", "wave", "mp3", "mpeg", "mpeg3", "x-mp3", "x-mpeg-3", "aac", "x-aac", "aiff", "x-aiff", "ogg", "opus", "flac", "x-flac", "mp4", "x-m4a", "amr", "x-ms-wma", "webm", "pcm_s16le", "pcm_l16", "pcm_raw"]>;
-}, "strip", z$1.ZodTypeAny, {
-  input_audio_codec: "wav" | "x-wav" | "wave" | "mp3" | "mpeg" | "mpeg3" | "x-mp3" | "x-mpeg-3" | "aac" | "x-aac" | "aiff" | "x-aiff" | "ogg" | "opus" | "flac" | "x-flac" | "mp4" | "x-m4a" | "amr" | "x-ms-wma" | "webm" | "pcm_s16le" | "pcm_l16" | "pcm_raw";
-}, {
-  input_audio_codec: "wav" | "x-wav" | "wave" | "mp3" | "mpeg" | "mpeg3" | "x-mp3" | "x-mpeg-3" | "aac" | "x-aac" | "aiff" | "x-aiff" | "ogg" | "opus" | "flac" | "x-flac" | "mp4" | "x-m4a" | "amr" | "x-ms-wma" | "webm" | "pcm_s16le" | "pcm_l16" | "pcm_raw";
-}>;
 type SpeechTranslationSettings = {
   /**
    * Audio codec/format of the input file.
@@ -82,7 +128,7 @@ type SpeechTranslationSettings = {
    * Our API automatically detects all codec formats, but for PCM files specifically (pcm_s16le, pcm_l16, pcm_raw), you must pass this parameter.
    * PCM files are supported only at 16kHz sample rate.
    */
-  input_audio_codec?: z$1.infer<typeof speechTranslationSettingsSchema.shape.input_audio_codec>;
+  input_audio_codec?: z$1.infer<typeof input_audio_codec>;
 };
 //#endregion
 //#region src/stt/transcription-settings.d.ts
@@ -92,21 +138,17 @@ type SpeechTranslationSettings = {
  */
 type TranscriptionModelId = "saaras:v3" | "saarika:v2.5" | (string & {});
 declare const transcriptionProviderOptionsSchema: z.ZodObject<{
-  mode: z.ZodOptional<z.ZodNullable<z.ZodEnum<["transcribe", "translate", "verbatim", "translit", "codemix"]>>>;
+  mode: z.ZodOptional<z.ZodNullable<z.ZodEnum<{
+    transcribe: "transcribe";
+    translate: "translate";
+    verbatim: "verbatim";
+    translit: "translit";
+    codemix: "codemix";
+  }>>>;
   with_timestamps: z.ZodOptional<z.ZodNullable<z.ZodBoolean>>;
   with_diarization: z.ZodOptional<z.ZodNullable<z.ZodBoolean>>;
   num_speakers: z.ZodOptional<z.ZodNullable<z.ZodNumber>>;
-}, "strip", z.ZodTypeAny, {
-  mode?: "transcribe" | "translate" | "verbatim" | "translit" | "codemix" | null | undefined;
-  with_timestamps?: boolean | null | undefined;
-  with_diarization?: boolean | null | undefined;
-  num_speakers?: number | null | undefined;
-}, {
-  mode?: "transcribe" | "translate" | "verbatim" | "translit" | "codemix" | null | undefined;
-  with_timestamps?: boolean | null | undefined;
-  with_diarization?: boolean | null | undefined;
-  num_speakers?: number | null | undefined;
-}>;
+}, z.core.$strip>;
 type TranscriptionSettings<T extends TranscriptionModelId = TranscriptionModelId> = {
   /**
    * Mode of operation. Only applicable when using `saaras:v3` model.
@@ -149,9 +191,66 @@ type TranscriptionSettings<T extends TranscriptionModelId = TranscriptionModelId
  * - `bulbul:v2`: Legacy model with pitch and loudness controls
  */
 type SpeechModelId = "bulbul:v2" | "bulbul:v3" | (string & {});
-declare const bulbul_v2: z.ZodEnum<["abhilash", "karun", "hitesh", "anushka", "manisha", "vidya", "arya"]>;
-declare const bulbul_v3: z.ZodEnum<["shubh", "aditya", "rahul", "rohan", "amit", "dev", "ratan", "varun", "manan", "sumit", "kabir", "aayan", "ashutosh", "advait", "anand", "tarun", "sunny", "mani", "gokul", "vijay", "mohit", "rehan", "soham", "ritu", "priya", "neha", "pooja", "simran", "kavya", "ishita", "shreya", "roopa", "amelia", "sophia", "tanya", "shruti", "suhani", "kavitha", "rupali"]>;
-declare const outputAudioCodecSchema: z.ZodEnum<["mp3", "linear16", "mulaw", "alaw", "opus", "flac", "aac", "wav"]>;
+declare const bulbul_v2: z.ZodEnum<{
+  abhilash: "abhilash";
+  karun: "karun";
+  hitesh: "hitesh";
+  anushka: "anushka";
+  manisha: "manisha";
+  vidya: "vidya";
+  arya: "arya";
+}>;
+declare const bulbul_v3: z.ZodEnum<{
+  shubh: "shubh";
+  aditya: "aditya";
+  rahul: "rahul";
+  rohan: "rohan";
+  amit: "amit";
+  dev: "dev";
+  ratan: "ratan";
+  varun: "varun";
+  manan: "manan";
+  sumit: "sumit";
+  kabir: "kabir";
+  aayan: "aayan";
+  ashutosh: "ashutosh";
+  advait: "advait";
+  anand: "anand";
+  tarun: "tarun";
+  sunny: "sunny";
+  mani: "mani";
+  gokul: "gokul";
+  vijay: "vijay";
+  mohit: "mohit";
+  rehan: "rehan";
+  soham: "soham";
+  ritu: "ritu";
+  priya: "priya";
+  neha: "neha";
+  pooja: "pooja";
+  simran: "simran";
+  kavya: "kavya";
+  ishita: "ishita";
+  shreya: "shreya";
+  roopa: "roopa";
+  amelia: "amelia";
+  sophia: "sophia";
+  tanya: "tanya";
+  shruti: "shruti";
+  suhani: "suhani";
+  kavitha: "kavitha";
+  rupali: "rupali";
+}>;
+declare const outputAudioCodecSchema: z.ZodEnum<{
+  mp3: "mp3";
+  linear16: "linear16";
+  mulaw: "mulaw";
+  alaw: "alaw";
+  opus: "opus";
+  flac: "flac";
+  aac: "aac";
+  wav: "wav";
+}>;
 /**
  * Configuration settings for Sarvam Text-to-Speech API.
  *
@@ -372,7 +471,7 @@ type SarvamProvider = {
    * 		prompt: "Translate this to malayalam: 'Keep cooking, guys'",
    * 	});
    */
-  (modelId: ChatModelId, settings?: ChatSettings): LanguageModelV1;
+  (modelId: ChatModelId, settings?: ChatSettings): LanguageModelV2;
   /**
    * Creates an Sarvam chat model for text generation.
    *
@@ -382,7 +481,7 @@ type SarvamProvider = {
    * 		prompt: "Translate this to malayalam: 'Keep cooking, guys'",
    * 	});
    */
-  languageModel(modelId: ChatModelId, settings?: ChatSettings): LanguageModelV1;
+  languageModel(modelId: ChatModelId, settings?: ChatSettings): LanguageModelV2;
   /**
    * Creates a Sarvam model for chat.
    *
@@ -392,7 +491,7 @@ type SarvamProvider = {
    * 		prompt: "Translate this to malayalam: 'Keep cooking, guys'",
    * 	});
    */
-  chat(modelId: ChatModelId, settings?: ChatSettings): LanguageModelV1;
+  chat(modelId: ChatModelId, settings?: ChatSettings): LanguageModelV2;
   /**
    * Creates a Sarvam model for transcription.
    *
@@ -409,7 +508,7 @@ type SarvamProvider = {
    *
    * @default unknown
    */
-  languageCode?: (T extends "saaras:v3" ? MoreSarvamLanguageCode : never) | SarvamLanguageCode | "unknown", settings?: TranscriptionSettings<T>): TranscriptionModelV1;
+  languageCode?: (T extends "saaras:v3" ? MoreSarvamLanguageCode : never) | SarvamLanguageCode | "unknown", settings?: TranscriptionSettings<T>): TranscriptionModelV2;
   /**
    * Creates a Sarvam model for Speech translation.
    *
@@ -419,7 +518,7 @@ type SarvamProvider = {
    *		audio: await readFile("./audio.wav"),
    * 	});
    */
-  speechTranslation<T extends SpeechTranslationModelId>(modelId: T, settings?: SpeechTranslationSettings): TranscriptionModelV1;
+  speechTranslation<T extends SpeechTranslationModelId>(modelId: T, settings?: SpeechTranslationSettings): TranscriptionModelV2;
   /**
    * Creates a Sarvam model for speech.
    * @example
@@ -430,7 +529,7 @@ type SarvamProvider = {
    *
    * 	await writeFile("./audio.wav", Buffer.from(audio.base64, "base64"););
    */
-  speech<T extends SpeechModelId>(modelId: T, languageCode: SarvamLanguageCode, settings?: SpeechSettings<T>): SpeechModelV1;
+  speech<T extends SpeechModelId>(modelId: T, languageCode: SarvamLanguageCode, settings?: SpeechSettings<T>): SpeechModelV2;
   /**
    * Creates an Sarvam model for transliterate.
    *
@@ -443,7 +542,7 @@ type SarvamProvider = {
    *		prompt: "eda mone, happy alle?",
    *	});
    */
-  transliterate<T extends SarvamLanguageCode>(settings: TransliterateSettings<false, T>): LanguageModelV1;
+  transliterate<T extends SarvamLanguageCode>(settings: TransliterateSettings<false, T>): LanguageModelV2;
   /**
    * Creates an Sarvam model for translation.
    *
@@ -456,7 +555,7 @@ type SarvamProvider = {
    *		prompt: "ഇതൊക്കെ ശ്രദ്ധിക്കണ്ടേ അംബാനെ?",
    *	});
    */
-  translation<T extends TranslationModelId>(model: T, settings: TranslationSettings<T>): LanguageModelV1;
+  translation<T extends TranslationModelId>(model: T, settings: TranslationSettings<T>): LanguageModelV2;
   /**
    * Creates an Sarvam model for language identification.
    *
@@ -466,7 +565,7 @@ type SarvamProvider = {
    *		prompt: "ബുദ്ധിയാണ് സാറേ ഇവൻ്റെ മെയിൻ",
    *	});
    */
-  languageIdentification(): LanguageModelV1;
+  languageIdentification(): LanguageModelV2;
 };
 //#endregion
 //#region src/provider.d.ts

package/dist/index.d.ts CHANGED Viewed

@@ -1,6 +1,6 @@
 import { FetchFunction } from "@ai-sdk/provider-utils";
 import z$1, { z } from "zod";
-import { LanguageModelV1, SpeechModelV1, TranscriptionModelV1 } from "@ai-sdk/provider";
+import { LanguageModelV2, SpeechModelV2, TranscriptionModelV2 } from "@ai-sdk/provider";
 //#region src/config.d.ts
@@ -8,9 +8,34 @@ import { LanguageModelV1, SpeechModelV1, TranscriptionModelV1 } from "@ai-sdk/pr
  * Specifies the language in BCP-47 format.
  */
 type SarvamLanguageCode = z.infer<typeof SarvamLanguageCodeSchema>;
-declare const SarvamLanguageCodeSchema: z.ZodEnum<["hi-IN", "bn-IN", "kn-IN", "ml-IN", "mr-IN", "od-IN", "pa-IN", "ta-IN", "te-IN", "en-IN", "gu-IN"]>;
+declare const SarvamLanguageCodeSchema: z.ZodEnum<{
+  "hi-IN": "hi-IN";
+  "bn-IN": "bn-IN";
+  "kn-IN": "kn-IN";
+  "ml-IN": "ml-IN";
+  "mr-IN": "mr-IN";
+  "od-IN": "od-IN";
+  "pa-IN": "pa-IN";
+  "ta-IN": "ta-IN";
+  "te-IN": "te-IN";
+  "en-IN": "en-IN";
+  "gu-IN": "gu-IN";
+}>;
 type MoreSarvamLanguageCode = z.infer<typeof MoreSarvamLanguageCodeSchema>;
-declare const MoreSarvamLanguageCodeSchema: z.ZodEnum<["as-IN", "ur-IN", "ne-IN", "kok-IN", "ks-IN", "sd-IN", "sa-IN", "sat-IN", "mni-IN", "brx-IN", "mai-IN", "doi-IN"]>;
+declare const MoreSarvamLanguageCodeSchema: z.ZodEnum<{
+  "as-IN": "as-IN";
+  "ur-IN": "ur-IN";
+  "ne-IN": "ne-IN";
+  "kok-IN": "kok-IN";
+  "ks-IN": "ks-IN";
+  "sd-IN": "sd-IN";
+  "sa-IN": "sa-IN";
+  "sat-IN": "sat-IN";
+  "mni-IN": "mni-IN";
+  "brx-IN": "brx-IN";
+  "mai-IN": "mai-IN";
+  "doi-IN": "doi-IN";
+}>;
 interface SarvamProviderSettings {
   /**
    * URL for the Sarvam API calls.
@@ -60,6 +85,34 @@ type ChatSettings = {
   n?: number;
 };
 //#endregion
+//#region src/stt/utils.d.ts
+declare const input_audio_codec: z$1.ZodEnum<{
+  mp3: "mp3";
+  opus: "opus";
+  flac: "flac";
+  aac: "aac";
+  wav: "wav";
+  "x-wav": "x-wav";
+  wave: "wave";
+  mpeg: "mpeg";
+  mpeg3: "mpeg3";
+  "x-mp3": "x-mp3";
+  "x-mpeg-3": "x-mpeg-3";
+  "x-aac": "x-aac";
+  aiff: "aiff";
+  "x-aiff": "x-aiff";
+  ogg: "ogg";
+  "x-flac": "x-flac";
+  mp4: "mp4";
+  "x-m4a": "x-m4a";
+  amr: "amr";
+  "x-ms-wma": "x-ms-wma";
+  webm: "webm";
+  pcm_s16le: "pcm_s16le";
+  pcm_l16: "pcm_l16";
+  pcm_raw: "pcm_raw";
+}>;
+//#endregion
 //#region src/stt/speech-translation-settings.d.ts
 /**
  * Specifies the speech generation model to use.
@@ -68,13 +121,6 @@ type ChatSettings = {
  * - `saaras:v3`: Translation model that translates audio from any spoken Indic language to English, with improved accuracy and support for more languages.
  */
 type SpeechTranslationModelId = "saaras:v3" | "saaras:v2.5" | (string & {});
-declare const speechTranslationSettingsSchema: z$1.ZodObject<{
-  input_audio_codec: z$1.ZodEnum<["wav", "x-wav", "wave", "mp3", "mpeg", "mpeg3", "x-mp3", "x-mpeg-3", "aac", "x-aac", "aiff", "x-aiff", "ogg", "opus", "flac", "x-flac", "mp4", "x-m4a", "amr", "x-ms-wma", "webm", "pcm_s16le", "pcm_l16", "pcm_raw"]>;
-}, "strip", z$1.ZodTypeAny, {
-  input_audio_codec: "wav" | "x-wav" | "wave" | "mp3" | "mpeg" | "mpeg3" | "x-mp3" | "x-mpeg-3" | "aac" | "x-aac" | "aiff" | "x-aiff" | "ogg" | "opus" | "flac" | "x-flac" | "mp4" | "x-m4a" | "amr" | "x-ms-wma" | "webm" | "pcm_s16le" | "pcm_l16" | "pcm_raw";
-}, {
-  input_audio_codec: "wav" | "x-wav" | "wave" | "mp3" | "mpeg" | "mpeg3" | "x-mp3" | "x-mpeg-3" | "aac" | "x-aac" | "aiff" | "x-aiff" | "ogg" | "opus" | "flac" | "x-flac" | "mp4" | "x-m4a" | "amr" | "x-ms-wma" | "webm" | "pcm_s16le" | "pcm_l16" | "pcm_raw";
-}>;
 type SpeechTranslationSettings = {
   /**
    * Audio codec/format of the input file.
@@ -82,7 +128,7 @@ type SpeechTranslationSettings = {
    * Our API automatically detects all codec formats, but for PCM files specifically (pcm_s16le, pcm_l16, pcm_raw), you must pass this parameter.
    * PCM files are supported only at 16kHz sample rate.
    */
-  input_audio_codec?: z$1.infer<typeof speechTranslationSettingsSchema.shape.input_audio_codec>;
+  input_audio_codec?: z$1.infer<typeof input_audio_codec>;
 };
 //#endregion
 //#region src/stt/transcription-settings.d.ts
@@ -92,21 +138,17 @@ type SpeechTranslationSettings = {
  */
 type TranscriptionModelId = "saaras:v3" | "saarika:v2.5" | (string & {});
 declare const transcriptionProviderOptionsSchema: z.ZodObject<{
-  mode: z.ZodOptional<z.ZodNullable<z.ZodEnum<["transcribe", "translate", "verbatim", "translit", "codemix"]>>>;
+  mode: z.ZodOptional<z.ZodNullable<z.ZodEnum<{
+    transcribe: "transcribe";
+    translate: "translate";
+    verbatim: "verbatim";
+    translit: "translit";
+    codemix: "codemix";
+  }>>>;
   with_timestamps: z.ZodOptional<z.ZodNullable<z.ZodBoolean>>;
   with_diarization: z.ZodOptional<z.ZodNullable<z.ZodBoolean>>;
   num_speakers: z.ZodOptional<z.ZodNullable<z.ZodNumber>>;
-}, "strip", z.ZodTypeAny, {
-  mode?: "transcribe" | "translate" | "verbatim" | "translit" | "codemix" | null | undefined;
-  with_timestamps?: boolean | null | undefined;
-  with_diarization?: boolean | null | undefined;
-  num_speakers?: number | null | undefined;
-}, {
-  mode?: "transcribe" | "translate" | "verbatim" | "translit" | "codemix" | null | undefined;
-  with_timestamps?: boolean | null | undefined;
-  with_diarization?: boolean | null | undefined;
-  num_speakers?: number | null | undefined;
-}>;
+}, z.core.$strip>;
 type TranscriptionSettings<T extends TranscriptionModelId = TranscriptionModelId> = {
   /**
    * Mode of operation. Only applicable when using `saaras:v3` model.
@@ -149,9 +191,66 @@ type TranscriptionSettings<T extends TranscriptionModelId = TranscriptionModelId
  * - `bulbul:v2`: Legacy model with pitch and loudness controls
  */
 type SpeechModelId = "bulbul:v2" | "bulbul:v3" | (string & {});
-declare const bulbul_v2: z.ZodEnum<["abhilash", "karun", "hitesh", "anushka", "manisha", "vidya", "arya"]>;
-declare const bulbul_v3: z.ZodEnum<["shubh", "aditya", "rahul", "rohan", "amit", "dev", "ratan", "varun", "manan", "sumit", "kabir", "aayan", "ashutosh", "advait", "anand", "tarun", "sunny", "mani", "gokul", "vijay", "mohit", "rehan", "soham", "ritu", "priya", "neha", "pooja", "simran", "kavya", "ishita", "shreya", "roopa", "amelia", "sophia", "tanya", "shruti", "suhani", "kavitha", "rupali"]>;
-declare const outputAudioCodecSchema: z.ZodEnum<["mp3", "linear16", "mulaw", "alaw", "opus", "flac", "aac", "wav"]>;
+declare const bulbul_v2: z.ZodEnum<{
+  abhilash: "abhilash";
+  karun: "karun";
+  hitesh: "hitesh";
+  anushka: "anushka";
+  manisha: "manisha";
+  vidya: "vidya";
+  arya: "arya";
+}>;
+declare const bulbul_v3: z.ZodEnum<{
+  shubh: "shubh";
+  aditya: "aditya";
+  rahul: "rahul";
+  rohan: "rohan";
+  amit: "amit";
+  dev: "dev";
+  ratan: "ratan";
+  varun: "varun";
+  manan: "manan";
+  sumit: "sumit";
+  kabir: "kabir";
+  aayan: "aayan";
+  ashutosh: "ashutosh";
+  advait: "advait";
+  anand: "anand";
+  tarun: "tarun";
+  sunny: "sunny";
+  mani: "mani";
+  gokul: "gokul";
+  vijay: "vijay";
+  mohit: "mohit";
+  rehan: "rehan";
+  soham: "soham";
+  ritu: "ritu";
+  priya: "priya";
+  neha: "neha";
+  pooja: "pooja";
+  simran: "simran";
+  kavya: "kavya";
+  ishita: "ishita";
+  shreya: "shreya";
+  roopa: "roopa";
+  amelia: "amelia";
+  sophia: "sophia";
+  tanya: "tanya";
+  shruti: "shruti";
+  suhani: "suhani";
+  kavitha: "kavitha";
+  rupali: "rupali";
+}>;
+declare const outputAudioCodecSchema: z.ZodEnum<{
+  mp3: "mp3";
+  linear16: "linear16";
+  mulaw: "mulaw";
+  alaw: "alaw";
+  opus: "opus";
+  flac: "flac";
+  aac: "aac";
+  wav: "wav";
+}>;
 /**
  * Configuration settings for Sarvam Text-to-Speech API.
  *
@@ -372,7 +471,7 @@ type SarvamProvider = {
    * 		prompt: "Translate this to malayalam: 'Keep cooking, guys'",
    * 	});
    */
-  (modelId: ChatModelId, settings?: ChatSettings): LanguageModelV1;
+  (modelId: ChatModelId, settings?: ChatSettings): LanguageModelV2;
   /**
    * Creates an Sarvam chat model for text generation.
    *
@@ -382,7 +481,7 @@ type SarvamProvider = {
    * 		prompt: "Translate this to malayalam: 'Keep cooking, guys'",
    * 	});
    */
-  languageModel(modelId: ChatModelId, settings?: ChatSettings): LanguageModelV1;
+  languageModel(modelId: ChatModelId, settings?: ChatSettings): LanguageModelV2;
   /**
    * Creates a Sarvam model for chat.
    *
@@ -392,7 +491,7 @@ type SarvamProvider = {
    * 		prompt: "Translate this to malayalam: 'Keep cooking, guys'",
    * 	});
    */
-  chat(modelId: ChatModelId, settings?: ChatSettings): LanguageModelV1;
+  chat(modelId: ChatModelId, settings?: ChatSettings): LanguageModelV2;
   /**
    * Creates a Sarvam model for transcription.
    *
@@ -409,7 +508,7 @@ type SarvamProvider = {
    *
    * @default unknown
    */
-  languageCode?: (T extends "saaras:v3" ? MoreSarvamLanguageCode : never) | SarvamLanguageCode | "unknown", settings?: TranscriptionSettings<T>): TranscriptionModelV1;
+  languageCode?: (T extends "saaras:v3" ? MoreSarvamLanguageCode : never) | SarvamLanguageCode | "unknown", settings?: TranscriptionSettings<T>): TranscriptionModelV2;
   /**
    * Creates a Sarvam model for Speech translation.
    *
@@ -419,7 +518,7 @@ type SarvamProvider = {
    *		audio: await readFile("./audio.wav"),
    * 	});
    */
-  speechTranslation<T extends SpeechTranslationModelId>(modelId: T, settings?: SpeechTranslationSettings): TranscriptionModelV1;
+  speechTranslation<T extends SpeechTranslationModelId>(modelId: T, settings?: SpeechTranslationSettings): TranscriptionModelV2;
   /**
    * Creates a Sarvam model for speech.
    * @example
@@ -430,7 +529,7 @@ type SarvamProvider = {
    *
    * 	await writeFile("./audio.wav", Buffer.from(audio.base64, "base64"););
    */
-  speech<T extends SpeechModelId>(modelId: T, languageCode: SarvamLanguageCode, settings?: SpeechSettings<T>): SpeechModelV1;
+  speech<T extends SpeechModelId>(modelId: T, languageCode: SarvamLanguageCode, settings?: SpeechSettings<T>): SpeechModelV2;
   /**
    * Creates an Sarvam model for transliterate.
    *
@@ -443,7 +542,7 @@ type SarvamProvider = {
    *		prompt: "eda mone, happy alle?",
    *	});
    */
-  transliterate<T extends SarvamLanguageCode>(settings: TransliterateSettings<false, T>): LanguageModelV1;
+  transliterate<T extends SarvamLanguageCode>(settings: TransliterateSettings<false, T>): LanguageModelV2;
   /**
    * Creates an Sarvam model for translation.
    *
@@ -456,7 +555,7 @@ type SarvamProvider = {
    *		prompt: "ഇതൊക്കെ ശ്രദ്ധിക്കണ്ടേ അംബാനെ?",
    *	});
    */
-  translation<T extends TranslationModelId>(model: T, settings: TranslationSettings<T>): LanguageModelV1;
+  translation<T extends TranslationModelId>(model: T, settings: TranslationSettings<T>): LanguageModelV2;
   /**
    * Creates an Sarvam model for language identification.
    *
@@ -466,7 +565,7 @@ type SarvamProvider = {
    *		prompt: "ബുദ്ധിയാണ് സാറേ ഇവൻ്റെ മെയിൻ",
    *	});
    */
-  languageIdentification(): LanguageModelV1;
+  languageIdentification(): LanguageModelV2;
 };
 //#endregion
 //#region src/provider.d.ts