npm - @llmgateway/ai-sdk-provider - Versions diffs - 1.0.3 → 2.0.0 - Mend

@llmgateway/ai-sdk-provider 1.0.3 → 2.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (14) hide show

package/README.md +1 -1
package/dist/index.d.mts +96 -64
package/dist/index.d.ts +96 -64
package/dist/index.js +1571 -673
package/dist/index.js.map +1 -1
package/dist/index.mjs +1532 -662
package/dist/index.mjs.map +1 -1
package/dist/internal/index.d.mts +50 -22
package/dist/internal/index.d.ts +50 -22
package/dist/internal/index.js +1517 -660
package/dist/internal/index.js.map +1 -1
package/dist/internal/index.mjs +1479 -650
package/dist/internal/index.mjs.map +1 -1
package/package.json +6 -8

package/dist/internal/index.d.mts CHANGED Viewed

@@ -1,15 +1,15 @@
-import { LanguageModelV1 } from '@ai-sdk/provider';
-export { LanguageModelV1 } from '@ai-sdk/provider';
+import { LanguageModelV2, LanguageModelV2CallOptions, LanguageModelV2Content, LanguageModelV2FinishReason, LanguageModelV2Usage, LanguageModelV2CallWarning, LanguageModelV2ResponseMetadata, SharedV2Headers, LanguageModelV2StreamPart } from '@ai-sdk/provider';
+export { LanguageModelV2, LanguageModelV2Prompt } from '@ai-sdk/provider';
-type LLMGatewayLanguageModel = LanguageModelV1;
 type LLMGatewayProviderOptions = {
     models?: string[];
     /**
-     * https://llmgateway.io/docs/use-cases/reasoning-tokens
+     * Reasoning configuration for supported models.
      * One of `max_tokens` or `effort` is required.
      * If `exclude` is true, reasoning will be removed from the response. Default is false.
      */
     reasoning?: {
+        enabled?: boolean;
         exclude?: boolean;
     } & ({
         max_tokens: number;
@@ -30,7 +30,6 @@ type LLMGatewaySharedSettings = LLMGatewayProviderOptions & {
     extraBody?: Record<string, unknown>;
     /**
      * Enable usage accounting to get detailed token usage information.
-     * https://llmgateway.io/docs/use-cases/usage-accounting
      */
     usage?: {
         /**
@@ -41,7 +40,6 @@ type LLMGatewaySharedSettings = LLMGatewayProviderOptions & {
 };
 /**
  * Usage accounting response
- * @see https://llmgateway.io/docs/use-cases/usage-accounting
  */
 type LLMGatewayUsageAccounting = {
     promptTokens: number;
@@ -54,6 +52,9 @@ type LLMGatewayUsageAccounting = {
     };
     totalTokens: number;
     cost?: number;
+    costDetails: {
+        upstreamInferenceCost: number;
+    };
 };
 type LLMGatewayCompletionModelId = string;
@@ -102,17 +103,18 @@ type LLMGatewayCompletionConfig = {
     fetch?: typeof fetch;
     extraBody?: Record<string, unknown>;
 };
-declare class LLMGatewayCompletionLanguageModel implements LanguageModelV1 {
-    readonly specificationVersion = "v1";
-    readonly defaultObjectGenerationMode: undefined;
+declare class LLMGatewayCompletionLanguageModel implements LanguageModelV2 {
+    readonly specificationVersion: "v2";
+    readonly provider = "llmgateway";
     readonly modelId: LLMGatewayCompletionModelId;
+    readonly supportedUrls: Record<string, RegExp[]>;
+    readonly defaultObjectGenerationMode: undefined;
     readonly settings: LLMGatewayCompletionSettings;
     private readonly config;
     constructor(modelId: LLMGatewayCompletionModelId, settings: LLMGatewayCompletionSettings, config: LLMGatewayCompletionConfig);
-    get provider(): string;
     private getArgs;
-    doGenerate(options: Parameters<LanguageModelV1['doGenerate']>[0]): Promise<Awaited<ReturnType<LanguageModelV1['doGenerate']>>>;
-    doStream(options: Parameters<LanguageModelV1['doStream']>[0]): Promise<Awaited<ReturnType<LanguageModelV1['doStream']>>>;
+    doGenerate(options: LanguageModelV2CallOptions): Promise<Awaited<ReturnType<LanguageModelV2['doGenerate']>>>;
+    doStream(options: LanguageModelV2CallOptions): Promise<Awaited<ReturnType<LanguageModelV2['doStream']>>>;
 }
 type LLMGatewayChatModelId = string;
@@ -135,7 +137,7 @@ type LLMGatewayChatSettings = {
     /**
   Return the log probabilities of the tokens. Including logprobs will increase
   the response size and can slow down response times. However, it can
-  be useful to better understand how the model is behaving.
+  be useful to understand better how the model is behaving.
   Setting to true will return the log probabilities of the tokens that
   were generated.
@@ -166,19 +168,45 @@ type LLMGatewayChatConfig = {
     fetch?: typeof fetch;
     extraBody?: Record<string, unknown>;
 };
-type DoGenerateOutput = Awaited<ReturnType<LanguageModelV1['doGenerate']>>;
-type DoStreamOutput = Awaited<ReturnType<LanguageModelV1['doStream']>>;
-declare class LLMGatewayChatLanguageModel implements LanguageModelV1 {
-    readonly specificationVersion = "v1";
-    readonly defaultObjectGenerationMode = "tool";
+declare class LLMGatewayChatLanguageModel implements LanguageModelV2 {
+    readonly specificationVersion: "v2";
+    readonly provider = "llmgateway";
+    readonly defaultObjectGenerationMode: "tool";
     readonly modelId: LLMGatewayChatModelId;
+    readonly supportedUrls: Record<string, RegExp[]>;
     readonly settings: LLMGatewayChatSettings;
     private readonly config;
     constructor(modelId: LLMGatewayChatModelId, settings: LLMGatewayChatSettings, config: LLMGatewayChatConfig);
-    get provider(): string;
     private getArgs;
-    doGenerate(options: Parameters<LanguageModelV1['doGenerate']>[0]): Promise<DoGenerateOutput>;
-    doStream(options: Parameters<LanguageModelV1['doStream']>[0]): Promise<DoStreamOutput>;
+    doGenerate(options: LanguageModelV2CallOptions): Promise<{
+        content: Array<LanguageModelV2Content>;
+        finishReason: LanguageModelV2FinishReason;
+        usage: LanguageModelV2Usage;
+        warnings: Array<LanguageModelV2CallWarning>;
+        providerMetadata?: {
+            llmgateway: {
+                usage: LLMGatewayUsageAccounting;
+            };
+        };
+        request?: {
+            body?: unknown;
+        };
+        response?: LanguageModelV2ResponseMetadata & {
+            headers?: SharedV2Headers;
+            body?: unknown;
+        };
+    }>;
+    doStream(options: LanguageModelV2CallOptions): Promise<{
+        stream: ReadableStream<LanguageModelV2StreamPart>;
+        warnings: Array<LanguageModelV2CallWarning>;
+        request?: {
+            body?: unknown;
+        };
+        response?: LanguageModelV2ResponseMetadata & {
+            headers?: SharedV2Headers;
+            body?: unknown;
+        };
+    }>;
 }
-export { LLMGatewayChatLanguageModel, type LLMGatewayChatModelId, type LLMGatewayChatSettings, LLMGatewayCompletionLanguageModel, type LLMGatewayCompletionModelId, type LLMGatewayCompletionSettings, type LLMGatewayLanguageModel, type LLMGatewayProviderOptions, type LLMGatewaySharedSettings, type LLMGatewayUsageAccounting };
+export { LLMGatewayChatLanguageModel, type LLMGatewayChatModelId, type LLMGatewayChatSettings, LLMGatewayCompletionLanguageModel, type LLMGatewayCompletionModelId, type LLMGatewayCompletionSettings, type LLMGatewayProviderOptions, type LLMGatewaySharedSettings, type LLMGatewayUsageAccounting };

package/dist/internal/index.d.ts CHANGED Viewed

@@ -1,15 +1,15 @@
-import { LanguageModelV1 } from '@ai-sdk/provider';
-export { LanguageModelV1 } from '@ai-sdk/provider';
+import { LanguageModelV2, LanguageModelV2CallOptions, LanguageModelV2Content, LanguageModelV2FinishReason, LanguageModelV2Usage, LanguageModelV2CallWarning, LanguageModelV2ResponseMetadata, SharedV2Headers, LanguageModelV2StreamPart } from '@ai-sdk/provider';
+export { LanguageModelV2, LanguageModelV2Prompt } from '@ai-sdk/provider';
-type LLMGatewayLanguageModel = LanguageModelV1;
 type LLMGatewayProviderOptions = {
     models?: string[];
     /**
-     * https://llmgateway.io/docs/use-cases/reasoning-tokens
+     * Reasoning configuration for supported models.
      * One of `max_tokens` or `effort` is required.
      * If `exclude` is true, reasoning will be removed from the response. Default is false.
      */
     reasoning?: {
+        enabled?: boolean;
         exclude?: boolean;
     } & ({
         max_tokens: number;
@@ -30,7 +30,6 @@ type LLMGatewaySharedSettings = LLMGatewayProviderOptions & {
     extraBody?: Record<string, unknown>;
     /**
      * Enable usage accounting to get detailed token usage information.
-     * https://llmgateway.io/docs/use-cases/usage-accounting
      */
     usage?: {
         /**
@@ -41,7 +40,6 @@ type LLMGatewaySharedSettings = LLMGatewayProviderOptions & {
 };
 /**
  * Usage accounting response
- * @see https://llmgateway.io/docs/use-cases/usage-accounting
  */
 type LLMGatewayUsageAccounting = {
     promptTokens: number;
@@ -54,6 +52,9 @@ type LLMGatewayUsageAccounting = {
     };
     totalTokens: number;
     cost?: number;
+    costDetails: {
+        upstreamInferenceCost: number;
+    };
 };
 type LLMGatewayCompletionModelId = string;
@@ -102,17 +103,18 @@ type LLMGatewayCompletionConfig = {
     fetch?: typeof fetch;
     extraBody?: Record<string, unknown>;
 };
-declare class LLMGatewayCompletionLanguageModel implements LanguageModelV1 {
-    readonly specificationVersion = "v1";
-    readonly defaultObjectGenerationMode: undefined;
+declare class LLMGatewayCompletionLanguageModel implements LanguageModelV2 {
+    readonly specificationVersion: "v2";
+    readonly provider = "llmgateway";
     readonly modelId: LLMGatewayCompletionModelId;
+    readonly supportedUrls: Record<string, RegExp[]>;
+    readonly defaultObjectGenerationMode: undefined;
     readonly settings: LLMGatewayCompletionSettings;
     private readonly config;
     constructor(modelId: LLMGatewayCompletionModelId, settings: LLMGatewayCompletionSettings, config: LLMGatewayCompletionConfig);
-    get provider(): string;
     private getArgs;
-    doGenerate(options: Parameters<LanguageModelV1['doGenerate']>[0]): Promise<Awaited<ReturnType<LanguageModelV1['doGenerate']>>>;
-    doStream(options: Parameters<LanguageModelV1['doStream']>[0]): Promise<Awaited<ReturnType<LanguageModelV1['doStream']>>>;
+    doGenerate(options: LanguageModelV2CallOptions): Promise<Awaited<ReturnType<LanguageModelV2['doGenerate']>>>;
+    doStream(options: LanguageModelV2CallOptions): Promise<Awaited<ReturnType<LanguageModelV2['doStream']>>>;
 }
 type LLMGatewayChatModelId = string;
@@ -135,7 +137,7 @@ type LLMGatewayChatSettings = {
     /**
   Return the log probabilities of the tokens. Including logprobs will increase
   the response size and can slow down response times. However, it can
-  be useful to better understand how the model is behaving.
+  be useful to understand better how the model is behaving.
   Setting to true will return the log probabilities of the tokens that
   were generated.
@@ -166,19 +168,45 @@ type LLMGatewayChatConfig = {
     fetch?: typeof fetch;
     extraBody?: Record<string, unknown>;
 };
-type DoGenerateOutput = Awaited<ReturnType<LanguageModelV1['doGenerate']>>;
-type DoStreamOutput = Awaited<ReturnType<LanguageModelV1['doStream']>>;
-declare class LLMGatewayChatLanguageModel implements LanguageModelV1 {
-    readonly specificationVersion = "v1";
-    readonly defaultObjectGenerationMode = "tool";
+declare class LLMGatewayChatLanguageModel implements LanguageModelV2 {
+    readonly specificationVersion: "v2";
+    readonly provider = "llmgateway";
+    readonly defaultObjectGenerationMode: "tool";
     readonly modelId: LLMGatewayChatModelId;
+    readonly supportedUrls: Record<string, RegExp[]>;
     readonly settings: LLMGatewayChatSettings;
     private readonly config;
     constructor(modelId: LLMGatewayChatModelId, settings: LLMGatewayChatSettings, config: LLMGatewayChatConfig);
-    get provider(): string;
     private getArgs;
-    doGenerate(options: Parameters<LanguageModelV1['doGenerate']>[0]): Promise<DoGenerateOutput>;
-    doStream(options: Parameters<LanguageModelV1['doStream']>[0]): Promise<DoStreamOutput>;
+    doGenerate(options: LanguageModelV2CallOptions): Promise<{
+        content: Array<LanguageModelV2Content>;
+        finishReason: LanguageModelV2FinishReason;
+        usage: LanguageModelV2Usage;
+        warnings: Array<LanguageModelV2CallWarning>;
+        providerMetadata?: {
+            llmgateway: {
+                usage: LLMGatewayUsageAccounting;
+            };
+        };
+        request?: {
+            body?: unknown;
+        };
+        response?: LanguageModelV2ResponseMetadata & {
+            headers?: SharedV2Headers;
+            body?: unknown;
+        };
+    }>;
+    doStream(options: LanguageModelV2CallOptions): Promise<{
+        stream: ReadableStream<LanguageModelV2StreamPart>;
+        warnings: Array<LanguageModelV2CallWarning>;
+        request?: {
+            body?: unknown;
+        };
+        response?: LanguageModelV2ResponseMetadata & {
+            headers?: SharedV2Headers;
+            body?: unknown;
+        };
+    }>;
 }
-export { LLMGatewayChatLanguageModel, type LLMGatewayChatModelId, type LLMGatewayChatSettings, LLMGatewayCompletionLanguageModel, type LLMGatewayCompletionModelId, type LLMGatewayCompletionSettings, type LLMGatewayLanguageModel, type LLMGatewayProviderOptions, type LLMGatewaySharedSettings, type LLMGatewayUsageAccounting };
+export { LLMGatewayChatLanguageModel, type LLMGatewayChatModelId, type LLMGatewayChatSettings, LLMGatewayCompletionLanguageModel, type LLMGatewayCompletionModelId, type LLMGatewayCompletionSettings, type LLMGatewayProviderOptions, type LLMGatewaySharedSettings, type LLMGatewayUsageAccounting };