npm - @earendil-works/pi-ai - Versions diffs - 0.78.1 → 0.79.1 - Mend

@earendil-works/pi-ai 0.78.1 → 0.79.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (32) hide show

package/README.md +4 -2
package/dist/image-models.generated.d.ts +30 -0
package/dist/image-models.generated.d.ts.map +1 -1
package/dist/image-models.generated.js +30 -0
package/dist/image-models.generated.js.map +1 -1
package/dist/models.generated.d.ts +421 -97
package/dist/models.generated.d.ts.map +1 -1
package/dist/models.generated.js +405 -185
package/dist/models.generated.js.map +1 -1
package/dist/providers/amazon-bedrock.d.ts.map +1 -1
package/dist/providers/amazon-bedrock.js +14 -6
package/dist/providers/amazon-bedrock.js.map +1 -1
package/dist/providers/anthropic.d.ts +1 -1
package/dist/providers/anthropic.d.ts.map +1 -1
package/dist/providers/anthropic.js +1 -1
package/dist/providers/anthropic.js.map +1 -1
package/dist/providers/azure-openai-responses.d.ts.map +1 -1
package/dist/providers/azure-openai-responses.js +1 -0
package/dist/providers/azure-openai-responses.js.map +1 -1
package/dist/providers/openai-completions.d.ts.map +1 -1
package/dist/providers/openai-completions.js +3 -2
package/dist/providers/openai-completions.js.map +1 -1
package/dist/providers/openai-responses-shared.d.ts.map +1 -1
package/dist/providers/openai-responses-shared.js +2 -1
package/dist/providers/openai-responses-shared.js.map +1 -1
package/dist/providers/openai-responses.d.ts.map +1 -1
package/dist/providers/openai-responses.js +1 -0
package/dist/providers/openai-responses.js.map +1 -1
package/dist/types.d.ts +4 -2
package/dist/types.d.ts.map +1 -1
package/dist/types.js.map +1 -1
package/package.json +1 -1

package/dist/models.generated.js CHANGED Viewed

@@ -8,7 +8,7 @@ export const MODELS = {
             api: "bedrock-converse-stream",
             provider: "amazon-bedrock",
             baseUrl: "https://bedrock-runtime.us-east-1.amazonaws.com",
-            reasoning: false,
+            reasoning: true,
             input: ["text", "image"],
             cost: {
                 input: 0.33,
@@ -347,6 +347,24 @@ export const MODELS = {
             contextWindow: 163840,
             maxTokens: 81920,
         },
+        "eu.anthropic.claude-fable-5": {
+            id: "eu.anthropic.claude-fable-5",
+            name: "Claude Fable 5 (EU)",
+            api: "bedrock-converse-stream",
+            provider: "amazon-bedrock",
+            baseUrl: "https://bedrock-runtime.eu-central-1.amazonaws.com",
+            reasoning: true,
+            thinkingLevelMap: { "xhigh": "xhigh" },
+            input: ["text", "image"],
+            cost: {
+                input: 11,
+                output: 55,
+                cacheRead: 1.1,
+                cacheWrite: 13.75,
+            },
+            contextWindow: 1000000,
+            maxTokens: 128000,
+        },
         "eu.anthropic.claude-haiku-4-5-20251001-v1:0": {
             id: "eu.anthropic.claude-haiku-4-5-20251001-v1:0",
             name: "Claude Haiku 4.5 (EU)",
@@ -469,6 +487,24 @@ export const MODELS = {
             contextWindow: 1000000,
             maxTokens: 64000,
         },
+        "global.anthropic.claude-fable-5": {
+            id: "global.anthropic.claude-fable-5",
+            name: "Claude Fable 5 (Global)",
+            api: "bedrock-converse-stream",
+            provider: "amazon-bedrock",
+            baseUrl: "https://bedrock-runtime.us-east-1.amazonaws.com",
+            reasoning: true,
+            thinkingLevelMap: { "xhigh": "xhigh" },
+            input: ["text", "image"],
+            cost: {
+                input: 10,
+                output: 50,
+                cacheRead: 1,
+                cacheWrite: 12.5,
+            },
+            contextWindow: 1000000,
+            maxTokens: 128000,
+        },
         "global.anthropic.claude-haiku-4-5-20251001-v1:0": {
             id: "global.anthropic.claude-haiku-4-5-20251001-v1:0",
             name: "Claude Haiku 4.5 (Global)",
@@ -1086,13 +1122,66 @@ export const MODELS = {
             contextWindow: 262144,
             maxTokens: 131072,
         },
+        "openai.gpt-5.4": {
+            id: "openai.gpt-5.4",
+            name: "GPT-5.4",
+            api: "bedrock-converse-stream",
+            provider: "amazon-bedrock",
+            baseUrl: "https://bedrock-runtime.us-east-1.amazonaws.com",
+            reasoning: true,
+            thinkingLevelMap: { "xhigh": "xhigh" },
+            input: ["text", "image"],
+            cost: {
+                input: 2.75,
+                output: 16.5,
+                cacheRead: 0.275,
+                cacheWrite: 0,
+            },
+            contextWindow: 272000,
+            maxTokens: 128000,
+        },
+        "openai.gpt-5.5": {
+            id: "openai.gpt-5.5",
+            name: "GPT-5.5",
+            api: "bedrock-converse-stream",
+            provider: "amazon-bedrock",
+            baseUrl: "https://bedrock-runtime.us-east-1.amazonaws.com",
+            reasoning: true,
+            thinkingLevelMap: { "xhigh": "xhigh" },
+            input: ["text", "image"],
+            cost: {
+                input: 5.5,
+                output: 33,
+                cacheRead: 0.55,
+                cacheWrite: 0,
+            },
+            contextWindow: 272000,
+            maxTokens: 128000,
+        },
+        "openai.gpt-oss-120b": {
+            id: "openai.gpt-oss-120b",
+            name: "gpt-oss-120b",
+            api: "bedrock-converse-stream",
+            provider: "amazon-bedrock",
+            baseUrl: "https://bedrock-runtime.us-east-1.amazonaws.com",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0.15,
+                output: 0.6,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 16384,
+        },
         "openai.gpt-oss-120b-1:0": {
             id: "openai.gpt-oss-120b-1:0",
             name: "gpt-oss-120b",
             api: "bedrock-converse-stream",
             provider: "amazon-bedrock",
             baseUrl: "https://bedrock-runtime.us-east-1.amazonaws.com",
-            reasoning: false,
+            reasoning: true,
             input: ["text"],
             cost: {
                 input: 0.15,
@@ -1103,13 +1192,30 @@ export const MODELS = {
             contextWindow: 128000,
             maxTokens: 16384,
         },
+        "openai.gpt-oss-20b": {
+            id: "openai.gpt-oss-20b",
+            name: "gpt-oss-20b",
+            api: "bedrock-converse-stream",
+            provider: "amazon-bedrock",
+            baseUrl: "https://bedrock-runtime.us-east-1.amazonaws.com",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0.07,
+                output: 0.3,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 16384,
+        },
         "openai.gpt-oss-20b-1:0": {
             id: "openai.gpt-oss-20b-1:0",
             name: "gpt-oss-20b",
             api: "bedrock-converse-stream",
             provider: "amazon-bedrock",
             baseUrl: "https://bedrock-runtime.us-east-1.amazonaws.com",
-            reasoning: false,
+            reasoning: true,
             input: ["text"],
             cost: {
                 input: 0.07,
@@ -1273,6 +1379,24 @@ export const MODELS = {
             contextWindow: 262000,
             maxTokens: 262000,
         },
+        "us.anthropic.claude-fable-5": {
+            id: "us.anthropic.claude-fable-5",
+            name: "Claude Fable 5 (US)",
+            api: "bedrock-converse-stream",
+            provider: "amazon-bedrock",
+            baseUrl: "https://bedrock-runtime.us-east-1.amazonaws.com",
+            reasoning: true,
+            thinkingLevelMap: { "xhigh": "xhigh" },
+            input: ["text", "image"],
+            cost: {
+                input: 10,
+                output: 50,
+                cacheRead: 1,
+                cacheWrite: 12.5,
+            },
+            contextWindow: 1000000,
+            maxTokens: 128000,
+        },
         "us.anthropic.claude-haiku-4-5-20251001-v1:0": {
             id: "us.anthropic.claude-haiku-4-5-20251001-v1:0",
             name: "Claude Haiku 4.5 (US)",
@@ -1743,6 +1867,25 @@ export const MODELS = {
             contextWindow: 200000,
             maxTokens: 4096,
         },
+        "claude-fable-5": {
+            id: "claude-fable-5",
+            name: "Claude Fable 5",
+            api: "anthropic-messages",
+            provider: "anthropic",
+            baseUrl: "https://api.anthropic.com",
+            compat: { "forceAdaptiveThinking": true },
+            reasoning: true,
+            thinkingLevelMap: { "xhigh": "xhigh" },
+            input: ["text", "image"],
+            cost: {
+                input: 10,
+                output: 50,
+                cacheRead: 1,
+                cacheWrite: 12.5,
+            },
+            contextWindow: 1000000,
+            maxTokens: 128000,
+        },
         "claude-haiku-4-5": {
             id: "claude-haiku-4-5",
             name: "Claude Haiku 4.5 (latest)",
@@ -2300,7 +2443,7 @@ export const MODELS = {
                 cacheWrite: 0,
             },
             contextWindow: 400000,
-            maxTokens: 272000,
+            maxTokens: 128000,
         },
         "gpt-5.1": {
             id: "gpt-5.1",
@@ -2533,7 +2676,7 @@ export const MODELS = {
                 cacheRead: 0.25,
                 cacheWrite: 0,
             },
-            contextWindow: 272000,
+            contextWindow: 1050000,
             maxTokens: 128000,
         },
         "gpt-5.4-mini": {
@@ -2605,7 +2748,7 @@ export const MODELS = {
                 cacheRead: 0.5,
                 cacheWrite: 0,
             },
-            contextWindow: 272000,
+            contextWindow: 1050000,
             maxTokens: 128000,
         },
         "gpt-5.5-pro": {
@@ -2919,6 +3062,25 @@ export const MODELS = {
             contextWindow: 200000,
             maxTokens: 8192,
         },
+        "claude-fable-5": {
+            id: "claude-fable-5",
+            name: "Claude Fable 5",
+            api: "anthropic-messages",
+            provider: "cloudflare-ai-gateway",
+            baseUrl: "https://gateway.ai.cloudflare.com/v1/{CLOUDFLARE_ACCOUNT_ID}/{CLOUDFLARE_GATEWAY_ID}/anthropic",
+            compat: { "forceAdaptiveThinking": true },
+            reasoning: true,
+            thinkingLevelMap: { "xhigh": "xhigh" },
+            input: ["text", "image"],
+            cost: {
+                input: 10,
+                output: 50,
+                cacheRead: 1,
+                cacheWrite: 12.5,
+            },
+            contextWindow: 1000000,
+            maxTokens: 128000,
+        },
         "claude-haiku-4-5": {
             id: "claude-haiku-4-5",
             name: "Claude Haiku 4.5 (latest)",
@@ -3887,6 +4049,24 @@ export const MODELS = {
             contextWindow: 202800,
             maxTokens: 131072,
         },
+        "accounts/fireworks/routers/kimi-k2p6-fast": {
+            id: "accounts/fireworks/routers/kimi-k2p6-fast",
+            name: "Kimi K2.6 Fast",
+            api: "anthropic-messages",
+            provider: "fireworks",
+            baseUrl: "https://api.fireworks.ai/inference",
+            compat: { "sendSessionAffinityHeaders": true, "supportsEagerToolInputStreaming": false, "supportsCacheControlOnTools": false, "supportsLongCacheRetention": false },
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 2,
+                output: 8,
+                cacheRead: 0.3,
+                cacheWrite: 0,
+            },
+            contextWindow: 262000,
+            maxTokens: 262000,
+        },
         "accounts/fireworks/routers/kimi-k2p6-turbo": {
             id: "accounts/fireworks/routers/kimi-k2p6-turbo",
             name: "Kimi K2.6 Turbo",
@@ -6019,11 +6199,11 @@ export const MODELS = {
             api: "mistral-conversations",
             provider: "mistral",
             baseUrl: "https://api.mistral.ai",
-            reasoning: true,
+            reasoning: false,
             input: ["text", "image"],
             cost: {
-                input: 1.5,
-                output: 7.5,
+                input: 0.4,
+                output: 2,
                 cacheRead: 0,
                 cacheWrite: 0,
             },
@@ -6208,7 +6388,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "moonshotai",
             baseUrl: "https://api.moonshot.ai/v1",
-            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false },
+            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false, "thinkingFormat": "deepseek" },
             reasoning: false,
             input: ["text"],
             cost: {
@@ -6226,7 +6406,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "moonshotai",
             baseUrl: "https://api.moonshot.ai/v1",
-            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false },
+            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false, "thinkingFormat": "deepseek" },
             reasoning: false,
             input: ["text"],
             cost: {
@@ -6244,7 +6424,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "moonshotai",
             baseUrl: "https://api.moonshot.ai/v1",
-            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false },
+            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false, "thinkingFormat": "deepseek" },
             reasoning: true,
             input: ["text"],
             cost: {
@@ -6262,7 +6442,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "moonshotai",
             baseUrl: "https://api.moonshot.ai/v1",
-            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false },
+            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false, "thinkingFormat": "deepseek" },
             reasoning: true,
             input: ["text"],
             cost: {
@@ -6280,7 +6460,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "moonshotai",
             baseUrl: "https://api.moonshot.ai/v1",
-            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false },
+            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false, "thinkingFormat": "deepseek" },
             reasoning: false,
             input: ["text"],
             cost: {
@@ -6298,7 +6478,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "moonshotai",
             baseUrl: "https://api.moonshot.ai/v1",
-            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false },
+            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false, "thinkingFormat": "deepseek" },
             reasoning: true,
             input: ["text", "image"],
             cost: {
@@ -6316,7 +6496,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "moonshotai",
             baseUrl: "https://api.moonshot.ai/v1",
-            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false },
+            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false, "thinkingFormat": "deepseek" },
             reasoning: true,
             input: ["text", "image"],
             cost: {
@@ -6336,7 +6516,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "moonshotai-cn",
             baseUrl: "https://api.moonshot.cn/v1",
-            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false },
+            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false, "thinkingFormat": "deepseek" },
             reasoning: false,
             input: ["text"],
             cost: {
@@ -6354,7 +6534,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "moonshotai-cn",
             baseUrl: "https://api.moonshot.cn/v1",
-            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false },
+            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false, "thinkingFormat": "deepseek" },
             reasoning: false,
             input: ["text"],
             cost: {
@@ -6372,7 +6552,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "moonshotai-cn",
             baseUrl: "https://api.moonshot.cn/v1",
-            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false },
+            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false, "thinkingFormat": "deepseek" },
             reasoning: true,
             input: ["text"],
             cost: {
@@ -6390,7 +6570,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "moonshotai-cn",
             baseUrl: "https://api.moonshot.cn/v1",
-            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false },
+            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false, "thinkingFormat": "deepseek" },
             reasoning: true,
             input: ["text"],
             cost: {
@@ -6408,7 +6588,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "moonshotai-cn",
             baseUrl: "https://api.moonshot.cn/v1",
-            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false },
+            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false, "thinkingFormat": "deepseek" },
             reasoning: false,
             input: ["text"],
             cost: {
@@ -6426,7 +6606,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "moonshotai-cn",
             baseUrl: "https://api.moonshot.cn/v1",
-            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false },
+            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false, "thinkingFormat": "deepseek" },
             reasoning: true,
             input: ["text", "image"],
             cost: {
@@ -6444,7 +6624,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "moonshotai-cn",
             baseUrl: "https://api.moonshot.cn/v1",
-            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false },
+            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false, "thinkingFormat": "deepseek" },
             reasoning: true,
             input: ["text", "image"],
             cost: {
@@ -6705,6 +6885,25 @@ export const MODELS = {
             contextWindow: 262144,
             maxTokens: 262144,
         },
+        "nvidia/nemotron-3-ultra-550b-a55b": {
+            id: "nvidia/nemotron-3-ultra-550b-a55b",
+            name: "Nemotron 3 Ultra 550B A55B",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            headers: { "NVCF-POLL-SECONDS": "3600" },
+            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false, "supportsLongCacheRetention": false },
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0.5,
+                output: 2.5,
+                cacheRead: 0.15,
+                cacheWrite: 0,
+            },
+            contextWindow: 1000000,
+            maxTokens: 65536,
+        },
         "nvidia/nvidia-nemotron-nano-9b-v2": {
             id: "nvidia/nvidia-nemotron-nano-9b-v2",
             name: "nvidia-nemotron-nano-9b-v2",
@@ -7116,7 +7315,7 @@ export const MODELS = {
                 cacheWrite: 0,
             },
             contextWindow: 400000,
-            maxTokens: 272000,
+            maxTokens: 128000,
         },
         "gpt-5.1": {
             id: "gpt-5.1",
@@ -7660,6 +7859,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "opencode",
             baseUrl: "https://opencode.ai/zen/v1",
+            compat: { "maxTokensField": "max_tokens" },
             reasoning: true,
             input: ["text"],
             cost: {
@@ -7671,6 +7871,25 @@ export const MODELS = {
             contextWindow: 200000,
             maxTokens: 32000,
         },
+        "claude-fable-5": {
+            id: "claude-fable-5",
+            name: "Claude Fable 5",
+            api: "anthropic-messages",
+            provider: "opencode",
+            baseUrl: "https://opencode.ai/zen",
+            compat: { "forceAdaptiveThinking": true },
+            reasoning: true,
+            thinkingLevelMap: { "xhigh": "xhigh" },
+            input: ["text", "image"],
+            cost: {
+                input: 10,
+                output: 50,
+                cacheRead: 1,
+                cacheWrite: 12.5,
+            },
+            contextWindow: 1000000,
+            maxTokens: 128000,
+        },
         "claude-haiku-4-5": {
             id: "claude-haiku-4-5",
             name: "Claude Haiku 4.5",
@@ -7837,7 +8056,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "opencode",
             baseUrl: "https://opencode.ai/zen/v1",
-            compat: { "requiresReasoningContentOnAssistantMessages": true, "thinkingFormat": "deepseek" },
+            compat: { "maxTokensField": "max_tokens", "requiresReasoningContentOnAssistantMessages": true, "thinkingFormat": "deepseek" },
             reasoning: true,
             thinkingLevelMap: { "minimal": null, "low": null, "medium": null, "high": "high", "xhigh": "max" },
             input: ["text"],
@@ -7856,7 +8075,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "opencode",
             baseUrl: "https://opencode.ai/zen/v1",
-            compat: { "requiresReasoningContentOnAssistantMessages": true, "thinkingFormat": "deepseek" },
+            compat: { "maxTokensField": "max_tokens", "requiresReasoningContentOnAssistantMessages": true, "thinkingFormat": "deepseek" },
             reasoning: true,
             thinkingLevelMap: { "minimal": null, "low": null, "medium": null, "high": "high", "xhigh": "max" },
             input: ["text"],
@@ -7929,6 +8148,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "opencode",
             baseUrl: "https://opencode.ai/zen/v1",
+            compat: { "maxTokensField": "max_tokens" },
             reasoning: true,
             input: ["text"],
             cost: {
@@ -7946,6 +8166,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "opencode",
             baseUrl: "https://opencode.ai/zen/v1",
+            compat: { "maxTokensField": "max_tokens" },
             reasoning: true,
             input: ["text"],
             cost: {
@@ -8251,7 +8472,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "opencode",
             baseUrl: "https://opencode.ai/zen/v1",
-            compat: { "supportsReasoningEffort": false },
+            compat: { "supportsReasoningEffort": false, "maxTokensField": "max_tokens" },
             reasoning: true,
             thinkingLevelMap: { "off": null, "minimal": null, "low": null, "medium": null },
             input: ["text", "image"],
@@ -8270,6 +8491,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "opencode",
             baseUrl: "https://opencode.ai/zen/v1",
+            compat: { "maxTokensField": "max_tokens" },
             reasoning: true,
             input: ["text", "image"],
             cost: {
@@ -8287,7 +8509,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "opencode",
             baseUrl: "https://opencode.ai/zen/v1",
-            compat: { "thinkingFormat": "deepseek", "supportsReasoningEffort": false },
+            compat: { "thinkingFormat": "deepseek", "supportsReasoningEffort": false, "maxTokensField": "max_tokens" },
             reasoning: true,
             input: ["text", "image"],
             cost: {
@@ -8305,6 +8527,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "opencode",
             baseUrl: "https://opencode.ai/zen/v1",
+            compat: { "maxTokensField": "max_tokens" },
             reasoning: true,
             input: ["text", "image"],
             cost: {
@@ -8322,6 +8545,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "opencode",
             baseUrl: "https://opencode.ai/zen/v1",
+            compat: { "maxTokensField": "max_tokens" },
             reasoning: true,
             input: ["text"],
             cost: {
@@ -8339,6 +8563,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "opencode",
             baseUrl: "https://opencode.ai/zen/v1",
+            compat: { "maxTokensField": "max_tokens" },
             reasoning: true,
             input: ["text"],
             cost: {
@@ -8350,29 +8575,31 @@ export const MODELS = {
             contextWindow: 204800,
             maxTokens: 131072,
         },
-        "minimax-m3-free": {
-            id: "minimax-m3-free",
-            name: "MiniMax M3 Free",
-            api: "anthropic-messages",
+        "nemotron-3-ultra-free": {
+            id: "nemotron-3-ultra-free",
+            name: "Nemotron 3 Ultra Free",
+            api: "openai-completions",
             provider: "opencode",
-            baseUrl: "https://opencode.ai/zen",
+            baseUrl: "https://opencode.ai/zen/v1",
+            compat: { "maxTokensField": "max_tokens" },
             reasoning: true,
-            input: ["text", "image"],
+            input: ["text"],
             cost: {
                 input: 0,
                 output: 0,
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 200000,
-            maxTokens: 32000,
+            contextWindow: 1000000,
+            maxTokens: 128000,
         },
-        "nemotron-3-ultra-free": {
-            id: "nemotron-3-ultra-free",
-            name: "Nemotron 3 Ultra Free",
+        "north-mini-code-free": {
+            id: "north-mini-code-free",
+            name: "North Mini Code Free",
             api: "openai-completions",
             provider: "opencode",
             baseUrl: "https://opencode.ai/zen/v1",
+            compat: { "maxTokensField": "max_tokens" },
             reasoning: true,
             input: ["text"],
             cost: {
@@ -8381,8 +8608,8 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 1000000,
-            maxTokens: 128000,
+            contextWindow: 256000,
+            maxTokens: 64000,
         },
         "qwen3.5-plus": {
             id: "qwen3.5-plus",
@@ -8426,7 +8653,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "opencode-go",
             baseUrl: "https://opencode.ai/zen/go/v1",
-            compat: { "requiresReasoningContentOnAssistantMessages": true, "thinkingFormat": "deepseek" },
+            compat: { "maxTokensField": "max_tokens", "requiresReasoningContentOnAssistantMessages": true, "thinkingFormat": "deepseek" },
             reasoning: true,
             thinkingLevelMap: { "minimal": null, "low": null, "medium": null, "high": "high", "xhigh": "max" },
             input: ["text"],
@@ -8445,7 +8672,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "opencode-go",
             baseUrl: "https://opencode.ai/zen/go/v1",
-            compat: { "requiresReasoningContentOnAssistantMessages": true, "thinkingFormat": "deepseek" },
+            compat: { "maxTokensField": "max_tokens", "requiresReasoningContentOnAssistantMessages": true, "thinkingFormat": "deepseek" },
             reasoning: true,
             thinkingLevelMap: { "minimal": null, "low": null, "medium": null, "high": "high", "xhigh": "max" },
             input: ["text"],
@@ -8464,6 +8691,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "opencode-go",
             baseUrl: "https://opencode.ai/zen/go/v1",
+            compat: { "maxTokensField": "max_tokens" },
             reasoning: true,
             input: ["text"],
             cost: {
@@ -8481,6 +8709,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "opencode-go",
             baseUrl: "https://opencode.ai/zen/go/v1",
+            compat: { "maxTokensField": "max_tokens" },
             reasoning: true,
             input: ["text"],
             cost: {
@@ -8498,6 +8727,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "opencode-go",
             baseUrl: "https://opencode.ai/zen/go/v1",
+            compat: { "maxTokensField": "max_tokens" },
             reasoning: true,
             input: ["text", "image"],
             cost: {
@@ -8515,7 +8745,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "opencode-go",
             baseUrl: "https://opencode.ai/zen/go/v1",
-            compat: { "thinkingFormat": "deepseek", "supportsReasoningEffort": false },
+            compat: { "thinkingFormat": "deepseek", "supportsReasoningEffort": false, "maxTokensField": "max_tokens" },
             reasoning: true,
             thinkingLevelMap: { "minimal": null, "low": null, "medium": null },
             input: ["text", "image"],
@@ -8534,6 +8764,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "opencode-go",
             baseUrl: "https://opencode.ai/zen/go/v1",
+            compat: { "maxTokensField": "max_tokens" },
             reasoning: true,
             input: ["text", "image"],
             cost: {
@@ -8551,6 +8782,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "opencode-go",
             baseUrl: "https://opencode.ai/zen/go/v1",
+            compat: { "maxTokensField": "max_tokens" },
             reasoning: true,
             input: ["text"],
             cost: {
@@ -8585,6 +8817,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "opencode-go",
             baseUrl: "https://opencode.ai/zen/go/v1",
+            compat: { "maxTokensField": "max_tokens" },
             reasoning: true,
             input: ["text"],
             cost: {
@@ -8605,9 +8838,9 @@ export const MODELS = {
             reasoning: true,
             input: ["text", "image"],
             cost: {
-                input: 0.6,
-                output: 2.4,
-                cacheRead: 0.12,
+                input: 0.3,
+                output: 1.2,
+                cacheRead: 0.06,
                 cacheWrite: 0,
             },
             contextWindow: 512000,
@@ -8619,7 +8852,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "opencode-go",
             baseUrl: "https://opencode.ai/zen/go/v1",
-            compat: { "thinkingFormat": "qwen" },
+            compat: { "thinkingFormat": "qwen", "maxTokensField": "max_tokens" },
             reasoning: true,
             input: ["text", "image"],
             cost: {
@@ -8628,7 +8861,7 @@ export const MODELS = {
                 cacheRead: 0.05,
                 cacheWrite: 0.625,
             },
-            contextWindow: 262144,
+            contextWindow: 1000000,
             maxTokens: 65536,
         },
         "qwen3.7-max": {
@@ -8662,7 +8895,7 @@ export const MODELS = {
                 cacheRead: 0.04,
                 cacheWrite: 0.5,
             },
-            contextWindow: 262144,
+            contextWindow: 1000000,
             maxTokens: 65536,
         },
     },
@@ -8803,6 +9036,23 @@ export const MODELS = {
             contextWindow: 200000,
             maxTokens: 8192,
         },
+        "anthropic/claude-fable-5": {
+            id: "anthropic/claude-fable-5",
+            name: "Anthropic: Claude Fable 5",
+            api: "openai-completions",
+            provider: "openrouter",
+            baseUrl: "https://openrouter.ai/api/v1",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 10,
+                output: 50,
+                cacheRead: 1,
+                cacheWrite: 12.5,
+            },
+            contextWindow: 1000000,
+            maxTokens: 128000,
+        },
         "anthropic/claude-haiku-4.5": {
             id: "anthropic/claude-haiku-4.5",
             name: "Anthropic: Claude Haiku 4.5",
@@ -9098,23 +9348,6 @@ export const MODELS = {
             contextWindow: 2000000,
             maxTokens: 30000,
         },
-        "baidu/ernie-4.5-vl-28b-a3b": {
-            id: "baidu/ernie-4.5-vl-28b-a3b",
-            name: "Baidu: ERNIE 4.5 VL 28B A3B",
-            api: "openai-completions",
-            provider: "openrouter",
-            baseUrl: "https://openrouter.ai/api/v1",
-            reasoning: true,
-            input: ["text", "image"],
-            cost: {
-                input: 0.14,
-                output: 0.56,
-                cacheRead: 0,
-                cacheWrite: 0,
-            },
-            contextWindow: 131072,
-            maxTokens: 8000,
-        },
         "bytedance-seed/seed-1.6": {
             id: "bytedance-seed/seed-1.6",
             name: "ByteDance Seed: Seed 1.6",
@@ -9621,8 +9854,8 @@ export const MODELS = {
             reasoning: false,
             input: ["text", "image"],
             cost: {
-                input: 0.04,
-                output: 0.13,
+                input: 0.049999999999999996,
+                output: 0.15,
                 cacheRead: 0,
                 cacheWrite: 0,
             },
@@ -9690,12 +9923,12 @@ export const MODELS = {
             input: ["text", "image"],
             cost: {
                 input: 0.12,
-                output: 0.37,
-                cacheRead: 0,
+                output: 0.36,
+                cacheRead: 0.09,
                 cacheWrite: 0,
             },
             contextWindow: 262144,
-            maxTokens: 16384,
+            maxTokens: 8192,
         },
         "google/gemma-4-31b-it:free": {
             id: "google/gemma-4-31b-it:free",
@@ -9844,7 +10077,7 @@ export const MODELS = {
             input: ["text"],
             cost: {
                 input: 0.02,
-                output: 0.049999999999999996,
+                output: 0.03,
                 cacheRead: 0,
                 cacheWrite: 0,
             },
@@ -9911,7 +10144,7 @@ export const MODELS = {
             reasoning: false,
             input: ["text", "image"],
             cost: {
-                input: 0.08,
+                input: 0.09999999999999999,
                 output: 0.3,
                 cacheRead: 0,
                 cacheWrite: 0,
@@ -9980,8 +10213,8 @@ export const MODELS = {
             input: ["text"],
             cost: {
                 input: 0.15,
-                output: 1.15,
-                cacheRead: 0,
+                output: 0.8999999999999999,
+                cacheRead: 0.049999999999999996,
                 cacheWrite: 0,
             },
             contextWindow: 204800,
@@ -9996,9 +10229,9 @@ export const MODELS = {
             reasoning: true,
             input: ["text"],
             cost: {
-                input: 0.27899999999999997,
-                output: 1.2,
-                cacheRead: 0,
+                input: 0.27,
+                output: 1.08,
+                cacheRead: 0.054,
                 cacheWrite: 0,
             },
             contextWindow: 204800,
@@ -10388,13 +10621,13 @@ export const MODELS = {
             reasoning: true,
             input: ["text", "image"],
             cost: {
-                input: 0.684,
-                output: 3.42,
-                cacheRead: 0.144,
+                input: 0.6799999999999999,
+                output: 3.41,
+                cacheRead: 0.33999999999999997,
                 cacheWrite: 0,
             },
             contextWindow: 262144,
-            maxTokens: 262144,
+            maxTokens: 262142,
         },
         "moonshotai/kimi-k2.6:free": {
             id: "moonshotai/kimi-k2.6:free",
@@ -10414,22 +10647,22 @@ export const MODELS = {
             contextWindow: 262144,
             maxTokens: 4096,
         },
-        "nex-agi/deepseek-v3.1-nex-n1": {
-            id: "nex-agi/deepseek-v3.1-nex-n1",
-            name: "Nex AGI: DeepSeek V3.1 Nex N1",
+        "nex-agi/nex-n2-pro:free": {
+            id: "nex-agi/nex-n2-pro:free",
+            name: "Nex AGI: Nex-N2-Pro (free)",
             api: "openai-completions",
             provider: "openrouter",
             baseUrl: "https://openrouter.ai/api/v1",
-            reasoning: false,
-            input: ["text"],
+            reasoning: true,
+            input: ["text", "image"],
             cost: {
-                input: 0.135,
-                output: 0.5,
+                input: 0,
+                output: 0,
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 131072,
-            maxTokens: 163840,
+            contextWindow: 262144,
+            maxTokens: 262144,
         },
         "nvidia/llama-3.3-nemotron-super-49b-v1.5": {
             id: "nvidia/llama-3.3-nemotron-super-49b-v1.5",
@@ -10440,7 +10673,7 @@ export const MODELS = {
             reasoning: true,
             input: ["text"],
             cost: {
-                input: 0.09999999999999999,
+                input: 0.39999999999999997,
                 output: 0.39999999999999997,
                 cacheRead: 0,
                 cacheWrite: 0,
@@ -10686,23 +10919,6 @@ export const MODELS = {
             contextWindow: 8191,
             maxTokens: 4096,
         },
-        "openai/gpt-4-1106-preview": {
-            id: "openai/gpt-4-1106-preview",
-            name: "OpenAI: GPT-4 Turbo (older v1106)",
-            api: "openai-completions",
-            provider: "openrouter",
-            baseUrl: "https://openrouter.ai/api/v1",
-            reasoning: false,
-            input: ["text"],
-            cost: {
-                input: 10,
-                output: 30,
-                cacheRead: 0,
-                cacheWrite: 0,
-            },
-            contextWindow: 128000,
-            maxTokens: 4096,
-        },
         "openai/gpt-4-turbo": {
             id: "openai/gpt-4-turbo",
             name: "OpenAI: GPT-4 Turbo",
@@ -11778,7 +11994,7 @@ export const MODELS = {
             reasoning: false,
             input: ["text"],
             cost: {
-                input: 0.071,
+                input: 0.09,
                 output: 0.09999999999999999,
                 cacheRead: 0,
                 cacheWrite: 0,
@@ -11812,13 +12028,13 @@ export const MODELS = {
             reasoning: true,
             input: ["text"],
             cost: {
-                input: 0.09,
-                output: 0.44999999999999996,
+                input: 0.12,
+                output: 0.5,
                 cacheRead: 0,
                 cacheWrite: 0,
             },
             contextWindow: 131072,
-            maxTokens: 20000,
+            maxTokens: 16384,
         },
         "qwen/qwen3-30b-a3b-instruct-2507": {
             id: "qwen/qwen3-30b-a3b-instruct-2507",
@@ -12271,13 +12487,13 @@ export const MODELS = {
             reasoning: true,
             input: ["text", "image"],
             cost: {
-                input: 0.04,
+                input: 0.09999999999999999,
                 output: 0.15,
                 cacheRead: 0,
                 cacheWrite: 0,
             },
             contextWindow: 262144,
-            maxTokens: 81920,
+            maxTokens: 262144,
         },
         "qwen/qwen3.5-flash-02-23": {
             id: "qwen/qwen3.5-flash-02-23",
@@ -12339,13 +12555,13 @@ export const MODELS = {
             reasoning: true,
             input: ["text", "image"],
             cost: {
-                input: 0.29,
-                output: 3.1999999999999997,
+                input: 0.28900000000000003,
+                output: 2.4,
                 cacheRead: 0,
                 cacheWrite: 0,
             },
             contextWindow: 262144,
-            maxTokens: 262140,
+            maxTokens: 131072,
         },
         "qwen/qwen3.6-35b-a3b": {
             id: "qwen/qwen3.6-35b-a3b",
@@ -12483,23 +12699,6 @@ export const MODELS = {
             contextWindow: 256000,
             maxTokens: 128000,
         },
-        "sao10k/l3-euryale-70b": {
-            id: "sao10k/l3-euryale-70b",
-            name: "Sao10k: Llama 3 Euryale 70B v2.1",
-            api: "openai-completions",
-            provider: "openrouter",
-            baseUrl: "https://openrouter.ai/api/v1",
-            reasoning: false,
-            input: ["text"],
-            cost: {
-                input: 1.48,
-                output: 1.48,
-                cacheRead: 0,
-                cacheWrite: 0,
-            },
-            contextWindow: 8192,
-            maxTokens: 8192,
-        },
         "sao10k/l3.1-euryale-70b": {
             id: "sao10k/l3.1-euryale-70b",
             name: "Sao10K: Llama 3.1 Euryale 70B v2.2",
@@ -12942,6 +13141,23 @@ export const MODELS = {
             contextWindow: 202752,
             maxTokens: 131072,
         },
+        "~anthropic/claude-fable-latest": {
+            id: "~anthropic/claude-fable-latest",
+            name: "Anthropic: Claude Fable Latest",
+            api: "openai-completions",
+            provider: "openrouter",
+            baseUrl: "https://openrouter.ai/api/v1",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 10,
+                output: 50,
+                cacheRead: 1,
+                cacheWrite: 12.5,
+            },
+            contextWindow: 1000000,
+            maxTokens: 128000,
+        },
         "~anthropic/claude-haiku-latest": {
             id: "~anthropic/claude-haiku-latest",
             name: "Anthropic Claude Haiku Latest",
@@ -13036,13 +13252,13 @@ export const MODELS = {
             reasoning: true,
             input: ["text", "image"],
             cost: {
-                input: 0.684,
-                output: 3.42,
-                cacheRead: 0.144,
+                input: 0.6799999999999999,
+                output: 3.41,
+                cacheRead: 0.33999999999999997,
                 cacheWrite: 0,
             },
             contextWindow: 262144,
-            maxTokens: 262144,
+            maxTokens: 262142,
         },
         "~openai/gpt-latest": {
             id: "~openai/gpt-latest",
@@ -13086,9 +13302,9 @@ export const MODELS = {
             api: "openai-completions",
             provider: "together",
             baseUrl: "https://api.together.ai/v1",
-            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false, "supportsLongCacheRetention": false },
+            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false, "supportsLongCacheRetention": false, "thinkingFormat": "together" },
             reasoning: true,
-            thinkingLevelMap: { "off": null, "minimal": null, "low": null, "medium": null },
+            thinkingLevelMap: { "minimal": null, "low": null, "medium": null },
             input: ["text"],
             cost: {
                 input: 0.3,
@@ -13233,7 +13449,7 @@ export const MODELS = {
         },
         "deepseek-ai/DeepSeek-V3": {
             id: "deepseek-ai/DeepSeek-V3",
-            name: "DeepSeek V3",
+            name: "DeepSeek-V3",
             api: "openai-completions",
             provider: "together",
             baseUrl: "https://api.together.ai/v1",
@@ -13381,6 +13597,25 @@ export const MODELS = {
             contextWindow: 262144,
             maxTokens: 131000,
         },
+        "nvidia/nemotron-3-ultra-550b-a55b": {
+            id: "nvidia/nemotron-3-ultra-550b-a55b",
+            name: "Nemotron 3 Ultra 550B A55B",
+            api: "openai-completions",
+            provider: "together",
+            baseUrl: "https://api.together.ai/v1",
+            compat: { "supportsStore": false, "supportsDeveloperRole": false, "supportsReasoningEffort": false, "maxTokensField": "max_tokens", "supportsStrictMode": false, "supportsLongCacheRetention": false, "thinkingFormat": "together" },
+            reasoning: true,
+            thinkingLevelMap: { "minimal": null, "low": null, "medium": null },
+            input: ["text"],
+            cost: {
+                input: 0.6,
+                output: 3.6,
+                cacheRead: 0.2,
+                cacheWrite: 0,
+            },
+            contextWindow: 512300,
+            maxTokens: 512300,
+        },
         "openai/gpt-oss-120b": {
             id: "openai/gpt-oss-120b",
             name: "GPT OSS 120B",
@@ -13464,8 +13699,8 @@ export const MODELS = {
             reasoning: true,
             input: ["text"],
             cost: {
-                input: 0.08,
-                output: 0.29,
+                input: 0.12,
+                output: 0.5,
                 cacheRead: 0,
                 cacheWrite: 0,
             },
@@ -13829,6 +14064,25 @@ export const MODELS = {
             contextWindow: 200000,
             maxTokens: 8192,
         },
+        "anthropic/claude-fable-5": {
+            id: "anthropic/claude-fable-5",
+            name: "Claude Fable 5",
+            api: "anthropic-messages",
+            provider: "vercel-ai-gateway",
+            baseUrl: "https://ai-gateway.vercel.sh",
+            compat: { "forceAdaptiveThinking": true },
+            reasoning: true,
+            thinkingLevelMap: { "xhigh": "xhigh" },
+            input: ["text", "image"],
+            cost: {
+                input: 10,
+                output: 50,
+                cacheRead: 1,
+                cacheWrite: 12.5,
+            },
+            contextWindow: 1000000,
+            maxTokens: 128000,
+        },
         "anthropic/claude-haiku-4.5": {
             id: "anthropic/claude-haiku-4.5",
             name: "Claude Haiku 4.5",
@@ -14210,40 +14464,6 @@ export const MODELS = {
             contextWindow: 1000000,
             maxTokens: 384000,
         },
-        "google/gemini-2.0-flash": {
-            id: "google/gemini-2.0-flash",
-            name: "Gemini 2.0 Flash",
-            api: "anthropic-messages",
-            provider: "vercel-ai-gateway",
-            baseUrl: "https://ai-gateway.vercel.sh",
-            reasoning: false,
-            input: ["text", "image"],
-            cost: {
-                input: 0.15,
-                output: 0.6,
-                cacheRead: 0.024999999999999998,
-                cacheWrite: 0,
-            },
-            contextWindow: 1048576,
-            maxTokens: 8192,
-        },
-        "google/gemini-2.0-flash-lite": {
-            id: "google/gemini-2.0-flash-lite",
-            name: "Gemini 2.0 Flash Lite",
-            api: "anthropic-messages",
-            provider: "vercel-ai-gateway",
-            baseUrl: "https://ai-gateway.vercel.sh",
-            reasoning: false,
-            input: ["text", "image"],
-            cost: {
-                input: 0.075,
-                output: 0.3,
-                cacheRead: 0.02,
-                cacheWrite: 0,
-            },
-            contextWindow: 1048576,
-            maxTokens: 8192,
-        },
         "google/gemini-2.5-flash": {
             id: "google/gemini-2.5-flash",
             name: "Gemini 2.5 Flash",
@@ -15086,12 +15306,12 @@ export const MODELS = {
             reasoning: true,
             input: ["text"],
             cost: {
-                input: 0.5,
-                output: 2.5,
-                cacheRead: 0.15,
+                input: 0.6,
+                output: 2.4,
+                cacheRead: 0.12,
                 cacheWrite: 0,
             },
-            contextWindow: 262144,
+            contextWindow: 1000000,
             maxTokens: 65000,
         },
         "nvidia/nemotron-nano-12b-v2-vl": {
@@ -16363,7 +16583,7 @@ export const MODELS = {
                 cacheRead: 0.2,
                 cacheWrite: 0,
             },
-            contextWindow: 2000000,
+            contextWindow: 1000000,
             maxTokens: 30000,
         },
         "grok-4.20-0309-reasoning": {
@@ -16380,7 +16600,7 @@ export const MODELS = {
                 cacheRead: 0.2,
                 cacheWrite: 0,
             },
-            contextWindow: 2000000,
+            contextWindow: 1000000,
             maxTokens: 30000,
         },
         "grok-4.3": {