npm - @dreb/ai - Versions diffs - 2.19.2 → 2.19.3 - Mend

@dreb/ai 2.19.2 → 2.19.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (5) hide show

package/dist/models.generated.d.ts +52 -358
package/dist/models.generated.d.ts.map +1 -1
package/dist/models.generated.js +105 -411
package/dist/models.generated.js.map +1 -1
package/package.json +1 -1

package/dist/models.generated.js CHANGED Viewed

@@ -900,8 +900,8 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 256000,
-            maxTokens: 256000,
+            contextWindow: 262143,
+            maxTokens: 16000,
         },
         "moonshotai.kimi-k2.5": {
             id: "moonshotai.kimi-k2.5",
@@ -917,8 +917,8 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 256000,
-            maxTokens: 256000,
+            contextWindow: 262143,
+            maxTokens: 16000,
         },
         "nvidia.nemotron-nano-12b-v2": {
             id: "nvidia.nemotron-nano-12b-v2",
@@ -3301,6 +3301,23 @@ export const MODELS = {
             contextWindow: 1048576,
             maxTokens: 65536,
         },
+        "gemini-3.5-flash": {
+            id: "gemini-3.5-flash",
+            name: "Gemini 3.5 Flash",
+            api: "google-generative-ai",
+            provider: "google",
+            baseUrl: "https://generativelanguage.googleapis.com/v1beta",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 1.5,
+                output: 9,
+                cacheRead: 0.15,
+                cacheWrite: 0,
+            },
+            contextWindow: 1048576,
+            maxTokens: 65536,
+        },
         "gemini-flash-latest": {
             id: "gemini-flash-latest",
             name: "Gemini Flash Latest",
@@ -6220,8 +6237,8 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 1000000,
-            maxTokens: 384000,
+            contextWindow: 200000,
+            maxTokens: 128000,
         },
         "gemini-3-flash": {
             id: "gemini-3-flash",
@@ -7397,7 +7414,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 120000,
+            contextWindow: 131072,
             maxTokens: 8000,
         },
         "baidu/ernie-4.5-vl-28b-a3b": {
@@ -7414,7 +7431,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 30000,
+            contextWindow: 131072,
             maxTokens: 8000,
         },
         "bytedance-seed/seed-1.6": {
@@ -7584,7 +7601,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 64000,
+            contextWindow: 163840,
             maxTokens: 16000,
         },
         "deepseek/deepseek-r1-0528": {
@@ -7669,7 +7686,7 @@ export const MODELS = {
                 cacheRead: 0.022,
                 cacheWrite: 0,
             },
-            contextWindow: 1048575,
+            contextWindow: 1048576,
             maxTokens: 4096,
         },
         "deepseek/deepseek-v4-flash:free": {
@@ -7941,6 +7958,23 @@ export const MODELS = {
                 cacheRead: 0.19999999999999998,
                 cacheWrite: 0.375,
             },
+            contextWindow: 1048756,
+            maxTokens: 65536,
+        },
+        "google/gemini-3.5-flash": {
+            id: "google/gemini-3.5-flash",
+            name: "Google: Gemini 3.5 Flash",
+            api: "openai-completions",
+            provider: "openrouter",
+            baseUrl: "https://openrouter.ai/api/v1",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 1.5,
+                output: 9,
+                cacheRead: 0.15,
+                cacheWrite: 0.08333333333333334,
+            },
             contextWindow: 1048576,
             maxTokens: 65536,
         },
@@ -8179,7 +8213,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 16384,
+            contextWindow: 131072,
             maxTokens: 16384,
         },
         "meta-llama/llama-3.3-70b-instruct": {
@@ -8213,7 +8247,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 65536,
+            contextWindow: 131072,
             maxTokens: 4096,
         },
         "meta-llama/llama-4-scout": {
@@ -8230,7 +8264,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 327680,
+            contextWindow: 10000000,
             maxTokens: 16384,
         },
         "minimax/minimax-m1": {
@@ -8264,7 +8298,7 @@ export const MODELS = {
                 cacheRead: 0.03,
                 cacheWrite: 0,
             },
-            contextWindow: 196608,
+            contextWindow: 204800,
             maxTokens: 196608,
         },
         "minimax/minimax-m2.1": {
@@ -8281,7 +8315,7 @@ export const MODELS = {
                 cacheRead: 0.03,
                 cacheWrite: 0,
             },
-            contextWindow: 196608,
+            contextWindow: 204800,
             maxTokens: 196608,
         },
         "minimax/minimax-m2.5": {
@@ -8298,7 +8332,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 196608,
+            contextWindow: 204800,
             maxTokens: 196608,
         },
         "minimax/minimax-m2.5:free": {
@@ -8315,7 +8349,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 196608,
+            contextWindow: 204800,
             maxTokens: 8192,
         },
         "minimax/minimax-m2.7": {
@@ -8332,7 +8366,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 196608,
+            contextWindow: 204800,
             maxTokens: 131072,
         },
         "mistralai/codestral-2508": {
@@ -8774,7 +8808,7 @@ export const MODELS = {
                 cacheRead: 0.25,
                 cacheWrite: 0,
             },
-            contextWindow: 262142,
+            contextWindow: 262144,
             maxTokens: 262142,
         },
         "nex-agi/deepseek-v3.1-nex-n1": {
@@ -8876,7 +8910,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 262144,
+            contextWindow: 1000000,
             maxTokens: 4096,
         },
         "nvidia/nemotron-3-super-120b-a12b:free": {
@@ -8893,7 +8927,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 262144,
+            contextWindow: 1000000,
             maxTokens: 262144,
         },
         "nvidia/nemotron-nano-12b-v2-vl:free": {
@@ -10032,7 +10066,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 32768,
+            contextWindow: 131072,
             maxTokens: 16384,
         },
         "qwen/qwen-2.5-7b-instruct": {
@@ -10049,7 +10083,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 32768,
+            contextWindow: 131072,
             maxTokens: 32768,
         },
         "qwen/qwen-plus": {
@@ -10117,7 +10151,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 40960,
+            contextWindow: 131702,
             maxTokens: 40960,
         },
         "qwen/qwen3-235b-a22b": {
@@ -10168,7 +10202,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 131072,
+            contextWindow: 262144,
             maxTokens: 4096,
         },
         "qwen/qwen3-30b-a3b": {
@@ -10185,7 +10219,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 40960,
+            contextWindow: 131072,
             maxTokens: 20000,
         },
         "qwen/qwen3-30b-a3b-instruct-2507": {
@@ -10236,7 +10270,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 40960,
+            contextWindow: 131072,
             maxTokens: 16384,
         },
         "qwen/qwen3-8b": {
@@ -10253,7 +10287,7 @@ export const MODELS = {
                 cacheRead: 0.049999999999999996,
                 cacheWrite: 0,
             },
-            contextWindow: 40960,
+            contextWindow: 131072,
             maxTokens: 8192,
         },
         "qwen/qwen3-coder": {
@@ -10270,7 +10304,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 262144,
+            contextWindow: 1048576,
             maxTokens: 65536,
         },
         "qwen/qwen3-coder-30b-a3b-instruct": {
@@ -10355,7 +10389,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 262000,
+            contextWindow: 1048576,
             maxTokens: 262000,
         },
         "qwen/qwen3-max": {
@@ -10440,7 +10474,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 131072,
+            contextWindow: 262144,
             maxTokens: 32768,
         },
         "qwen/qwen3-vl-235b-a22b-instruct": {
@@ -10491,7 +10525,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 131072,
+            contextWindow: 262144,
             maxTokens: 32768,
         },
         "qwen/qwen3-vl-30b-a3b-thinking": {
@@ -10525,7 +10559,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 131072,
+            contextWindow: 262144,
             maxTokens: 32768,
         },
         "qwen/qwen3-vl-8b-instruct": {
@@ -10542,7 +10576,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 131072,
+            contextWindow: 256000,
             maxTokens: 32768,
         },
         "qwen/qwen3-vl-8b-thinking": {
@@ -10559,7 +10593,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 131072,
+            contextWindow: 256000,
             maxTokens: 32768,
         },
         "qwen/qwen3.5-122b-a10b": {
@@ -10605,13 +10639,13 @@ export const MODELS = {
             reasoning: true,
             input: ["text", "image"],
             cost: {
-                input: 0.14,
+                input: 0.13899999999999998,
                 output: 1,
-                cacheRead: 0.049999999999999996,
+                cacheRead: 0,
                 cacheWrite: 0,
             },
             contextWindow: 262144,
-            maxTokens: 81920,
+            maxTokens: 4096,
         },
         "qwen/qwen3.5-397b-a17b": {
             id: "qwen/qwen3.5-397b-a17b",
@@ -11251,13 +11285,13 @@ export const MODELS = {
             reasoning: true,
             input: ["text"],
             cost: {
-                input: 0.98,
-                output: 3.08,
-                cacheRead: 0.182,
+                input: 0,
+                output: 0,
+                cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 202752,
-            maxTokens: 4096,
+            contextWindow: 202800,
+            maxTokens: 202800,
         },
         "z-ai/glm-5v-turbo": {
             id: "z-ai/glm-5v-turbo",
@@ -11336,9 +11370,9 @@ export const MODELS = {
             reasoning: true,
             input: ["text", "image"],
             cost: {
-                input: 0.5,
-                output: 3,
-                cacheRead: 0.049999999999999996,
+                input: 1.5,
+                output: 9,
+                cacheRead: 0.15,
                 cacheWrite: 0.08333333333333334,
             },
             contextWindow: 1048576,
@@ -11375,7 +11409,7 @@ export const MODELS = {
                 cacheRead: 0.25,
                 cacheWrite: 0,
             },
-            contextWindow: 262142,
+            contextWindow: 262144,
             maxTokens: 262142,
         },
         "~openai/gpt-latest": {
@@ -12281,6 +12315,23 @@ export const MODELS = {
             contextWindow: 1000000,
             maxTokens: 64000,
         },
+        "google/gemini-3.5-flash": {
+            id: "google/gemini-3.5-flash",
+            name: "Gemini 3.5 Flash",
+            api: "anthropic-messages",
+            provider: "vercel-ai-gateway",
+            baseUrl: "https://ai-gateway.vercel.sh",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 1.5,
+                output: 9,
+                cacheRead: 0.15,
+                cacheWrite: 0,
+            },
+            contextWindow: 1000000,
+            maxTokens: 64000,
+        },
         "google/gemma-4-26b-a4b-it": {
             id: "google/gemma-4-26b-a4b-it",
             name: "Gemma 4 26B A4B IT",
@@ -13590,125 +13641,6 @@ export const MODELS = {
             contextWindow: 200000,
             maxTokens: 8000,
         },
-        "xai/grok-3": {
-            id: "xai/grok-3",
-            name: "Grok 3 Beta",
-            api: "anthropic-messages",
-            provider: "vercel-ai-gateway",
-            baseUrl: "https://ai-gateway.vercel.sh",
-            reasoning: false,
-            input: ["text"],
-            cost: {
-                input: 3,
-                output: 15,
-                cacheRead: 0.75,
-                cacheWrite: 0,
-            },
-            contextWindow: 131072,
-            maxTokens: 131072,
-        },
-        "xai/grok-3-fast": {
-            id: "xai/grok-3-fast",
-            name: "Grok 3 Fast Beta",
-            api: "anthropic-messages",
-            provider: "vercel-ai-gateway",
-            baseUrl: "https://ai-gateway.vercel.sh",
-            reasoning: false,
-            input: ["text"],
-            cost: {
-                input: 5,
-                output: 25,
-                cacheRead: 1.25,
-                cacheWrite: 0,
-            },
-            contextWindow: 131072,
-            maxTokens: 131072,
-        },
-        "xai/grok-3-mini": {
-            id: "xai/grok-3-mini",
-            name: "Grok 3 Mini Beta",
-            api: "anthropic-messages",
-            provider: "vercel-ai-gateway",
-            baseUrl: "https://ai-gateway.vercel.sh",
-            reasoning: false,
-            input: ["text"],
-            cost: {
-                input: 0.3,
-                output: 0.5,
-                cacheRead: 0.075,
-                cacheWrite: 0,
-            },
-            contextWindow: 131072,
-            maxTokens: 131072,
-        },
-        "xai/grok-3-mini-fast": {
-            id: "xai/grok-3-mini-fast",
-            name: "Grok 3 Mini Fast Beta",
-            api: "anthropic-messages",
-            provider: "vercel-ai-gateway",
-            baseUrl: "https://ai-gateway.vercel.sh",
-            reasoning: false,
-            input: ["text"],
-            cost: {
-                input: 0.6,
-                output: 4,
-                cacheRead: 0,
-                cacheWrite: 0,
-            },
-            contextWindow: 131072,
-            maxTokens: 131072,
-        },
-        "xai/grok-4": {
-            id: "xai/grok-4",
-            name: "Grok 4",
-            api: "anthropic-messages",
-            provider: "vercel-ai-gateway",
-            baseUrl: "https://ai-gateway.vercel.sh",
-            reasoning: true,
-            input: ["text", "image"],
-            cost: {
-                input: 3,
-                output: 15,
-                cacheRead: 0.75,
-                cacheWrite: 0,
-            },
-            contextWindow: 256000,
-            maxTokens: 256000,
-        },
-        "xai/grok-4-fast-non-reasoning": {
-            id: "xai/grok-4-fast-non-reasoning",
-            name: "Grok 4 Fast Non-Reasoning",
-            api: "anthropic-messages",
-            provider: "vercel-ai-gateway",
-            baseUrl: "https://ai-gateway.vercel.sh",
-            reasoning: false,
-            input: ["text", "image"],
-            cost: {
-                input: 0.19999999999999998,
-                output: 0.5,
-                cacheRead: 0.049999999999999996,
-                cacheWrite: 0,
-            },
-            contextWindow: 2000000,
-            maxTokens: 256000,
-        },
-        "xai/grok-4-fast-reasoning": {
-            id: "xai/grok-4-fast-reasoning",
-            name: "Grok 4 Fast Reasoning",
-            api: "anthropic-messages",
-            provider: "vercel-ai-gateway",
-            baseUrl: "https://ai-gateway.vercel.sh",
-            reasoning: true,
-            input: ["text", "image"],
-            cost: {
-                input: 0.19999999999999998,
-                output: 0.5,
-                cacheRead: 0.049999999999999996,
-                cacheWrite: 0,
-            },
-            contextWindow: 2000000,
-            maxTokens: 256000,
-        },
         "xai/grok-4.1-fast-non-reasoning": {
             id: "xai/grok-4.1-fast-non-reasoning",
             name: "Grok 4.1 Fast Non-Reasoning",
@@ -13723,8 +13655,8 @@ export const MODELS = {
                 cacheRead: 0.049999999999999996,
                 cacheWrite: 0,
             },
-            contextWindow: 2000000,
-            maxTokens: 30000,
+            contextWindow: 1000000,
+            maxTokens: 1000000,
         },
         "xai/grok-4.1-fast-reasoning": {
             id: "xai/grok-4.1-fast-reasoning",
@@ -13740,8 +13672,8 @@ export const MODELS = {
                 cacheRead: 0.049999999999999996,
                 cacheWrite: 0,
             },
-            contextWindow: 2000000,
-            maxTokens: 30000,
+            contextWindow: 1000000,
+            maxTokens: 1000000,
         },
         "xai/grok-4.20-multi-agent": {
             id: "xai/grok-4.20-multi-agent",
@@ -13862,23 +13794,6 @@ export const MODELS = {
             contextWindow: 1000000,
             maxTokens: 1000000,
         },
-        "xai/grok-code-fast-1": {
-            id: "xai/grok-code-fast-1",
-            name: "Grok Code Fast 1",
-            api: "anthropic-messages",
-            provider: "vercel-ai-gateway",
-            baseUrl: "https://ai-gateway.vercel.sh",
-            reasoning: true,
-            input: ["text"],
-            cost: {
-                input: 0.19999999999999998,
-                output: 1.5,
-                cacheRead: 0.02,
-                cacheWrite: 0,
-            },
-            contextWindow: 256000,
-            maxTokens: 256000,
-        },
         "xiaomi/mimo-v2-flash": {
             id: "xiaomi/mimo-v2-flash",
             name: "MiMo V2 Flash",
@@ -14272,227 +14187,6 @@ export const MODELS = {
             contextWindow: 8192,
             maxTokens: 4096,
         },
-        "grok-3": {
-            id: "grok-3",
-            name: "Grok 3",
-            api: "openai-completions",
-            provider: "xai",
-            baseUrl: "https://api.x.ai/v1",
-            reasoning: false,
-            input: ["text"],
-            cost: {
-                input: 3,
-                output: 15,
-                cacheRead: 0.75,
-                cacheWrite: 0,
-            },
-            contextWindow: 131072,
-            maxTokens: 8192,
-        },
-        "grok-3-fast": {
-            id: "grok-3-fast",
-            name: "Grok 3 Fast",
-            api: "openai-completions",
-            provider: "xai",
-            baseUrl: "https://api.x.ai/v1",
-            reasoning: false,
-            input: ["text"],
-            cost: {
-                input: 5,
-                output: 25,
-                cacheRead: 1.25,
-                cacheWrite: 0,
-            },
-            contextWindow: 131072,
-            maxTokens: 8192,
-        },
-        "grok-3-fast-latest": {
-            id: "grok-3-fast-latest",
-            name: "Grok 3 Fast Latest",
-            api: "openai-completions",
-            provider: "xai",
-            baseUrl: "https://api.x.ai/v1",
-            reasoning: false,
-            input: ["text"],
-            cost: {
-                input: 5,
-                output: 25,
-                cacheRead: 1.25,
-                cacheWrite: 0,
-            },
-            contextWindow: 131072,
-            maxTokens: 8192,
-        },
-        "grok-3-latest": {
-            id: "grok-3-latest",
-            name: "Grok 3 Latest",
-            api: "openai-completions",
-            provider: "xai",
-            baseUrl: "https://api.x.ai/v1",
-            reasoning: false,
-            input: ["text"],
-            cost: {
-                input: 3,
-                output: 15,
-                cacheRead: 0.75,
-                cacheWrite: 0,
-            },
-            contextWindow: 131072,
-            maxTokens: 8192,
-        },
-        "grok-3-mini": {
-            id: "grok-3-mini",
-            name: "Grok 3 Mini",
-            api: "openai-completions",
-            provider: "xai",
-            baseUrl: "https://api.x.ai/v1",
-            reasoning: true,
-            input: ["text"],
-            cost: {
-                input: 0.3,
-                output: 0.5,
-                cacheRead: 0.075,
-                cacheWrite: 0,
-            },
-            contextWindow: 131072,
-            maxTokens: 8192,
-        },
-        "grok-3-mini-fast": {
-            id: "grok-3-mini-fast",
-            name: "Grok 3 Mini Fast",
-            api: "openai-completions",
-            provider: "xai",
-            baseUrl: "https://api.x.ai/v1",
-            reasoning: true,
-            input: ["text"],
-            cost: {
-                input: 0.6,
-                output: 4,
-                cacheRead: 0.15,
-                cacheWrite: 0,
-            },
-            contextWindow: 131072,
-            maxTokens: 8192,
-        },
-        "grok-3-mini-fast-latest": {
-            id: "grok-3-mini-fast-latest",
-            name: "Grok 3 Mini Fast Latest",
-            api: "openai-completions",
-            provider: "xai",
-            baseUrl: "https://api.x.ai/v1",
-            reasoning: true,
-            input: ["text"],
-            cost: {
-                input: 0.6,
-                output: 4,
-                cacheRead: 0.15,
-                cacheWrite: 0,
-            },
-            contextWindow: 131072,
-            maxTokens: 8192,
-        },
-        "grok-3-mini-latest": {
-            id: "grok-3-mini-latest",
-            name: "Grok 3 Mini Latest",
-            api: "openai-completions",
-            provider: "xai",
-            baseUrl: "https://api.x.ai/v1",
-            reasoning: true,
-            input: ["text"],
-            cost: {
-                input: 0.3,
-                output: 0.5,
-                cacheRead: 0.075,
-                cacheWrite: 0,
-            },
-            contextWindow: 131072,
-            maxTokens: 8192,
-        },
-        "grok-4": {
-            id: "grok-4",
-            name: "Grok 4",
-            api: "openai-completions",
-            provider: "xai",
-            baseUrl: "https://api.x.ai/v1",
-            reasoning: true,
-            input: ["text"],
-            cost: {
-                input: 3,
-                output: 15,
-                cacheRead: 0.75,
-                cacheWrite: 0,
-            },
-            contextWindow: 256000,
-            maxTokens: 64000,
-        },
-        "grok-4-1-fast": {
-            id: "grok-4-1-fast",
-            name: "Grok 4.1 Fast",
-            api: "openai-completions",
-            provider: "xai",
-            baseUrl: "https://api.x.ai/v1",
-            reasoning: true,
-            input: ["text", "image"],
-            cost: {
-                input: 0.2,
-                output: 0.5,
-                cacheRead: 0.05,
-                cacheWrite: 0,
-            },
-            contextWindow: 2000000,
-            maxTokens: 30000,
-        },
-        "grok-4-1-fast-non-reasoning": {
-            id: "grok-4-1-fast-non-reasoning",
-            name: "Grok 4.1 Fast (Non-Reasoning)",
-            api: "openai-completions",
-            provider: "xai",
-            baseUrl: "https://api.x.ai/v1",
-            reasoning: false,
-            input: ["text", "image"],
-            cost: {
-                input: 0.2,
-                output: 0.5,
-                cacheRead: 0.05,
-                cacheWrite: 0,
-            },
-            contextWindow: 2000000,
-            maxTokens: 30000,
-        },
-        "grok-4-fast": {
-            id: "grok-4-fast",
-            name: "Grok 4 Fast",
-            api: "openai-completions",
-            provider: "xai",
-            baseUrl: "https://api.x.ai/v1",
-            reasoning: true,
-            input: ["text", "image"],
-            cost: {
-                input: 0.2,
-                output: 0.5,
-                cacheRead: 0.05,
-                cacheWrite: 0,
-            },
-            contextWindow: 2000000,
-            maxTokens: 30000,
-        },
-        "grok-4-fast-non-reasoning": {
-            id: "grok-4-fast-non-reasoning",
-            name: "Grok 4 Fast (Non-Reasoning)",
-            api: "openai-completions",
-            provider: "xai",
-            baseUrl: "https://api.x.ai/v1",
-            reasoning: false,
-            input: ["text", "image"],
-            cost: {
-                input: 0.2,
-                output: 0.5,
-                cacheRead: 0.05,
-                cacheWrite: 0,
-            },
-            contextWindow: 2000000,
-            maxTokens: 30000,
-        },
         "grok-4.20-0309-non-reasoning": {
             id: "grok-4.20-0309-non-reasoning",
             name: "Grok 4.20 (Non-Reasoning)",
@@ -14567,7 +14261,7 @@ export const MODELS = {
             api: "openai-completions",
             provider: "xai",
             baseUrl: "https://api.x.ai/v1",
-            reasoning: true,
+            reasoning: false,
             input: ["text"],
             cost: {
                 input: 0.2,
@@ -14575,8 +14269,8 @@ export const MODELS = {
                 cacheRead: 0.02,
                 cacheWrite: 0,
             },
-            contextWindow: 256000,
-            maxTokens: 10000,
+            contextWindow: 32768,
+            maxTokens: 8192,
         },
         "grok-vision-beta": {
             id: "grok-vision-beta",