npm - @mariozechner/pi-ai - Versions diffs - 0.49.3 → 0.50.0 - Mend

@mariozechner/pi-ai 0.49.3 → 0.50.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (108) hide show

package/README.md +32 -22
package/dist/api-registry.d.ts +20 -0
package/dist/api-registry.d.ts.map +1 -0
package/dist/api-registry.js +44 -0
package/dist/api-registry.js.map +1 -0
package/dist/cli.d.ts.map +1 -1
package/dist/cli.js +22 -67
package/dist/cli.js.map +1 -1
package/dist/env-api-keys.d.ts +9 -0
package/dist/env-api-keys.d.ts.map +1 -0
package/dist/env-api-keys.js +91 -0
package/dist/env-api-keys.js.map +1 -0
package/dist/index.d.ts +4 -0
package/dist/index.d.ts.map +1 -1
package/dist/index.js +4 -0
package/dist/index.js.map +1 -1
package/dist/models.generated.d.ts +599 -70
package/dist/models.generated.d.ts.map +1 -1
package/dist/models.generated.js +619 -90
package/dist/models.generated.js.map +1 -1
package/dist/providers/amazon-bedrock.d.ts +3 -2
package/dist/providers/amazon-bedrock.d.ts.map +1 -1
package/dist/providers/amazon-bedrock.js +52 -5
package/dist/providers/amazon-bedrock.js.map +1 -1
package/dist/providers/anthropic.d.ts +3 -2
package/dist/providers/anthropic.d.ts.map +1 -1
package/dist/providers/anthropic.js +20 -2
package/dist/providers/anthropic.js.map +1 -1
package/dist/providers/azure-openai-responses.d.ts +15 -0
package/dist/providers/azure-openai-responses.d.ts.map +1 -0
package/dist/providers/azure-openai-responses.js +184 -0
package/dist/providers/azure-openai-responses.js.map +1 -0
package/dist/providers/google-gemini-cli.d.ts +3 -2
package/dist/providers/google-gemini-cli.d.ts.map +1 -1
package/dist/providers/google-gemini-cli.js +68 -1
package/dist/providers/google-gemini-cli.js.map +1 -1
package/dist/providers/google-vertex.d.ts +3 -2
package/dist/providers/google-vertex.d.ts.map +1 -1
package/dist/providers/google-vertex.js +81 -1
package/dist/providers/google-vertex.js.map +1 -1
package/dist/providers/google.d.ts +3 -2
package/dist/providers/google.d.ts.map +1 -1
package/dist/providers/google.js +84 -3
package/dist/providers/google.js.map +1 -1
package/dist/providers/openai-codex-responses.d.ts +3 -2
package/dist/providers/openai-codex-responses.d.ts.map +1 -1
package/dist/providers/openai-codex-responses.js +57 -307
package/dist/providers/openai-codex-responses.js.map +1 -1
package/dist/providers/openai-completions.d.ts +5 -2
package/dist/providers/openai-completions.d.ts.map +1 -1
package/dist/providers/openai-completions.js +78 -41
package/dist/providers/openai-completions.js.map +1 -1
package/dist/providers/openai-responses-shared.d.ts +17 -0
package/dist/providers/openai-responses-shared.d.ts.map +1 -0
package/dist/providers/openai-responses-shared.js +424 -0
package/dist/providers/openai-responses-shared.js.map +1 -0
package/dist/providers/openai-responses.d.ts +3 -2
package/dist/providers/openai-responses.d.ts.map +1 -1
package/dist/providers/openai-responses.js +25 -415
package/dist/providers/openai-responses.js.map +1 -1
package/dist/providers/register-builtins.d.ts +3 -0
package/dist/providers/register-builtins.d.ts.map +1 -0
package/dist/providers/register-builtins.js +63 -0
package/dist/providers/register-builtins.js.map +1 -0
package/dist/providers/simple-options.d.ts +8 -0
package/dist/providers/simple-options.d.ts.map +1 -0
package/dist/providers/simple-options.js +32 -0
package/dist/providers/simple-options.js.map +1 -0
package/dist/stream.d.ts +5 -10
package/dist/stream.d.ts.map +1 -1
package/dist/stream.js +17 -420
package/dist/stream.js.map +1 -1
package/dist/types.d.ts +18 -22
package/dist/types.d.ts.map +1 -1
package/dist/types.js +0 -1
package/dist/types.js.map +1 -1
package/dist/utils/event-stream.d.ts +2 -0
package/dist/utils/event-stream.d.ts.map +1 -1
package/dist/utils/event-stream.js +4 -0
package/dist/utils/event-stream.js.map +1 -1
package/dist/utils/oauth/anthropic.d.ts +2 -1
package/dist/utils/oauth/anthropic.d.ts.map +1 -1
package/dist/utils/oauth/anthropic.js +13 -0
package/dist/utils/oauth/anthropic.js.map +1 -1
package/dist/utils/oauth/github-copilot.d.ts +2 -1
package/dist/utils/oauth/github-copilot.d.ts.map +1 -1
package/dist/utils/oauth/github-copilot.js +25 -0
package/dist/utils/oauth/github-copilot.js.map +1 -1
package/dist/utils/oauth/google-antigravity.d.ts +2 -1
package/dist/utils/oauth/google-antigravity.d.ts.map +1 -1
package/dist/utils/oauth/google-antigravity.js +19 -0
package/dist/utils/oauth/google-antigravity.js.map +1 -1
package/dist/utils/oauth/google-gemini-cli.d.ts +2 -1
package/dist/utils/oauth/google-gemini-cli.d.ts.map +1 -1
package/dist/utils/oauth/google-gemini-cli.js +19 -0
package/dist/utils/oauth/google-gemini-cli.js.map +1 -1
package/dist/utils/oauth/index.d.ts +26 -16
package/dist/utils/oauth/index.d.ts.map +1 -1
package/dist/utils/oauth/index.js +65 -84
package/dist/utils/oauth/index.js.map +1 -1
package/dist/utils/oauth/openai-codex.d.ts +2 -1
package/dist/utils/oauth/openai-codex.d.ts.map +1 -1
package/dist/utils/oauth/openai-codex.js +20 -1
package/dist/utils/oauth/openai-codex.js.map +1 -1
package/dist/utils/oauth/types.d.ts +28 -6
package/dist/utils/oauth/types.d.ts.map +1 -1
package/dist/utils/oauth/types.js.map +1 -1
package/package.json +3 -1

package/dist/models.generated.js CHANGED Viewed

@@ -1297,6 +1297,586 @@ export const MODELS = {
             maxTokens: 64000,
         },
     },
+    "azure-openai-responses": {
+        "codex-mini-latest": {
+            id: "codex-mini-latest",
+            name: "Codex Mini",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 1.5,
+                output: 6,
+                cacheRead: 0.375,
+                cacheWrite: 0,
+            },
+            contextWindow: 200000,
+            maxTokens: 100000,
+        },
+        "gpt-4": {
+            id: "gpt-4",
+            name: "GPT-4",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: false,
+            input: ["text"],
+            cost: {
+                input: 30,
+                output: 60,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 8192,
+            maxTokens: 8192,
+        },
+        "gpt-4-turbo": {
+            id: "gpt-4-turbo",
+            name: "GPT-4 Turbo",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: false,
+            input: ["text", "image"],
+            cost: {
+                input: 10,
+                output: 30,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 4096,
+        },
+        "gpt-4.1": {
+            id: "gpt-4.1",
+            name: "GPT-4.1",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: false,
+            input: ["text", "image"],
+            cost: {
+                input: 2,
+                output: 8,
+                cacheRead: 0.5,
+                cacheWrite: 0,
+            },
+            contextWindow: 1047576,
+            maxTokens: 32768,
+        },
+        "gpt-4.1-mini": {
+            id: "gpt-4.1-mini",
+            name: "GPT-4.1 mini",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: false,
+            input: ["text", "image"],
+            cost: {
+                input: 0.4,
+                output: 1.6,
+                cacheRead: 0.1,
+                cacheWrite: 0,
+            },
+            contextWindow: 1047576,
+            maxTokens: 32768,
+        },
+        "gpt-4.1-nano": {
+            id: "gpt-4.1-nano",
+            name: "GPT-4.1 nano",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: false,
+            input: ["text", "image"],
+            cost: {
+                input: 0.1,
+                output: 0.4,
+                cacheRead: 0.03,
+                cacheWrite: 0,
+            },
+            contextWindow: 1047576,
+            maxTokens: 32768,
+        },
+        "gpt-4o": {
+            id: "gpt-4o",
+            name: "GPT-4o",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: false,
+            input: ["text", "image"],
+            cost: {
+                input: 2.5,
+                output: 10,
+                cacheRead: 1.25,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 16384,
+        },
+        "gpt-4o-2024-05-13": {
+            id: "gpt-4o-2024-05-13",
+            name: "GPT-4o (2024-05-13)",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: false,
+            input: ["text", "image"],
+            cost: {
+                input: 5,
+                output: 15,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 4096,
+        },
+        "gpt-4o-2024-08-06": {
+            id: "gpt-4o-2024-08-06",
+            name: "GPT-4o (2024-08-06)",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: false,
+            input: ["text", "image"],
+            cost: {
+                input: 2.5,
+                output: 10,
+                cacheRead: 1.25,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 16384,
+        },
+        "gpt-4o-2024-11-20": {
+            id: "gpt-4o-2024-11-20",
+            name: "GPT-4o (2024-11-20)",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: false,
+            input: ["text", "image"],
+            cost: {
+                input: 2.5,
+                output: 10,
+                cacheRead: 1.25,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 16384,
+        },
+        "gpt-4o-mini": {
+            id: "gpt-4o-mini",
+            name: "GPT-4o mini",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: false,
+            input: ["text", "image"],
+            cost: {
+                input: 0.15,
+                output: 0.6,
+                cacheRead: 0.08,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 16384,
+        },
+        "gpt-5": {
+            id: "gpt-5",
+            name: "GPT-5",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 1.25,
+                output: 10,
+                cacheRead: 0.125,
+                cacheWrite: 0,
+            },
+            contextWindow: 400000,
+            maxTokens: 128000,
+        },
+        "gpt-5-chat-latest": {
+            id: "gpt-5-chat-latest",
+            name: "GPT-5 Chat Latest",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: false,
+            input: ["text", "image"],
+            cost: {
+                input: 1.25,
+                output: 10,
+                cacheRead: 0.125,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 16384,
+        },
+        "gpt-5-codex": {
+            id: "gpt-5-codex",
+            name: "GPT-5-Codex",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 1.25,
+                output: 10,
+                cacheRead: 0.125,
+                cacheWrite: 0,
+            },
+            contextWindow: 400000,
+            maxTokens: 128000,
+        },
+        "gpt-5-mini": {
+            id: "gpt-5-mini",
+            name: "GPT-5 Mini",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 0.25,
+                output: 2,
+                cacheRead: 0.025,
+                cacheWrite: 0,
+            },
+            contextWindow: 400000,
+            maxTokens: 128000,
+        },
+        "gpt-5-nano": {
+            id: "gpt-5-nano",
+            name: "GPT-5 Nano",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 0.05,
+                output: 0.4,
+                cacheRead: 0.005,
+                cacheWrite: 0,
+            },
+            contextWindow: 400000,
+            maxTokens: 128000,
+        },
+        "gpt-5-pro": {
+            id: "gpt-5-pro",
+            name: "GPT-5 Pro",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 15,
+                output: 120,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 400000,
+            maxTokens: 272000,
+        },
+        "gpt-5.1": {
+            id: "gpt-5.1",
+            name: "GPT-5.1",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 1.25,
+                output: 10,
+                cacheRead: 0.13,
+                cacheWrite: 0,
+            },
+            contextWindow: 400000,
+            maxTokens: 128000,
+        },
+        "gpt-5.1-chat-latest": {
+            id: "gpt-5.1-chat-latest",
+            name: "GPT-5.1 Chat",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 1.25,
+                output: 10,
+                cacheRead: 0.125,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 16384,
+        },
+        "gpt-5.1-codex": {
+            id: "gpt-5.1-codex",
+            name: "GPT-5.1 Codex",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 1.25,
+                output: 10,
+                cacheRead: 0.125,
+                cacheWrite: 0,
+            },
+            contextWindow: 400000,
+            maxTokens: 128000,
+        },
+        "gpt-5.1-codex-max": {
+            id: "gpt-5.1-codex-max",
+            name: "GPT-5.1 Codex Max",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 1.25,
+                output: 10,
+                cacheRead: 0.125,
+                cacheWrite: 0,
+            },
+            contextWindow: 400000,
+            maxTokens: 128000,
+        },
+        "gpt-5.1-codex-mini": {
+            id: "gpt-5.1-codex-mini",
+            name: "GPT-5.1 Codex mini",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 0.25,
+                output: 2,
+                cacheRead: 0.025,
+                cacheWrite: 0,
+            },
+            contextWindow: 400000,
+            maxTokens: 128000,
+        },
+        "gpt-5.2": {
+            id: "gpt-5.2",
+            name: "GPT-5.2",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 1.75,
+                output: 14,
+                cacheRead: 0.175,
+                cacheWrite: 0,
+            },
+            contextWindow: 400000,
+            maxTokens: 128000,
+        },
+        "gpt-5.2-chat-latest": {
+            id: "gpt-5.2-chat-latest",
+            name: "GPT-5.2 Chat",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 1.75,
+                output: 14,
+                cacheRead: 0.175,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 16384,
+        },
+        "gpt-5.2-codex": {
+            id: "gpt-5.2-codex",
+            name: "GPT-5.2 Codex",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 1.75,
+                output: 14,
+                cacheRead: 0.175,
+                cacheWrite: 0,
+            },
+            contextWindow: 400000,
+            maxTokens: 128000,
+        },
+        "gpt-5.2-pro": {
+            id: "gpt-5.2-pro",
+            name: "GPT-5.2 Pro",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 21,
+                output: 168,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 400000,
+            maxTokens: 128000,
+        },
+        "o1": {
+            id: "o1",
+            name: "o1",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 15,
+                output: 60,
+                cacheRead: 7.5,
+                cacheWrite: 0,
+            },
+            contextWindow: 200000,
+            maxTokens: 100000,
+        },
+        "o1-pro": {
+            id: "o1-pro",
+            name: "o1-pro",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 150,
+                output: 600,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 200000,
+            maxTokens: 100000,
+        },
+        "o3": {
+            id: "o3",
+            name: "o3",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 2,
+                output: 8,
+                cacheRead: 0.5,
+                cacheWrite: 0,
+            },
+            contextWindow: 200000,
+            maxTokens: 100000,
+        },
+        "o3-deep-research": {
+            id: "o3-deep-research",
+            name: "o3-deep-research",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 10,
+                output: 40,
+                cacheRead: 2.5,
+                cacheWrite: 0,
+            },
+            contextWindow: 200000,
+            maxTokens: 100000,
+        },
+        "o3-mini": {
+            id: "o3-mini",
+            name: "o3-mini",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 1.1,
+                output: 4.4,
+                cacheRead: 0.55,
+                cacheWrite: 0,
+            },
+            contextWindow: 200000,
+            maxTokens: 100000,
+        },
+        "o3-pro": {
+            id: "o3-pro",
+            name: "o3-pro",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 20,
+                output: 80,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 200000,
+            maxTokens: 100000,
+        },
+        "o4-mini": {
+            id: "o4-mini",
+            name: "o4-mini",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 1.1,
+                output: 4.4,
+                cacheRead: 0.28,
+                cacheWrite: 0,
+            },
+            contextWindow: 200000,
+            maxTokens: 100000,
+        },
+        "o4-mini-deep-research": {
+            id: "o4-mini-deep-research",
+            name: "o4-mini-deep-research",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 2,
+                output: 8,
+                cacheRead: 0.5,
+                cacheWrite: 0,
+            },
+            contextWindow: 200000,
+            maxTokens: 100000,
+        },
+    },
     "cerebras": {
         "gpt-oss-120b": {
             id: "gpt-oss-120b",
@@ -1500,7 +2080,7 @@ export const MODELS = {
                 cacheRead: 0,
                 cacheWrite: 0,
             },
-            contextWindow: 128000,
+            contextWindow: 64000,
             maxTokens: 16384,
         },
         "gpt-4o": {
@@ -3866,40 +4446,6 @@ export const MODELS = {
         },
     },
     "opencode": {
-        "alpha-gd4": {
-            id: "alpha-gd4",
-            name: "Alpha GD4",
-            api: "anthropic-messages",
-            provider: "opencode",
-            baseUrl: "https://opencode.ai/zen",
-            reasoning: true,
-            input: ["text"],
-            cost: {
-                input: 0.5,
-                output: 2,
-                cacheRead: 0.15,
-                cacheWrite: 0,
-            },
-            contextWindow: 262144,
-            maxTokens: 32768,
-        },
-        "alpha-glm-4.7": {
-            id: "alpha-glm-4.7",
-            name: "Alpha GLM-4.7",
-            api: "openai-completions",
-            provider: "opencode",
-            baseUrl: "https://opencode.ai/zen/v1",
-            reasoning: true,
-            input: ["text"],
-            cost: {
-                input: 0.6,
-                output: 2.2,
-                cacheRead: 0.6,
-                cacheWrite: 0,
-            },
-            contextWindow: 204800,
-            maxTokens: 131072,
-        },
         "big-pickle": {
             id: "big-pickle",
             name: "Big Pickle",
@@ -4070,6 +4616,23 @@ export const MODELS = {
             contextWindow: 204800,
             maxTokens: 131072,
         },
+        "glm-4.7": {
+            id: "glm-4.7",
+            name: "GLM-4.7",
+            api: "openai-completions",
+            provider: "opencode",
+            baseUrl: "https://opencode.ai/zen/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0.6,
+                output: 2.2,
+                cacheRead: 0.1,
+                cacheWrite: 0,
+            },
+            contextWindow: 204800,
+            maxTokens: 131072,
+        },
         "glm-4.7-free": {
             id: "glm-4.7-free",
             name: "GLM-4.7",
@@ -4508,8 +5071,8 @@ export const MODELS = {
             cost: {
                 input: 0.7999999999999999,
                 output: 4,
-                cacheRead: 0.08,
-                cacheWrite: 1,
+                cacheRead: 0,
+                cacheWrite: 0,
             },
             contextWindow: 200000,
             maxTokens: 8192,
@@ -5053,7 +5616,7 @@ export const MODELS = {
                 input: 0.09999999999999999,
                 output: 0.39999999999999997,
                 cacheRead: 0.024999999999999998,
-                cacheWrite: 0.0833,
+                cacheWrite: 0.08333333333333334,
             },
             contextWindow: 1048576,
             maxTokens: 8192,
@@ -5121,7 +5684,7 @@ export const MODELS = {
                 input: 0.09999999999999999,
                 output: 0.39999999999999997,
                 cacheRead: 0.01,
-                cacheWrite: 0.0833,
+                cacheWrite: 0.08333333333333334,
             },
             contextWindow: 1048576,
             maxTokens: 65535,
@@ -5138,7 +5701,7 @@ export const MODELS = {
                 input: 0.09999999999999999,
                 output: 0.39999999999999997,
                 cacheRead: 0.01,
-                cacheWrite: 0.0833,
+                cacheWrite: 0.08333333333333334,
             },
             contextWindow: 1048576,
             maxTokens: 65535,
@@ -5155,7 +5718,7 @@ export const MODELS = {
                 input: 0.3,
                 output: 2.5,
                 cacheRead: 0.03,
-                cacheWrite: 0.0833,
+                cacheWrite: 0.08333333333333334,
             },
             contextWindow: 1048576,
             maxTokens: 65535,
@@ -5188,7 +5751,7 @@ export const MODELS = {
             cost: {
                 input: 1.25,
                 output: 10,
-                cacheRead: 0.31,
+                cacheRead: 0.125,
                 cacheWrite: 0.375,
             },
             contextWindow: 1048576,
@@ -5205,7 +5768,7 @@ export const MODELS = {
             cost: {
                 input: 1.25,
                 output: 10,
-                cacheRead: 0.31,
+                cacheRead: 0.125,
                 cacheWrite: 0.375,
             },
             contextWindow: 1048576,
@@ -5223,7 +5786,7 @@ export const MODELS = {
                 input: 0.5,
                 output: 3,
                 cacheRead: 0.049999999999999996,
-                cacheWrite: 0,
+                cacheWrite: 0.08333333333333334,
             },
             contextWindow: 1048576,
             maxTokens: 65535,
@@ -5510,12 +6073,12 @@ export const MODELS = {
             input: ["text"],
             cost: {
                 input: 0.27,
-                output: 1.12,
+                output: 1.1,
                 cacheRead: 0,
                 cacheWrite: 0,
             },
             contextWindow: 196608,
-            maxTokens: 65536,
+            maxTokens: 196608,
         },
         "mistralai/codestral-2508": {
             id: "mistralai/codestral-2508",
@@ -7268,23 +7831,6 @@ export const MODELS = {
             contextWindow: 131072,
             maxTokens: 8192,
         },
-        "qwen/qwen2.5-vl-72b-instruct": {
-            id: "qwen/qwen2.5-vl-72b-instruct",
-            name: "Qwen: Qwen2.5 VL 72B Instruct",
-            api: "openai-completions",
-            provider: "openrouter",
-            baseUrl: "https://openrouter.ai/api/v1",
-            reasoning: false,
-            input: ["text", "image"],
-            cost: {
-                input: 0.15,
-                output: 0.6,
-                cacheRead: 0,
-                cacheWrite: 0,
-            },
-            contextWindow: 32768,
-            maxTokens: 32768,
-        },
         "qwen/qwen3-14b": {
             id: "qwen/qwen3-14b",
             name: "Qwen: Qwen3 14B",
@@ -7534,7 +8080,7 @@ export const MODELS = {
             cost: {
                 input: 0.22,
                 output: 1.7999999999999998,
-                cacheRead: 0,
+                cacheRead: 0.022,
                 cacheWrite: 0,
             },
             contextWindow: 262144,
@@ -7670,7 +8216,7 @@ export const MODELS = {
             cost: {
                 input: 0.15,
                 output: 0.6,
-                cacheRead: 0,
+                cacheRead: 0.075,
                 cacheWrite: 0,
             },
             contextWindow: 262144,
@@ -8050,23 +8596,6 @@ export const MODELS = {
             contextWindow: 262144,
             maxTokens: 4096,
         },
-        "xiaomi/mimo-v2-flash:free": {
-            id: "xiaomi/mimo-v2-flash:free",
-            name: "Xiaomi: MiMo-V2-Flash (free)",
-            api: "openai-completions",
-            provider: "openrouter",
-            baseUrl: "https://openrouter.ai/api/v1",
-            reasoning: true,
-            input: ["text"],
-            cost: {
-                input: 0,
-                output: 0,
-                cacheRead: 0,
-                cacheWrite: 0,
-            },
-            contextWindow: 262144,
-            maxTokens: 65536,
-        },
         "z-ai/glm-4-32b": {
             id: "z-ai/glm-4-32b",
             name: "Z.AI: GLM 4 32B ",
@@ -8180,7 +8709,7 @@ export const MODELS = {
             cost: {
                 input: 0.44,
                 output: 1.76,
-                cacheRead: 0,
+                cacheRead: 0.11,
                 cacheWrite: 0,
             },
             contextWindow: 204800,
@@ -8369,7 +8898,7 @@ export const MODELS = {
             cost: {
                 input: 1,
                 output: 5,
-                cacheRead: 0,
+                cacheRead: 0.19999999999999998,
                 cacheWrite: 0,
             },
             contextWindow: 1000000,
@@ -8722,15 +9251,15 @@ export const MODELS = {
             provider: "vercel-ai-gateway",
             baseUrl: "https://ai-gateway.vercel.sh",
             reasoning: true,
-            input: ["text", "image"],
+            input: ["text"],
             cost: {
                 input: 0.3,
                 output: 2.5,
-                cacheRead: 0.03,
+                cacheRead: 0,
                 cacheWrite: 0,
             },
             contextWindow: 1000000,
-            maxTokens: 64000,
+            maxTokens: 65536,
         },
         "google/gemini-2.5-flash-lite": {
             id: "google/gemini-2.5-flash-lite",
@@ -8790,11 +9319,11 @@ export const MODELS = {
             provider: "vercel-ai-gateway",
             baseUrl: "https://ai-gateway.vercel.sh",
             reasoning: true,
-            input: ["text", "image"],
+            input: ["text"],
             cost: {
                 input: 1.25,
                 output: 10,
-                cacheRead: 0.125,
+                cacheRead: 0,
                 cacheWrite: 0,
             },
             contextWindow: 1048576,
@@ -10205,7 +10734,7 @@ export const MODELS = {
             cost: {
                 input: 0.19999999999999998,
                 output: 1.1,
-                cacheRead: 0,
+                cacheRead: 0.03,
                 cacheWrite: 0,
             },
             contextWindow: 128000,