npm - @hyperspaceng/neural-ai - Versions diffs - 0.68.2 → 0.70.1 - Mend

@hyperspaceng/neural-ai 0.68.2 → 0.70.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (48) hide show

package/README.md +1 -1
package/dist/env-api-keys.d.ts +9 -0
package/dist/env-api-keys.d.ts.map +1 -1
package/dist/env-api-keys.js +41 -31
package/dist/env-api-keys.js.map +1 -1
package/dist/index.d.ts +2 -2
package/dist/index.d.ts.map +1 -1
package/dist/index.js +1 -1
package/dist/index.js.map +1 -1
package/dist/models.d.ts +1 -1
package/dist/models.d.ts.map +1 -1
package/dist/models.generated.d.ts +409 -0
package/dist/models.generated.d.ts.map +1 -1
package/dist/models.generated.js +436 -39
package/dist/models.generated.js.map +1 -1
package/dist/models.js +5 -2
package/dist/models.js.map +1 -1
package/dist/providers/amazon-bedrock.d.ts.map +1 -1
package/dist/providers/amazon-bedrock.js.map +1 -1
package/dist/providers/anthropic.d.ts.map +1 -1
package/dist/providers/anthropic.js +28 -11
package/dist/providers/anthropic.js.map +1 -1
package/dist/providers/google-vertex.d.ts.map +1 -1
package/dist/providers/google-vertex.js +34 -13
package/dist/providers/google-vertex.js.map +1 -1
package/dist/providers/openai-codex-responses.d.ts.map +1 -1
package/dist/providers/openai-codex-responses.js +8 -7
package/dist/providers/openai-codex-responses.js.map +1 -1
package/dist/providers/openai-completions.d.ts.map +1 -1
package/dist/providers/openai-completions.js +53 -31
package/dist/providers/openai-completions.js.map +1 -1
package/dist/providers/openai-responses.d.ts.map +1 -1
package/dist/providers/openai-responses.js +19 -19
package/dist/providers/openai-responses.js.map +1 -1
package/dist/providers/transform-messages.d.ts.map +1 -1
package/dist/providers/transform-messages.js +2 -0
package/dist/providers/transform-messages.js.map +1 -1
package/dist/types.d.ts +21 -2
package/dist/types.d.ts.map +1 -1
package/dist/types.js.map +1 -1
package/dist/utils/typebox-helpers.d.ts +1 -1
package/dist/utils/typebox-helpers.d.ts.map +1 -1
package/dist/utils/typebox-helpers.js +1 -1
package/dist/utils/typebox-helpers.js.map +1 -1
package/dist/utils/validation.d.ts.map +1 -1
package/dist/utils/validation.js +242 -41
package/dist/utils/validation.js.map +1 -1
package/package.json +2 -4

package/dist/models.generated.js CHANGED Viewed

@@ -325,6 +325,40 @@ export const MODELS = {
             contextWindow: 1000000,
             maxTokens: 64000,
         },
+        "au.anthropic.claude-opus-4-6-v1": {
+            id: "au.anthropic.claude-opus-4-6-v1",
+            name: "AU Anthropic Claude Opus 4.6",
+            api: "bedrock-converse-stream",
+            provider: "amazon-bedrock",
+            baseUrl: "https://bedrock-runtime.us-east-1.amazonaws.com",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 16.5,
+                output: 82.5,
+                cacheRead: 0.5,
+                cacheWrite: 6.25,
+            },
+            contextWindow: 1000000,
+            maxTokens: 128000,
+        },
+        "au.anthropic.claude-sonnet-4-6": {
+            id: "au.anthropic.claude-sonnet-4-6",
+            name: "AU Anthropic Claude Sonnet 4.6",
+            api: "bedrock-converse-stream",
+            provider: "amazon-bedrock",
+            baseUrl: "https://bedrock-runtime.us-east-1.amazonaws.com",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 3.3,
+                output: 16.5,
+                cacheRead: 0.33,
+                cacheWrite: 4.125,
+            },
+            contextWindow: 1000000,
+            maxTokens: 128000,
+        },
         "deepseek.r1-v1:0": {
             id: "deepseek.r1-v1:0",
             name: "DeepSeek-R1",
@@ -2488,6 +2522,23 @@ export const MODELS = {
             contextWindow: 1050000,
             maxTokens: 128000,
         },
+        "gpt-5.5": {
+            id: "gpt-5.5",
+            name: "GPT-5.5",
+            api: "azure-openai-responses",
+            provider: "azure-openai-responses",
+            baseUrl: "",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 5,
+                output: 30,
+                cacheRead: 0.5,
+                cacheWrite: 0,
+            },
+            contextWindow: 1050000,
+            maxTokens: 130000,
+        },
         "o1": {
             id: "o1",
             name: "o1",
@@ -3011,6 +3062,7 @@ export const MODELS = {
             provider: "github-copilot",
             baseUrl: "https://api.individual.githubcopilot.com",
             headers: { "User-Agent": "GitHubCopilotChat/0.35.0", "Editor-Version": "vscode/1.107.0", "Editor-Plugin-Version": "copilot-chat/0.35.0", "Copilot-Integration-Id": "vscode-chat" },
+            compat: { "supportsEagerToolInputStreaming": false },
             reasoning: true,
             input: ["text", "image"],
             cost: {
@@ -3083,6 +3135,7 @@ export const MODELS = {
             provider: "github-copilot",
             baseUrl: "https://api.individual.githubcopilot.com",
             headers: { "User-Agent": "GitHubCopilotChat/0.35.0", "Editor-Version": "vscode/1.107.0", "Editor-Plugin-Version": "copilot-chat/0.35.0", "Copilot-Integration-Id": "vscode-chat" },
+            compat: { "supportsEagerToolInputStreaming": false },
             reasoning: true,
             input: ["text", "image"],
             cost: {
@@ -3101,6 +3154,7 @@ export const MODELS = {
             provider: "github-copilot",
             baseUrl: "https://api.individual.githubcopilot.com",
             headers: { "User-Agent": "GitHubCopilotChat/0.35.0", "Editor-Version": "vscode/1.107.0", "Editor-Plugin-Version": "copilot-chat/0.35.0", "Copilot-Integration-Id": "vscode-chat" },
+            compat: { "supportsEagerToolInputStreaming": false },
             reasoning: true,
             input: ["text", "image"],
             cost: {
@@ -4164,6 +4218,23 @@ export const MODELS = {
             contextWindow: 1048576,
             maxTokens: 65535,
         },
+        "gemini-3.1-flash-lite-preview": {
+            id: "gemini-3.1-flash-lite-preview",
+            name: "Gemini 3.1 Flash Lite Preview (Cloud Code Assist)",
+            api: "google-gemini-cli",
+            provider: "google-gemini-cli",
+            baseUrl: "https://cloudcode-pa.googleapis.com",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 1048576,
+            maxTokens: 65535,
+        },
         "gemini-3.1-pro-preview": {
             id: "gemini-3.1-pro-preview",
             name: "Gemini 3.1 Pro Preview (Cloud Code Assist)",
@@ -5100,6 +5171,7 @@ export const MODELS = {
             api: "anthropic-messages",
             provider: "kimi-coding",
             baseUrl: "https://api.kimi.com/coding",
+            headers: { "User-Agent": "KimiCLI/1.5" },
             reasoning: true,
             input: ["text", "image"],
             cost: {
@@ -5117,6 +5189,7 @@ export const MODELS = {
             api: "anthropic-messages",
             provider: "kimi-coding",
             baseUrl: "https://api.kimi.com/coding",
+            headers: { "User-Agent": "KimiCLI/1.5" },
             reasoning: true,
             input: ["text", "image"],
             cost: {
@@ -5134,6 +5207,7 @@ export const MODELS = {
             api: "anthropic-messages",
             provider: "kimi-coding",
             baseUrl: "https://api.kimi.com/coding",
+            headers: { "User-Agent": "KimiCLI/1.5" },
             reasoning: true,
             input: ["text"],
             cost: {
@@ -6207,6 +6281,23 @@ export const MODELS = {
             contextWindow: 1050000,
             maxTokens: 128000,
         },
+        "gpt-5.5": {
+            id: "gpt-5.5",
+            name: "GPT-5.5",
+            api: "openai-responses",
+            provider: "openai",
+            baseUrl: "https://api.openai.com/v1",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 5,
+                output: 30,
+                cacheRead: 0.5,
+                cacheWrite: 0,
+            },
+            contextWindow: 1050000,
+            maxTokens: 130000,
+        },
         "o1": {
             id: "o1",
             name: "o1",
@@ -6498,6 +6589,23 @@ export const MODELS = {
             contextWindow: 272000,
             maxTokens: 128000,
         },
+        "gpt-5.5": {
+            id: "gpt-5.5",
+            name: "GPT-5.5",
+            api: "openai-codex-responses",
+            provider: "openai-codex",
+            baseUrl: "https://chatgpt.com/backend-api",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 5,
+                output: 30,
+                cacheRead: 0.5,
+                cacheWrite: 0,
+            },
+            contextWindow: 400000,
+            maxTokens: 128000,
+        },
     },
     "opencode": {
         "big-pickle": {
@@ -6976,6 +7084,57 @@ export const MODELS = {
             contextWindow: 1050000,
             maxTokens: 128000,
         },
+        "gpt-5.5": {
+            id: "gpt-5.5",
+            name: "GPT-5.5",
+            api: "openai-responses",
+            provider: "opencode",
+            baseUrl: "https://opencode.ai/zen/v1",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 5,
+                output: 30,
+                cacheRead: 0.5,
+                cacheWrite: 0,
+            },
+            contextWindow: 1050000,
+            maxTokens: 130000,
+        },
+        "gpt-5.5-pro": {
+            id: "gpt-5.5-pro",
+            name: "GPT-5.5 Pro",
+            api: "openai-responses",
+            provider: "opencode",
+            baseUrl: "https://opencode.ai/zen/v1",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 30,
+                output: 180,
+                cacheRead: 30,
+                cacheWrite: 0,
+            },
+            contextWindow: 1050000,
+            maxTokens: 128000,
+        },
+        "hy3-preview-free": {
+            id: "hy3-preview-free",
+            name: "Hy3 preview Free",
+            api: "openai-completions",
+            provider: "opencode",
+            baseUrl: "https://opencode.ai/zen/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 256000,
+            maxTokens: 64000,
+        },
         "kimi-k2.5": {
             id: "kimi-k2.5",
             name: "Kimi K2.5",
@@ -7131,6 +7290,40 @@ export const MODELS = {
         },
     },
     "opencode-go": {
+        "deepseek-v4-flash": {
+            id: "deepseek-v4-flash",
+            name: "DeepSeek V4 Flash",
+            api: "openai-completions",
+            provider: "opencode-go",
+            baseUrl: "https://opencode.ai/zen/go/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0.14,
+                output: 0.28,
+                cacheRead: 0.028,
+                cacheWrite: 0,
+            },
+            contextWindow: 1000000,
+            maxTokens: 384000,
+        },
+        "deepseek-v4-pro": {
+            id: "deepseek-v4-pro",
+            name: "DeepSeek V4 Pro",
+            api: "openai-completions",
+            provider: "opencode-go",
+            baseUrl: "https://opencode.ai/zen/go/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 1.74,
+                output: 3.48,
+                cacheRead: 0.145,
+                cacheWrite: 0,
+            },
+            contextWindow: 1000000,
+            maxTokens: 384000,
+        },
         "glm-5": {
             id: "glm-5",
             name: "GLM-5",
@@ -7386,7 +7579,7 @@ export const MODELS = {
                 cacheWrite: 0,
             },
             contextWindow: 65536,
-            maxTokens: 4096,
+            maxTokens: 16384,
         },
         "amazon/nova-2-lite-v1": {
             id: "amazon/nova-2-lite-v1",
@@ -7947,7 +8140,7 @@ export const MODELS = {
                 cacheWrite: 0,
             },
             contextWindow: 163840,
-            maxTokens: 163840,
+            maxTokens: 16384,
         },
         "deepseek/deepseek-chat-v3-0324": {
             id: "deepseek/deepseek-chat-v3-0324",
@@ -7964,7 +8157,7 @@ export const MODELS = {
                 cacheWrite: 0,
             },
             contextWindow: 163840,
-            maxTokens: 4096,
+            maxTokens: 16384,
         },
         "deepseek/deepseek-chat-v3.1": {
             id: "deepseek/deepseek-chat-v3.1",
@@ -8015,7 +8208,7 @@ export const MODELS = {
                 cacheWrite: 0,
             },
             contextWindow: 163840,
-            maxTokens: 4096,
+            maxTokens: 32768,
         },
         "deepseek/deepseek-v3.1-terminus": {
             id: "deepseek/deepseek-v3.1-terminus",
@@ -8028,11 +8221,11 @@ export const MODELS = {
             cost: {
                 input: 0.21,
                 output: 0.7899999999999999,
-                cacheRead: 0.1300000002,
+                cacheRead: 0.13,
                 cacheWrite: 0,
             },
             contextWindow: 163840,
-            maxTokens: 4096,
+            maxTokens: 32768,
         },
         "deepseek/deepseek-v3.2": {
             id: "deepseek/deepseek-v3.2",
@@ -8068,6 +8261,40 @@ export const MODELS = {
             contextWindow: 163840,
             maxTokens: 65536,
         },
+        "deepseek/deepseek-v4-flash": {
+            id: "deepseek/deepseek-v4-flash",
+            name: "DeepSeek: DeepSeek V4 Flash",
+            api: "openai-completions",
+            provider: "openrouter",
+            baseUrl: "https://openrouter.ai/api/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0.14,
+                output: 0.28,
+                cacheRead: 0.028,
+                cacheWrite: 0,
+            },
+            contextWindow: 1048576,
+            maxTokens: 384000,
+        },
+        "deepseek/deepseek-v4-pro": {
+            id: "deepseek/deepseek-v4-pro",
+            name: "DeepSeek: DeepSeek V4 Pro",
+            api: "openai-completions",
+            provider: "openrouter",
+            baseUrl: "https://openrouter.ai/api/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 1.74,
+                output: 3.48,
+                cacheRead: 0.145,
+                cacheWrite: 0,
+            },
+            contextWindow: 1048576,
+            maxTokens: 384000,
+        },
         "essentialai/rnj-1-instruct": {
             id: "essentialai/rnj-1-instruct",
             name: "EssentialAI: Rnj 1 Instruct",
@@ -8289,6 +8516,40 @@ export const MODELS = {
             contextWindow: 1048576,
             maxTokens: 65536,
         },
+        "google/gemma-3-12b-it": {
+            id: "google/gemma-3-12b-it",
+            name: "Google: Gemma 3 12B",
+            api: "openai-completions",
+            provider: "openrouter",
+            baseUrl: "https://openrouter.ai/api/v1",
+            reasoning: false,
+            input: ["text", "image"],
+            cost: {
+                input: 0.04,
+                output: 0.13,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 131072,
+            maxTokens: 16384,
+        },
+        "google/gemma-3-27b-it": {
+            id: "google/gemma-3-27b-it",
+            name: "Google: Gemma 3 27B",
+            api: "openai-completions",
+            provider: "openrouter",
+            baseUrl: "https://openrouter.ai/api/v1",
+            reasoning: false,
+            input: ["text", "image"],
+            cost: {
+                input: 0.08,
+                output: 0.16,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 131072,
+            maxTokens: 16384,
+        },
         "google/gemma-4-26b-a4b-it": {
             id: "google/gemma-4-26b-a4b-it",
             name: "Google: Gemma 4 26B A4B ",
@@ -8298,8 +8559,8 @@ export const MODELS = {
             reasoning: true,
             input: ["text", "image"],
             cost: {
-                input: 0.07,
-                output: 0.33999999999999997,
+                input: 0.06,
+                output: 0.33,
                 cacheRead: 0,
                 cacheWrite: 0,
             },
@@ -8338,7 +8599,7 @@ export const MODELS = {
                 cacheWrite: 0,
             },
             contextWindow: 262144,
-            maxTokens: 4096,
+            maxTokens: 16384,
         },
         "google/gemma-4-31b-it:free": {
             id: "google/gemma-4-31b-it:free",
@@ -8374,6 +8635,23 @@ export const MODELS = {
             contextWindow: 128000,
             maxTokens: 50000,
         },
+        "inclusionai/ling-2.6-1t:free": {
+            id: "inclusionai/ling-2.6-1t:free",
+            name: "inclusionAI: Ling-2.6-1T (free)",
+            api: "openai-completions",
+            provider: "openrouter",
+            baseUrl: "https://openrouter.ai/api/v1",
+            reasoning: false,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 262144,
+            maxTokens: 32768,
+        },
         "inclusionai/ling-2.6-flash:free": {
             id: "inclusionai/ling-2.6-flash:free",
             name: "inclusionAI: Ling-2.6-flash (free)",
@@ -8440,7 +8718,7 @@ export const MODELS = {
                 cacheWrite: 0,
             },
             contextWindow: 131072,
-            maxTokens: 4096,
+            maxTokens: 16384,
         },
         "meta-llama/llama-3.1-8b-instruct": {
             id: "meta-llama/llama-3.1-8b-instruct",
@@ -8571,12 +8849,12 @@ export const MODELS = {
             input: ["text"],
             cost: {
                 input: 0.15,
-                output: 1.2,
-                cacheRead: 0.075,
+                output: 1.15,
+                cacheRead: 0.03,
                 cacheWrite: 0,
             },
             contextWindow: 196608,
-            maxTokens: 65536,
+            maxTokens: 131072,
         },
         "minimax/minimax-m2.5:free": {
             id: "minimax/minimax-m2.5:free",
@@ -8842,13 +9120,13 @@ export const MODELS = {
             reasoning: false,
             input: ["text"],
             cost: {
-                input: 0.02,
-                output: 0.04,
+                input: 0.01,
+                output: 0.03,
                 cacheRead: 0,
                 cacheWrite: 0,
             },
             contextWindow: 131072,
-            maxTokens: 16384,
+            maxTokens: 4096,
         },
         "mistralai/mistral-saba": {
             id: "mistralai/mistral-saba",
@@ -8899,7 +9177,7 @@ export const MODELS = {
                 cacheWrite: 0,
             },
             contextWindow: 128000,
-            maxTokens: 4096,
+            maxTokens: 16384,
         },
         "mistralai/mistral-small-creative": {
             id: "mistralai/mistral-small-creative",
@@ -9063,13 +9341,13 @@ export const MODELS = {
             reasoning: true,
             input: ["text", "image"],
             cost: {
-                input: 0.75,
-                output: 3.5,
-                cacheRead: 0.15,
+                input: 0.7448,
+                output: 4.655,
+                cacheRead: 0.1463,
                 cacheWrite: 0,
             },
-            contextWindow: 262144,
-            maxTokens: 4096,
+            contextWindow: 256000,
+            maxTokens: 65536,
         },
         "nex-agi/deepseek-v3.1-nex-n1": {
             id: "nex-agi/deepseek-v3.1-nex-n1",
@@ -9120,7 +9398,7 @@ export const MODELS = {
                 cacheWrite: 0,
             },
             contextWindow: 131072,
-            maxTokens: 4096,
+            maxTokens: 16384,
         },
         "nvidia/nemotron-3-nano-30b-a3b": {
             id: "nvidia/nemotron-3-nano-30b-a3b",
@@ -9137,7 +9415,7 @@ export const MODELS = {
                 cacheWrite: 0,
             },
             contextWindow: 262144,
-            maxTokens: 4096,
+            maxTokens: 228000,
         },
         "nvidia/nemotron-3-nano-30b-a3b:free": {
             id: "nvidia/nemotron-3-nano-30b-a3b:free",
@@ -9222,7 +9500,7 @@ export const MODELS = {
                 cacheWrite: 0,
             },
             contextWindow: 131072,
-            maxTokens: 4096,
+            maxTokens: 16384,
         },
         "nvidia/nemotron-nano-9b-v2:free": {
             id: "nvidia/nemotron-nano-9b-v2:free",
@@ -9887,6 +10165,40 @@ export const MODELS = {
             contextWindow: 1050000,
             maxTokens: 128000,
         },
+        "openai/gpt-5.5": {
+            id: "openai/gpt-5.5",
+            name: "OpenAI: GPT-5.5",
+            api: "openai-completions",
+            provider: "openrouter",
+            baseUrl: "https://openrouter.ai/api/v1",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 5,
+                output: 30,
+                cacheRead: 0.5,
+                cacheWrite: 0,
+            },
+            contextWindow: 1050000,
+            maxTokens: 128000,
+        },
+        "openai/gpt-5.5-pro": {
+            id: "openai/gpt-5.5-pro",
+            name: "OpenAI: GPT-5.5 Pro",
+            api: "openai-completions",
+            provider: "openrouter",
+            baseUrl: "https://openrouter.ai/api/v1",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 30,
+                output: 180,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 1050000,
+            maxTokens: 128000,
+        },
         "openai/gpt-audio": {
             id: "openai/gpt-audio",
             name: "OpenAI: GPT Audio",
@@ -9936,7 +10248,7 @@ export const MODELS = {
                 cacheWrite: 0,
             },
             contextWindow: 131072,
-            maxTokens: 4096,
+            maxTokens: 131072,
         },
         "openai/gpt-oss-120b:free": {
             id: "openai/gpt-oss-120b:free",
@@ -9970,7 +10282,7 @@ export const MODELS = {
                 cacheWrite: 0,
             },
             contextWindow: 131072,
-            maxTokens: 4096,
+            maxTokens: 131072,
         },
         "openai/gpt-oss-20b:free": {
             id: "openai/gpt-oss-20b:free",
@@ -10395,7 +10707,7 @@ export const MODELS = {
                 cacheWrite: 0,
             },
             contextWindow: 262144,
-            maxTokens: 4096,
+            maxTokens: 16384,
         },
         "qwen/qwen3-235b-a22b-thinking-2507": {
             id: "qwen/qwen3-235b-a22b-thinking-2507",
@@ -10429,7 +10741,7 @@ export const MODELS = {
                 cacheWrite: 0,
             },
             contextWindow: 40960,
-            maxTokens: 40960,
+            maxTokens: 16384,
         },
         "qwen/qwen3-30b-a3b-instruct-2507": {
             id: "qwen/qwen3-30b-a3b-instruct-2507",
@@ -10514,7 +10826,7 @@ export const MODELS = {
                 cacheWrite: 0,
             },
             contextWindow: 262144,
-            maxTokens: 4096,
+            maxTokens: 65536,
         },
         "qwen/qwen3-coder-30b-a3b-instruct": {
             id: "qwen/qwen3-coder-30b-a3b-instruct",
@@ -10559,9 +10871,9 @@ export const MODELS = {
             reasoning: false,
             input: ["text"],
             cost: {
-                input: 0.15,
+                input: 0.14,
                 output: 0.7999999999999999,
-                cacheRead: 0.11,
+                cacheRead: 0.09,
                 cacheWrite: 0,
             },
             contextWindow: 262144,
@@ -10650,7 +10962,7 @@ export const MODELS = {
                 cacheWrite: 0,
             },
             contextWindow: 262144,
-            maxTokens: 4096,
+            maxTokens: 16384,
         },
         "qwen/qwen3-next-80b-a3b-instruct:free": {
             id: "qwen/qwen3-next-80b-a3b-instruct:free",
@@ -10701,7 +11013,7 @@ export const MODELS = {
                 cacheWrite: 0,
             },
             contextWindow: 262144,
-            maxTokens: 4096,
+            maxTokens: 16384,
         },
         "qwen/qwen3-vl-235b-a22b-thinking": {
             id: "qwen/qwen3-vl-235b-a22b-thinking",
@@ -11043,6 +11355,23 @@ export const MODELS = {
             contextWindow: 262144,
             maxTokens: 65536,
         },
+        "tencent/hy3-preview:free": {
+            id: "tencent/hy3-preview:free",
+            name: "Tencent: Hy3 preview (free)",
+            api: "openai-completions",
+            provider: "openrouter",
+            baseUrl: "https://openrouter.ai/api/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 262144,
+            maxTokens: 262144,
+        },
         "thedrummer/rocinante-12b": {
             id: "thedrummer/rocinante-12b",
             name: "TheDrummer: Rocinante 12B",
@@ -11462,11 +11791,11 @@ export const MODELS = {
             cost: {
                 input: 0.3,
                 output: 0.8999999999999999,
-                cacheRead: 0,
+                cacheRead: 0.049999999999999996,
                 cacheWrite: 0,
             },
             contextWindow: 131072,
-            maxTokens: 131072,
+            maxTokens: 24000,
         },
         "z-ai/glm-4.7": {
             id: "z-ai/glm-4.7",
@@ -11496,11 +11825,11 @@ export const MODELS = {
             cost: {
                 input: 0.06,
                 output: 0.39999999999999997,
-                cacheRead: 0.0100000002,
+                cacheRead: 0.01,
                 cacheWrite: 0,
             },
             contextWindow: 202752,
-            maxTokens: 4096,
+            maxTokens: 16384,
         },
         "z-ai/glm-5": {
             id: "z-ai/glm-5",
@@ -11517,7 +11846,7 @@ export const MODELS = {
                 cacheWrite: 0,
             },
             contextWindow: 202752,
-            maxTokens: 4096,
+            maxTokens: 16384,
         },
         "z-ai/glm-5-turbo": {
             id: "z-ai/glm-5-turbo",
@@ -12252,6 +12581,40 @@ export const MODELS = {
             contextWindow: 128000,
             maxTokens: 64000,
         },
+        "deepseek/deepseek-v4-flash": {
+            id: "deepseek/deepseek-v4-flash",
+            name: "DeepSeek V4 Flash",
+            api: "anthropic-messages",
+            provider: "vercel-ai-gateway",
+            baseUrl: "https://ai-gateway.vercel.sh",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0.14,
+                output: 0.28,
+                cacheRead: 0.028,
+                cacheWrite: 0,
+            },
+            contextWindow: 1000000,
+            maxTokens: 384000,
+        },
+        "deepseek/deepseek-v4-pro": {
+            id: "deepseek/deepseek-v4-pro",
+            name: "DeepSeek V4 Pro",
+            api: "anthropic-messages",
+            provider: "vercel-ai-gateway",
+            baseUrl: "https://ai-gateway.vercel.sh",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 1.74,
+                output: 3.48,
+                cacheRead: 0.145,
+                cacheWrite: 0,
+            },
+            contextWindow: 1000000,
+            maxTokens: 384000,
+        },
         "google/gemini-2.0-flash": {
             id: "google/gemini-2.0-flash",
             name: "Gemini 2.0 Flash",
@@ -13527,6 +13890,40 @@ export const MODELS = {
             contextWindow: 1050000,
             maxTokens: 128000,
         },
+        "openai/gpt-5.5": {
+            id: "openai/gpt-5.5",
+            name: "GPT 5.5",
+            api: "anthropic-messages",
+            provider: "vercel-ai-gateway",
+            baseUrl: "https://ai-gateway.vercel.sh",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 5,
+                output: 30,
+                cacheRead: 0.5,
+                cacheWrite: 0,
+            },
+            contextWindow: 1000000,
+            maxTokens: 128000,
+        },
+        "openai/gpt-5.5-pro": {
+            id: "openai/gpt-5.5-pro",
+            name: "GPT 5.5 Pro",
+            api: "anthropic-messages",
+            provider: "vercel-ai-gateway",
+            baseUrl: "https://ai-gateway.vercel.sh",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 30,
+                output: 180,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 1000000,
+            maxTokens: 128000,
+        },
         "openai/gpt-oss-20b": {
             id: "openai/gpt-oss-20b",
             name: "GPT OSS 120B",