npm - @kolisachint/hoocode-ai - Versions diffs - 0.1.1 → 0.2.0 - Mend

@kolisachint/hoocode-ai 0.1.1 → 0.2.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (12) hide show

package/README.md +1 -0
package/dist/env-api-keys.d.ts.map +1 -1
package/dist/env-api-keys.js +1 -0
package/dist/env-api-keys.js.map +1 -1
package/dist/models.generated.d.ts +953 -34
package/dist/models.generated.d.ts.map +1 -1
package/dist/models.generated.js +930 -38
package/dist/models.generated.js.map +1 -1
package/dist/types.d.ts +1 -1
package/dist/types.d.ts.map +1 -1
package/dist/types.js.map +1 -1
package/package.json +1 -1

package/dist/models.generated.js CHANGED Viewed

@@ -6392,6 +6392,896 @@ export const MODELS = {
             maxTokens: 262144,
         },
     },
+    "nvidia": {
+        "abacusai/dracarys-llama-3_1-70b-instruct": {
+            id: "abacusai/dracarys-llama-3_1-70b-instruct",
+            name: "dracarys-llama-3.1-70b-instruct",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 8192,
+        },
+        "bytedance/seed-oss-36b-instruct": {
+            id: "bytedance/seed-oss-36b-instruct",
+            name: "ByteDance-Seed/Seed-OSS-36B-Instruct",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 262000,
+            maxTokens: 262000,
+        },
+        "deepseek-ai/deepseek-v3.1-terminus": {
+            id: "deepseek-ai/deepseek-v3.1-terminus",
+            name: "DeepSeek V3.1 Terminus",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 8192,
+        },
+        "deepseek-ai/deepseek-v3.2": {
+            id: "deepseek-ai/deepseek-v3.2",
+            name: "DeepSeek V3.2",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 163840,
+            maxTokens: 65536,
+        },
+        "deepseek-ai/deepseek-v4-flash": {
+            id: "deepseek-ai/deepseek-v4-flash",
+            name: "DeepSeek V4 Flash",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            compat: { "requiresReasoningContentOnAssistantMessages": true, "thinkingFormat": "deepseek" },
+            reasoning: true,
+            thinkingLevelMap: { "minimal": null, "low": null, "medium": null, "high": "high", "xhigh": "max" },
+            input: ["text"],
+            cost: {
+                input: 0.14,
+                output: 0.28,
+                cacheRead: 0.028,
+                cacheWrite: 0,
+            },
+            contextWindow: 1048576,
+            maxTokens: 393216,
+        },
+        "deepseek-ai/deepseek-v4-pro": {
+            id: "deepseek-ai/deepseek-v4-pro",
+            name: "DeepSeek V4 Pro",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            compat: { "requiresReasoningContentOnAssistantMessages": true, "thinkingFormat": "deepseek" },
+            reasoning: true,
+            thinkingLevelMap: { "minimal": null, "low": null, "medium": null, "high": "high", "xhigh": "max" },
+            input: ["text"],
+            cost: {
+                input: 1.74,
+                output: 3.48,
+                cacheRead: 0.145,
+                cacheWrite: 0,
+            },
+            contextWindow: 1048576,
+            maxTokens: 393216,
+        },
+        "google/gemma-2-2b-it": {
+            id: "google/gemma-2-2b-it",
+            name: "Gemma 2 2b It",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 4096,
+        },
+        "google/gemma-3-27b-it": {
+            id: "google/gemma-3-27b-it",
+            name: "Gemma-3-27B-IT",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 131072,
+            maxTokens: 8192,
+        },
+        "google/gemma-3n-e2b-it": {
+            id: "google/gemma-3n-e2b-it",
+            name: "Gemma 3n E2b It",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text", "image"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 4096,
+        },
+        "google/gemma-3n-e4b-it": {
+            id: "google/gemma-3n-e4b-it",
+            name: "Gemma 3n E4b It",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text", "image"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 4096,
+        },
+        "google/gemma-4-31b-it": {
+            id: "google/gemma-4-31b-it",
+            name: "Gemma-4-31B-IT",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 256000,
+            maxTokens: 16384,
+        },
+        "meta/llama-3.1-70b-instruct": {
+            id: "meta/llama-3.1-70b-instruct",
+            name: "Llama 3.1 70b Instruct",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 4096,
+        },
+        "meta/llama-3.1-8b-instruct": {
+            id: "meta/llama-3.1-8b-instruct",
+            name: "Llama 3.1 8B Instruct",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 16000,
+            maxTokens: 4096,
+        },
+        "meta/llama-3.2-11b-vision-instruct": {
+            id: "meta/llama-3.2-11b-vision-instruct",
+            name: "Llama 3.2 11b Vision Instruct",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text", "image"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 4096,
+        },
+        "meta/llama-3.2-1b-instruct": {
+            id: "meta/llama-3.2-1b-instruct",
+            name: "Llama 3.2 1b Instruct",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 4096,
+        },
+        "meta/llama-3.2-90b-vision-instruct": {
+            id: "meta/llama-3.2-90b-vision-instruct",
+            name: "Llama-3.2-90B-Vision-Instruct",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text", "image"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 8192,
+        },
+        "meta/llama-3.3-70b-instruct": {
+            id: "meta/llama-3.3-70b-instruct",
+            name: "Llama 3.3 70b Instruct",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 4096,
+        },
+        "meta/llama-4-maverick-17b-128e-instruct": {
+            id: "meta/llama-4-maverick-17b-128e-instruct",
+            name: "Llama 4 Maverick 17b 128e Instruct",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text", "image"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 4096,
+        },
+        "microsoft/phi-4-mini-instruct": {
+            id: "microsoft/phi-4-mini-instruct",
+            name: "Phi-4-Mini",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 131072,
+            maxTokens: 8192,
+        },
+        "minimaxai/minimax-m2.5": {
+            id: "minimaxai/minimax-m2.5",
+            name: "MiniMax-M2.5",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 204800,
+            maxTokens: 131072,
+        },
+        "minimaxai/minimax-m2.7": {
+            id: "minimaxai/minimax-m2.7",
+            name: "MiniMax-M2.7",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 204800,
+            maxTokens: 131072,
+        },
+        "mistralai/devstral-2-123b-instruct-2512": {
+            id: "mistralai/devstral-2-123b-instruct-2512",
+            name: "Devstral-2-123B-Instruct-2512",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 262144,
+            maxTokens: 262144,
+        },
+        "mistralai/mistral-7b-instruct-v03": {
+            id: "mistralai/mistral-7b-instruct-v03",
+            name: "Mistral-7B-Instruct-v0.3",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 65536,
+            maxTokens: 65536,
+        },
+        "mistralai/mistral-large-3-675b-instruct-2512": {
+            id: "mistralai/mistral-large-3-675b-instruct-2512",
+            name: "Mistral Large 3 675B Instruct 2512",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text", "image"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 262144,
+            maxTokens: 262144,
+        },
+        "mistralai/mistral-nemotron": {
+            id: "mistralai/mistral-nemotron",
+            name: "mistral-nemotron",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 8192,
+        },
+        "mistralai/mistral-small-4-119b-2603": {
+            id: "mistralai/mistral-small-4-119b-2603",
+            name: "mistral-small-4-119b-2603",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 8192,
+        },
+        "mistralai/mixtral-8x22b-instruct": {
+            id: "mistralai/mixtral-8x22b-instruct",
+            name: "Mistral: Mixtral 8x22B Instruct",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 65536,
+            maxTokens: 13108,
+        },
+        "mistralai/mixtral-8x7b-instruct": {
+            id: "mistralai/mixtral-8x7b-instruct",
+            name: "Mistral: Mixtral 8x7B Instruct",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 32768,
+            maxTokens: 16384,
+        },
+        "moonshotai/kimi-k2-instruct": {
+            id: "moonshotai/kimi-k2-instruct",
+            name: "Kimi K2 Instruct",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 8192,
+        },
+        "moonshotai/kimi-k2-instruct-0905": {
+            id: "moonshotai/kimi-k2-instruct-0905",
+            name: "Kimi K2 0905",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 262144,
+            maxTokens: 262144,
+        },
+        "moonshotai/kimi-k2-thinking": {
+            id: "moonshotai/kimi-k2-thinking",
+            name: "Kimi K2 Thinking",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 262144,
+            maxTokens: 262144,
+        },
+        "moonshotai/kimi-k2.6": {
+            id: "moonshotai/kimi-k2.6",
+            name: "Kimi K2.6",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 262144,
+            maxTokens: 262144,
+        },
+        "nvidia/llama-3_3-nemotron-super-49b-v1": {
+            id: "nvidia/llama-3_3-nemotron-super-49b-v1",
+            name: "Llama 3.3 Nemotron Super 49B v1",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 131072,
+            maxTokens: 131072,
+        },
+        "nvidia/llama-3_3-nemotron-super-49b-v1_5": {
+            id: "nvidia/llama-3_3-nemotron-super-49b-v1_5",
+            name: "Llama 3.3 Nemotron Super 49B v1.5",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 131072,
+            maxTokens: 131072,
+        },
+        "nvidia/nemotron-3-nano-30b-a3b": {
+            id: "nvidia/nemotron-3-nano-30b-a3b",
+            name: "nemotron-3-nano-30b-a3b",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 131072,
+            maxTokens: 131072,
+        },
+        "nvidia/nemotron-3-nano-omni-30b-a3b-reasoning": {
+            id: "nvidia/nemotron-3-nano-omni-30b-a3b-reasoning",
+            name: "Nemotron 3 Nano Omni",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 256000,
+            maxTokens: 65536,
+        },
+        "nvidia/nemotron-3-super-120b-a12b": {
+            id: "nvidia/nemotron-3-super-120b-a12b",
+            name: "Nemotron 3 Super",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0.2,
+                output: 0.8,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 262144,
+            maxTokens: 262144,
+        },
+        "nvidia/nemotron-mini-4b-instruct": {
+            id: "nvidia/nemotron-mini-4b-instruct",
+            name: "nemotron-mini-4b-instruct",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 8192,
+        },
+        "nvidia/nemotron-voicechat": {
+            id: "nvidia/nemotron-voicechat",
+            name: "nemotron-voicechat",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 8192,
+        },
+        "nvidia/nvidia-nemotron-nano-9b-v2": {
+            id: "nvidia/nvidia-nemotron-nano-9b-v2",
+            name: "nvidia-nemotron-nano-9b-v2",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 131072,
+            maxTokens: 131072,
+        },
+        "openai/gpt-oss-20b": {
+            id: "openai/gpt-oss-20b",
+            name: "GPT OSS 20B",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 131072,
+            maxTokens: 32768,
+        },
+        "qwen/qwen2.5-coder-32b-instruct": {
+            id: "qwen/qwen2.5-coder-32b-instruct",
+            name: "Qwen2.5 Coder 32b Instruct",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 4096,
+        },
+        "qwen/qwen3-coder-480b-a35b-instruct": {
+            id: "qwen/qwen3-coder-480b-a35b-instruct",
+            name: "Qwen3 Coder 480B A35B Instruct",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 262144,
+            maxTokens: 66536,
+        },
+        "qwen/qwen3-next-80b-a3b-instruct": {
+            id: "qwen/qwen3-next-80b-a3b-instruct",
+            name: "Qwen3-Next-80B-A3B-Instruct",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 262144,
+            maxTokens: 16384,
+        },
+        "qwen/qwen3-next-80b-a3b-thinking": {
+            id: "qwen/qwen3-next-80b-a3b-thinking",
+            name: "Qwen3-Next-80B-A3B-Thinking",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 262144,
+            maxTokens: 16384,
+        },
+        "qwen/qwen3.5-122b-a10b": {
+            id: "qwen/qwen3.5-122b-a10b",
+            name: "Qwen3.5 122B-A10B",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 262144,
+            maxTokens: 65536,
+        },
+        "qwen/qwen3.5-397b-a17b": {
+            id: "qwen/qwen3.5-397b-a17b",
+            name: "Qwen3.5-397B-A17B",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: true,
+            input: ["text", "image"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 262144,
+            maxTokens: 8192,
+        },
+        "sarvamai/sarvam-m": {
+            id: "sarvamai/sarvam-m",
+            name: "sarvam-m",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 8192,
+        },
+        "stepfun-ai/step-3.5-flash": {
+            id: "stepfun-ai/step-3.5-flash",
+            name: "Step 3.5 Flash",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 256000,
+            maxTokens: 16384,
+        },
+        "upstage/solar-10_7b-instruct": {
+            id: "upstage/solar-10_7b-instruct",
+            name: "solar-10.7b-instruct",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: false,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 128000,
+            maxTokens: 8192,
+        },
+        "z-ai/glm-5.1": {
+            id: "z-ai/glm-5.1",
+            name: "GLM-5.1",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 131072,
+            maxTokens: 131072,
+        },
+        "z-ai/glm4.7": {
+            id: "z-ai/glm4.7",
+            name: "GLM-4.7",
+            api: "openai-completions",
+            provider: "nvidia",
+            baseUrl: "https://integrate.api.nvidia.com/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 204800,
+            maxTokens: 131072,
+        },
+    },
     "openai": {
         "gpt-4": {
             id: "gpt-4",
@@ -7468,6 +8358,25 @@ export const MODELS = {
             contextWindow: 1000000,
             maxTokens: 64000,
         },
+        "deepseek-v4-flash-free": {
+            id: "deepseek-v4-flash-free",
+            name: "DeepSeek V4 Flash Free",
+            api: "openai-completions",
+            provider: "opencode",
+            baseUrl: "https://opencode.ai/zen/v1",
+            compat: { "requiresReasoningContentOnAssistantMessages": true, "thinkingFormat": "deepseek" },
+            reasoning: true,
+            thinkingLevelMap: { "minimal": null, "low": null, "medium": null, "high": "high", "xhigh": "max" },
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 1000000,
+            maxTokens: 384000,
+        },
         "gemini-3-flash": {
             id: "gemini-3-flash",
             name: "Gemini 3 Flash",
@@ -8346,40 +9255,6 @@ export const MODELS = {
             contextWindow: 200000,
             maxTokens: 8192,
         },
-        "anthropic/claude-3.7-sonnet": {
-            id: "anthropic/claude-3.7-sonnet",
-            name: "Anthropic: Claude 3.7 Sonnet",
-            api: "openai-completions",
-            provider: "openrouter",
-            baseUrl: "https://openrouter.ai/api/v1",
-            reasoning: true,
-            input: ["text", "image"],
-            cost: {
-                input: 3,
-                output: 15,
-                cacheRead: 0.3,
-                cacheWrite: 3.75,
-            },
-            contextWindow: 200000,
-            maxTokens: 64000,
-        },
-        "anthropic/claude-3.7-sonnet:thinking": {
-            id: "anthropic/claude-3.7-sonnet:thinking",
-            name: "Anthropic: Claude 3.7 Sonnet (thinking)",
-            api: "openai-completions",
-            provider: "openrouter",
-            baseUrl: "https://openrouter.ai/api/v1",
-            reasoning: true,
-            input: ["text", "image"],
-            cost: {
-                input: 3,
-                output: 15,
-                cacheRead: 0.3,
-                cacheWrite: 3.75,
-            },
-            contextWindow: 200000,
-            maxTokens: 64000,
-        },
         "anthropic/claude-haiku-4.5": {
             id: "anthropic/claude-haiku-4.5",
             name: "Anthropic: Claude Haiku 4.5",
@@ -8587,6 +9462,23 @@ export const MODELS = {
             contextWindow: 262144,
             maxTokens: 262144,
         },
+        "arcee-ai/trinity-large-thinking:free": {
+            id: "arcee-ai/trinity-large-thinking:free",
+            name: "Arcee AI: Trinity Large Thinking (free)",
+            api: "openai-completions",
+            provider: "openrouter",
+            baseUrl: "https://openrouter.ai/api/v1",
+            reasoning: true,
+            input: ["text"],
+            cost: {
+                input: 0,
+                output: 0,
+                cacheRead: 0,
+                cacheWrite: 0,
+            },
+            contextWindow: 262144,
+            maxTokens: 80000,
+        },
         "arcee-ai/trinity-mini": {
             id: "arcee-ai/trinity-mini",
             name: "Arcee AI: Trinity Mini",
@@ -12709,13 +13601,13 @@ export const MODELS = {
             reasoning: true,
             input: ["text"],
             cost: {
-                input: 1.0499999999999998,
-                output: 3.5,
-                cacheRead: 0.5249999999999999,
+                input: 0.98,
+                output: 3.08,
+                cacheRead: 0.182,
                 cacheWrite: 0,
             },
             contextWindow: 202752,
-            maxTokens: 65535,
+            maxTokens: 4096,
         },
         "z-ai/glm-5v-turbo": {
             id: "z-ai/glm-5v-turbo",