npm - @just-every/ensemble - Versions diffs - 0.1.0 - Mend

@just-every/ensemble 0.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (127) hide show

package/README.md +245 -0
package/dist/cost_tracker.d.ts +2 -0
package/dist/cost_tracker.d.ts.map +1 -0
package/dist/cost_tracker.js +2 -0
package/dist/cost_tracker.js.map +1 -0
package/dist/errors.d.ts +55 -0
package/dist/errors.d.ts.map +1 -0
package/dist/errors.js +134 -0
package/dist/errors.js.map +1 -0
package/dist/external_models.d.ts +10 -0
package/dist/external_models.d.ts.map +1 -0
package/dist/external_models.js +36 -0
package/dist/external_models.js.map +1 -0
package/dist/index.d.ts +31 -0
package/dist/index.d.ts.map +1 -0
package/dist/index.js +47 -0
package/dist/index.js.map +1 -0
package/dist/model_data.d.ts +63 -0
package/dist/model_data.d.ts.map +1 -0
package/dist/model_data.js +1070 -0
package/dist/model_data.js.map +1 -0
package/dist/model_providers/base_provider.d.ts +37 -0
package/dist/model_providers/base_provider.d.ts.map +1 -0
package/dist/model_providers/base_provider.js +146 -0
package/dist/model_providers/base_provider.js.map +1 -0
package/dist/model_providers/claude.d.ts +11 -0
package/dist/model_providers/claude.d.ts.map +1 -0
package/dist/model_providers/claude.js +788 -0
package/dist/model_providers/claude.js.map +1 -0
package/dist/model_providers/deepseek.d.ts +8 -0
package/dist/model_providers/deepseek.d.ts.map +1 -0
package/dist/model_providers/deepseek.js +136 -0
package/dist/model_providers/deepseek.js.map +1 -0
package/dist/model_providers/gemini.d.ts +11 -0
package/dist/model_providers/gemini.d.ts.map +1 -0
package/dist/model_providers/gemini.js +711 -0
package/dist/model_providers/gemini.js.map +1 -0
package/dist/model_providers/grok.d.ts +8 -0
package/dist/model_providers/grok.d.ts.map +1 -0
package/dist/model_providers/grok.js +22 -0
package/dist/model_providers/grok.js.map +1 -0
package/dist/model_providers/model_provider.d.ts +11 -0
package/dist/model_providers/model_provider.d.ts.map +1 -0
package/dist/model_providers/model_provider.js +170 -0
package/dist/model_providers/model_provider.js.map +1 -0
package/dist/model_providers/openai.d.ts +13 -0
package/dist/model_providers/openai.d.ts.map +1 -0
package/dist/model_providers/openai.js +822 -0
package/dist/model_providers/openai.js.map +1 -0
package/dist/model_providers/openai_chat.d.ts +14 -0
package/dist/model_providers/openai_chat.d.ts.map +1 -0
package/dist/model_providers/openai_chat.js +719 -0
package/dist/model_providers/openai_chat.js.map +1 -0
package/dist/model_providers/openrouter.d.ts +6 -0
package/dist/model_providers/openrouter.d.ts.map +1 -0
package/dist/model_providers/openrouter.js +18 -0
package/dist/model_providers/openrouter.js.map +1 -0
package/dist/model_providers/refactored_openai.d.ts +22 -0
package/dist/model_providers/refactored_openai.d.ts.map +1 -0
package/dist/model_providers/refactored_openai.js +310 -0
package/dist/model_providers/refactored_openai.js.map +1 -0
package/dist/model_providers/test_provider.d.ts +27 -0
package/dist/model_providers/test_provider.d.ts.map +1 -0
package/dist/model_providers/test_provider.js +185 -0
package/dist/model_providers/test_provider.js.map +1 -0
package/dist/tsconfig.tsbuildinfo +1 -0
package/dist/types/api_types.d.ts +249 -0
package/dist/types/api_types.d.ts.map +1 -0
package/dist/types/api_types.js +2 -0
package/dist/types/api_types.js.map +1 -0
package/dist/types/extended_types.d.ts +43 -0
package/dist/types/extended_types.d.ts.map +1 -0
package/dist/types/extended_types.js +2 -0
package/dist/types/extended_types.js.map +1 -0
package/dist/types.d.ts +301 -0
package/dist/types.d.ts.map +1 -0
package/dist/types.js +2 -0
package/dist/types.js.map +1 -0
package/dist/utils/async_queue.d.ts +14 -0
package/dist/utils/async_queue.d.ts.map +1 -0
package/dist/utils/async_queue.js +68 -0
package/dist/utils/async_queue.js.map +1 -0
package/dist/utils/cache.d.ts +60 -0
package/dist/utils/cache.d.ts.map +1 -0
package/dist/utils/cache.js +205 -0
package/dist/utils/cache.js.map +1 -0
package/dist/utils/communication.d.ts +3 -0
package/dist/utils/communication.d.ts.map +1 -0
package/dist/utils/communication.js +8 -0
package/dist/utils/communication.js.map +1 -0
package/dist/utils/cost_tracker.d.ts +26 -0
package/dist/utils/cost_tracker.d.ts.map +1 -0
package/dist/utils/cost_tracker.js +177 -0
package/dist/utils/cost_tracker.js.map +1 -0
package/dist/utils/delta_buffer.d.ts +14 -0
package/dist/utils/delta_buffer.d.ts.map +1 -0
package/dist/utils/delta_buffer.js +60 -0
package/dist/utils/delta_buffer.js.map +1 -0
package/dist/utils/image_to_text.d.ts +3 -0
package/dist/utils/image_to_text.d.ts.map +1 -0
package/dist/utils/image_to_text.js +81 -0
package/dist/utils/image_to_text.js.map +1 -0
package/dist/utils/image_utils.d.ts +18 -0
package/dist/utils/image_utils.d.ts.map +1 -0
package/dist/utils/image_utils.js +132 -0
package/dist/utils/image_utils.js.map +1 -0
package/dist/utils/llm_logger.d.ts +8 -0
package/dist/utils/llm_logger.d.ts.map +1 -0
package/dist/utils/llm_logger.js +24 -0
package/dist/utils/llm_logger.js.map +1 -0
package/dist/utils/quota_tracker.d.ts +22 -0
package/dist/utils/quota_tracker.d.ts.map +1 -0
package/dist/utils/quota_tracker.js +338 -0
package/dist/utils/quota_tracker.js.map +1 -0
package/dist/utils/stream_converter.d.ts +19 -0
package/dist/utils/stream_converter.d.ts.map +1 -0
package/dist/utils/stream_converter.js +172 -0
package/dist/utils/stream_converter.js.map +1 -0
package/dist/validation.d.ts +1789 -0
package/dist/validation.d.ts.map +1 -0
package/dist/validation.js +289 -0
package/dist/validation.js.map +1 -0
package/dist/vitest.config.d.ts +3 -0
package/dist/vitest.config.d.ts.map +1 -0
package/dist/vitest.config.js +34 -0
package/dist/vitest.config.js.map +1 -0
package/package.json +86 -0

package/dist/model_data.js ADDED Viewed

@@ -0,0 +1,1070 @@
+import { getExternalModel } from './external_models.js';
+export const MODEL_CLASSES = {
+    standard: {
+        models: [
+            'gpt-4.1',
+            'gemini-2.5-flash-preview-05-20-low',
+            'claude-3-5-haiku-latest',
+            'grok-3-mini-fast',
+            'deepseek-chat',
+        ],
+        random: true,
+    },
+    mini: {
+        models: [
+            'gpt-4.1-nano',
+            'claude-3-5-haiku-latest',
+            'gemini-2.0-flash-lite',
+            'grok-3-mini',
+            'meta-llama/llama-4-scout',
+            'mistral/ministral-8b',
+        ],
+        random: true,
+    },
+    reasoning: {
+        models: [
+            'gemini-2.5-pro-preview-05-06',
+            'gemini-2.5-flash-preview-05-20-max',
+            'o4-mini-high',
+            'o3-high',
+            'claude-3-7-sonnet-latest',
+        ],
+        random: true,
+    },
+    reasoning_mini: {
+        models: [
+            'gemini-2.5-flash-preview-05-20-medium',
+            'grok-3-mini-fast',
+        ],
+        random: true,
+    },
+    monologue: {
+        models: [
+            'gemini-2.5-pro-preview-05-06',
+            'gemini-2.5-flash-preview-05-20-medium',
+            'o4-mini-low',
+            'o3-low',
+            'claude-3-7-sonnet-latest',
+            'grok-3-mini-fast',
+        ],
+        random: true,
+    },
+    metacognition: {
+        models: [
+            'gemini-2.5-pro-preview-05-06',
+            'gemini-2.5-flash-preview-05-20-high',
+            'o3-medium',
+            'claude-3-7-sonnet-latest',
+            'grok-3-mini-fast',
+        ],
+        random: true,
+    },
+    code: {
+        models: [
+            'claude-3-7-sonnet-latest',
+            'gpt-4.1',
+            'gemini-2.5-flash-preview-05-20-medium',
+        ],
+        random: true,
+    },
+    writing: {
+        models: [
+            'gemini-2.5-flash-preview-05-20-low',
+            'gpt-4.1-mini',
+        ],
+        random: true,
+    },
+    summary: {
+        models: [
+            'gemini-2.5-flash-preview-05-20-low',
+            'gpt-4.1-mini',
+        ],
+        random: true,
+    },
+    vision: {
+        models: [
+            'o4-mini-medium',
+            'o3-low',
+            'gemini-2.5-flash-preview-05-20-max',
+            'gemini-2.5-pro-preview-05-06',
+            'claude-3-7-sonnet-latest',
+        ],
+        random: true,
+    },
+    vision_mini: {
+        models: [
+            'gpt-4.1-mini',
+            'gemini-2.5-flash-preview-05-20-low',
+        ],
+        random: true,
+    },
+    search: {
+        models: [
+            'gpt-4.1',
+            'deepseek-reasoner',
+            'gemini-2.5-flash-preview-05-20',
+            'perplexity/sonar-deep-research',
+        ],
+        random: true,
+    },
+    image_generation: {
+        models: ['gpt-image-1'],
+    },
+    embedding: {
+        models: [
+            'gemini-embedding-exp-03-07',
+            'text-embedding-3-small',
+        ],
+        description: 'Vector embedding models for semantic search and RAG',
+    },
+};
+export const EMBEDDING_DIMENSIONS = {
+    'text-embedding-3-small': 1536,
+    'text-embedding-3-large': 3072,
+    'gemini-embedding-exp-03-07': 768,
+};
+export const MODEL_REGISTRY = [
+    {
+        id: 'text-embedding-3-small',
+        provider: 'openai',
+        cost: {
+            input_per_million: 0.02,
+            output_per_million: 0,
+        },
+        features: {
+            input_modality: ['text'],
+            output_modality: ['embedding'],
+        },
+        embedding: true,
+        dim: 1536,
+        class: 'embedding',
+        description: "OpenAI's small embedding model, good balance of performance and cost",
+    },
+    {
+        id: 'text-embedding-3-large',
+        provider: 'openai',
+        cost: {
+            input_per_million: 0.13,
+            output_per_million: 0,
+        },
+        features: {
+            input_modality: ['text'],
+            output_modality: ['embedding'],
+        },
+        embedding: true,
+        dim: 3072,
+        class: 'embedding',
+        description: "OpenAI's large embedding model, good balance of performance and cost",
+    },
+    {
+        id: 'gemini-embedding-exp-03-07',
+        provider: 'google',
+        cost: {
+            input_per_million: 0,
+            output_per_million: 0,
+        },
+        features: {
+            input_modality: ['text'],
+            output_modality: ['embedding'],
+        },
+        embedding: true,
+        dim: 768,
+        class: 'embedding',
+        description: "Google's experimental embedding model optimized for semantic similarity",
+    },
+    {
+        id: 'meta-llama/llama-4-maverick',
+        provider: 'openrouter',
+        cost: {
+            input_per_million: 0.18,
+            output_per_million: 0.6,
+        },
+        features: {
+            context_length: 1048576,
+            input_modality: ['text', 'image'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'standard',
+        score: 78,
+        scores: {
+            monologue: 72,
+            code: 64,
+            reasoning: 56,
+        },
+        description: 'Llama 4 Maverick 17B Instruct (128E) is a high-capacity multimodal language model from Meta, built on a mixture-of-experts (MoE) architecture with 128 experts and 17 billion active parameters per forward pass (400B total).',
+    },
+    {
+        id: 'meta-llama/llama-4-scout',
+        provider: 'openrouter',
+        cost: {
+            input_per_million: 0.08,
+            output_per_million: 0.3,
+        },
+        features: {
+            context_length: 327680,
+            input_modality: ['text'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'mini',
+        score: 65,
+        description: 'Llama 4 Scout 17B Instruct (16E) is a mixture-of-experts (MoE) language model developed by Meta, activating 17 billion parameters out of a total of 109B.',
+    },
+    {
+        id: 'qwen/qwen3-235b-a22b',
+        aliases: [
+            'qwen/qwen3-235b-a22b-low',
+            'qwen/qwen3-235b-a22b-medium',
+            'qwen/qwen3-235b-a22b-high',
+        ],
+        provider: 'openrouter',
+        cost: {
+            input_per_million: 0.1,
+            output_per_million: 0.1,
+        },
+        features: {
+            context_length: 40960,
+            input_modality: ['text'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'reasoning',
+        score: 83,
+        scores: {
+            monologue: 73,
+            code: 62,
+            reasoning: 57,
+        },
+        description: 'Qwen3-235B-A22B is a 235B parameter mixture-of-experts (MoE) model developed by Qwen, activating 22B parameters per forward pass.',
+    },
+    {
+        id: 'qwen/qwen-max',
+        provider: 'openrouter',
+        cost: {
+            input_per_million: 1.6,
+            output_per_million: 6.4,
+        },
+        features: {
+            context_length: 131072,
+            input_modality: ['text', 'image'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'reasoning',
+        score: 80,
+        scores: {
+            monologue: 73,
+            code: 61,
+            reasoning: 57,
+        },
+        description: 'Qwen-Max, based on Qwen2.5, provides the best inference performance among Qwen models, especially for complex multi-step tasks.',
+    },
+    {
+        id: 'mistral/ministral-8b',
+        provider: 'openrouter',
+        cost: {
+            input_per_million: 0.1,
+            output_per_million: 0.1,
+        },
+        features: {
+            context_length: 131072,
+            input_modality: ['text'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'standard',
+        score: 55,
+        description: 'Ministral 8B is a state-of-the-art language model optimized for on-device and edge computing. Designed for efficiency in knowledge-intensive tasks, commonsense reasoning, and function-calling.',
+    },
+    {
+        id: 'grok-3',
+        aliases: ['grok-3-2025-02-11'],
+        provider: 'xai',
+        cost: {
+            input_per_million: 3.0,
+            output_per_million: 15.0,
+        },
+        features: {
+            context_length: 131_072,
+            input_modality: ['text', 'image'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'standard',
+        score: 78,
+        scores: {
+            monologue: 80,
+            code: 70,
+            reasoning: 65,
+        },
+        description: 'Flagship Grok-3 model for complex reasoning and generation',
+    },
+    {
+        id: 'grok-3-fast',
+        aliases: ['grok-3-fast-2025-04-11'],
+        provider: 'xai',
+        cost: {
+            input_per_million: 5.0,
+            output_per_million: 25.0,
+        },
+        features: {
+            context_length: 131_072,
+            input_modality: ['text', 'image'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'standard',
+        score: 78,
+        scores: {
+            monologue: 80,
+            code: 70,
+            reasoning: 65,
+        },
+        description: 'Same Grok-3 weights on premium infra for lower latency',
+    },
+    {
+        id: 'grok-3-mini',
+        aliases: ['grok-3-mini-2025-04-11'],
+        provider: 'xai',
+        cost: {
+            input_per_million: 0.3,
+            output_per_million: 0.5,
+        },
+        features: {
+            context_length: 131_072,
+            input_modality: ['text', 'image'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'mini',
+        score: 60,
+        scores: {
+            monologue: 62,
+            code: 55,
+            reasoning: 50,
+        },
+        description: 'Lightweight Grok-3 Mini—budget model for logic tasks',
+    },
+    {
+        id: 'grok-3-mini-fast',
+        aliases: ['grok-3-mini-fast-2025-04-11'],
+        provider: 'xai',
+        cost: {
+            input_per_million: 0.6,
+            output_per_million: 4.0,
+        },
+        features: {
+            context_length: 131_072,
+            input_modality: ['text', 'image'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'mini',
+        score: 60,
+        scores: {
+            monologue: 62,
+            code: 55,
+            reasoning: 50,
+        },
+        description: 'Grok-3 Mini on accelerated hardware for latency-critical use',
+    },
+    {
+        id: 'gpt-4.1',
+        aliases: ['gpt-4.1-2025-04-14'],
+        provider: 'openai',
+        cost: {
+            input_per_million: 2.0,
+            cached_input_per_million: 0.5,
+            output_per_million: 8.0,
+        },
+        features: {
+            context_length: 1048576,
+            input_modality: ['text', 'image'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'standard',
+        score: 82,
+        scores: {
+            monologue: 86,
+            code: 83,
+            reasoning: 71,
+        },
+        description: 'Flagship GPT model for complex tasks',
+    },
+    {
+        id: 'gpt-4.1-mini',
+        aliases: ['gpt-4.1-mini-2025-04-14'],
+        provider: 'openai',
+        cost: {
+            input_per_million: 0.4,
+            cached_input_per_million: 0.1,
+            output_per_million: 1.6,
+        },
+        features: {
+            context_length: 1048576,
+            input_modality: ['text', 'image'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'mini',
+        score: 75,
+        description: 'Balanced for intelligence, speed, and cost',
+    },
+    {
+        id: 'gpt-4.1-nano',
+        aliases: ['gpt-4.1-nano-2025-04-14'],
+        provider: 'openai',
+        cost: {
+            input_per_million: 0.1,
+            cached_input_per_million: 0.025,
+            output_per_million: 0.4,
+        },
+        features: {
+            context_length: 1048576,
+            input_modality: ['text', 'image'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'mini',
+        score: 60,
+        description: 'Fastest, most cost-effective GPT-4.1 model',
+    },
+    {
+        id: 'gpt-4.5-preview',
+        aliases: ['gpt-4.5-preview-2025-02-27'],
+        provider: 'openai',
+        cost: {
+            input_per_million: 75.0,
+            cached_input_per_million: 37.5,
+            output_per_million: 150.0,
+        },
+        features: {
+            context_length: 128000,
+            input_modality: ['text', 'image'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'standard',
+        description: 'Latest premium GPT model from OpenAI',
+    },
+    {
+        id: 'gpt-4o',
+        aliases: ['gpt-4o-2024-08-06'],
+        provider: 'openai',
+        cost: {
+            input_per_million: 2.5,
+            cached_input_per_million: 1.25,
+            output_per_million: 10.0,
+        },
+        features: {
+            context_length: 128000,
+            input_modality: ['text', 'image', 'audio'],
+            output_modality: ['text', 'audio'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'standard',
+        score: 80,
+        description: 'OpenAI standard model with multimodal capabilities',
+    },
+    {
+        id: 'gpt-4o-mini',
+        aliases: ['gpt-4o-mini-2024-07-18'],
+        provider: 'openai',
+        cost: {
+            input_per_million: 0.15,
+            cached_input_per_million: 0.075,
+            output_per_million: 0.6,
+        },
+        features: {
+            context_length: 128000,
+            input_modality: ['text', 'image', 'audio'],
+            output_modality: ['text', 'audio'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'mini',
+        score: 65,
+        scores: {
+            monologue: 70,
+            code: 63,
+            reasoning: 60,
+        },
+        description: 'Smaller, faster version of GPT-4o',
+    },
+    {
+        id: 'gpt-4o-search-preview',
+        aliases: ['gpt-4o-search-preview-2025-03-11'],
+        provider: 'openai',
+        cost: {
+            input_per_million: 2.5,
+            output_per_million: 10.0,
+        },
+        features: {
+            context_length: 128000,
+            input_modality: ['text', 'image'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'search',
+        description: 'GPT-4o with built-in search capabilities',
+    },
+    {
+        id: 'gpt-4o-mini-search-preview',
+        aliases: ['gpt-4o-mini-search-preview-2025-03-11'],
+        provider: 'openai',
+        cost: {
+            input_per_million: 0.15,
+            output_per_million: 0.6,
+        },
+        features: {
+            context_length: 128000,
+            input_modality: ['text', 'image'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'search',
+        description: 'Smaller GPT-4o with built-in search capabilities',
+    },
+    {
+        id: 'o4-mini',
+        aliases: [
+            'o4-mini-2025-04-16',
+            'o4-mini-low',
+            'o4-mini-medium',
+            'o4-mini-high',
+        ],
+        provider: 'openai',
+        cost: {
+            input_per_million: 1.1,
+            cached_input_per_million: 0.275,
+            output_per_million: 4.4,
+        },
+        features: {
+            context_length: 200000,
+            input_modality: ['text', 'image'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'reasoning',
+        score: 80,
+        scores: {
+            monologue: 85,
+            code: 82,
+            reasoning: 76,
+        },
+        description: 'Faster, more affordable reasoning model',
+    },
+    {
+        id: 'o3',
+        aliases: ['o3-2025-04-16', 'o3-low', 'o3-medium', 'o3-high'],
+        provider: 'openai',
+        cost: {
+            input_per_million: 10,
+            cached_input_per_million: 2.5,
+            output_per_million: 40,
+        },
+        features: {
+            context_length: 200000,
+            input_modality: ['text', 'image'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'reasoning',
+        score: 85,
+        scores: {
+            monologue: 87,
+            code: 84,
+            reasoning: 79,
+        },
+        description: 'Powerful reasoning model (superseded by o1-pro)',
+    },
+    {
+        id: 'o1',
+        aliases: ['o1-2024-12-17'],
+        provider: 'openai',
+        cost: {
+            input_per_million: 15.0,
+            cached_input_per_million: 7.5,
+            output_per_million: 60.0,
+        },
+        features: {
+            context_length: 200000,
+            input_modality: ['text', 'image'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'reasoning',
+        description: 'Advanced reasoning model from OpenAI',
+    },
+    {
+        id: 'o1-pro',
+        aliases: ['o1-pro-2025-03-19'],
+        provider: 'openai',
+        cost: {
+            input_per_million: 150.0,
+            output_per_million: 600.0,
+        },
+        features: {
+            context_length: 200000,
+            input_modality: ['text', 'image'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: false,
+            json_output: true,
+        },
+        class: 'reasoning',
+        score: 90,
+        description: 'Premium O-series model from OpenAI, highest reasoning capability',
+    },
+    {
+        id: 'o3-mini',
+        aliases: ['o3-mini-2025-01-31', 'o1-mini', 'o1-mini-2024-09-12'],
+        provider: 'openai',
+        cost: {
+            input_per_million: 1.1,
+            cached_input_per_million: 0.55,
+            output_per_million: 4.4,
+        },
+        features: {
+            context_length: 200000,
+            input_modality: ['text', 'image'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'reasoning',
+        score: 70,
+        description: 'Smaller O-series model with reasoning capabilities',
+    },
+    {
+        id: 'computer-use-preview',
+        aliases: ['computer-use-preview-2025-03-11'],
+        provider: 'openai',
+        cost: {
+            input_per_million: 3.0,
+            output_per_million: 12.0,
+        },
+        features: {
+            input_modality: ['text', 'image'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'vision',
+        description: 'Model that can understand and control computer interfaces',
+    },
+    {
+        id: 'claude-3-7-sonnet-latest',
+        aliases: ['claude-3-7-sonnet'],
+        provider: 'anthropic',
+        cost: {
+            input_per_million: 3.0,
+            output_per_million: 15.0,
+            cached_input_per_million: 0.3,
+        },
+        features: {
+            context_length: 200000,
+            input_modality: ['text', 'image'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+            max_output_tokens: 64000,
+        },
+        class: 'reasoning',
+        score: 85,
+        scores: {
+            monologue: 83,
+            code: 77,
+            reasoning: 69,
+        },
+        description: 'Latest Claude model with strong reasoning capabilities (extended thinking internal)',
+    },
+    {
+        id: 'claude-3-5-haiku-latest',
+        aliases: ['claude-3-5-haiku'],
+        provider: 'anthropic',
+        cost: {
+            input_per_million: 0.8,
+            output_per_million: 4.0,
+            cached_input_per_million: 0.08,
+        },
+        features: {
+            context_length: 200000,
+            input_modality: ['text', 'image'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+            max_output_tokens: 8192,
+        },
+        class: 'mini',
+        score: 70,
+        scores: {
+            monologue: 66,
+            code: 63,
+            reasoning: 55,
+        },
+        description: 'Fast, cost-effective Claude model',
+    },
+    {
+        id: 'claude-cli',
+        provider: 'anthropic',
+        cost: {
+            input_per_million: 3.0,
+            output_per_million: 15.0,
+            cached_input_per_million: 0.3,
+        },
+        features: {
+            context_length: 200000,
+            input_modality: ['text', 'image'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'reasoning',
+        description: 'Claude accessed via CLI (likely uses latest Sonnet or Haiku model)',
+    },
+    {
+        id: 'gemini-2.5-pro-exp-03-25',
+        provider: 'google',
+        cost: {
+            input_per_million: 0,
+            output_per_million: 0,
+            cached_input_per_million: 0,
+        },
+        features: {
+            context_length: 1048576,
+            input_modality: ['text', 'image', 'video', 'audio'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+            max_output_tokens: 65536,
+        },
+        rate_limit_fallback: 'gemini-2.5-pro-preview-05-06',
+        class: 'reasoning',
+        score: 85,
+        scores: {
+            monologue: 78,
+            code: 70,
+            reasoning: 66,
+        },
+        description: 'Free experimental version of Gemini 2.5 Pro. Excels at coding & complex reasoning.',
+    },
+    {
+        id: 'gemini-2.5-pro-preview-05-06',
+        aliases: ['gemini-2.5-pro'],
+        provider: 'google',
+        cost: {
+            input_per_million: {
+                threshold_tokens: 200000,
+                price_below_threshold_per_million: 1.25,
+                price_above_threshold_per_million: 2.5,
+            },
+            output_per_million: {
+                threshold_tokens: 200000,
+                price_below_threshold_per_million: 10.0,
+                price_above_threshold_per_million: 15.0,
+            },
+        },
+        features: {
+            context_length: 1048576,
+            input_modality: ['text', 'image', 'video', 'audio'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+            max_output_tokens: 65536,
+        },
+        class: 'reasoning',
+        score: 80,
+        description: 'Paid preview of Gemini 2.5 Pro. State-of-the-art multipurpose model.',
+    },
+    {
+        id: 'gemini-2.5-flash-preview-05-20',
+        aliases: [
+            'gemini-2.5-flash',
+            'gemini-2.5-flash-preview-04-17',
+            'gemini-2.5-flash-preview-05-20-low',
+            'gemini-2.5-flash-preview-05-20-medium',
+            'gemini-2.5-flash-preview-05-20-high',
+            'gemini-2.5-flash-preview-05-20-max',
+        ],
+        provider: 'google',
+        cost: {
+            input_per_million: 0.15,
+            output_per_million: 3.5,
+        },
+        features: {
+            context_length: 1048576,
+            input_modality: ['text', 'image', 'video', 'audio'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+            max_output_tokens: 65536,
+        },
+        class: 'reasoning',
+        score: 75,
+        scores: {
+            monologue: 12,
+            code: 63,
+            reasoning: 78,
+        },
+        description: 'Balanced multimodal model with large context, built for Agents.',
+    },
+    {
+        id: 'gemini-2.0-flash-lite',
+        provider: 'google',
+        cost: {
+            input_per_million: 0.075,
+            output_per_million: 0.3,
+        },
+        features: {
+            context_length: 1048576,
+            input_modality: ['text', 'image', 'video', 'audio'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+            max_output_tokens: 8192,
+        },
+        class: 'standard',
+        score: 75,
+        scores: {
+            monologue: 70,
+            code: 55,
+            reasoning: 56,
+        },
+        description: 'Lite multimodal model with large context, built for Agents.',
+    },
+    {
+        id: 'gemini-2.0-flash',
+        provider: 'google',
+        cost: {
+            input_per_million: 0.1,
+            output_per_million: 0.4,
+            cached_input_per_million: 0.025,
+        },
+        features: {
+            context_length: 1048576,
+            input_modality: ['text', 'image', 'video', 'audio'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+            max_output_tokens: 8192,
+        },
+        class: 'standard',
+        score: 75,
+        scores: {
+            monologue: 70,
+            code: 55,
+            reasoning: 56,
+        },
+        description: 'Balanced multimodal model with large context, built for Agents.',
+    },
+    {
+        id: 'gpt-image-1',
+        provider: 'openai',
+        cost: {
+            per_image: 0.042,
+        },
+        features: {
+            input_modality: ['text', 'image'],
+            output_modality: ['image'],
+            streaming: false,
+        },
+        class: 'image_generation',
+        description: "OpenAI's GPT-Image-1 model for text-to-image generation. Supports quality levels (low: $0.011-0.016, medium: $0.042-0.063, high: $0.167-0.25) and sizes (1024x1024, 1024x1536, 1536x1024).",
+    },
+    {
+        id: 'codex-mini-latest',
+        provider: 'openai',
+        cost: {
+            input_per_million: 1.5,
+            cached_input_per_million: 0.375,
+            output_per_million: 6.0,
+        },
+        features: {
+            context_length: 200000,
+            max_output_tokens: 100000,
+            input_modality: ['text', 'image'],
+            output_modality: ['text'],
+            tool_use: false,
+            streaming: true,
+            json_output: true,
+            reasoning_output: true,
+        },
+        class: 'code',
+        description: 'Fine-tuned o4-mini model for Codex CLI with reasoning token support',
+    },
+    {
+        id: 'perplexity/sonar',
+        provider: 'openrouter',
+        cost: {
+            input_per_million: 1.0,
+            output_per_million: 1.0,
+        },
+        features: {
+            context_length: 32768,
+            input_modality: ['text'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'search',
+        description: 'Lightweight, cost-effective search model designed for quick, grounded answers.',
+    },
+    {
+        id: 'perplexity/sonar-pro',
+        provider: 'openrouter',
+        cost: {
+            input_per_million: 3.0,
+            output_per_million: 15.0,
+        },
+        features: {
+            context_length: 32768,
+            input_modality: ['text'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'search',
+        description: 'Advanced search model optimized for complex queries and deeper content understanding.',
+    },
+    {
+        id: 'perplexity/sonar-reasoning',
+        provider: 'openrouter',
+        cost: {
+            input_per_million: 1.0,
+            output_per_million: 5.0,
+        },
+        features: {
+            context_length: 32768,
+            input_modality: ['text'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'reasoning_mini',
+        description: 'Quick problem-solving and reasoning model, ideal for evaluating complex queries.',
+    },
+    {
+        id: 'perplexity/sonar-reasoning-pro',
+        provider: 'openrouter',
+        cost: {
+            input_per_million: 2.0,
+            output_per_million: 8.0,
+        },
+        features: {
+            context_length: 32768,
+            input_modality: ['text'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'reasoning',
+        description: 'Enhanced reasoning model with multi-step problem-solving capabilities and real-time search.',
+    },
+    {
+        id: 'perplexity/sonar-deep-research',
+        provider: 'openrouter',
+        cost: {
+            input_per_million: 2.0,
+            output_per_million: 8.0,
+        },
+        features: {
+            context_length: 32768,
+            input_modality: ['text'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'search',
+        description: 'Best suited for exhaustive research, generating detailed reports and in-depth insights.',
+    },
+    {
+        id: 'test-model',
+        provider: 'test',
+        cost: {
+            input_per_million: 0,
+            output_per_million: 0,
+        },
+        features: {
+            context_length: 8192,
+            input_modality: ['text'],
+            output_modality: ['text'],
+            tool_use: true,
+            streaming: true,
+            json_output: true,
+        },
+        class: 'standard',
+        scores: {
+            monologue: 50,
+            code: 50,
+            reasoning: 50,
+        },
+        description: 'Test model for unit testing purposes',
+    },
+];
+export function findModel(modelId) {
+    const externalModel = getExternalModel(modelId);
+    if (externalModel)
+        return externalModel;
+    const directMatch = MODEL_REGISTRY.find(model => model.id === modelId);
+    if (directMatch)
+        return directMatch;
+    return MODEL_REGISTRY.find(model => model.aliases?.includes(modelId));
+}
+//# sourceMappingURL=model_data.js.map