npm - @voria/cli - Versions diffs - 0.0.3 → 0.0.4 - Mend

@voria/cli 0.0.3 → 0.0.4

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (4) hide show

package/README.md +1 -1
package/bin/voria +17 -2
package/package.json +1 -1
package/python/voria/core/llm/model_discovery.py +82 -175

package/README.md CHANGED Viewed

@@ -1,6 +1,6 @@
 # voria
-🚀 **AI-Powered Bug Fixing Tool**
+ **AI-Powered Bug Fixing Tool**
 voria is a CLI tool that automatically fixes bugs and implements features in your codebase. Describe an issue or provide a GitHub issue number, and voria will generate a fix, test it, iterate on failures, and create a pull request - all automatically.

package/bin/voria CHANGED Viewed

@@ -131,7 +131,19 @@ function saveConfig(config, isGlobal = true) {
   fs.writeFileSync(file, JSON.stringify(config, null, 2));
 }
-// Interactive setup
+/**
+ * Dynamically fetch models for a provider using Python backend
+ */
+function fetchModels(provider, apiKey) {
+  try {
+    const scriptPath = path.join(__dirname, '..', 'python', 'voria', 'core', 'llm', 'model_discovery.py');
+    const output = execSync(`python3 "${scriptPath}" "${provider}" "${apiKey}"`, { encoding: 'utf8', stdio: ['pipe', 'pipe', 'ignore'] });
+    return JSON.parse(output);
+  } catch (e) {
+    return [];
+  }
+}
 // Interactive setup
 async function runSetup() {
   const rl = readline.createInterface({ input: process.stdin, output: process.stdout });
@@ -170,8 +182,11 @@ async function runSetup() {
       return;
     }
+    console.log(`\n${colors.dim("   Fetching latest models...")}`);
+    const fetchedModels = fetchModels(provider, apiKey);
+    const models = fetchedModels.length > 0 ? fetchedModels.map(m => m.name) : (PROVIDER_MODELS[provider] || ['gpt-4o']);
     console.log(`\n${colors.bold("Select Model:")}`);
-    const models = PROVIDER_MODELS[provider] || ['default'];
     models.forEach((model, index) => {
       console.log(`  ${colors.blue((index + 1) + ")")} ${model}`);
     });

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@voria/cli",
-  "version": "0.0.3",
+  "version": "0.0.4",
   "description": "AI-powered CLI tool for automated bug fixing - initialize with voria --init",
   "main": "bin/voria",
   "type": "module",

package/python/voria/core/llm/model_discovery.py CHANGED Viewed

@@ -5,9 +5,10 @@ Fetches available models at runtime based on API keys.
 import asyncio
 import httpx
-from dataclasses import dataclass
+from dataclasses import dataclass, asdict
 from typing import List, Optional
 import logging
+import json
 logger = logging.getLogger(__name__)
@@ -26,6 +27,36 @@ class ModelInfo:
 class ModelDiscovery:
     """Fetch available models from LLM providers."""
+    @staticmethod
+    async def fetch_generic_openai_compatible(api_key: str, base_url: str, provider_name: str) -> List[ModelInfo]:
+        """Fetch models from an OpenAI-compatible API."""
+        try:
+            async with httpx.AsyncClient() as client:
+                response = await client.get(
+                    f"{base_url.rstrip('/')}/models",
+                    headers={"Authorization": f"Bearer {api_key}"},
+                    timeout=10.0,
+                )
+                if response.status_code == 200:
+                    data = response.json()
+                    models = []
+                    for model in data.get("data", []):
+                        model_id = model.get("id", "")
+                        models.append(
+                            ModelInfo(
+                                name=model_id,
+                                display_name=model_id,
+                                description=f"{provider_name} Model",
+                            )
+                        )
+                    return models
+                else:
+                    logger.warning(f"{provider_name} API returned {response.status_code}")
+                    return []
+        except Exception as e:
+            logger.warning(f"Failed to fetch {provider_name} models: {e}")
+            return []
     @staticmethod
     async def fetch_modal_models(api_key: str) -> List[ModelInfo]:
         """Fetch available models from Modal Z.ai API."""
@@ -39,7 +70,6 @@ class ModelDiscovery:
                 if response.status_code == 200:
                     data = response.json()
                     models = []
-                    # Modal returns model data in "data" key
                     for model in data.get("data", []):
                         models.append(
                             ModelInfo(
@@ -49,34 +79,16 @@ class ModelDiscovery:
                                 description=f"Modal Z.ai - {model.get('created', 'N/A')}",
                             )
                         )
-                    return (
-                        models if models else await ModelDiscovery._get_modal_fallback()
-                    )
-                else:
-                    logger.warning(
-                        f"Modal API returned {response.status_code}, using fallback models"
-                    )
-                    return await ModelDiscovery._get_modal_fallback()
-        except Exception as e:
-            logger.warning(f"Failed to fetch Modal models: {e}, using fallback")
+                    return models if models else await ModelDiscovery._get_modal_fallback()
+                return await ModelDiscovery._get_modal_fallback()
+        except Exception:
             return await ModelDiscovery._get_modal_fallback()
     @staticmethod
     async def _get_modal_fallback() -> List[ModelInfo]:
-        """Fallback models for Modal when API unavailable."""
         return [
-            ModelInfo(
-                name="zai-org/GLM-5.1-FP8",
-                display_name="GLM-5.1-FP8 (745B, Latest)",
-                max_tokens=4096,
-                description="Latest Modal Z.ai model - 745B parameters",
-            ),
-            ModelInfo(
-                name="zai-org/GLM-4",
-                display_name="GLM-4 (370B, Legacy)",
-                max_tokens=2048,
-                description="Previous generation Modal model",
-            ),
+            ModelInfo(name="zai-org/GLM-5.1-FP8", display_name="GLM-5.1-FP8 (Latest)"),
+            ModelInfo(name="zai-org/GLM-4", display_name="GLM-4 (Legacy)"),
         ]
     @staticmethod
@@ -92,81 +104,26 @@ class ModelDiscovery:
                 if response.status_code == 200:
                     data = response.json()
                     models = []
-                    # Filter to only gpt models suitable for text generation
-                    suitable_models = {
-                        "gpt-4o",
-                        "gpt-4-turbo",
-                        "gpt-4",
-                        "gpt-3.5-turbo",
-                    }
+                    suitable_prefixes = {"gpt-4", "gpt-3.5", "o1-"}
                     for model in data.get("data", []):
                         model_id = model.get("id", "")
-                        # Match by prefix or exact name
-                        if any(
-                            model_id.startswith(prefix) for prefix in suitable_models
-                        ):
-                            models.append(
-                                ModelInfo(
-                                    name=model_id,
-                                    display_name=model_id,
-                                    description=f"OpenAI - {model.get('owned_by', 'N/A')}",
-                                )
-                            )
-                    # Sort by recency (gpt-4o > gpt-4-turbo > gpt-4 > gpt-3.5-turbo)
-                    return (
-                        sorted(
-                            models,
-                            key=lambda x: (
-                                not x.name.startswith("gpt-4o"),
-                                not x.name.startswith("gpt-4-turbo"),
-                                not x.name.startswith("gpt-4"),
-                            ),
-                        )
-                        if models
-                        else await ModelDiscovery._get_openai_fallback()
-                    )
-                else:
-                    logger.warning(
-                        f"OpenAI API returned {response.status_code}, using fallback models"
-                    )
-                    return await ModelDiscovery._get_openai_fallback()
-        except Exception as e:
-            logger.warning(f"Failed to fetch OpenAI models: {e}, using fallback")
+                        if any(model_id.startswith(p) for p in suitable_prefixes):
+                            models.append(ModelInfo(name=model_id, display_name=model_id))
+                    return models if models else await ModelDiscovery._get_openai_fallback()
+                return await ModelDiscovery._get_openai_fallback()
+        except Exception:
             return await ModelDiscovery._get_openai_fallback()
     @staticmethod
     async def _get_openai_fallback() -> List[ModelInfo]:
-        """Fallback models for OpenAI when API unavailable."""
         return [
-            ModelInfo(
-                name="gpt-5.4",
-                display_name="GPT-5.4 (Latest Frontier)",
-                max_tokens=128000,
-                description="Best intelligence at scale for agentic, coding, and professional workflows. $2.50 input, $15 output per 1M tokens",
-            ),
-            ModelInfo(
-                name="gpt-5.4-mini",
-                display_name="GPT-5.4-mini (Mini Model)",
-                max_tokens=128000,
-                description="Strongest mini model yet for coding, computer use, and agentic tasks. $0.75 input, $4.50 output per 1M tokens",
-            ),
-            ModelInfo(
-                name="gpt-5.4-nano",
-                display_name="GPT-5.4-nano (Cheapest)",
-                max_tokens=128000,
-                description="Cheapest GPT-5.4-class model for simple high-volume tasks. $0.20 input, $1.25 output per 1M tokens",
-            ),
-            ModelInfo(
-                name="gpt-4o",
-                display_name="GPT-4o (Previous High Quality)",
-                max_tokens=128000,
-                description="Previous latest model - optimized for speed and cost",
-            ),
+            ModelInfo(name="gpt-4o", display_name="GPT-4o"),
+            ModelInfo(name="gpt-4o-mini", display_name="GPT-4o-mini"),
+            ModelInfo(name="o1-preview", display_name="o1-preview"),
         ]
     @staticmethod
     async def fetch_gemini_models(api_key: str) -> List[ModelInfo]:
-        """Fetch available models from Google Gemini API."""
         try:
             async with httpx.AsyncClient() as client:
                 response = await client.get(
@@ -176,106 +133,33 @@ class ModelDiscovery:
                 if response.status_code == 200:
                     data = response.json()
                     models = []
-                    # Filter to generative models
                     for model in data.get("models", []):
-                        model_name = model.get("name", "").replace("models/", "")
-                        if "gemini" in model_name.lower():
-                            models.append(
-                                ModelInfo(
-                                    name=model_name,
-                                    display_name=model_name,
-                                    description=f"Google Gemini - {model.get('displayName', 'N/A')}",
-                                )
-                            )
-                    return (
-                        models
-                        if models
-                        else await ModelDiscovery._get_gemini_fallback()
-                    )
-                else:
-                    logger.warning(
-                        f"Gemini API returned {response.status_code}, using fallback models"
-                    )
-                    return await ModelDiscovery._get_gemini_fallback()
-        except Exception as e:
-            logger.warning(f"Failed to fetch Gemini models: {e}, using fallback")
+                        name = model.get("name", "").replace("models/", "")
+                        if "gemini" in name.lower():
+                            models.append(ModelInfo(name=name, display_name=name))
+                    return models if models else await ModelDiscovery._get_gemini_fallback()
+                return await ModelDiscovery._get_gemini_fallback()
+        except Exception:
             return await ModelDiscovery._get_gemini_fallback()
     @staticmethod
     async def _get_gemini_fallback() -> List[ModelInfo]:
-        """Fallback models for Gemini when API unavailable."""
         return [
-            ModelInfo(
-                name="gemini-3.1-pro",
-                display_name="Gemini 3.1 Pro (Latest SOTA Reasoning)",
-                max_tokens=200000,
-                description="Latest SOTA reasoning model with unprecedented depth and nuance. $2 input, $12 output per context window",
-            ),
-            ModelInfo(
-                name="gemini-3-flash",
-                display_name="Gemini 3 Flash (Latest, Fastest)",
-                max_tokens=200000,
-                description="Most intelligent model built for speed, combining frontier intelligence with superior search and grounding",
-            ),
-            ModelInfo(
-                name="gemini-3.1-flash-lite",
-                display_name="Gemini 3.1 Flash Lite (Cheapest)",
-                max_tokens=200000,
-                description="Most cost-efficient model, optimized for high-volume agentic tasks. $0.25 input, $1.50 output",
-            ),
-            ModelInfo(
-                name="gemini-2.0-flash",
-                display_name="Gemini 2.0 Flash (Previous)",
-                max_tokens=2000,
-                description="Previous generation Gemini model",
-            ),
+            ModelInfo(name="gemini-1.5-pro", display_name="Gemini 1.5 Pro"),
+            ModelInfo(name="gemini-1.5-flash", display_name="Gemini 1.5 Flash"),
         ]
     @staticmethod
     async def fetch_claude_models(api_key: str) -> List[ModelInfo]:
-        """Fetch available models from Anthropic Claude API."""
-        try:
-            async with httpx.AsyncClient() as client:
-                # Claude doesn't have a public models endpoint, use documented models
-                # Make a test call to verify API key works
-                response = await client.get(
-                    "https://api.anthropic.com/v1/models",
-                    headers={"x-api-key": api_key},
-                    timeout=10.0,
-                )
-                # If we get here, API key works - return known models
-                return await ModelDiscovery._get_claude_fallback()
-        except Exception as e:
-            logger.warning(f"Failed to verify Claude API: {e}, returning known models")
-            return await ModelDiscovery._get_claude_fallback()
-    @staticmethod
-    async def _get_claude_fallback() -> List[ModelInfo]:
-        """Known Claude models (Anthropic doesn't provide list endpoint)."""
+        # Anthropic doesn't have a models endpoint, just return hardcoded
         return [
-            ModelInfo(
-                name="claude-opus-4.6",
-                display_name="Claude Opus 4.6 (Most Intelligent)",
-                max_tokens=200000,
-                description="Most intelligent broadly available model for complex reasoning. $5 input, $25 output per 1M tokens",
-            ),
-            ModelInfo(
-                name="claude-sonnet-4.6",
-                display_name="Claude Sonnet 4.6 (Best Value)",
-                max_tokens=200000,
-                description="Best balance of speed and intelligence. $3 input, $15 output per 1M tokens",
-            ),
-            ModelInfo(
-                name="claude-haiku-4.5",
-                display_name="Claude Haiku 4.5 (Fastest, Cheapest)",
-                max_tokens=200000,
-                description="Fast and cost-efficient for simpler tasks. $0.80 input, $4 output per 1M tokens",
-            ),
+            ModelInfo(name="claude-3-5-sonnet-20240620", display_name="Claude 3.5 Sonnet"),
+            ModelInfo(name="claude-3-opus-20240229", display_name="Claude 3 Opus"),
+            ModelInfo(name="claude-3-haiku-20240307", display_name="Claude 3 Haiku"),
         ]
     @staticmethod
     async def discover_all(provider: str, api_key: str) -> List[ModelInfo]:
-        """Discover all models for a given provider."""
         provider = provider.lower().strip()
         if provider == "modal":
             return await ModelDiscovery.fetch_modal_models(api_key)
@@ -285,5 +169,28 @@ class ModelDiscovery:
             return await ModelDiscovery.fetch_gemini_models(api_key)
         elif provider == "claude":
             return await ModelDiscovery.fetch_claude_models(api_key)
+        elif provider == "deepseek":
+            return await ModelDiscovery.fetch_generic_openai_compatible(api_key, "https://api.deepseek.com/v1", "DeepSeek")
+        elif provider == "kimi":
+            return await ModelDiscovery.fetch_generic_openai_compatible(api_key, "https://api.moonshot.cn/v1", "Kimi")
+        elif provider == "minimax":
+            return await ModelDiscovery.fetch_generic_openai_compatible(api_key, "https://api.minimax.chat/v1", "Minimax")
+        elif provider == "siliconflow":
+            return await ModelDiscovery.fetch_generic_openai_compatible(api_key, "https://api.siliconflow.cn/v1", "SiliconFlow")
         else:
-            raise ValueError(f"Unknown provider: {provider}")
+            return []
+if __name__ == "__main__":
+    import sys
+    if len(sys.argv) < 3:
+        print(json.dumps([]))
+        sys.exit(0)
+    provider = sys.argv[1]
+    api_key = sys.argv[2]
+    async def main():
+        models = await ModelDiscovery.discover_all(provider, api_key)
+        print(json.dumps([asdict(m) for m in models]))
+    asyncio.run(main())