npm - @voria/cli - Versions diffs - 0.0.2 - Mend

@voria/cli 0.0.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (67) hide show

package/README.md +439 -0
package/bin/voria +730 -0
package/docs/ARCHITECTURE.md +419 -0
package/docs/CHANGELOG.md +189 -0
package/docs/CONTRIBUTING.md +447 -0
package/docs/DESIGN_DECISIONS.md +380 -0
package/docs/DEVELOPMENT.md +535 -0
package/docs/EXAMPLES.md +434 -0
package/docs/INSTALL.md +335 -0
package/docs/IPC_PROTOCOL.md +310 -0
package/docs/LLM_INTEGRATION.md +416 -0
package/docs/MODULES.md +470 -0
package/docs/PERFORMANCE.md +346 -0
package/docs/PLUGINS.md +432 -0
package/docs/QUICKSTART.md +184 -0
package/docs/README.md +133 -0
package/docs/ROADMAP.md +346 -0
package/docs/SECURITY.md +334 -0
package/docs/TROUBLESHOOTING.md +565 -0
package/docs/USER_GUIDE.md +700 -0
package/package.json +63 -0
package/python/voria/__init__.py +8 -0
package/python/voria/__pycache__/__init__.cpython-312.pyc +0 -0
package/python/voria/__pycache__/engine.cpython-312.pyc +0 -0
package/python/voria/core/__init__.py +1 -0
package/python/voria/core/__pycache__/__init__.cpython-312.pyc +0 -0
package/python/voria/core/__pycache__/setup.cpython-312.pyc +0 -0
package/python/voria/core/agent/__init__.py +9 -0
package/python/voria/core/agent/__pycache__/__init__.cpython-312.pyc +0 -0
package/python/voria/core/agent/__pycache__/loop.cpython-312.pyc +0 -0
package/python/voria/core/agent/loop.py +343 -0
package/python/voria/core/executor/__init__.py +19 -0
package/python/voria/core/executor/__pycache__/__init__.cpython-312.pyc +0 -0
package/python/voria/core/executor/__pycache__/executor.cpython-312.pyc +0 -0
package/python/voria/core/executor/executor.py +431 -0
package/python/voria/core/github/__init__.py +33 -0
package/python/voria/core/github/__pycache__/__init__.cpython-312.pyc +0 -0
package/python/voria/core/github/__pycache__/client.cpython-312.pyc +0 -0
package/python/voria/core/github/client.py +438 -0
package/python/voria/core/llm/__init__.py +55 -0
package/python/voria/core/llm/__pycache__/__init__.cpython-312.pyc +0 -0
package/python/voria/core/llm/__pycache__/base.cpython-312.pyc +0 -0
package/python/voria/core/llm/__pycache__/claude_provider.cpython-312.pyc +0 -0
package/python/voria/core/llm/__pycache__/gemini_provider.cpython-312.pyc +0 -0
package/python/voria/core/llm/__pycache__/modal_provider.cpython-312.pyc +0 -0
package/python/voria/core/llm/__pycache__/model_discovery.cpython-312.pyc +0 -0
package/python/voria/core/llm/__pycache__/openai_provider.cpython-312.pyc +0 -0
package/python/voria/core/llm/base.py +152 -0
package/python/voria/core/llm/claude_provider.py +188 -0
package/python/voria/core/llm/gemini_provider.py +148 -0
package/python/voria/core/llm/modal_provider.py +228 -0
package/python/voria/core/llm/model_discovery.py +289 -0
package/python/voria/core/llm/openai_provider.py +146 -0
package/python/voria/core/patcher/__init__.py +9 -0
package/python/voria/core/patcher/__pycache__/__init__.cpython-312.pyc +0 -0
package/python/voria/core/patcher/__pycache__/patcher.cpython-312.pyc +0 -0
package/python/voria/core/patcher/patcher.py +375 -0
package/python/voria/core/planner/__init__.py +1 -0
package/python/voria/core/setup.py +201 -0
package/python/voria/core/token_manager/__init__.py +29 -0
package/python/voria/core/token_manager/__pycache__/__init__.cpython-312.pyc +0 -0
package/python/voria/core/token_manager/__pycache__/manager.cpython-312.pyc +0 -0
package/python/voria/core/token_manager/manager.py +241 -0
package/python/voria/engine.py +1185 -0
package/python/voria/plugins/__init__.py +1 -0
package/python/voria/plugins/python/__init__.py +1 -0
package/python/voria/plugins/typescript/__init__.py +1 -0

package/python/voria/core/llm/model_discovery.py ADDED Viewed

@@ -0,0 +1,289 @@
+"""
+Dynamic model discovery for all LLM providers.
+Fetches available models at runtime based on API keys.
+"""
+import asyncio
+import httpx
+from dataclasses import dataclass
+from typing import List, Optional
+import logging
+logger = logging.getLogger(__name__)
+@dataclass
+class ModelInfo:
+    """Information about an available model."""
+    name: str
+    display_name: str
+    tokens_per_hour: Optional[int] = None
+    max_tokens: Optional[int] = None
+    description: str = ""
+class ModelDiscovery:
+    """Fetch available models from LLM providers."""
+    @staticmethod
+    async def fetch_modal_models(api_key: str) -> List[ModelInfo]:
+        """Fetch available models from Modal Z.ai API."""
+        try:
+            async with httpx.AsyncClient() as client:
+                response = await client.get(
+                    "https://api.us-west-2.modal.direct/v1/models",
+                    headers={"Authorization": f"Bearer {api_key}"},
+                    timeout=10.0,
+                )
+                if response.status_code == 200:
+                    data = response.json()
+                    models = []
+                    # Modal returns model data in "data" key
+                    for model in data.get("data", []):
+                        models.append(
+                            ModelInfo(
+                                name=model.get("id", model.get("name")),
+                                display_name=model.get("id", model.get("name")),
+                                max_tokens=model.get("max_tokens", 4096),
+                                description=f"Modal Z.ai - {model.get('created', 'N/A')}",
+                            )
+                        )
+                    return (
+                        models if models else await ModelDiscovery._get_modal_fallback()
+                    )
+                else:
+                    logger.warning(
+                        f"Modal API returned {response.status_code}, using fallback models"
+                    )
+                    return await ModelDiscovery._get_modal_fallback()
+        except Exception as e:
+            logger.warning(f"Failed to fetch Modal models: {e}, using fallback")
+            return await ModelDiscovery._get_modal_fallback()
+    @staticmethod
+    async def _get_modal_fallback() -> List[ModelInfo]:
+        """Fallback models for Modal when API unavailable."""
+        return [
+            ModelInfo(
+                name="zai-org/GLM-5.1-FP8",
+                display_name="GLM-5.1-FP8 (745B, Latest)",
+                max_tokens=4096,
+                description="Latest Modal Z.ai model - 745B parameters",
+            ),
+            ModelInfo(
+                name="zai-org/GLM-4",
+                display_name="GLM-4 (370B, Legacy)",
+                max_tokens=2048,
+                description="Previous generation Modal model",
+            ),
+        ]
+    @staticmethod
+    async def fetch_openai_models(api_key: str) -> List[ModelInfo]:
+        """Fetch available models from OpenAI API."""
+        try:
+            async with httpx.AsyncClient() as client:
+                response = await client.get(
+                    "https://api.openai.com/v1/models",
+                    headers={"Authorization": f"Bearer {api_key}"},
+                    timeout=10.0,
+                )
+                if response.status_code == 200:
+                    data = response.json()
+                    models = []
+                    # Filter to only gpt models suitable for text generation
+                    suitable_models = {
+                        "gpt-4o",
+                        "gpt-4-turbo",
+                        "gpt-4",
+                        "gpt-3.5-turbo",
+                    }
+                    for model in data.get("data", []):
+                        model_id = model.get("id", "")
+                        # Match by prefix or exact name
+                        if any(
+                            model_id.startswith(prefix) for prefix in suitable_models
+                        ):
+                            models.append(
+                                ModelInfo(
+                                    name=model_id,
+                                    display_name=model_id,
+                                    description=f"OpenAI - {model.get('owned_by', 'N/A')}",
+                                )
+                            )
+                    # Sort by recency (gpt-4o > gpt-4-turbo > gpt-4 > gpt-3.5-turbo)
+                    return (
+                        sorted(
+                            models,
+                            key=lambda x: (
+                                not x.name.startswith("gpt-4o"),
+                                not x.name.startswith("gpt-4-turbo"),
+                                not x.name.startswith("gpt-4"),
+                            ),
+                        )
+                        if models
+                        else await ModelDiscovery._get_openai_fallback()
+                    )
+                else:
+                    logger.warning(
+                        f"OpenAI API returned {response.status_code}, using fallback models"
+                    )
+                    return await ModelDiscovery._get_openai_fallback()
+        except Exception as e:
+            logger.warning(f"Failed to fetch OpenAI models: {e}, using fallback")
+            return await ModelDiscovery._get_openai_fallback()
+    @staticmethod
+    async def _get_openai_fallback() -> List[ModelInfo]:
+        """Fallback models for OpenAI when API unavailable."""
+        return [
+            ModelInfo(
+                name="gpt-5.4",
+                display_name="GPT-5.4 (Latest Frontier)",
+                max_tokens=128000,
+                description="Best intelligence at scale for agentic, coding, and professional workflows. $2.50 input, $15 output per 1M tokens",
+            ),
+            ModelInfo(
+                name="gpt-5.4-mini",
+                display_name="GPT-5.4-mini (Mini Model)",
+                max_tokens=128000,
+                description="Strongest mini model yet for coding, computer use, and agentic tasks. $0.75 input, $4.50 output per 1M tokens",
+            ),
+            ModelInfo(
+                name="gpt-5.4-nano",
+                display_name="GPT-5.4-nano (Cheapest)",
+                max_tokens=128000,
+                description="Cheapest GPT-5.4-class model for simple high-volume tasks. $0.20 input, $1.25 output per 1M tokens",
+            ),
+            ModelInfo(
+                name="gpt-4o",
+                display_name="GPT-4o (Previous High Quality)",
+                max_tokens=128000,
+                description="Previous latest model - optimized for speed and cost",
+            ),
+        ]
+    @staticmethod
+    async def fetch_gemini_models(api_key: str) -> List[ModelInfo]:
+        """Fetch available models from Google Gemini API."""
+        try:
+            async with httpx.AsyncClient() as client:
+                response = await client.get(
+                    f"https://generativelanguage.googleapis.com/v1/models?key={api_key}",
+                    timeout=10.0,
+                )
+                if response.status_code == 200:
+                    data = response.json()
+                    models = []
+                    # Filter to generative models
+                    for model in data.get("models", []):
+                        model_name = model.get("name", "").replace("models/", "")
+                        if "gemini" in model_name.lower():
+                            models.append(
+                                ModelInfo(
+                                    name=model_name,
+                                    display_name=model_name,
+                                    description=f"Google Gemini - {model.get('displayName', 'N/A')}",
+                                )
+                            )
+                    return (
+                        models
+                        if models
+                        else await ModelDiscovery._get_gemini_fallback()
+                    )
+                else:
+                    logger.warning(
+                        f"Gemini API returned {response.status_code}, using fallback models"
+                    )
+                    return await ModelDiscovery._get_gemini_fallback()
+        except Exception as e:
+            logger.warning(f"Failed to fetch Gemini models: {e}, using fallback")
+            return await ModelDiscovery._get_gemini_fallback()
+    @staticmethod
+    async def _get_gemini_fallback() -> List[ModelInfo]:
+        """Fallback models for Gemini when API unavailable."""
+        return [
+            ModelInfo(
+                name="gemini-3.1-pro",
+                display_name="Gemini 3.1 Pro (Latest SOTA Reasoning)",
+                max_tokens=200000,
+                description="Latest SOTA reasoning model with unprecedented depth and nuance. $2 input, $12 output per context window",
+            ),
+            ModelInfo(
+                name="gemini-3-flash",
+                display_name="Gemini 3 Flash (Latest, Fastest)",
+                max_tokens=200000,
+                description="Most intelligent model built for speed, combining frontier intelligence with superior search and grounding",
+            ),
+            ModelInfo(
+                name="gemini-3.1-flash-lite",
+                display_name="Gemini 3.1 Flash Lite (Cheapest)",
+                max_tokens=200000,
+                description="Most cost-efficient model, optimized for high-volume agentic tasks. $0.25 input, $1.50 output",
+            ),
+            ModelInfo(
+                name="gemini-2.0-flash",
+                display_name="Gemini 2.0 Flash (Previous)",
+                max_tokens=2000,
+                description="Previous generation Gemini model",
+            ),
+        ]
+    @staticmethod
+    async def fetch_claude_models(api_key: str) -> List[ModelInfo]:
+        """Fetch available models from Anthropic Claude API."""
+        try:
+            async with httpx.AsyncClient() as client:
+                # Claude doesn't have a public models endpoint, use documented models
+                # Make a test call to verify API key works
+                response = await client.get(
+                    "https://api.anthropic.com/v1/models",
+                    headers={"x-api-key": api_key},
+                    timeout=10.0,
+                )
+                # If we get here, API key works - return known models
+                return await ModelDiscovery._get_claude_fallback()
+        except Exception as e:
+            logger.warning(f"Failed to verify Claude API: {e}, returning known models")
+            return await ModelDiscovery._get_claude_fallback()
+    @staticmethod
+    async def _get_claude_fallback() -> List[ModelInfo]:
+        """Known Claude models (Anthropic doesn't provide list endpoint)."""
+        return [
+            ModelInfo(
+                name="claude-opus-4.6",
+                display_name="Claude Opus 4.6 (Most Intelligent)",
+                max_tokens=200000,
+                description="Most intelligent broadly available model for complex reasoning. $5 input, $25 output per 1M tokens",
+            ),
+            ModelInfo(
+                name="claude-sonnet-4.6",
+                display_name="Claude Sonnet 4.6 (Best Value)",
+                max_tokens=200000,
+                description="Best balance of speed and intelligence. $3 input, $15 output per 1M tokens",
+            ),
+            ModelInfo(
+                name="claude-haiku-4.5",
+                display_name="Claude Haiku 4.5 (Fastest, Cheapest)",
+                max_tokens=200000,
+                description="Fast and cost-efficient for simpler tasks. $0.80 input, $4 output per 1M tokens",
+            ),
+        ]
+    @staticmethod
+    async def discover_all(provider: str, api_key: str) -> List[ModelInfo]:
+        """Discover all models for a given provider."""
+        provider = provider.lower().strip()
+        if provider == "modal":
+            return await ModelDiscovery.fetch_modal_models(api_key)
+        elif provider == "openai":
+            return await ModelDiscovery.fetch_openai_models(api_key)
+        elif provider == "gemini":
+            return await ModelDiscovery.fetch_gemini_models(api_key)
+        elif provider == "claude":
+            return await ModelDiscovery.fetch_claude_models(api_key)
+        else:
+            raise ValueError(f"Unknown provider: {provider}")

package/python/voria/core/llm/openai_provider.py ADDED Viewed

@@ -0,0 +1,146 @@
+"""OpenAI GPT-4 and GPT-3.5 LLM Provider"""
+import logging
+from typing import List, Dict, Any, Optional
+import httpx
+from .base import BaseLLMProvider, Message, LLMResponse
+logger = logging.getLogger(__name__)
+class OpenAIProvider(BaseLLMProvider):
+    """OpenAI GPT-4 and GPT-3.5-turbo Provider"""
+    API_ENDPOINT = "https://api.openai.com/v1/chat/completions"
+    DEFAULT_MODEL = "gpt-4"
+    def __init__(self, api_key: str, model: str = DEFAULT_MODEL):
+        """
+        Initialize OpenAI provider
+        Args:
+            api_key: OpenAI API key
+            model: Model (gpt-4, gpt-3.5-turbo, etc)
+        """
+        super().__init__(api_key, model)
+        self.client = httpx.AsyncClient(
+            headers={
+                "Authorization": f"Bearer {api_key}",
+                "Content-Type": "application/json",
+            },
+            timeout=300.0,
+        )
+    async def generate(
+        self, messages: List[Message], max_tokens: int = 2000, temperature: float = 0.7
+    ) -> LLMResponse:
+        """Generate response using OpenAI"""
+        try:
+            payload = {
+                "model": self.model,
+                "messages": [
+                    {"role": msg.role, "content": msg.content} for msg in messages
+                ],
+                "max_tokens": max_tokens,
+                "temperature": temperature,
+            }
+            logger.debug(f"Calling OpenAI API with {len(messages)} messages")
+            response = await self.client.post(self.API_ENDPOINT, json=payload)
+            response.raise_for_status()
+            data = response.json()
+            content = data["choices"][0]["message"]["content"]
+            tokens_used = data.get("usage", {}).get("total_tokens", 0)
+            logger.info(f"OpenAI API response: {tokens_used} tokens used")
+            return LLMResponse(
+                content=content,
+                tokens_used=tokens_used,
+                model=self.model,
+                provider="OpenAI",
+            )
+        except httpx.HTTPError as e:
+            logger.error(f"OpenAI API error: {e}")
+            raise
+        except Exception as e:
+            logger.error(f"Error generating with OpenAI: {e}")
+            raise
+    async def plan(self, issue_description: str) -> str:
+        """Generate implementation plan"""
+        system_message = Message(
+            role="system",
+            content="""You are an expert software architect.
+Create a detailed implementation plan for fixing this GitHub issue.""",
+        )
+        user_message = Message(role="user", content=f"Issue:\n{issue_description}")
+        response = await self.generate([system_message, user_message], max_tokens=2000)
+        return response.content
+    async def generate_patch(
+        self,
+        issue_description: str,
+        context_files: Dict[str, str],
+        previous_errors: Optional[str] = None,
+    ) -> str:
+        """Generate code patch in unified diff format"""
+        system_message = Message(
+            role="system",
+            content="""Generate a unified diff format patch.
+Format:
+--- a/path
++++ b/path
+@@ -line,count +line,count @@""",
+        )
+        context = f"Issue:\n{issue_description}\n\n"
+        for filename, content in context_files.items():
+            context += f"\n--- {filename} ---\n{content}\n"
+        if previous_errors:
+            context += f"\nPrevious Errors:\n{previous_errors}"
+        user_message = Message(role="user", content=context)
+        response = await self.generate(
+            [system_message, user_message], max_tokens=3000, temperature=0.5
+        )
+        return response.content
+    async def analyze_test_failure(
+        self, test_output: str, code_context: str
+    ) -> Dict[str, Any]:
+        """Analyze test failure"""
+        system_message = Message(
+            role="system", content="Analyze the test failure and suggest fixes."
+        )
+        user_message = Message(
+            role="user",
+            content=f"""Test Output:
+{test_output}
+Code:
+{code_context}""",
+        )
+        response = await self.generate([system_message, user_message], max_tokens=1500)
+        return {
+            "analysis": response.content,
+            "provider": "OpenAI",
+            "tokens_used": response.tokens_used,
+        }
+    async def close(self):
+        """Close HTTP client"""
+        await self.client.aclose()

package/python/voria/core/patcher/__init__.py ADDED Viewed

@@ -0,0 +1,9 @@
+"""Code Patcher Module - Apply unified diff patches"""
+from .patcher import CodePatcher, UnifiedDiffParser, PatchHunk
+__all__ = [
+    "CodePatcher",
+    "UnifiedDiffParser",
+    "PatchHunk",
+]

package/python/voria/core/patcher/__pycache__/__init__.cpython-312.pyc ADDED Viewed

Binary file

package/python/voria/core/patcher/__pycache__/patcher.cpython-312.pyc ADDED Viewed

Binary file