PyPI - stravinsky - Versions diffs - 0.1.2__py3-none-any.whl → 0.2.38__py3-none-any.whl - Mend

stravinsky 0.1.2py3-none-any.whl → 0.2.38py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of stravinsky might be problematic. Click here for more details.

Files changed (42) hide show

mcp_bridge/__init__.py +1 -5
mcp_bridge/auth/cli.py +89 -44
mcp_bridge/auth/oauth.py +88 -63
mcp_bridge/hooks/__init__.py +49 -0
mcp_bridge/hooks/agent_reminder.py +61 -0
mcp_bridge/hooks/auto_slash_command.py +186 -0
mcp_bridge/hooks/budget_optimizer.py +38 -0
mcp_bridge/hooks/comment_checker.py +136 -0
mcp_bridge/hooks/compaction.py +32 -0
mcp_bridge/hooks/context_monitor.py +58 -0
mcp_bridge/hooks/directory_context.py +40 -0
mcp_bridge/hooks/edit_recovery.py +41 -0
mcp_bridge/hooks/empty_message_sanitizer.py +240 -0
mcp_bridge/hooks/keyword_detector.py +122 -0
mcp_bridge/hooks/manager.py +96 -0
mcp_bridge/hooks/preemptive_compaction.py +157 -0
mcp_bridge/hooks/session_recovery.py +186 -0
mcp_bridge/hooks/todo_enforcer.py +75 -0
mcp_bridge/hooks/truncator.py +19 -0
mcp_bridge/native_hooks/context.py +38 -0
mcp_bridge/native_hooks/edit_recovery.py +46 -0
mcp_bridge/native_hooks/stravinsky_mode.py +109 -0
mcp_bridge/native_hooks/truncator.py +23 -0
mcp_bridge/prompts/delphi.py +3 -2
mcp_bridge/prompts/dewey.py +105 -21
mcp_bridge/prompts/stravinsky.py +452 -118
mcp_bridge/server.py +491 -668
mcp_bridge/server_tools.py +547 -0
mcp_bridge/tools/__init__.py +13 -3
mcp_bridge/tools/agent_manager.py +359 -190
mcp_bridge/tools/continuous_loop.py +67 -0
mcp_bridge/tools/init.py +50 -0
mcp_bridge/tools/lsp/tools.py +15 -15
mcp_bridge/tools/model_invoke.py +594 -48
mcp_bridge/tools/skill_loader.py +51 -47
mcp_bridge/tools/task_runner.py +141 -0
mcp_bridge/tools/templates.py +175 -0
{stravinsky-0.1.2.dist-info → stravinsky-0.2.38.dist-info}/METADATA +55 -10
stravinsky-0.2.38.dist-info/RECORD +57 -0
stravinsky-0.1.2.dist-info/RECORD +0 -32
{stravinsky-0.1.2.dist-info → stravinsky-0.2.38.dist-info}/WHEEL +0 -0
{stravinsky-0.1.2.dist-info → stravinsky-0.2.38.dist-info}/entry_points.txt +0 -0

mcp_bridge/tools/model_invoke.py CHANGED Viewed

@@ -5,39 +5,188 @@ These tools use OAuth tokens from the token store to authenticate
 API requests to external model providers.
 """
+import logging
+import os
 import time
+logger = logging.getLogger(__name__)
+# Model name mapping: user-friendly names -> Antigravity API model IDs
+# Per API spec: https://github.com/NoeFabris/opencode-antigravity-auth/blob/main/docs/ANTIGRAVITY_API_SPEC.md
+# VERIFIED GEMINI MODELS (as of 2025-12):
+#   - gemini-3-pro-high, gemini-3-pro-low
+# NOTE: There is NO gemini-3-flash in the API - all flash aliases map to gemini-3-pro-low
+# NOTE: Claude models should use Anthropic API directly, NOT Antigravity
+GEMINI_MODEL_MAP = {
+    # Antigravity verified Gemini models (pass-through)
+    "gemini-3-pro-low": "gemini-3-pro-low",
+    "gemini-3-pro-high": "gemini-3-pro-high",
+    # Aliases for convenience (map to closest verified model)
+    "gemini-flash": "gemini-3-pro-low",
+    "gemini-3-flash": "gemini-3-pro-low",  # NOT a real model - redirect to pro-low
+    "gemini-pro": "gemini-3-pro-low",
+    "gemini-3-pro": "gemini-3-pro-low",
+    "gemini": "gemini-3-pro-low",  # Default gemini alias
+    # Legacy mappings (redirect to Antigravity models)
+    "gemini-2.0-flash": "gemini-3-pro-low",
+    "gemini-2.0-flash-001": "gemini-3-pro-low",
+    "gemini-2.0-pro": "gemini-3-pro-low",
+    "gemini-2.0-pro-exp": "gemini-3-pro-high",
+}
+def resolve_gemini_model(model: str) -> str:
+    """Resolve a user-friendly model name to the actual API model ID."""
+    return GEMINI_MODEL_MAP.get(model, model)  # Pass through if not in map
 import httpx
+from tenacity import (
+    retry,
+    stop_after_attempt,
+    wait_exponential,
+    retry_if_exception,
+)
 from ..auth.token_store import TokenStore
-from ..auth.oauth import refresh_access_token as gemini_refresh, ANTIGRAVITY_HEADERS
+from ..auth.oauth import (
+    refresh_access_token as gemini_refresh,
+    ANTIGRAVITY_HEADERS,
+    ANTIGRAVITY_ENDPOINTS,
+    ANTIGRAVITY_DEFAULT_PROJECT_ID,
+    ANTIGRAVITY_API_VERSION,
+)
 from ..auth.openai_oauth import refresh_access_token as openai_refresh
+from ..hooks.manager import get_hook_manager
+# ========================
+# SESSION & HTTP MANAGEMENT
+# ========================
+# Session cache for thinking signature persistence across multi-turn conversations
+# Key: conversation_key (or "default"), Value: session UUID
+_SESSION_CACHE: dict[str, str] = {}
+# Pooled HTTP client for connection reuse
+_HTTP_CLIENT: httpx.AsyncClient | None = None
+def _get_session_id(conversation_key: str | None = None) -> str:
+    """
+    Get or create persistent session ID for thinking signature caching.
+    Per Antigravity API: session IDs must persist across multi-turn to maintain
+    thinking signature cache. Creating new UUID per call breaks this.
+    Args:
+        conversation_key: Optional key to scope session (e.g., per-agent)
+    Returns:
+        Stable session UUID for this conversation
+    """
+    import uuid
+    key = conversation_key or "default"
+    if key not in _SESSION_CACHE:
+        _SESSION_CACHE[key] = str(uuid.uuid4())
+    return _SESSION_CACHE[key]
+def clear_session_cache() -> None:
+    """Clear session cache (for thinking recovery on error)."""
+    _SESSION_CACHE.clear()
+async def _get_http_client() -> httpx.AsyncClient:
+    """
+    Get or create pooled HTTP client for connection reuse.
+    Reusing a single client across requests improves performance
+    by maintaining connection pools.
+    """
+    global _HTTP_CLIENT
+    if _HTTP_CLIENT is None or _HTTP_CLIENT.is_closed:
+        _HTTP_CLIENT = httpx.AsyncClient(timeout=120.0)
+    return _HTTP_CLIENT
+def _extract_gemini_response(data: dict) -> str:
+    """
+    Extract text from Gemini response, handling thinking blocks.
+    Per Antigravity API, responses may contain:
+    - text: Regular response text
+    - thought: Thinking block content (when thinkingConfig enabled)
+    - thoughtSignature: Signature for caching (ignored)
+    Args:
+        data: Raw API response JSON
+    Returns:
+        Extracted text, with thinking blocks formatted as <thinking>...</thinking>
+    """
+    try:
+        # Unwrap the outer "response" envelope if present
+        inner_response = data.get("response", data)
+        candidates = inner_response.get("candidates", [])
+        if not candidates:
+            return "No response generated"
+        content = candidates[0].get("content", {})
+        parts = content.get("parts", [])
+        if not parts:
+            return "No response parts"
+        text_parts = []
+        thinking_parts = []
+        for part in parts:
+            if "thought" in part:
+                thinking_parts.append(part["thought"])
+            elif "text" in part:
+                text_parts.append(part["text"])
+            # Skip thoughtSignature parts
+        # Combine results
+        result = "".join(text_parts)
+        # Prepend thinking blocks if present
+        if thinking_parts:
+            thinking_content = "".join(thinking_parts)
+            result = f"<thinking>\n{thinking_content}\n</thinking>\n\n{result}"
+        return result if result.strip() else "No response generated"
+    except (KeyError, IndexError, TypeError) as e:
+        return f"Error parsing response: {e}"
 async def _ensure_valid_token(token_store: TokenStore, provider: str) -> str:
     """
     Get a valid access token, refreshing if needed.
     Args:
         token_store: Token store
         provider: Provider name
     Returns:
         Valid access token
     Raises:
         ValueError: If not authenticated
     """
     # Check if token needs refresh (with 5 minute buffer)
     if token_store.needs_refresh(provider, buffer_seconds=300):
         token = token_store.get_token(provider)
         if not token or not token.get("refresh_token"):
             raise ValueError(
                 f"Not authenticated with {provider}. "
                 f"Run: python -m mcp_bridge.auth.cli login {provider}"
             )
         try:
             if provider == "gemini":
                 result = gemini_refresh(token["refresh_token"])
@@ -45,7 +194,7 @@ async def _ensure_valid_token(token_store: TokenStore, provider: str) -> str:
                 result = openai_refresh(token["refresh_token"])
             else:
                 raise ValueError(f"Unknown provider: {provider}")
             # Update stored token
             token_store.set_token(
                 provider=provider,
@@ -53,24 +202,38 @@ async def _ensure_valid_token(token_store: TokenStore, provider: str) -> str:
                 refresh_token=result.refresh_token or token["refresh_token"],
                 expires_at=time.time() + result.expires_in,
             )
             return result.access_token
         except Exception as e:
             raise ValueError(
-                f"Token refresh failed: {e}. "
-                f"Run: python -m mcp_bridge.auth.cli login {provider}"
+                f"Token refresh failed: {e}. Run: python -m mcp_bridge.auth.cli login {provider}"
             )
     access_token = token_store.get_access_token(provider)
     if not access_token:
         raise ValueError(
             f"Not authenticated with {provider}. "
             f"Run: python -m mcp_bridge.auth.cli login {provider}"
         )
     return access_token
+def is_retryable_exception(e: Exception) -> bool:
+    """Check if an exception is retryable (429 or 5xx)."""
+    if isinstance(e, httpx.HTTPStatusError):
+        return e.response.status_code == 429 or 500 <= e.response.status_code < 600
+    return False
+@retry(
+    stop=stop_after_attempt(5),
+    wait=wait_exponential(multiplier=1, min=4, max=60),
+    retry=retry_if_exception(is_retryable_exception),
+    before_sleep=lambda retry_state: logger.info(
+        f"Rate limited or server error, retrying in {retry_state.next_action.sleep} seconds..."
+    ),
+)
 async def invoke_gemini(
     token_store: TokenStore,
     prompt: str,
@@ -98,10 +261,32 @@ async def invoke_gemini(
         ValueError: If not authenticated with Gemini
         httpx.HTTPStatusError: If API request fails
     """
+    # Execute pre-model invoke hooks
+    params = {
+        "prompt": prompt,
+        "model": model,
+        "temperature": temperature,
+        "max_tokens": max_tokens,
+        "thinking_budget": thinking_budget,
+    }
+    hook_manager = get_hook_manager()
+    params = await hook_manager.execute_pre_model_invoke(params)
+    # Update local variables from possibly modified params
+    prompt = params["prompt"]
+    model = params["model"]
+    temperature = params["temperature"]
+    max_tokens = params["max_tokens"]
+    thinking_budget = params["thinking_budget"]
     access_token = await _ensure_valid_token(token_store, "gemini")
-    # Gemini API endpoint with OAuth
-    api_url = f"https://generativelanguage.googleapis.com/v1beta/models/{model}:generateContent"
+    # Resolve user-friendly model name to actual API model ID
+    api_model = resolve_gemini_model(model)
+    # Use persistent session ID for thinking signature caching
+    session_id = _get_session_id()
+    project_id = os.getenv("STRAVINSKY_ANTIGRAVITY_PROJECT_ID", ANTIGRAVITY_DEFAULT_PROJECT_ID)
     headers = {
         "Authorization": f"Bearer {access_token}",
@@ -109,53 +294,397 @@ async def invoke_gemini(
         **ANTIGRAVITY_HEADERS,  # Include Antigravity headers
     }
-    payload = {
-        "contents": [{"parts": [{"text": prompt}]}],
+    # Build inner request payload
+    # Per API spec: contents must include role ("user" or "model")
+    inner_payload = {
+        "contents": [{"role": "user", "parts": [{"text": prompt}]}],
         "generationConfig": {
             "temperature": temperature,
             "maxOutputTokens": max_tokens,
         },
+        "sessionId": session_id,
     }
     # Add thinking budget if supported by model/API
     if thinking_budget > 0:
         # For Gemini 2.0+ Thinking models
-        payload["generationConfig"]["thinkingConfig"] = {
+        # Per Antigravity API: use "thinkingBudget", NOT "tokenLimit"
+        inner_payload["generationConfig"]["thinkingConfig"] = {
             "includeThoughts": True,
-            "tokenLimit": thinking_budget
+            "thinkingBudget": thinking_budget,
         }
-    async with httpx.AsyncClient() as client:
-        response = await client.post(
-            api_url,
-            headers=headers,
-            json=payload,
-            timeout=120.0,
-        )
-        if response.status_code == 401:
-            raise ValueError(
-                "Gemini authentication expired. "
-                "Run: python -m mcp_bridge.auth.cli login gemini"
+    # Wrap request body per reference implementation
+    wrapped_payload = {
+        "project": project_id,
+        "model": api_model,
+        "userAgent": "antigravity",
+        "requestId": f"invoke-{uuid.uuid4()}",
+        "request": inner_payload,
+    }
+    # Get pooled HTTP client for connection reuse
+    client = await _get_http_client()
+    # Try endpoints in fallback order with thinking recovery
+    response = None
+    last_error = None
+    max_retries = 2  # For thinking recovery
+    for retry_attempt in range(max_retries):
+        for endpoint in ANTIGRAVITY_ENDPOINTS:
+            # Reference uses: {endpoint}/v1internal:generateContent (NOT /models/{model})
+            api_url = f"{endpoint}/v1internal:generateContent"
+            try:
+                response = await client.post(
+                    api_url,
+                    headers=headers,
+                    json=wrapped_payload,
+                    timeout=120.0,
+                )
+                # 401/403 might be endpoint-specific, try next endpoint
+                if response.status_code in (401, 403):
+                    logger.warning(
+                        f"[Gemini] Endpoint {endpoint} returned {response.status_code}, trying next"
+                    )
+                    last_error = Exception(f"{response.status_code} from {endpoint}")
+                    continue
+                # Check for thinking-related errors that need recovery
+                if response.status_code in (400, 500):
+                    error_text = response.text.lower()
+                    if "thinking" in error_text or "signature" in error_text:
+                        logger.warning(
+                            f"[Gemini] Thinking error detected, clearing session cache and retrying"
+                        )
+                        clear_session_cache()
+                        # Update session ID for retry
+                        wrapped_payload["request"]["sessionId"] = _get_session_id()
+                        last_error = Exception(f"Thinking error: {response.text[:200]}")
+                        break  # Break inner loop to retry with new session
+                # If we got a non-retryable response (success or 4xx client error), use it
+                if response.status_code < 500 and response.status_code != 429:
+                    break
+            except httpx.TimeoutException as e:
+                last_error = e
+                continue
+            except Exception as e:
+                last_error = e
+                continue
+        else:
+            # Inner loop completed without break - no thinking recovery needed
+            break
+        # If we broke out of inner loop for thinking recovery, continue outer retry loop
+        if response and response.status_code in (400, 500):
+            continue
+        break
+    if response is None:
+        raise ValueError(f"All Antigravity endpoints failed: {last_error}")
+    response.raise_for_status()
+    data = response.json()
+    # Extract text from response using thinking-aware parser
+    return _extract_gemini_response(data)
+# ========================
+# AGENTIC FUNCTION CALLING
+# ========================
+# Tool definitions for background agents
+AGENT_TOOLS = [
+    {
+        "functionDeclarations": [
+            {
+                "name": "read_file",
+                "description": "Read the contents of a file. Returns the file contents as text.",
+                "parameters": {
+                    "type": "object",
+                    "properties": {
+                        "path": {
+                            "type": "string",
+                            "description": "Absolute or relative path to the file",
+                        }
+                    },
+                    "required": ["path"],
+                },
+            },
+            {
+                "name": "list_directory",
+                "description": "List files and directories in a path",
+                "parameters": {
+                    "type": "object",
+                    "properties": {
+                        "path": {"type": "string", "description": "Directory path to list"}
+                    },
+                    "required": ["path"],
+                },
+            },
+            {
+                "name": "grep_search",
+                "description": "Search for a pattern in files using ripgrep. Returns matching lines with file paths and line numbers.",
+                "parameters": {
+                    "type": "object",
+                    "properties": {
+                        "pattern": {"type": "string", "description": "The search pattern (regex)"},
+                        "path": {"type": "string", "description": "Directory or file to search in"},
+                    },
+                    "required": ["pattern", "path"],
+                },
+            },
+            {
+                "name": "write_file",
+                "description": "Write content to a file",
+                "parameters": {
+                    "type": "object",
+                    "properties": {
+                        "path": {"type": "string", "description": "Path to the file to write"},
+                        "content": {
+                            "type": "string",
+                            "description": "Content to write to the file",
+                        },
+                    },
+                    "required": ["path", "content"],
+                },
+            },
+        ]
+    }
+]
+def _execute_tool(name: str, args: dict) -> str:
+    """Execute a tool and return the result."""
+    import os
+    import subprocess
+    from pathlib import Path
+    try:
+        if name == "read_file":
+            path = Path(args["path"])
+            if not path.exists():
+                return f"Error: File not found: {path}"
+            return path.read_text()
+        elif name == "list_directory":
+            path = Path(args["path"])
+            if not path.exists():
+                return f"Error: Directory not found: {path}"
+            entries = []
+            for entry in path.iterdir():
+                entry_type = "DIR" if entry.is_dir() else "FILE"
+                entries.append(f"[{entry_type}] {entry.name}")
+            return "\n".join(entries) if entries else "(empty directory)"
+        elif name == "grep_search":
+            pattern = args["pattern"]
+            search_path = args["path"]
+            result = subprocess.run(
+                ["rg", "--json", "-m", "50", pattern, search_path],
+                capture_output=True,
+                text=True,
+                timeout=30,
             )
-        response.raise_for_status()
+            if result.returncode == 0:
+                return result.stdout[:10000]  # Limit output size
+            elif result.returncode == 1:
+                return "No matches found"
+            else:
+                return f"Search error: {result.stderr}"
+        elif name == "write_file":
+            path = Path(args["path"])
+            path.parent.mkdir(parents=True, exist_ok=True)
+            path.write_text(args["content"])
+            return f"Successfully wrote {len(args['content'])} bytes to {path}"
+        else:
+            return f"Unknown tool: {name}"
+    except Exception as e:
+        return f"Tool error: {str(e)}"
+async def invoke_gemini_agentic(
+    token_store: TokenStore,
+    prompt: str,
+    model: str = "gemini-3-flash",
+    max_turns: int = 10,
+    timeout: int = 120,
+) -> str:
+    """
+    Invoke Gemini with function calling for agentic tasks.
+    This function implements a multi-turn agentic loop:
+    1. Send prompt with tool definitions
+    2. If model returns FunctionCall, execute the tool
+    3. Send FunctionResponse back to model
+    4. Repeat until model returns text or max_turns reached
+    Args:
+        token_store: Token store for OAuth credentials
+        prompt: The task prompt
+        model: Gemini model to use
+        max_turns: Maximum number of tool-use turns
+        timeout: Request timeout in seconds
+    Returns:
+        Final text response from the model
+    """
+    import uuid
+    access_token = await _ensure_valid_token(token_store, "gemini")
+    api_model = resolve_gemini_model(model)
+    # Use persistent session ID for this conversation
+    session_id = _get_session_id(conversation_key="agentic")
+    # Project ID from environment or default
+    project_id = os.getenv("STRAVINSKY_ANTIGRAVITY_PROJECT_ID", ANTIGRAVITY_DEFAULT_PROJECT_ID)
+    headers = {
+        "Authorization": f"Bearer {access_token}",
+        "Content-Type": "application/json",
+        **ANTIGRAVITY_HEADERS,
+    }
+    # Initialize conversation
+    contents = [{"role": "user", "parts": [{"text": prompt}]}]
+    # Get pooled HTTP client for connection reuse
+    client = await _get_http_client()
+    for turn in range(max_turns):
+        # Build inner request payload (what goes inside "request" wrapper)
+        inner_payload = {
+            "contents": contents,
+            "tools": AGENT_TOOLS,
+            "generationConfig": {
+                "temperature": 0.7,
+                "maxOutputTokens": 8192,
+            },
+            "sessionId": session_id,
+        }
+        # Wrap request body per reference implementation
+        # From request.ts wrapRequestBody()
+        wrapped_payload = {
+            "project": project_id,
+            "model": api_model,
+            "userAgent": "antigravity",
+            "requestId": f"agent-{uuid.uuid4()}",
+            "request": inner_payload,
+        }
+        # Try endpoints in fallback order
+        response = None
+        last_error = None
+        for endpoint in ANTIGRAVITY_ENDPOINTS:
+            # Reference uses: {endpoint}/v1internal:generateContent (NOT /models/{model})
+            api_url = f"{endpoint}/v1internal:generateContent"
+            try:
+                response = await client.post(
+                    api_url,
+                    headers=headers,
+                    json=wrapped_payload,
+                    timeout=float(timeout),
+                )
+                # 401/403 might be endpoint-specific, try next endpoint
+                if response.status_code in (401, 403):
+                    logger.warning(
+                        f"[AgenticGemini] Endpoint {endpoint} returned {response.status_code}, trying next"
+                    )
+                    last_error = Exception(f"{response.status_code} from {endpoint}")
+                    continue
+                # If we got a non-retryable response (success or 4xx client error), use it
+                if response.status_code < 500 and response.status_code != 429:
+                    break
+                logger.warning(
+                    f"[AgenticGemini] Endpoint {endpoint} returned {response.status_code}, trying next"
+                )
+            except httpx.TimeoutException as e:
+                last_error = e
+                logger.warning(f"[AgenticGemini] Endpoint {endpoint} timed out, trying next")
+                continue
+            except Exception as e:
+                last_error = e
+                logger.warning(f"[AgenticGemini] Endpoint {endpoint} failed: {e}, trying next")
+                continue
+        if response is None:
+            raise ValueError(f"All Antigravity endpoints failed: {last_error}")
+        response.raise_for_status()
         data = response.json()
-        # Extract text from response
-        try:
-            candidates = data.get("candidates", [])
-            if candidates:
-                content = candidates[0].get("content", {})
-                parts = content.get("parts", [])
-                if parts:
-                    return parts[0].get("text", "")
+        # Extract response - unwrap outer "response" envelope if present
+        inner_response = data.get("response", data)
+        candidates = inner_response.get("candidates", [])
+        if not candidates:
             return "No response generated"
-        except (KeyError, IndexError) as e:
-            return f"Error parsing response: {e}"
+        content = candidates[0].get("content", {})
+        parts = content.get("parts", [])
+        if not parts:
+            return "No response parts"
+        # Check for function call
+        function_call = None
+        text_response = None
+        for part in parts:
+            if "functionCall" in part:
+                function_call = part["functionCall"]
+                break
+            elif "text" in part:
+                text_response = part["text"]
+        if function_call:
+            # Execute the function
+            func_name = function_call.get("name")
+            func_args = function_call.get("args", {})
+            logger.info(f"[AgenticGemini] Turn {turn + 1}: Executing {func_name}")
+            result = _execute_tool(func_name, func_args)
+            # Add model's response and function result to conversation
+            contents.append({"role": "model", "parts": [{"functionCall": function_call}]})
+            contents.append(
+                {
+                    "role": "user",
+                    "parts": [
+                        {"functionResponse": {"name": func_name, "response": {"result": result}}}
+                    ],
+                }
+            )
+        else:
+            # No function call, return text response
+            return text_response or "Task completed"
+    return "Max turns reached without final response"
+@retry(
+    stop=stop_after_attempt(5),
+    wait=wait_exponential(multiplier=1, min=4, max=60),
+    retry=retry_if_exception(is_retryable_exception),
+    before_sleep=lambda retry_state: logger.info(
+        f"Rate limited or server error, retrying in {retry_state.next_action.sleep} seconds..."
+    ),
+)
 async def invoke_openai(
     token_store: TokenStore,
     prompt: str,
@@ -181,6 +710,24 @@ async def invoke_openai(
         ValueError: If not authenticated with OpenAI
         httpx.HTTPStatusError: If API request fails
     """
+    # Execute pre-model invoke hooks
+    params = {
+        "prompt": prompt,
+        "model": model,
+        "temperature": temperature,
+        "max_tokens": max_tokens,
+        "thinking_budget": thinking_budget,
+    }
+    hook_manager = get_hook_manager()
+    params = await hook_manager.execute_pre_model_invoke(params)
+    # Update local variables from possibly modified params
+    prompt = params["prompt"]
+    model = params["model"]
+    temperature = params["temperature"]
+    max_tokens = params["max_tokens"]
+    thinking_budget = params["thinking_budget"]
     access_token = await _ensure_valid_token(token_store, "openai")
     # OpenAI Chat Completions API
@@ -196,7 +743,7 @@ async def invoke_openai(
         "messages": [{"role": "user", "content": prompt}],
         "temperature": temperature,
     }
     # Handle thinking budget for O1/O3 style models (GPT-5.2)
     if thinking_budget > 0:
         payload["max_completion_tokens"] = max_tokens + thinking_budget
@@ -211,13 +758,12 @@ async def invoke_openai(
             json=payload,
             timeout=120.0,
         )
         if response.status_code == 401:
             raise ValueError(
-                "OpenAI authentication failed. "
-                "Run: python -m mcp_bridge.auth.cli login openai"
+                "OpenAI authentication failed. Run: python -m mcp_bridge.auth.cli login openai"
             )
         response.raise_for_status()
         data = response.json()

stravinsky 0.1.2__py3-none-any.whl → 0.2.38__py3-none-any.whl

Potentially problematic release.

stravinsky 0.1.2py3-none-any.whl → 0.2.38py3-none-any.whl