npm - loki-mode - Versions diffs - 7.5.17 → 7.5.28 - Mend

loki-mode 7.5.17 → 7.5.28

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (47) hide show

package/README.md +10 -9
package/SKILL.md +14 -14
package/VERSION +1 -1
package/autonomy/completion-council.sh +26 -3
package/autonomy/lib/claude-flags.sh +132 -0
package/autonomy/lib/mcp-config.sh +160 -0
package/autonomy/lib/project-graph.sh +685 -0
package/autonomy/lib/voter-agents.sh +356 -0
package/autonomy/loki +108 -111
package/autonomy/run.sh +95 -186
package/bin/loki +12 -1
package/dashboard/__init__.py +1 -1
package/dashboard/requirements.txt +13 -8
package/dashboard/server.py +33 -15
package/dashboard/static/index.html +298 -299
package/docs/INSTALLATION.md +54 -21
package/docs/retrospectives/v7.5.15-fleet-postmortem.md +325 -0
package/docs/retrospectives/v7.5.15-honesty-audit.md +136 -0
package/docs/retrospectives/v7.5.15-llm-failure-modes.md +49 -0
package/loki-ts/data/finding-schema.json +74 -0
package/loki-ts/data/model-pricing.json +12 -0
package/loki-ts/dist/loki.js +198 -172
package/mcp/__init__.py +1 -1
package/mcp/lsp_proxy.py +713 -0
package/mcp/requirements.txt +9 -3
package/mcp/tests/__init__.py +0 -0
package/mcp/tests/test_lsp_proxy.py +377 -0
package/memory/app_graph.py +153 -0
package/memory/storage.py +6 -1
package/memory/tests/test_app_graph.py +134 -0
package/package.json +4 -3
package/providers/claude.sh +115 -4
package/providers/codex.sh +2 -2
package/providers/loader.sh +4 -4
package/providers/model_catalog.json +0 -9
package/providers/models.sh +1 -2
package/references/multi-provider.md +26 -35
package/references/prompt-repetition.md +1 -1
package/references/quality-control.md +1 -1
package/skills/00-index.md +3 -3
package/skills/model-selection.md +11 -14
package/skills/providers.md +17 -57
package/skills/quality-gates.md +2 -2
package/skills/troubleshooting.md +1 -1
package/src/integrations/github/action-handler.js +3 -2
package/src/protocols/tools/start-project.js +1 -1
package/providers/gemini.sh +0 -343

package/skills/providers.md CHANGED Viewed

@@ -1,35 +1,34 @@
 # Multi-Provider Support
-Loki Mode v5.0.0 supports five AI providers for autonomous execution.
+Loki Mode supports four AI providers for autonomous execution.
 ## Provider Comparison
 > **CLI Flags Verified:** The autonomous mode flags have been verified against actual CLI help output:
 > - Claude: `--dangerously-skip-permissions` (verified)
 > - Codex: `--full-auto` (recommended, v0.98.0) or `exec --dangerously-bypass-approvals-and-sandbox` (legacy)
-> - Gemini: `--approval-mode=yolo` (v0.27.3+) - Note: `-p` prompt flag is deprecated, using positional prompts
-| Feature | Claude Code | OpenAI Codex | Gemini CLI | Cline CLI | Aider |
-|---------|-------------|--------------|------------|-----------|-------|
-| **Full Features** | Yes | No (Degraded) | No (Degraded) | Near-Full (Tier 2) | No (Degraded) |
-| **Task Tool (Subagents)** | Yes | No | No | Yes (Subagents) | No |
-| **Parallel Agents** | Yes (10+) | No | No | No | No |
-| **MCP Integration** | Yes | Yes (basic) | No | Yes | No |
-| **Context Window** | 200K | 400K | 1M | Varies by provider | Varies by provider |
-| **Max Output Tokens** | 128K | 32K | 64K | Varies by provider | Varies by provider |
-| **Model Tiers** | 3 (opus/sonnet/haiku) | 1 (effort param) | 1 (thinking param) | 1 (external) | 1 (external) |
-| **Multi-Provider** | Claude only | OpenAI only | Gemini only | 12+ providers | 18+ providers |
-| **Skill Directory** | ~/.claude/skills | None | None | None | None |
+| Feature | Claude Code | OpenAI Codex | Cline CLI | Aider |
+|---------|-------------|--------------|-----------|-------|
+| **Full Features** | Yes | No (Degraded) | Near-Full (Tier 2) | No (Degraded) |
+| **Task Tool (Subagents)** | Yes | No | Yes (Subagents) | No |
+| **Parallel Agents** | Yes (10+) | No | No | No |
+| **MCP Integration** | Yes | Yes (basic) | Yes | No |
+| **Context Window** | 200K | 400K | Varies by provider | Varies by provider |
+| **Max Output Tokens** | 128K | 32K | Varies by provider | Varies by provider |
+| **Model Tiers** | 3 (opus/sonnet/haiku) | 1 (effort param) | 1 (external) | 1 (external) |
+| **Multi-Provider** | Claude only | OpenAI only | 12+ providers | 18+ providers |
+| **Skill Directory** | ~/.claude/skills | None | None | None |
 ## Provider Selection
 ```bash
 # Via environment variable
-export LOKI_PROVIDER=claude  # or codex, gemini
+export LOKI_PROVIDER=claude  # or codex, cline, aider
 # Via CLI flag
 ./autonomy/run.sh --provider codex ./prd.md
-loki start --provider gemini ./prd.md
+loki start --provider cline ./prd.md
 ```
 ## Claude Code (Default, Full Features)
@@ -94,42 +93,6 @@ CODEX_MODEL_REASONING_EFFORT=high codex exec --dangerously-bypass-approvals-and-
 ---
-## Google Gemini CLI (Degraded Mode)
-**Best for:** Teams standardized on Google. Large context needs (1M tokens).
-**Limitations:**
-- No Task tool (cannot spawn subagents)
-- No parallel execution (sequential only)
-- No MCP integration
-- Single model with thinking_level parameter
-- 1M context window (largest)
-**Invocation:**
-```bash
-# Note: -p flag is DEPRECATED. Using positional prompt.
-gemini --approval-mode=yolo "$prompt"
-```
-**Model Tiers via Thinking Level (settings.json, not CLI flag):**
-Note: Gemini CLI does not support `--thinking-level` as a CLI flag. Thinking mode must be configured in `~/.gemini/settings.json`.
-```json
-// ~/.gemini/settings.json
-{
-  "thinkingMode": "medium"  // high, medium, low
-}
-```
-| Tier | Thinking | Use Case |
-|------|----------|----------|
-| planning | high | Architecture, PRD analysis |
-| development | medium | Feature implementation, tests |
-| fast | low | Simple fixes, docs |
----
 ## Cline CLI (Tier 2 - Near-Full, 12+ Providers)
 **Best for:** Teams wanting Claude Code-like experience with any model provider.
@@ -248,13 +211,12 @@ aider --message "$prompt" --yes-always --no-auto-commits --model model_name
 ## Degraded Mode Behavior
-When running with Codex, Gemini, or Aider (Tier 3):
+When running with Codex or Aider (Tier 3):
 1. **RARV Cycle executes sequentially** - No parallel agents
 2. **Task tool calls are skipped** - Main thread handles all work
 3. **Model tier maps to provider configuration:**
    - Codex: `CODEX_MODEL_REASONING_EFFORT` env var (xhigh/high/medium/low)
-   - Gemini: `~/.gemini/settings.json` thinkingMode (high/medium/low)
 4. **Quality gates run sequentially** - No 3-reviewer parallel review
 5. **Git worktree parallelism disabled** - `--parallel` flag has no effect
@@ -277,7 +239,6 @@ Provider configs are shell-sourceable files in `providers/`:
 providers/
   claude.sh   # Full-featured provider (Tier 1)
   codex.sh    # Degraded mode, effort parameter (Tier 3)
-  gemini.sh   # Degraded mode, thinking_level parameter (Tier 3)
   cline.sh    # Near-full mode, 12+ providers (Tier 2)
   aider.sh    # Degraded mode, 18+ providers (Tier 3)
   loader.sh   # Provider loader utility
@@ -303,8 +264,7 @@ PROVIDER_DEGRADED=false
 | MCP server integration | Claude (full), Cline, or Codex (basic) |
 | Subagents without Claude subscription | Cline |
 | OpenAI ecosystem compatibility | Codex |
-| Largest context window (1M) | Gemini |
 | Maximum provider flexibility (18+) | Aider |
 | Local models (Ollama, free) | Aider or Cline |
 | Architect mode (dual model) | Aider |
-| Sequential-only is acceptable | Codex, Gemini, or Aider |
+| Sequential-only is acceptable | Codex or Aider |

package/skills/quality-gates.md CHANGED Viewed

@@ -113,10 +113,10 @@ the Python episodic memory layer via `memory.engine.save_episode`.
 **Override-judge knobs (v7.5.4+):**
 ```bash
-LOKI_OVERRIDE_JUDGES=claude,gemini   # csv of provider names for the
+LOKI_OVERRIDE_JUDGES=claude,codex    # csv of provider names for the
                                      # 3-judge override council. Defaults
                                      # to the available installed providers
-                                     # (claude, codex, gemini, cline, aider).
+                                     # (claude, codex, cline, aider).
 LOKI_OVERRIDE_REAL_JUDGE=0           # force the deterministic stub-judge
                                      # path (hermetic CI / cost control).
                                      # Default: 1 = real provider-backed

package/skills/troubleshooting.md CHANGED Viewed

@@ -229,7 +229,7 @@ The circuit breaker prevents cascading failures by temporarily disabling operati
     "cooldown_until": "2025-01-20T10:40:42Z",
     "failure_window_start": "2025-01-20T10:34:50Z"
   },
-  "api/gemini": {
+  "api/codex": {
     "state": "HALF_OPEN",
     "failure_count": 0,
     "success_count": 1,

package/src/integrations/github/action-handler.js CHANGED Viewed

@@ -12,7 +12,7 @@
  * Allowed provider values. The workflow_dispatch REST API can supply any
  * string even when the YAML declares a choice type, so we validate here.
  */
-var ALLOWED_PROVIDERS = ['claude', 'codex', 'gemini'];
+var ALLOWED_PROVIDERS = ['claude', 'codex', 'cline', 'aider'];
 /**
  * Label-to-configuration mapping.
@@ -23,7 +23,8 @@ const LABEL_CONFIG_MAP = {
   'loki-priority-high': { priority: 'high' },
   'loki-priority-low': { priority: 'low' },
   'loki-provider-codex': { provider: 'codex' },
-  'loki-provider-gemini': { provider: 'gemini' },
+  'loki-provider-cline': { provider: 'cline' },
+  'loki-provider-aider': { provider: 'aider' },
   'loki-dry-run': { dryRun: true },
 };

package/src/protocols/tools/start-project.js CHANGED Viewed

@@ -25,7 +25,7 @@ const schema = {
       },
       provider: {
         type: 'string',
-        enum: ['claude', 'codex', 'gemini'],
+        enum: ['claude', 'codex', 'cline', 'aider'],
         description: 'AI provider to use (default: claude)',
         default: 'claude'
       }

package/providers/gemini.sh DELETED Viewed

@@ -1,343 +0,0 @@
-#!/usr/bin/env bash
-# Google Gemini CLI Provider Configuration
-# Shell-sourceable config for loki-mode multi-provider support
-# Provider Functions (for external use)
-# =====================================
-# These functions provide a clean interface for external scripts:
-#   provider_detect()           - Check if CLI is installed
-#   provider_version()          - Get CLI version
-#   provider_invoke()           - Invoke with prompt (autonomous mode)
-#   provider_invoke_with_tier() - Invoke with tier-specific thinking level
-#   provider_get_tier_param()   - Map tier name to thinking level
-#
-# Usage:
-#   source providers/gemini.sh
-#   if provider_detect; then
-#       provider_invoke "Your prompt here"
-#   fi
-#
-# Note: autonomy/run.sh uses inline invocation for streaming support
-# and real-time agent tracking. These functions are intended for
-# simpler scripts, wrappers, and external integrations.
-# =====================================
-# Provider Identity
-PROVIDER_NAME="gemini"
-PROVIDER_DISPLAY_NAME="Google Gemini CLI"
-PROVIDER_CLI="gemini"
-# CLI Invocation
-# VERIFIED: --approval-mode=yolo is the unified approach (replaces legacy --yolo)
-# Sandbox enabled by default in yolo mode
-PROVIDER_AUTONOMOUS_FLAG="--approval-mode=yolo"
-# NOTE: -p flag is DEPRECATED per gemini --help. Using positional prompt instead.
-PROVIDER_PROMPT_FLAG=""
-PROVIDER_PROMPT_POSITIONAL=true
-# Skill System
-# Note: Gemini CLI does not have a native skills system
-PROVIDER_SKILL_DIR=""
-PROVIDER_SKILL_FORMAT="none"
-# Capability Flags
-PROVIDER_HAS_SUBAGENTS=false
-PROVIDER_HAS_PARALLEL=false
-PROVIDER_HAS_TASK_TOOL=false
-PROVIDER_HAS_MCP=false
-PROVIDER_MAX_PARALLEL=1
-# Model Configuration
-# Gemini CLI supports --model flag to specify model
-# Primary: gemini-3-pro-preview (preview names - may change when GA is released)
-# Fallback: gemini-3-flash-preview (for rate limit scenarios)
-GEMINI_DEFAULT_PRO="gemini-3-pro-preview"
-GEMINI_DEFAULT_FLASH="gemini-3-flash-preview"
-# Known valid Gemini model prefixes for validation
-GEMINI_KNOWN_MODELS=("gemini-" "models/gemini-")
-# Validate that a model name looks like a Gemini model
-_gemini_validate_model() {
-    local model="$1"
-    local fallback="$2"
-    for prefix in "${GEMINI_KNOWN_MODELS[@]}"; do
-        if [[ "$model" == ${prefix}* ]]; then
-            echo "$model"
-            return 0
-        fi
-    done
-    # Not a valid Gemini model name -- fall back
-    echo "$fallback"
-}
-PROVIDER_MODEL_PLANNING="$(_gemini_validate_model "${LOKI_GEMINI_MODEL_PLANNING:-${LOKI_MODEL_PLANNING:-$GEMINI_DEFAULT_PRO}}" "$GEMINI_DEFAULT_PRO")"
-PROVIDER_MODEL_DEVELOPMENT="$(_gemini_validate_model "${LOKI_GEMINI_MODEL_DEVELOPMENT:-${LOKI_MODEL_DEVELOPMENT:-$GEMINI_DEFAULT_PRO}}" "$GEMINI_DEFAULT_PRO")"
-PROVIDER_MODEL_FAST="$(_gemini_validate_model "${LOKI_GEMINI_MODEL_FAST:-${LOKI_MODEL_FAST:-$GEMINI_DEFAULT_FLASH}}" "$GEMINI_DEFAULT_FLASH")"
-PROVIDER_MODEL_FALLBACK="${LOKI_GEMINI_MODEL_FALLBACK:-$GEMINI_DEFAULT_FLASH}"
-# BUG-PROV-006 fix: PROVIDER_MODEL is now a function, not a frozen variable.
-# For backward compatibility, set the variable to planning model at load time,
-# but callers should use provider_get_current_model() for runtime resolution.
-PROVIDER_MODEL="${PROVIDER_MODEL_PLANNING}"
-# Return the model for the current tier at runtime (not frozen at load time)
-provider_get_current_model() {
-    local tier="${LOKI_CURRENT_TIER:-planning}"
-    resolve_model_for_tier "$tier"
-}
-# Thinking levels (Gemini-specific: maps to reasoning depth)
-PROVIDER_THINKING_PLANNING="high"
-PROVIDER_THINKING_DEVELOPMENT="medium"
-PROVIDER_THINKING_FAST="low"
-# No Task tool - thinking level is set via CLI flag
-PROVIDER_TASK_MODEL_PARAM=""
-PROVIDER_TASK_MODEL_VALUES=()
-# Context and Limits
-PROVIDER_CONTEXT_WINDOW=1000000  # Gemini 3 has 1M context
-PROVIDER_MAX_OUTPUT_TOKENS=65536
-# Rate limit varies by tier: Free=5-15 RPM, Tier1=150+ RPM, Tier2=500+ RPM
-# Default to conservative free-tier value; override with LOKI_GEMINI_RPM env var
-PROVIDER_RATE_LIMIT_RPM="${LOKI_GEMINI_RPM:-15}"
-# Cost (USD per 1K tokens, approximate for Gemini 3 Pro)
-PROVIDER_COST_INPUT_PLANNING=0.00125
-PROVIDER_COST_OUTPUT_PLANNING=0.005
-PROVIDER_COST_INPUT_DEV=0.00125
-PROVIDER_COST_OUTPUT_DEV=0.005
-PROVIDER_COST_INPUT_FAST=0.00125
-PROVIDER_COST_OUTPUT_FAST=0.005
-# Degraded Mode
-PROVIDER_DEGRADED=true
-PROVIDER_DEGRADED_REASONS=(
-    "No Task tool subagent support - cannot spawn parallel agents"
-    "Single model with thinking_level parameter - no cheap tier for parallelization"
-    "No native skills system - SKILL.md must be passed via prompt"
-    "No MCP server integration"
-)
-# BUG-PROV-003 fix: API key resolution with fallback and rotation support.
-# Gemini CLI accepts GOOGLE_API_KEY or GEMINI_API_KEY env vars.
-# If LOKI_GEMINI_API_KEYS is set (comma-separated), rotate through them on auth errors.
-# This function sets GOOGLE_API_KEY for the current invocation.
-_gemini_resolve_api_key() {
-    # Already have a key set -- nothing to do
-    if [ -n "${GOOGLE_API_KEY:-}" ]; then
-        return 0
-    fi
-    # Try GEMINI_API_KEY as alias
-    if [ -n "${GEMINI_API_KEY:-}" ]; then
-        export GOOGLE_API_KEY="$GEMINI_API_KEY"
-        return 0
-    fi
-    # Try gcloud ADC (Application Default Credentials) -- gemini CLI supports this natively
-    if [ -f "${HOME}/.config/gcloud/application_default_credentials.json" ]; then
-        return 0  # Let gemini CLI handle ADC
-    fi
-    return 1
-}
-# Rotate to next API key from LOKI_GEMINI_API_KEYS (comma-separated list)
-# Called after auth errors (401/403) to try the next key
-_gemini_rotate_api_key() {
-    local keys="${LOKI_GEMINI_API_KEYS:-}"
-    [ -z "$keys" ] && return 1  # No key list configured
-    local current="${GOOGLE_API_KEY:-}"
-    local IFS=','
-    local found_current=false
-    local first_key=""
-    for key in $keys; do
-        key=$(echo "$key" | tr -d ' ')  # trim whitespace
-        [ -z "$key" ] && continue
-        [ -z "$first_key" ] && first_key="$key"
-        if [ "$found_current" = "true" ]; then
-            export GOOGLE_API_KEY="$key"
-            return 0
-        fi
-        if [ "$key" = "$current" ]; then
-            found_current=true
-        fi
-    done
-    # Wrap around to first key (or set first key if current wasn't in list)
-    if [ -n "$first_key" ] && [ "$first_key" != "$current" ]; then
-        export GOOGLE_API_KEY="$first_key"
-        return 0
-    fi
-    return 1  # All keys exhausted or only one key
-}
-# Detection function - check if provider CLI is available
-provider_detect() {
-    command -v gemini >/dev/null 2>&1
-}
-# Version check function
-provider_version() {
-    gemini --version 2>/dev/null | head -1
-}
-# Invocation function with rate limit fallback and API key rotation
-# Uses --model flag to specify model, --approval-mode=yolo for autonomous mode
-# Falls back to flash model if pro hits rate limit
-# BUG-PROV-003 fix: rotates API keys on auth errors (401/403)
-# Accepts optional --model <name> as first args to override default model
-# BUG-PROV-010 fix: uses tee to stream output while still capturing for rate-limit check
-# Note: < /dev/null prevents Gemini from pausing on stdin
-provider_invoke() {
-    # Resolve API key before invocation
-    _gemini_resolve_api_key || true
-    local model
-    model=$(provider_get_current_model)
-    # Allow callers to pass --model <name> to override
-    if [[ "${1:-}" == "--model" ]] && [[ -n "${2:-}" ]]; then
-        model="$2"
-        shift 2
-    fi
-    local prompt="$1"
-    shift
-    local exit_code
-    # Stream output via tee while capturing for rate-limit check
-    local output_file stderr_file
-    output_file=$(mktemp)
-    stderr_file=$(mktemp)
-    gemini --approval-mode=yolo --model "$model" "$prompt" "$@" < /dev/null 2>"$stderr_file" | tee "$output_file"
-    exit_code=${PIPESTATUS[0]}
-    # Check for auth errors (401/403) -- try rotating API key
-    if [[ $exit_code -ne 0 ]] && grep -qiE "(401|403|unauthorized|forbidden|invalid.?api.?key|permission.?denied)" "$stderr_file" 2>/dev/null; then
-        if _gemini_rotate_api_key; then
-            echo "[loki] Auth error on Gemini, rotated to next API key" >&2
-            rm -f "$stderr_file" "$output_file"
-            output_file=$(mktemp)
-            stderr_file=$(mktemp)
-            gemini --approval-mode=yolo --model "$model" "$prompt" "$@" < /dev/null 2>"$stderr_file" | tee "$output_file"
-            exit_code=${PIPESTATUS[0]}
-        fi
-    fi
-    # Check for rate limit (429) or quota exceeded (check stderr for error indicators)
-    if [[ $exit_code -ne 0 ]] && grep -qiE "(rate.?limit|429|quota|resource.?exhausted)" "$stderr_file" 2>/dev/null; then
-        rm -f "$stderr_file" "$output_file"
-        echo "[loki] Rate limit hit on $model, falling back to $PROVIDER_MODEL_FALLBACK" >&2
-        gemini --approval-mode=yolo --model "$PROVIDER_MODEL_FALLBACK" "$prompt" "$@" < /dev/null
-    else
-        rm -f "$stderr_file" "$output_file"
-        return $exit_code
-    fi
-}
-# Model tier to thinking level parameter
-provider_get_tier_param() {
-    local tier="$1"
-    case "$tier" in
-        planning) echo "high" ;;
-        development) echo "medium" ;;
-        fast) echo "low" ;;
-        *) echo "medium" ;;  # default to development tier
-    esac
-}
-# Dynamic model resolution (v6.0.0)
-# Resolves a capability tier to a concrete model name at runtime.
-# Respects LOKI_MAX_TIER to cap cost.
-resolve_model_for_tier() {
-    local tier="$1"
-    # Handle capability aliases
-    case "$tier" in
-        best)    tier="planning" ;;
-        balanced) tier="development" ;;
-        cheap)   tier="fast" ;;
-    esac
-    local max_tier="${LOKI_MAX_TIER:-}"
-    local model=""
-    case "$tier" in
-        planning)    model="$PROVIDER_MODEL_PLANNING" ;;
-        development) model="$PROVIDER_MODEL_DEVELOPMENT" ;;
-        fast)        model="$PROVIDER_MODEL_FAST" ;;
-        *)           model="$PROVIDER_MODEL_DEVELOPMENT" ;;
-    esac
-    # Apply maxTier ceiling
-    if [ -n "$max_tier" ]; then
-        case "$max_tier" in
-            haiku|flash)
-                model="$PROVIDER_MODEL_FAST"
-                ;;
-            sonnet|pro)
-                # Cap planning to development (pro)
-                if [ "$tier" = "planning" ]; then
-                    model="$PROVIDER_MODEL_DEVELOPMENT"
-                fi
-                ;;
-            opus)  ;; # No cap
-        esac
-    fi
-    echo "$model"
-}
-# Tier-aware invocation with rate limit fallback and API key rotation
-# BUG-PROV-001 fix: uses resolve_model_for_tier to select actual model for the tier
-# BUG-PROV-003 fix: rotates API keys on auth errors (401/403)
-# BUG-PROV-010 fix: uses tee to stream output while capturing for rate-limit check
-# Note: < /dev/null prevents Gemini from pausing on stdin
-provider_invoke_with_tier() {
-    # Resolve API key before invocation
-    _gemini_resolve_api_key || true
-    local tier="$1"
-    local prompt="$2"
-    shift 2
-    local model
-    model=$(resolve_model_for_tier "$tier")
-    echo "[loki] Using tier: $tier, model: $model" >&2
-    local exit_code
-    # Stream output via tee while capturing for rate-limit check
-    local output_file stderr_file
-    output_file=$(mktemp)
-    stderr_file=$(mktemp)
-    gemini --approval-mode=yolo --model "$model" "$prompt" "$@" < /dev/null 2>"$stderr_file" | tee "$output_file"
-    exit_code=${PIPESTATUS[0]}
-    # Check for auth errors (401/403) -- try rotating API key
-    if [[ $exit_code -ne 0 ]] && grep -qiE "(401|403|unauthorized|forbidden|invalid.?api.?key|permission.?denied)" "$stderr_file" 2>/dev/null; then
-        if _gemini_rotate_api_key; then
-            echo "[loki] Auth error on Gemini, rotated to next API key" >&2
-            rm -f "$stderr_file" "$output_file"
-            output_file=$(mktemp)
-            stderr_file=$(mktemp)
-            gemini --approval-mode=yolo --model "$model" "$prompt" "$@" < /dev/null 2>"$stderr_file" | tee "$output_file"
-            exit_code=${PIPESTATUS[0]}
-        fi
-    fi
-    # Check for rate limit (429) or quota exceeded - fallback to flash
-    if [[ $exit_code -ne 0 ]] && grep -qiE "(rate.?limit|429|quota|resource.?exhausted)" "$stderr_file" 2>/dev/null; then
-        rm -f "$stderr_file" "$output_file"
-        echo "[loki] Rate limit hit on $model, falling back to $PROVIDER_MODEL_FALLBACK" >&2
-        gemini --approval-mode=yolo --model "$PROVIDER_MODEL_FALLBACK" "$prompt" "$@" < /dev/null
-    else
-        rm -f "$stderr_file" "$output_file"
-        return $exit_code
-    fi
-}