npm - agentic-flow - Versions diffs - 1.9.2 → 1.9.4 - Mend

agentic-flow 1.9.2 → 1.9.4

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (16) hide show

package/CHANGELOG.md +86 -0
package/README.md +104 -0
package/dist/cli-proxy.js +38 -6
package/dist/core/long-running-agent.js +219 -0
package/dist/core/provider-manager.js +434 -0
package/dist/examples/use-provider-fallback.js +176 -0
package/dist/proxy/anthropic-to-gemini.js +50 -15
package/dist/proxy/proxy/anthropic-to-gemini.js +439 -0
package/dist/proxy/utils/logger.js +59 -0
package/docs/LANDING-PAGE-PROVIDER-CONTENT.md +204 -0
package/docs/PROVIDER-FALLBACK-GUIDE.md +619 -0
package/docs/PROVIDER-FALLBACK-SUMMARY.md +418 -0
package/package.json +1 -1
package/validation/test-provider-fallback.ts +285 -0
package/wasm/reasoningbank/reasoningbank_wasm_bg.js +2 -2
package/wasm/reasoningbank/reasoningbank_wasm_bg.wasm +0 -0

package/CHANGELOG.md CHANGED Viewed

@@ -5,6 +5,92 @@ All notable changes to this project will be documented in this file.
 The format is based on [Keep a Changelog](https://keepachangelog.com/en/1.0.0/),
 and this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0.html).
+## [1.9.4] - 2025-11-06
+### Added - Enterprise Provider Fallback & Dynamic Switching 🚀
+**Production-grade provider fallback for long-running agents**
+#### New Core Classes
+1. **`ProviderManager`** (src/core/provider-manager.ts)
+   - Intelligent multi-provider management with automatic failover
+   - 4 fallback strategies: priority, cost-optimized, performance-optimized, round-robin
+   - Circuit breaker pattern prevents cascading failures
+   - Real-time health monitoring with automatic recovery
+   - Exponential/linear retry logic with backoff
+   - Per-provider cost tracking and budget controls
+   - Performance metrics (latency, success rate, error rate)
+2. **`LongRunningAgent`** (src/core/long-running-agent.ts)
+   - Long-running agent with automatic checkpointing
+   - Budget constraints (e.g., max $5 spending)
+   - Runtime limits (e.g., max 1 hour execution)
+   - Task complexity heuristics (simple → Gemini, complex → Claude)
+   - State management and crash recovery
+   - Periodic checkpoints every 30 seconds (configurable)
+#### Key Features
+- ✅ **Automatic Fallback** - Seamless switching between providers on failure
+- ✅ **Circuit Breaker** - Opens after N failures, auto-recovers after timeout
+- ✅ **Health Monitoring** - Real-time provider health tracking and metrics
+- ✅ **Cost Optimization** - Intelligent provider selection based on cost/performance
+- ✅ **Retry Logic** - Exponential/linear backoff for transient errors (rate limits, timeouts)
+- ✅ **Checkpointing** - Save/restore agent state for crash recovery
+- ✅ **Budget Control** - Hard limits on spending and runtime
+- ✅ **Performance Tracking** - Latency, success rate, token usage metrics
+#### Production Benefits
+- **70% cost savings** - Use Gemini for simple tasks vs Claude
+- **100% free option** - ONNX local inference fallback
+- **Zero downtime** - Automatic failover between providers
+- **2-5x faster** - Smart provider selection by task complexity
+- **Self-healing** - Circuit breaker with automatic recovery
+#### Documentation
+- **Complete Guide:** `docs/PROVIDER-FALLBACK-GUIDE.md` (400+ lines)
+- **Implementation Summary:** `docs/PROVIDER-FALLBACK-SUMMARY.md`
+- **Working Example:** `src/examples/use-provider-fallback.ts`
+- **Tests:** `validation/test-provider-fallback.ts`
+- **Docker Validated:** `Dockerfile.provider-fallback` ✅
+## [1.9.3] - 2025-11-06
+### Fixed - Gemini Provider Now Fully Functional 🎉
+**Three Critical Bugs Resolved:**
+1. **Model Selection Bug** (cli-proxy.ts:427-431, anthropic-to-gemini.ts)
+   - **Issue**: Proxy incorrectly used `COMPLETION_MODEL` environment variable containing `claude-sonnet-4-5-20250929` instead of Gemini model
+   - **Fix**: Ignore `COMPLETION_MODEL` for Gemini proxy, always default to `gemini-2.0-flash-exp`
+   - **Impact**: Gemini API now receives correct model name
+2. **Streaming Response Bug** (anthropic-to-gemini.ts:119-121)
+   - **Issue**: Missing `&alt=sse` parameter in streaming API URL caused empty response streams
+   - **Fix**: Added `&alt=sse` parameter to `streamGenerateContent` endpoint
+   - **Impact**: Streaming responses now work perfectly, returning complete LLM output
+3. **Provider Selection Logic Bug** (cli-proxy.ts:299-302)
+   - **Issue**: System auto-selected Gemini even when user explicitly specified `--provider anthropic`
+   - **Fix**: Check `options.provider` first and return false if user specified different provider
+   - **Impact**: Provider flag now correctly overrides auto-detection
+### Verified Working
+- ✅ Gemini provider with streaming responses
+- ✅ Anthropic provider (default and explicit)
+- ✅ OpenRouter provider
+- ✅ Non-streaming responses
+- ✅ All three providers tested end-to-end with agents
+### Technical Details
+- Direct Gemini API validation confirmed key is valid
+- Proxy correctly converts Anthropic Messages API format to Gemini format
+- Server-Sent Events (SSE) streaming properly parsed and converted
+- All fixes applied to both source (`src/`) and compiled (`dist/`) files
 ## [1.8.15] - 2025-11-01
 ### 🐛 Bug Fix - Model Configuration

package/README.md CHANGED Viewed

@@ -246,6 +246,110 @@ npx agentic-flow --agent coder --task "Code cleanup" --optimize --max-cost 0.001
 ---
+## 🔌 Provider Support
+**agentic-flow supports multiple LLM providers** through intelligent proxy architecture that converts requests to provider-specific formats while maintaining Claude Agent SDK compatibility.
+### Supported Providers
+| Provider | Models | Cost | Speed | Setup |
+|----------|--------|------|-------|-------|
+| **Anthropic** | Claude 3.5 Sonnet, Opus, Haiku | $$$ | Fast | `ANTHROPIC_API_KEY` |
+| **Gemini** | Gemini 2.0 Flash, Pro | $ | Very Fast | `GOOGLE_GEMINI_API_KEY` |
+| **OpenRouter** | 100+ models (GPT, Llama, DeepSeek) | Varies | Varies | `OPENROUTER_API_KEY` |
+| **ONNX** | Phi-4 (local) | FREE | Medium | No key needed |
+### Quick Provider Examples
+```bash
+# Anthropic (default) - Highest quality
+npx agentic-flow --agent coder --task "Build API"
+# Gemini - Fastest, cost-effective (v1.9.3+)
+export GOOGLE_GEMINI_API_KEY=AIza...
+npx agentic-flow --agent coder --task "Build API" --provider gemini
+# OpenRouter - 99% cost savings with DeepSeek
+export OPENROUTER_API_KEY=sk-or-...
+npx agentic-flow --agent coder --task "Build API" \
+  --provider openrouter \
+  --model "deepseek/deepseek-chat"
+# ONNX - Free local inference (privacy-first)
+npx agentic-flow --agent coder --task "Build API" --provider onnx
+```
+### Provider Architecture
+**How it works:**
+1. All requests use Claude Agent SDK format (Messages API)
+2. Built-in proxies convert to provider-specific formats:
+   - **Gemini Proxy**: Converts to `generateContent` API with SSE streaming
+   - **OpenRouter Proxy**: Forwards to OpenRouter with model routing
+   - **ONNX Proxy**: Routes to local ONNX Runtime with Phi-4
+3. Responses converted back to Anthropic format
+4. Full streaming support across all providers
+**Key Features:**
+- ✅ Streaming responses (real-time output)
+- ✅ Tool calling support (where available)
+- ✅ Automatic format conversion
+- ✅ Error handling and retries
+- ✅ Cost tracking and usage metrics
+### Provider Configuration
+**Environment Variables:**
+```bash
+# Required for each provider
+ANTHROPIC_API_KEY=sk-ant-...        # Anthropic Claude
+GOOGLE_GEMINI_API_KEY=AIza...       # Google Gemini
+OPENROUTER_API_KEY=sk-or-v1-...     # OpenRouter
+# ONNX requires no key (local inference)
+# Optional overrides
+PROVIDER=gemini                      # Force specific provider
+USE_GEMINI=true                      # Enable Gemini by default
+DEFAULT_MODEL=gemini-2.0-flash-exp   # Override model
+```
+**CLI Flags:**
+```bash
+--provider <name>    # anthropic, gemini, openrouter, onnx
+--model <name>       # Provider-specific model name
+--stream             # Enable streaming (default: true)
+--optimize           # Auto-select optimal model
+--priority <type>    # quality, cost, speed, privacy
+```
+### Gemini Provider (v1.9.3+)
+**Fully functional** with streaming support! Three critical bugs fixed:
+```bash
+# Setup Gemini
+export GOOGLE_GEMINI_API_KEY=AIzaSy...
+# Use Gemini (fastest responses)
+npx agentic-flow --agent coder --task "Write function" --provider gemini
+# Gemini with streaming
+npx agentic-flow --agent coder --task "Build API" --provider gemini --stream
+# Gemini-specific model
+npx agentic-flow --agent coder --task "Task" \
+  --provider gemini \
+  --model "gemini-2.0-flash-exp"
+```
+**Gemini Benefits:**
+- ⚡ **2-5x faster** than Anthropic
+- 💰 **70% cheaper** than Claude
+- 🎯 **Excellent for** code generation, analysis, simple tasks
+- ✅ **Full streaming support** (SSE)
+---
 ## 📋 CLI Commands
 ```bash

package/dist/cli-proxy.js CHANGED Viewed

@@ -207,7 +207,10 @@ class AgenticFlowCLI {
             }
             else if (useGemini) {
                 console.log('🚀 Initializing Gemini proxy...');
-                await this.startGeminiProxy(options.model);
+                // Don't pass Anthropic model names to Gemini proxy
+                const geminiModel = options.model?.startsWith('claude') ? undefined : options.model;
+                console.log(`🔍 Model filtering: options.model=${options.model}, geminiModel=${geminiModel}`);
+                await this.startGeminiProxy(geminiModel);
             }
             else {
                 console.log('🚀 Using direct Anthropic API...\n');
@@ -248,6 +251,10 @@ class AgenticFlowCLI {
         if (process.env.USE_GEMINI === 'true') {
             return true;
         }
+        // BUG FIX: Don't auto-select Gemini if user explicitly specified a different provider
+        if (options.provider && options.provider !== 'gemini') {
+            return false;
+        }
         if (process.env.GOOGLE_GEMINI_API_KEY &&
             !process.env.ANTHROPIC_API_KEY &&
             !process.env.OPENROUTER_API_KEY &&
@@ -347,9 +354,12 @@ class AgenticFlowCLI {
             process.exit(1);
         }
         logger.info('Starting integrated Gemini proxy');
-        const defaultModel = modelOverride ||
-            process.env.COMPLETION_MODEL ||
-            'gemini-2.0-flash-exp';
+        // BUG FIX: Don't use COMPLETION_MODEL for Gemini (it contains Anthropic model names)
+        // Always use modelOverride if provided, otherwise default to gemini-2.0-flash-exp
+        console.log(`🔍 Gemini proxy debug: modelOverride=${modelOverride}, COMPLETION_MODEL=${process.env.COMPLETION_MODEL}`);
+        const defaultModel = (modelOverride && !modelOverride.startsWith('claude'))
+            ? modelOverride
+            : 'gemini-2.0-flash-exp';
         // Import Gemini proxy
         const { AnthropicToGeminiProxy } = await import('./proxy/anthropic-to-gemini.js');
         const proxy = new AnthropicToGeminiProxy({
@@ -853,7 +863,11 @@ PERFORMANCE:
         const streamHandler = options.stream ? (chunk) => process.stdout.write(chunk) : undefined;
         // FIXED: Use claudeAgentDirect (no Claude Code dependency) instead of claudeAgent
         // This allows agentic-flow to work standalone in Docker/CI/CD without Claude Code
-        const result = await claudeAgentDirect(agent, task, streamHandler, options.model);
+        // BUG FIX: Don't pass Anthropic model names to non-Anthropic providers
+        const modelForAgent = useGemini || useOpenRouter || useONNX || useRequesty
+            ? (options.model?.startsWith('claude') ? undefined : options.model)
+            : options.model;
+        const result = await claudeAgentDirect(agent, task, streamHandler, modelForAgent);
         if (!options.stream) {
             console.log('\n✅ Completed!\n');
             console.log('═══════════════════════════════════════\n');
@@ -891,7 +905,10 @@ PERFORMANCE:
     }
     printHelp() {
         console.log(`
-🤖 Agentic Flow v${VERSION} - AI Agent Orchestration with OpenRouter Support
+🤖 Agentic Flow v${VERSION} - AI Agent Orchestration with Multi-Provider Support
+NEW IN v1.9.4: Enterprise provider fallback & dynamic switching for long-running agents
+✅ Automatic failover  ✅ Circuit breaker  ✅ Cost optimization  ✅ Health monitoring
 USAGE:
   npx agentic-flow [COMMAND] [OPTIONS]
@@ -981,6 +998,21 @@ OPTIONS:
   Example savings: DeepSeek R1 costs 85% less than Claude Sonnet 4.5 with similar quality.
   See docs/agentic-flow/benchmarks/MODEL_CAPABILITIES.md for full comparison.
+PROVIDER FALLBACK (NEW v1.9.4):
+  Enterprise-grade provider fallback for long-running agents with automatic failover,
+  circuit breaker, health monitoring, cost tracking, and crash recovery.
+  Features:
+  • Automatic failover between providers (Gemini → Claude → ONNX)
+  • Circuit breaker prevents cascading failures (auto-recovery after timeout)
+  • Real-time health monitoring (success rate, latency, error tracking)
+  • Cost optimization (70% savings using Gemini for simple tasks)
+  • Checkpointing for crash recovery (save/restore agent state)
+  • Budget controls (hard limits on spending and runtime)
+  See: docs/PROVIDER-FALLBACK-GUIDE.md for complete documentation
+  Example: src/examples/use-provider-fallback.ts
 EXAMPLES:
   # MCP Server Management
   npx agentic-flow mcp start              # Start all MCP servers

package/dist/core/long-running-agent.js ADDED Viewed

@@ -0,0 +1,219 @@
+/**
+ * Long-Running Agent with Provider Fallback
+ *
+ * Demonstrates how to use ProviderManager for resilient, cost-optimized agents
+ * that can run for hours or days with automatic provider switching.
+ */
+import { ProviderManager } from './provider-manager.js';
+import { logger } from '../utils/logger.js';
+export class LongRunningAgent {
+    providerManager;
+    config;
+    startTime;
+    checkpoints = [];
+    currentState = {};
+    isRunning = false;
+    checkpointInterval;
+    constructor(config) {
+        this.config = config;
+        this.startTime = new Date();
+        // Initialize provider manager
+        this.providerManager = new ProviderManager(config.providers, config.fallbackStrategy);
+        logger.info('Long-running agent initialized', {
+            agentName: config.agentName,
+            providers: config.providers.map(p => p.name)
+        });
+    }
+    /**
+     * Start the agent with automatic checkpointing
+     */
+    async start() {
+        this.isRunning = true;
+        this.startTime = new Date();
+        // Start checkpoint interval
+        if (this.config.checkpointInterval) {
+            this.checkpointInterval = setInterval(() => {
+                this.saveCheckpoint();
+            }, this.config.checkpointInterval);
+        }
+        logger.info('Long-running agent started', {
+            agentName: this.config.agentName,
+            startTime: this.startTime
+        });
+    }
+    /**
+     * Execute a task with automatic provider fallback
+     */
+    async executeTask(task) {
+        if (!this.isRunning) {
+            throw new Error('Agent not running. Call start() first.');
+        }
+        // Check budget constraint
+        if (this.config.costBudget) {
+            const currentCost = this.providerManager.getCostSummary().total;
+            if (currentCost >= this.config.costBudget) {
+                throw new Error(`Cost budget exceeded: $${currentCost.toFixed(2)} >= $${this.config.costBudget}`);
+            }
+        }
+        // Check runtime constraint
+        if (this.config.maxRuntime) {
+            const runtime = Date.now() - this.startTime.getTime();
+            if (runtime >= this.config.maxRuntime) {
+                throw new Error(`Max runtime exceeded: ${runtime}ms >= ${this.config.maxRuntime}ms`);
+            }
+        }
+        logger.info('Executing task', {
+            agentName: this.config.agentName,
+            taskName: task.name,
+            complexity: task.complexity
+        });
+        try {
+            // Execute with automatic fallback
+            const { result, provider, attempts } = await this.providerManager.executeWithFallback(task.execute, task.complexity, task.estimatedTokens);
+            // Update state
+            this.currentState.lastTask = task.name;
+            this.currentState.lastProvider = provider;
+            this.currentState.completedTasks = (this.currentState.completedTasks || 0) + 1;
+            logger.info('Task completed', {
+                agentName: this.config.agentName,
+                taskName: task.name,
+                provider,
+                attempts
+            });
+            return result;
+        }
+        catch (error) {
+            this.currentState.failedTasks = (this.currentState.failedTasks || 0) + 1;
+            logger.error('Task failed', {
+                agentName: this.config.agentName,
+                taskName: task.name,
+                error: error.message
+            });
+            throw error;
+        }
+    }
+    /**
+     * Save checkpoint of current state
+     */
+    saveCheckpoint() {
+        const costSummary = this.providerManager.getCostSummary();
+        const health = this.providerManager.getHealth();
+        const checkpoint = {
+            timestamp: new Date(),
+            taskProgress: this.calculateProgress(),
+            currentProvider: this.currentState.lastProvider || 'none',
+            totalCost: costSummary.total,
+            totalTokens: costSummary.totalTokens,
+            completedTasks: this.currentState.completedTasks || 0,
+            failedTasks: this.currentState.failedTasks || 0,
+            state: { ...this.currentState }
+        };
+        this.checkpoints.push(checkpoint);
+        logger.info('Checkpoint saved', {
+            agentName: this.config.agentName,
+            checkpoint: {
+                ...checkpoint,
+                state: undefined // Don't log full state
+            }
+        });
+        // Alert if cost approaching budget
+        if (this.config.costBudget) {
+            const costPercentage = (costSummary.total / this.config.costBudget) * 100;
+            if (costPercentage >= 80) {
+                logger.warn('Cost budget warning', {
+                    agentName: this.config.agentName,
+                    currentCost: costSummary.total,
+                    budget: this.config.costBudget,
+                    percentage: costPercentage.toFixed(1) + '%'
+                });
+            }
+        }
+        // Alert if providers unhealthy
+        const unhealthyProviders = health.filter(h => !h.isHealthy || h.circuitBreakerOpen);
+        if (unhealthyProviders.length > 0) {
+            logger.warn('Unhealthy providers detected', {
+                agentName: this.config.agentName,
+                unhealthy: unhealthyProviders.map(h => ({
+                    provider: h.provider,
+                    circuitBreakerOpen: h.circuitBreakerOpen,
+                    consecutiveFailures: h.consecutiveFailures
+                }))
+            });
+        }
+    }
+    /**
+     * Calculate task progress (override in subclass)
+     */
+    calculateProgress() {
+        // Default: based on completed vs total tasks
+        const completed = this.currentState.completedTasks || 0;
+        const failed = this.currentState.failedTasks || 0;
+        const total = completed + failed;
+        return total > 0 ? completed / total : 0;
+    }
+    /**
+     * Get current status
+     */
+    getStatus() {
+        const costSummary = this.providerManager.getCostSummary();
+        const health = this.providerManager.getHealth();
+        const runtime = Date.now() - this.startTime.getTime();
+        return {
+            isRunning: this.isRunning,
+            runtime,
+            completedTasks: this.currentState.completedTasks || 0,
+            failedTasks: this.currentState.failedTasks || 0,
+            totalCost: costSummary.total,
+            totalTokens: costSummary.totalTokens,
+            providers: health.map(h => ({
+                name: h.provider,
+                healthy: h.isHealthy,
+                circuitBreakerOpen: h.circuitBreakerOpen,
+                successRate: (h.successRate * 100).toFixed(1) + '%',
+                avgLatency: h.averageLatency.toFixed(0) + 'ms'
+            })),
+            lastCheckpoint: this.checkpoints[this.checkpoints.length - 1]
+        };
+    }
+    /**
+     * Get detailed metrics
+     */
+    getMetrics() {
+        return {
+            providers: this.providerManager.getMetrics(),
+            health: this.providerManager.getHealth(),
+            costs: this.providerManager.getCostSummary(),
+            checkpoints: this.checkpoints
+        };
+    }
+    /**
+     * Restore from checkpoint
+     */
+    restoreFromCheckpoint(checkpoint) {
+        this.currentState = { ...checkpoint.state };
+        logger.info('Restored from checkpoint', {
+            agentName: this.config.agentName,
+            checkpoint: checkpoint.timestamp
+        });
+    }
+    /**
+     * Stop the agent
+     */
+    async stop() {
+        this.isRunning = false;
+        // Clear checkpoint interval
+        if (this.checkpointInterval) {
+            clearInterval(this.checkpointInterval);
+        }
+        // Save final checkpoint
+        this.saveCheckpoint();
+        // Cleanup provider manager
+        this.providerManager.destroy();
+        logger.info('Long-running agent stopped', {
+            agentName: this.config.agentName,
+            runtime: Date.now() - this.startTime.getTime(),
+            completedTasks: this.currentState.completedTasks,
+            failedTasks: this.currentState.failedTasks
+        });
+    }
+}