npm - popeye-cli - Versions diffs - 1.0.0 → 1.1.0 - Mend

popeye-cli 1.0.0 → 1.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (171) hide show

package/README.md +521 -125
package/dist/adapters/claude.d.ts +16 -4
package/dist/adapters/claude.d.ts.map +1 -1
package/dist/adapters/claude.js +679 -33
package/dist/adapters/claude.js.map +1 -1
package/dist/adapters/gemini.d.ts +55 -0
package/dist/adapters/gemini.d.ts.map +1 -0
package/dist/adapters/gemini.js +318 -0
package/dist/adapters/gemini.js.map +1 -0
package/dist/adapters/openai.d.ts.map +1 -1
package/dist/adapters/openai.js +41 -7
package/dist/adapters/openai.js.map +1 -1
package/dist/auth/claude.d.ts +11 -9
package/dist/auth/claude.d.ts.map +1 -1
package/dist/auth/claude.js +107 -71
package/dist/auth/claude.js.map +1 -1
package/dist/auth/gemini.d.ts +58 -0
package/dist/auth/gemini.d.ts.map +1 -0
package/dist/auth/gemini.js +172 -0
package/dist/auth/gemini.js.map +1 -0
package/dist/auth/index.d.ts +11 -7
package/dist/auth/index.d.ts.map +1 -1
package/dist/auth/index.js +23 -5
package/dist/auth/index.js.map +1 -1
package/dist/auth/keychain.d.ts +20 -7
package/dist/auth/keychain.d.ts.map +1 -1
package/dist/auth/keychain.js +85 -29
package/dist/auth/keychain.js.map +1 -1
package/dist/auth/openai.d.ts +2 -2
package/dist/auth/openai.d.ts.map +1 -1
package/dist/auth/openai.js +30 -32
package/dist/auth/openai.js.map +1 -1
package/dist/cli/index.d.ts.map +1 -1
package/dist/cli/index.js +4 -7
package/dist/cli/index.js.map +1 -1
package/dist/cli/interactive.d.ts +2 -2
package/dist/cli/interactive.d.ts.map +1 -1
package/dist/cli/interactive.js +1380 -183
package/dist/cli/interactive.js.map +1 -1
package/dist/config/defaults.d.ts +6 -1
package/dist/config/defaults.d.ts.map +1 -1
package/dist/config/defaults.js +10 -2
package/dist/config/defaults.js.map +1 -1
package/dist/config/index.d.ts +10 -0
package/dist/config/index.d.ts.map +1 -1
package/dist/config/index.js +19 -0
package/dist/config/index.js.map +1 -1
package/dist/config/schema.d.ts +20 -0
package/dist/config/schema.d.ts.map +1 -1
package/dist/config/schema.js +7 -0
package/dist/config/schema.js.map +1 -1
package/dist/generators/python.d.ts.map +1 -1
package/dist/generators/python.js +1 -0
package/dist/generators/python.js.map +1 -1
package/dist/generators/typescript.d.ts.map +1 -1
package/dist/generators/typescript.js +1 -0
package/dist/generators/typescript.js.map +1 -1
package/dist/state/index.d.ts +108 -0
package/dist/state/index.d.ts.map +1 -1
package/dist/state/index.js +551 -4
package/dist/state/index.js.map +1 -1
package/dist/state/registry.d.ts +52 -0
package/dist/state/registry.d.ts.map +1 -0
package/dist/state/registry.js +215 -0
package/dist/state/registry.js.map +1 -0
package/dist/types/cli.d.ts +4 -0
package/dist/types/cli.d.ts.map +1 -1
package/dist/types/cli.js.map +1 -1
package/dist/types/consensus.d.ts +69 -4
package/dist/types/consensus.d.ts.map +1 -1
package/dist/types/consensus.js +24 -3
package/dist/types/consensus.js.map +1 -1
package/dist/types/workflow.d.ts +55 -0
package/dist/types/workflow.d.ts.map +1 -1
package/dist/types/workflow.js +16 -0
package/dist/types/workflow.js.map +1 -1
package/dist/workflow/auto-fix.d.ts +45 -0
package/dist/workflow/auto-fix.d.ts.map +1 -0
package/dist/workflow/auto-fix.js +274 -0
package/dist/workflow/auto-fix.js.map +1 -0
package/dist/workflow/consensus.d.ts +44 -2
package/dist/workflow/consensus.d.ts.map +1 -1
package/dist/workflow/consensus.js +565 -17
package/dist/workflow/consensus.js.map +1 -1
package/dist/workflow/execution-mode.d.ts +10 -4
package/dist/workflow/execution-mode.d.ts.map +1 -1
package/dist/workflow/execution-mode.js +547 -58
package/dist/workflow/execution-mode.js.map +1 -1
package/dist/workflow/index.d.ts +14 -2
package/dist/workflow/index.d.ts.map +1 -1
package/dist/workflow/index.js +69 -6
package/dist/workflow/index.js.map +1 -1
package/dist/workflow/milestone-workflow.d.ts +34 -0
package/dist/workflow/milestone-workflow.d.ts.map +1 -0
package/dist/workflow/milestone-workflow.js +414 -0
package/dist/workflow/milestone-workflow.js.map +1 -0
package/dist/workflow/plan-mode.d.ts +14 -1
package/dist/workflow/plan-mode.d.ts.map +1 -1
package/dist/workflow/plan-mode.js +589 -47
package/dist/workflow/plan-mode.js.map +1 -1
package/dist/workflow/plan-storage.d.ts +142 -0
package/dist/workflow/plan-storage.d.ts.map +1 -0
package/dist/workflow/plan-storage.js +331 -0
package/dist/workflow/plan-storage.js.map +1 -0
package/dist/workflow/project-verification.d.ts +37 -0
package/dist/workflow/project-verification.d.ts.map +1 -0
package/dist/workflow/project-verification.js +381 -0
package/dist/workflow/project-verification.js.map +1 -0
package/dist/workflow/task-workflow.d.ts +37 -0
package/dist/workflow/task-workflow.d.ts.map +1 -0
package/dist/workflow/task-workflow.js +383 -0
package/dist/workflow/task-workflow.js.map +1 -0
package/dist/workflow/test-runner.d.ts +1 -0
package/dist/workflow/test-runner.d.ts.map +1 -1
package/dist/workflow/test-runner.js +9 -5
package/dist/workflow/test-runner.js.map +1 -1
package/dist/workflow/ui-designer.d.ts +82 -0
package/dist/workflow/ui-designer.d.ts.map +1 -0
package/dist/workflow/ui-designer.js +234 -0
package/dist/workflow/ui-designer.js.map +1 -0
package/dist/workflow/ui-setup.d.ts +58 -0
package/dist/workflow/ui-setup.d.ts.map +1 -0
package/dist/workflow/ui-setup.js +685 -0
package/dist/workflow/ui-setup.js.map +1 -0
package/dist/workflow/ui-verification.d.ts +114 -0
package/dist/workflow/ui-verification.d.ts.map +1 -0
package/dist/workflow/ui-verification.js +258 -0
package/dist/workflow/ui-verification.js.map +1 -0
package/dist/workflow/workflow-logger.d.ts +110 -0
package/dist/workflow/workflow-logger.d.ts.map +1 -0
package/dist/workflow/workflow-logger.js +267 -0
package/dist/workflow/workflow-logger.js.map +1 -0
package/package.json +2 -2
package/src/adapters/claude.ts +815 -34
package/src/adapters/gemini.ts +373 -0
package/src/adapters/openai.ts +40 -7
package/src/auth/claude.ts +120 -78
package/src/auth/gemini.ts +207 -0
package/src/auth/index.ts +28 -8
package/src/auth/keychain.ts +95 -28
package/src/auth/openai.ts +29 -36
package/src/cli/index.ts +4 -7
package/src/cli/interactive.ts +1641 -216
package/src/config/defaults.ts +10 -2
package/src/config/index.ts +21 -0
package/src/config/schema.ts +7 -0
package/src/generators/python.ts +1 -0
package/src/generators/typescript.ts +1 -0
package/src/state/index.ts +713 -4
package/src/state/registry.ts +278 -0
package/src/types/cli.ts +4 -0
package/src/types/consensus.ts +65 -6
package/src/types/workflow.ts +35 -0
package/src/workflow/auto-fix.ts +340 -0
package/src/workflow/consensus.ts +750 -16
package/src/workflow/execution-mode.ts +673 -74
package/src/workflow/index.ts +95 -6
package/src/workflow/milestone-workflow.ts +576 -0
package/src/workflow/plan-mode.ts +696 -50
package/src/workflow/plan-storage.ts +482 -0
package/src/workflow/project-verification.ts +471 -0
package/src/workflow/task-workflow.ts +525 -0
package/src/workflow/test-runner.ts +10 -5
package/src/workflow/ui-designer.ts +337 -0
package/src/workflow/ui-setup.ts +797 -0
package/src/workflow/ui-verification.ts +357 -0
package/src/workflow/workflow-logger.ts +353 -0
package/tests/config/config.test.ts +1 -1
package/tests/types/consensus.test.ts +3 -3
package/tests/workflow/plan-mode.test.ts +213 -0
package/tests/workflow/test-runner.test.ts +5 -3

package/src/workflow/consensus.ts CHANGED Viewed

@@ -1,13 +1,16 @@
 /**
  * Consensus workflow module
- * Handles the iterative consensus-building process between Claude and OpenAI
+ * Handles the iterative consensus-building process between Claude and OpenAI/Gemini
+ * with arbitration support when consensus cannot be reached
  */
-import type { ConsensusResult, ConsensusIteration, ConsensusConfig } from '../types/consensus.js';
+import type { ConsensusResult, ConsensusIteration, ConsensusConfig, ArbitrationResult, AIProvider } from '../types/consensus.js';
 import { DEFAULT_CONSENSUS_CONFIG } from '../types/consensus.js';
-import { requestConsensus } from '../adapters/openai.js';
+import { requestConsensus as requestOpenAIConsensus } from '../adapters/openai.js';
+import { requestConsensus as requestGeminiConsensus, requestArbitration as requestGeminiArbitration } from '../adapters/gemini.js';
 import { revisePlan } from '../adapters/claude.js';
 import { recordConsensusIteration } from '../state/index.js';
+import { createPlanStorage, type ReviewerFeedback } from './plan-storage.js';
 /**
  * Options for consensus iteration
@@ -17,6 +20,9 @@ export interface ConsensusOptions {
   config?: Partial<ConsensusConfig>;
   onIteration?: (iteration: number, result: ConsensusResult) => void;
   onRevision?: (iteration: number, revisedPlan: string) => void;
+  onConcerns?: (concerns: string[], recommendations: string[]) => void;
+  onArbitration?: (result: ArbitrationResult) => void;
+  onProgress?: (phase: string, message: string) => void;
 }
 /**
@@ -26,10 +32,84 @@ export interface ConsensusProcessResult {
   approved: boolean;
   finalPlan: string;
   finalScore: number;
+  bestPlan: string;
+  bestScore: number;
+  bestIteration: number;
   iterations: ConsensusIteration[];
   totalIterations: number;
+  finalConcerns: string[];
+  finalRecommendations: string[];
+  arbitrated: boolean;
+  arbitrationResult?: ArbitrationResult;
+  /** True if consensus timed out and we accepted the best available plan */
+  timedOut?: boolean;
 }
+/**
+ * Request consensus from the configured reviewer (OpenAI or Gemini)
+ */
+async function requestReviewerConsensus(
+  plan: string,
+  context: string,
+  reviewer: AIProvider,
+  config: Partial<ConsensusConfig>
+): Promise<ConsensusResult> {
+  if (reviewer === 'gemini') {
+    return requestGeminiConsensus(plan, context, {
+      model: config.geminiModel,
+      temperature: config.temperature,
+      maxTokens: config.maxTokens,
+    });
+  }
+  return requestOpenAIConsensus(plan, context, config);
+}
+/**
+ * Check if the consensus process is "stuck" (not improving)
+ * Detects both:
+ * 1. Stagnation: scores within 5% of each other
+ * 2. Oscillation: scores going up and down without progress
+ */
+function isStuck(scores: number[], stuckIterations: number): boolean {
+  if (scores.length < stuckIterations) return false;
+  const recentScores = scores.slice(-stuckIterations);
+  const maxRecent = Math.max(...recentScores);
+  const minRecent = Math.min(...recentScores);
+  // Check 1: Stagnation - all recent scores are within 5% of each other
+  if ((maxRecent - minRecent) <= 5) {
+    return true;
+  }
+  // Check 2: Oscillation - detect if we're going up and down without making progress
+  // e.g., 70 -> 85 -> 75 -> 80 (oscillating around ~77.5)
+  if (recentScores.length >= 3) {
+    const avg = recentScores.reduce((a, b) => a + b, 0) / recentScores.length;
+    const deviations = recentScores.map(s => Math.abs(s - avg));
+    const avgDeviation = deviations.reduce((a, b) => a + b, 0) / deviations.length;
+    // If scores are oscillating around an average (avg deviation > 3% but range < 20%)
+    // and we're not trending upward, consider it stuck
+    if (avgDeviation > 3 && (maxRecent - minRecent) < 20) {
+      // Check if we're trending upward (last score should be close to max)
+      const lastScore = recentScores[recentScores.length - 1];
+      const firstScore = recentScores[0];
+      // Not improving if last score is not better than first
+      if (lastScore <= firstScore + 2) {
+        return true;
+      }
+    }
+  }
+  return false;
+}
+/**
+ * Default consensus timeout (15 minutes total)
+ */
+const DEFAULT_CONSENSUS_TIMEOUT_MS = 15 * 60 * 1000;
 /**
  * Format a plan for consensus review
  * Structures the plan in a way that's optimal for review
@@ -88,6 +168,7 @@ export function meetsThreshold(
 /**
  * Iterate until consensus is reached
+ * Supports configurable reviewer and arbitration when stuck
  *
  * @param initialPlan - The initial plan to review
  * @param context - Project context
@@ -104,22 +185,122 @@ export async function iterateUntilConsensus(
     config = {},
     onIteration,
     onRevision,
+    onConcerns,
+    onArbitration,
+    onProgress,
   } = options;
   const {
     threshold = DEFAULT_CONSENSUS_CONFIG.threshold,
     maxIterations = DEFAULT_CONSENSUS_CONFIG.maxIterations,
+    reviewer = DEFAULT_CONSENSUS_CONFIG.reviewer,
+    arbitrator = DEFAULT_CONSENSUS_CONFIG.arbitrator,
+    enableArbitration = DEFAULT_CONSENSUS_CONFIG.enableArbitration,
+    arbitrationThreshold = DEFAULT_CONSENSUS_CONFIG.arbitrationThreshold,
+    stuckIterations = DEFAULT_CONSENSUS_CONFIG.stuckIterations,
   } = config;
   const iterations: ConsensusIteration[] = [];
+  const scores: number[] = [];
   let currentPlan = initialPlan;
   let iteration = 0;
+  // Track the best plan throughout the process
+  let bestPlan = initialPlan;
+  let bestScore = 0;
+  let bestIteration = 0;
+  let lastConcerns: string[] = [];
+  let lastRecommendations: string[] = [];
+  let lastAnalysis = '';
+  // Track arbitration attempts to prevent infinite loops
+  let arbitrationAttempts = 0;
+  // Track elapsed time to detect stuck processes
+  const startTime = Date.now();
+  const maxArbitrationAttempts = 2;
+  onProgress?.('consensus', `Using ${reviewer} as reviewer${enableArbitration ? `, ${arbitrator} as arbitrator` : ''}`);
   while (iteration < maxIterations) {
     iteration++;
-    // Request consensus review from OpenAI
-    const consensusResult = await requestConsensus(currentPlan, context, config);
+    // Check total elapsed time - if timing out, try arbitration before giving up
+    const totalElapsed = Date.now() - startTime;
+    if (totalElapsed > DEFAULT_CONSENSUS_TIMEOUT_MS && enableArbitration && arbitrationAttempts < maxArbitrationAttempts) {
+      onProgress?.('consensus', `Consensus timeout after ${Math.round(totalElapsed / 60000)} minutes - invoking arbitrator before accepting`);
+      try {
+        arbitrationAttempts++;
+        const arbitrationResult = await requestGeminiArbitration(
+          bestPlan,
+          lastAnalysis,
+          `Consensus timed out after ${Math.round(totalElapsed / 60000)} minutes. Best score: ${bestScore}%. Main concerns: ${lastConcerns.slice(0, 3).join('; ')}`,
+          iteration,
+          scores
+        );
+        if (onArbitration) {
+          onArbitration(arbitrationResult);
+        }
+        // Accept arbitration result (we're out of time)
+        onProgress?.('arbitration', `Arbitrator decision: ${arbitrationResult.approved ? 'APPROVED' : 'REVISE'} with ${arbitrationResult.score}%`);
+        return {
+          approved: arbitrationResult.approved || arbitrationResult.score >= 80,
+          finalPlan: bestPlan,
+          finalScore: arbitrationResult.score,
+          bestPlan,
+          bestScore: arbitrationResult.score,
+          bestIteration,
+          iterations,
+          totalIterations: iteration - 1,
+          finalConcerns: arbitrationResult.minorConcerns || lastConcerns,
+          finalRecommendations: arbitrationResult.suggestedChanges || lastRecommendations,
+          arbitrated: true,
+          arbitrationResult,
+          timedOut: true,
+        };
+      } catch (arbError) {
+        onProgress?.('arbitration', `Arbitration failed on timeout: ${arbError instanceof Error ? arbError.message : 'Unknown error'}`);
+        // Fall through to accept best plan
+      }
+    }
+    // Hard timeout - no more arbitration attempts left
+    if (totalElapsed > DEFAULT_CONSENSUS_TIMEOUT_MS) {
+      onProgress?.('consensus', `Consensus timeout - accepting best plan with ${bestScore}%`);
+      return {
+        approved: bestScore >= arbitrationThreshold,
+        finalPlan: bestPlan,
+        finalScore: bestScore,
+        bestPlan,
+        bestScore,
+        bestIteration,
+        iterations,
+        totalIterations: iteration - 1,
+        finalConcerns: lastConcerns,
+        finalRecommendations: lastRecommendations,
+        arbitrated: false,
+        timedOut: true,
+      };
+    }
+    // Log iteration timing
+    const iterationStart = Date.now();
+    const elapsedMinutes = Math.round((iterationStart - startTime) / 60000);
+    onProgress?.('consensus', `Iteration ${iteration} starting (${elapsedMinutes}min elapsed)`);
+    // Request consensus review from configured reviewer
+    onProgress?.('consensus', `Requesting review from ${reviewer}...`);
+    const consensusResult = await requestReviewerConsensus(currentPlan, context, reviewer, config);
+    // Log iteration duration
+    const iterationDuration = Math.round((Date.now() - iterationStart) / 1000);
+    onProgress?.('consensus', `Review completed in ${iterationDuration}s - score: ${consensusResult.score}%`);
+    scores.push(consensusResult.score);
     // Record the iteration
     const iterationRecord: ConsensusIteration = {
@@ -134,54 +315,183 @@ export async function iterateUntilConsensus(
     // Save to project state
     await recordConsensusIteration(projectDir, iterationRecord);
-    // Notify callback
+    // Track best plan - only update if this score is better
+    if (consensusResult.score > bestScore) {
+      bestPlan = currentPlan;
+      bestScore = consensusResult.score;
+      bestIteration = iteration;
+    }
+    // Track concerns for output
+    lastConcerns = consensusResult.concerns || [];
+    lastRecommendations = consensusResult.recommendations || [];
+    lastAnalysis = consensusResult.analysis || '';
+    // Notify callbacks
     if (onIteration) {
       onIteration(iteration, consensusResult);
     }
+    if (onConcerns && (lastConcerns.length > 0 || lastRecommendations.length > 0)) {
+      onConcerns(lastConcerns, lastRecommendations);
+    }
     // Check if we've reached consensus
     if (meetsThreshold(consensusResult.score, threshold)) {
       return {
         approved: true,
         finalPlan: currentPlan,
         finalScore: consensusResult.score,
+        bestPlan: currentPlan,
+        bestScore: consensusResult.score,
+        bestIteration: iteration,
         iterations,
         totalIterations: iteration,
+        finalConcerns: [],
+        finalRecommendations: [],
+        arbitrated: false,
       };
     }
+    // Check if we're stuck and should trigger arbitration
+    if (enableArbitration &&
+        bestScore >= arbitrationThreshold &&
+        isStuck(scores, stuckIterations) &&
+        arbitrationAttempts < maxArbitrationAttempts) {
+      arbitrationAttempts++;
+      onProgress?.('arbitration', `Consensus stuck at ${bestScore}%, invoking ${arbitrator} arbitrator (attempt ${arbitrationAttempts}/${maxArbitrationAttempts})...`);
+      try {
+        const arbitrationResult = await requestGeminiArbitration(
+          bestPlan,
+          lastAnalysis,
+          `The plan has been revised ${iteration} times. Best score achieved: ${bestScore}%. The reviewer's main concerns are: ${lastConcerns.slice(0, 3).join('; ')}`,
+          iteration,
+          scores
+        );
+        if (onArbitration) {
+          onArbitration(arbitrationResult);
+        }
+        // Accept if arbitrator approves OR if arbitrator gives a high score (>= 88%)
+        // This prevents infinite REVISE loops when the arbitrator is happy enough
+        const acceptArbitration = arbitrationResult.approved ||
+                                   arbitrationResult.score >= 88 ||
+                                   (arbitrationAttempts >= maxArbitrationAttempts && arbitrationResult.score >= 80);
+        if (acceptArbitration) {
+          const reason = arbitrationResult.approved
+            ? `Arbitrator approved plan with ${arbitrationResult.score}% confidence`
+            : `Arbitrator score ${arbitrationResult.score}% is acceptable - proceeding with best plan`;
+          onProgress?.('arbitration', reason);
+          return {
+            approved: true,
+            finalPlan: bestPlan,
+            finalScore: arbitrationResult.score,
+            bestPlan,
+            bestScore: arbitrationResult.score,
+            bestIteration,
+            iterations,
+            totalIterations: iteration,
+            finalConcerns: arbitrationResult.minorConcerns || [],
+            finalRecommendations: arbitrationResult.suggestedChanges || [],
+            arbitrated: true,
+            arbitrationResult,
+          };
+        } else {
+          onProgress?.('arbitration', `Arbitrator requests changes: ${arbitrationResult.suggestedChanges.slice(0, 2).join('; ')}`);
+          // Apply arbitrator's suggested changes
+          if (arbitrationResult.suggestedChanges.length > 0) {
+            onProgress?.('consensus', 'Applying arbitrator suggestions...');
+            const revisionResult = await revisePlan(
+              bestPlan,
+              arbitrationResult.reasoning,
+              arbitrationResult.suggestedChanges
+            );
+            if (revisionResult.success && revisionResult.response) {
+              currentPlan = revisionResult.response;
+              // Reset stuck detection after arbitration revision
+              scores.length = 0;
+              scores.push(arbitrationResult.score);
+              onProgress?.('consensus', 'Plan revised based on arbitrator feedback');
+            } else {
+              onProgress?.('consensus', 'Revision failed, continuing with current plan');
+            }
+          }
+        }
+      } catch (error) {
+        onProgress?.('arbitration', `Arbitration failed: ${error instanceof Error ? error.message : 'Unknown error'}`);
+        // If we've tried arbitration and it failed, accept the best plan we have
+        if (arbitrationAttempts >= maxArbitrationAttempts && bestScore >= arbitrationThreshold) {
+          onProgress?.('arbitration', `Max arbitration attempts reached, accepting best plan with ${bestScore}%`);
+          return {
+            approved: true,
+            finalPlan: bestPlan,
+            finalScore: bestScore,
+            bestPlan,
+            bestScore,
+            bestIteration,
+            iterations,
+            totalIterations: iteration,
+            finalConcerns: lastConcerns,
+            finalRecommendations: lastRecommendations,
+            arbitrated: true,
+          };
+        }
+      }
+    }
     // If not at max iterations, revise the plan
     if (iteration < maxIterations) {
       const concerns = extractConcerns(consensusResult);
+      onProgress?.('consensus', 'Revising plan based on feedback...');
+      // Create a progress handler for revision
+      const revisionProgress = onProgress
+        ? (msg: string) => onProgress('consensus', `[revision] ${msg}`)
+        : undefined;
       // Use Claude to revise the plan
       const revisionResult = await revisePlan(
         currentPlan,
         consensusResult.analysis,
-        concerns
+        concerns,
+        revisionProgress
       );
       if (revisionResult.success && revisionResult.response) {
+        // Only use the revised plan for the next iteration
+        // The best plan tracking above will decide if it's actually better
         currentPlan = revisionResult.response;
         if (onRevision) {
           onRevision(iteration, currentPlan);
         }
       } else {
-        // If revision fails, try to continue with current plan
+        // If revision fails, try to continue with best plan
         console.warn(`Plan revision failed at iteration ${iteration}:`, revisionResult.error);
+        currentPlan = bestPlan;
       }
     }
   }
   // Max iterations reached without consensus
-  const lastIteration = iterations[iterations.length - 1];
+  // Return the BEST plan we found, not the last one
   return {
     approved: false,
-    finalPlan: currentPlan,
-    finalScore: lastIteration?.result.score || 0,
+    finalPlan: bestPlan,
+    finalScore: bestScore,
+    bestPlan,
+    bestScore,
+    bestIteration,
     iterations,
     totalIterations: iteration,
+    finalConcerns: lastConcerns,
+    finalRecommendations: lastRecommendations,
+    arbitrated: false,
   };
 }
@@ -196,16 +506,31 @@ export function summarizeConsensusProcess(result: ConsensusProcessResult): strin
   lines.push(`## Consensus Summary`);
   lines.push('');
-  lines.push(`**Status:** ${result.approved ? 'APPROVED' : 'NOT APPROVED'}`);
+  lines.push(`**Status:** ${result.approved ? 'APPROVED' : 'NOT APPROVED'}${result.arbitrated ? ' (via arbitration)' : ''}`);
   lines.push(`**Final Score:** ${result.finalScore}%`);
+  lines.push(`**Best Score:** ${result.bestScore}% (iteration ${result.bestIteration})`);
   lines.push(`**Total Iterations:** ${result.totalIterations}`);
+  if (result.arbitrated && result.arbitrationResult) {
+    lines.push('');
+    lines.push(`### Arbitration Decision`);
+    lines.push(`- Decision: ${result.arbitrationResult.approved ? 'APPROVED' : 'REVISE'}`);
+    lines.push(`- Confidence: ${result.arbitrationResult.score}%`);
+    if (result.arbitrationResult.criticalConcerns.length > 0) {
+      lines.push(`- Critical Concerns: ${result.arbitrationResult.criticalConcerns.length}`);
+    }
+    if (result.arbitrationResult.minorConcerns.length > 0) {
+      lines.push(`- Minor Concerns: ${result.arbitrationResult.minorConcerns.length}`);
+    }
+  }
   lines.push('');
   lines.push(`### Iteration History`);
   lines.push('');
   for (const iteration of result.iterations) {
-    lines.push(`#### Iteration ${iteration.iteration}`);
+    const isBest = iteration.iteration === result.bestIteration;
+    lines.push(`#### Iteration ${iteration.iteration}${isBest ? ' (BEST)' : ''}`);
     lines.push(`- Score: ${iteration.result.score}%`);
     lines.push(`- Strengths: ${iteration.result.strengths?.length || 0}`);
     lines.push(`- Concerns: ${iteration.result.concerns?.length || 0}`);
@@ -213,13 +538,21 @@ export function summarizeConsensusProcess(result: ConsensusProcessResult): strin
   }
   if (!result.approved) {
-    const lastResult = result.iterations[result.iterations.length - 1]?.result;
-    if (lastResult?.concerns && lastResult.concerns.length > 0) {
+    if (result.finalConcerns && result.finalConcerns.length > 0) {
       lines.push(`### Remaining Concerns`);
       lines.push('');
-      for (const concern of lastResult.concerns) {
+      for (const concern of result.finalConcerns) {
         lines.push(`- ${concern}`);
       }
+      lines.push('');
+    }
+    if (result.finalRecommendations && result.finalRecommendations.length > 0) {
+      lines.push(`### Recommendations`);
+      lines.push('');
+      for (const rec of result.finalRecommendations) {
+        lines.push(`- ${rec}`);
+      }
     }
   }
@@ -297,3 +630,404 @@ export function getScoreTrend(
   if (diff < -5) return 'declining';
   return 'stable';
 }
+/**
+ * Options for optimized consensus
+ */
+export interface OptimizedConsensusOptions extends ConsensusOptions {
+  milestoneId: string;
+  milestoneName?: string;
+  taskId?: string;
+  taskName?: string;
+  /** Use parallel reviews from multiple providers */
+  parallelReviews?: boolean;
+  /** Additional reviewers beyond primary */
+  additionalReviewers?: AIProvider[];
+}
+/**
+ * Collect feedback from a single reviewer
+ */
+async function collectReviewerFeedback(
+  plan: string,
+  context: string,
+  reviewer: AIProvider,
+  config: Partial<ConsensusConfig>,
+  onProgress?: (phase: string, message: string) => void
+): Promise<ReviewerFeedback> {
+  onProgress?.('consensus', `Requesting review from ${reviewer}...`);
+  const startTime = Date.now();
+  const result = await requestReviewerConsensus(plan, context, reviewer, config);
+  const duration = Math.round((Date.now() - startTime) / 1000);
+  onProgress?.('consensus', `${reviewer} review completed in ${duration}s - score: ${result.score}%`);
+  return {
+    reviewer,
+    score: result.score,
+    timestamp: new Date().toISOString(),
+    concerns: result.concerns || [],
+    recommendations: result.recommendations || [],
+    analysis: result.analysis || '',
+  };
+}
+/**
+ * Collect feedback from multiple reviewers in parallel
+ */
+async function collectAllFeedback(
+  plan: string,
+  context: string,
+  reviewers: AIProvider[],
+  config: Partial<ConsensusConfig>,
+  onProgress?: (phase: string, message: string) => void
+): Promise<ReviewerFeedback[]> {
+  onProgress?.('consensus', `Collecting feedback from ${reviewers.length} reviewer(s) in parallel...`);
+  const feedbackPromises = reviewers.map(reviewer =>
+    collectReviewerFeedback(plan, context, reviewer, config, onProgress)
+      .catch(error => {
+        onProgress?.('consensus', `${reviewer} review failed: ${error instanceof Error ? error.message : 'Unknown error'}`);
+        return null;
+      })
+  );
+  const results = await Promise.all(feedbackPromises);
+  return results.filter((f): f is ReviewerFeedback => f !== null);
+}
+/**
+ * Optimized consensus process that batches feedback and reduces API calls
+ *
+ * Key optimizations:
+ * 1. Plans stored in files, not regenerated from scratch
+ * 2. Collects ALL reviewer feedback before revision
+ * 3. Claude revises ONCE per round with combined feedback
+ * 4. Parallel reviews when multiple reviewers configured
+ *
+ * @param initialPlan - The initial plan to seek consensus on
+ * @param context - Project context for review
+ * @param options - Consensus options including tracking info
+ * @returns Consensus process result
+ */
+export async function runOptimizedConsensusProcess(
+  initialPlan: string,
+  context: string,
+  options: OptimizedConsensusOptions
+): Promise<ConsensusProcessResult> {
+  const {
+    projectDir,
+    config = {},
+    onIteration,
+    onRevision,
+    onConcerns,
+    onArbitration,
+    onProgress,
+    milestoneId,
+    milestoneName,
+    taskId,
+    taskName,
+    parallelReviews = true,
+    additionalReviewers = [],
+  } = options;
+  const {
+    threshold = DEFAULT_CONSENSUS_CONFIG.threshold,
+    maxIterations = DEFAULT_CONSENSUS_CONFIG.maxIterations,
+    reviewer = DEFAULT_CONSENSUS_CONFIG.reviewer,
+    arbitrator = DEFAULT_CONSENSUS_CONFIG.arbitrator,
+    enableArbitration = DEFAULT_CONSENSUS_CONFIG.enableArbitration,
+    arbitrationThreshold = DEFAULT_CONSENSUS_CONFIG.arbitrationThreshold,
+    stuckIterations = DEFAULT_CONSENSUS_CONFIG.stuckIterations,
+  } = config;
+  // Initialize plan storage
+  const planStorage = createPlanStorage(projectDir);
+  await planStorage.initialize();
+  // Determine all reviewers
+  const allReviewers: AIProvider[] = [reviewer, ...additionalReviewers.filter(r => r !== reviewer)];
+  const iterations: ConsensusIteration[] = [];
+  const scores: number[] = [];
+  let currentPlan = initialPlan;
+  let iteration = 0;
+  // Track the best plan
+  let bestPlan = initialPlan;
+  let bestScore = 0;
+  let bestIteration = 0;
+  let lastConcerns: string[] = [];
+  let lastRecommendations: string[] = [];
+  let lastAnalysis = '';
+  const startTime = Date.now();
+  onProgress?.('consensus', `Using optimized consensus with ${allReviewers.join(', ')} as reviewer(s)`);
+  onProgress?.('consensus', `Plan tracking: milestone=${milestoneId}${taskId ? `, task=${taskId}` : ''}`);
+  // Save initial plan to storage
+  await planStorage.savePlan(currentPlan, taskId ? 'task' : 'milestone', {
+    milestoneId,
+    milestoneName,
+    taskId,
+    taskName,
+  });
+  while (iteration < maxIterations) {
+    iteration++;
+    // Check timeout
+    const totalElapsed = Date.now() - startTime;
+    if (totalElapsed > DEFAULT_CONSENSUS_TIMEOUT_MS) {
+      onProgress?.('consensus', `Consensus timeout after ${Math.round(totalElapsed / 60000)} minutes`);
+      if (enableArbitration) {
+        try {
+          const arbitrationResult = await requestGeminiArbitration(
+            bestPlan,
+            lastAnalysis,
+            `Timeout. Best score: ${bestScore}%. Concerns: ${lastConcerns.slice(0, 3).join('; ')}`,
+            iteration,
+            scores
+          );
+          if (onArbitration) onArbitration(arbitrationResult);
+          return {
+            approved: arbitrationResult.approved || arbitrationResult.score >= 80,
+            finalPlan: bestPlan,
+            finalScore: arbitrationResult.score,
+            bestPlan,
+            bestScore: arbitrationResult.score,
+            bestIteration,
+            iterations,
+            totalIterations: iteration - 1,
+            finalConcerns: arbitrationResult.minorConcerns || lastConcerns,
+            finalRecommendations: arbitrationResult.suggestedChanges || lastRecommendations,
+            arbitrated: true,
+            arbitrationResult,
+            timedOut: true,
+          };
+        } catch {
+          // Fall through to accept best plan
+        }
+      }
+      return {
+        approved: bestScore >= arbitrationThreshold,
+        finalPlan: bestPlan,
+        finalScore: bestScore,
+        bestPlan,
+        bestScore,
+        bestIteration,
+        iterations,
+        totalIterations: iteration - 1,
+        finalConcerns: lastConcerns,
+        finalRecommendations: lastRecommendations,
+        arbitrated: false,
+        timedOut: true,
+      };
+    }
+    const elapsedMinutes = Math.round((Date.now() - startTime) / 60000);
+    onProgress?.('consensus', `Iteration ${iteration} starting (${elapsedMinutes}min elapsed)`);
+    // Clear previous feedback for this round
+    await planStorage.clearFeedback(milestoneId, taskId);
+    // ============================================
+    // OPTIMIZATION: Collect ALL feedback in parallel
+    // ============================================
+    let allFeedback: ReviewerFeedback[];
+    if (parallelReviews && allReviewers.length > 1) {
+      allFeedback = await collectAllFeedback(currentPlan, context, allReviewers, config, onProgress);
+    } else {
+      // Sequential fallback
+      allFeedback = [];
+      for (const rev of allReviewers) {
+        const feedback = await collectReviewerFeedback(currentPlan, context, rev, config, onProgress);
+        allFeedback.push(feedback);
+      }
+    }
+    // Save all feedback
+    for (const feedback of allFeedback) {
+      await planStorage.saveFeedback(feedback, milestoneId, taskId);
+    }
+    // Calculate combined score (average of all reviewers)
+    const combinedScore = allFeedback.length > 0
+      ? Math.round(allFeedback.reduce((sum, f) => sum + f.score, 0) / allFeedback.length)
+      : 0;
+    scores.push(combinedScore);
+    // Combine all concerns and recommendations
+    const allConcerns = [...new Set(allFeedback.flatMap(f => f.concerns))];
+    const allRecommendations = [...new Set(allFeedback.flatMap(f => f.recommendations))];
+    const combinedAnalysis = allFeedback.map(f => `[${f.reviewer}] ${f.analysis}`).join('\n\n');
+    lastConcerns = allConcerns;
+    lastRecommendations = allRecommendations;
+    lastAnalysis = combinedAnalysis;
+    // Create consensus result for tracking
+    const consensusResult: ConsensusResult = {
+      score: combinedScore,
+      analysis: combinedAnalysis,
+      concerns: allConcerns,
+      recommendations: allRecommendations,
+      approved: combinedScore >= threshold,
+      strengths: [],
+      rawResponse: combinedAnalysis,
+    };
+    // Record iteration
+    const iterationRecord: ConsensusIteration = {
+      iteration,
+      plan: currentPlan,
+      timestamp: new Date().toISOString(),
+      result: consensusResult,
+    };
+    iterations.push(iterationRecord);
+    if (onIteration) onIteration(iteration, consensusResult);
+    if (onConcerns) onConcerns(allConcerns, allRecommendations);
+    // Update best plan tracking
+    if (combinedScore > bestScore) {
+      bestScore = combinedScore;
+      bestPlan = currentPlan;
+      bestIteration = iteration;
+    }
+    // Save plan with updated score
+    await planStorage.savePlan(currentPlan, taskId ? 'task' : 'milestone', {
+      milestoneId,
+      milestoneName,
+      taskId,
+      taskName,
+      score: combinedScore,
+    });
+    // Record in project state
+    await recordConsensusIteration(projectDir, iterationRecord);
+    onProgress?.('consensus', `Combined score: ${combinedScore}% (from ${allFeedback.length} reviewer(s))`);
+    // Check if consensus reached
+    if (combinedScore >= threshold) {
+      onProgress?.('consensus', `Consensus reached at ${combinedScore}%`);
+      await planStorage.updateStatus('approved', milestoneId, taskId);
+      return {
+        approved: true,
+        finalPlan: currentPlan,
+        finalScore: combinedScore,
+        bestPlan: currentPlan,
+        bestScore: combinedScore,
+        bestIteration: iteration,
+        iterations,
+        totalIterations: iteration,
+        finalConcerns: allConcerns,
+        finalRecommendations: allRecommendations,
+        arbitrated: false,
+      };
+    }
+    // Check if stuck
+    if (isStuck(scores, stuckIterations) && enableArbitration) {
+      onProgress?.('consensus', `Consensus stuck - invoking ${arbitrator} for arbitration`);
+      try {
+        const arbitrationResult = await requestGeminiArbitration(
+          bestPlan,
+          combinedAnalysis,
+          `Stuck after ${iteration} iterations. Scores: ${scores.slice(-stuckIterations).join(', ')}`,
+          iteration,
+          scores
+        );
+        if (onArbitration) onArbitration(arbitrationResult);
+        if (arbitrationResult.approved || arbitrationResult.score >= arbitrationThreshold) {
+          onProgress?.('arbitration', `Arbitrator approved with ${arbitrationResult.score}%`);
+          await planStorage.updateStatus('approved', milestoneId, taskId);
+          return {
+            approved: true,
+            finalPlan: bestPlan,
+            finalScore: arbitrationResult.score,
+            bestPlan,
+            bestScore: arbitrationResult.score,
+            bestIteration,
+            iterations,
+            totalIterations: iteration,
+            finalConcerns: arbitrationResult.minorConcerns || allConcerns,
+            finalRecommendations: arbitrationResult.suggestedChanges || allRecommendations,
+            arbitrated: true,
+            arbitrationResult,
+          };
+        }
+      } catch (arbError) {
+        onProgress?.('arbitration', `Arbitration failed: ${arbError instanceof Error ? arbError.message : 'Unknown error'}`);
+      }
+    }
+    // ============================================
+    // OPTIMIZATION: Single revision with ALL feedback
+    // ============================================
+    if (iteration < maxIterations) {
+      onProgress?.('consensus', `Revising plan with combined feedback from ${allFeedback.length} reviewer(s)...`);
+      const revisionProgress = onProgress
+        ? (msg: string) => onProgress('consensus', `[revision] ${msg}`)
+        : undefined;
+      // Use Claude to revise with ALL combined feedback (single API call)
+      const revisionResult = await revisePlan(
+        currentPlan,
+        combinedAnalysis,
+        allConcerns,
+        revisionProgress
+      );
+      if (revisionResult.success && revisionResult.response) {
+        currentPlan = revisionResult.response;
+        // Save revised plan
+        await planStorage.savePlan(currentPlan, taskId ? 'task' : 'milestone', {
+          milestoneId,
+          milestoneName,
+          taskId,
+          taskName,
+        });
+        if (onRevision) onRevision(iteration, currentPlan);
+      } else {
+        onProgress?.('consensus', `Revision failed, continuing with best plan`);
+        currentPlan = bestPlan;
+      }
+    }
+  }
+  // Max iterations reached
+  await planStorage.updateStatus('reviewing', milestoneId, taskId);
+  return {
+    approved: false,
+    finalPlan: bestPlan,
+    finalScore: bestScore,
+    bestPlan,
+    bestScore,
+    bestIteration,
+    iterations,
+    totalIterations: iteration,
+    finalConcerns: lastConcerns,
+    finalRecommendations: lastRecommendations,
+    arbitrated: false,
+  };
+}