npm - popeye-cli - Versions diffs - 1.0.1 → 1.2.0 - Mend

popeye-cli 1.0.1 → 1.2.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (216) hide show

package/.env.example +24 -1
package/CONTRIBUTING.md +275 -0
package/OPEN_SOURCE_MANIFESTO.md +172 -0
package/README.md +832 -123
package/dist/adapters/claude.d.ts +19 -4
package/dist/adapters/claude.d.ts.map +1 -1
package/dist/adapters/claude.js +908 -42
package/dist/adapters/claude.js.map +1 -1
package/dist/adapters/gemini.d.ts +55 -0
package/dist/adapters/gemini.d.ts.map +1 -0
package/dist/adapters/gemini.js +318 -0
package/dist/adapters/gemini.js.map +1 -0
package/dist/adapters/grok.d.ts +73 -0
package/dist/adapters/grok.d.ts.map +1 -0
package/dist/adapters/grok.js +430 -0
package/dist/adapters/grok.js.map +1 -0
package/dist/adapters/openai.d.ts +1 -1
package/dist/adapters/openai.d.ts.map +1 -1
package/dist/adapters/openai.js +47 -8
package/dist/adapters/openai.js.map +1 -1
package/dist/auth/claude.d.ts +11 -9
package/dist/auth/claude.d.ts.map +1 -1
package/dist/auth/claude.js +107 -71
package/dist/auth/claude.js.map +1 -1
package/dist/auth/gemini.d.ts +58 -0
package/dist/auth/gemini.d.ts.map +1 -0
package/dist/auth/gemini.js +172 -0
package/dist/auth/gemini.js.map +1 -0
package/dist/auth/grok.d.ts +73 -0
package/dist/auth/grok.d.ts.map +1 -0
package/dist/auth/grok.js +211 -0
package/dist/auth/grok.js.map +1 -0
package/dist/auth/index.d.ts +14 -7
package/dist/auth/index.d.ts.map +1 -1
package/dist/auth/index.js +41 -6
package/dist/auth/index.js.map +1 -1
package/dist/auth/keychain.d.ts +20 -7
package/dist/auth/keychain.d.ts.map +1 -1
package/dist/auth/keychain.js +85 -29
package/dist/auth/keychain.js.map +1 -1
package/dist/auth/openai.d.ts +2 -2
package/dist/auth/openai.d.ts.map +1 -1
package/dist/auth/openai.js +30 -32
package/dist/auth/openai.js.map +1 -1
package/dist/cli/commands/auth.d.ts +1 -1
package/dist/cli/commands/auth.d.ts.map +1 -1
package/dist/cli/commands/auth.js +79 -8
package/dist/cli/commands/auth.js.map +1 -1
package/dist/cli/commands/create.d.ts.map +1 -1
package/dist/cli/commands/create.js +15 -4
package/dist/cli/commands/create.js.map +1 -1
package/dist/cli/interactive.d.ts.map +1 -1
package/dist/cli/interactive.js +1494 -114
package/dist/cli/interactive.js.map +1 -1
package/dist/config/defaults.d.ts +9 -1
package/dist/config/defaults.d.ts.map +1 -1
package/dist/config/defaults.js +19 -2
package/dist/config/defaults.js.map +1 -1
package/dist/config/index.d.ts +19 -0
package/dist/config/index.d.ts.map +1 -1
package/dist/config/index.js +33 -1
package/dist/config/index.js.map +1 -1
package/dist/config/schema.d.ts +47 -0
package/dist/config/schema.d.ts.map +1 -1
package/dist/config/schema.js +29 -1
package/dist/config/schema.js.map +1 -1
package/dist/generators/fullstack.d.ts +32 -0
package/dist/generators/fullstack.d.ts.map +1 -0
package/dist/generators/fullstack.js +497 -0
package/dist/generators/fullstack.js.map +1 -0
package/dist/generators/index.d.ts +4 -3
package/dist/generators/index.d.ts.map +1 -1
package/dist/generators/index.js +15 -1
package/dist/generators/index.js.map +1 -1
package/dist/generators/python.d.ts +17 -1
package/dist/generators/python.d.ts.map +1 -1
package/dist/generators/python.js +34 -20
package/dist/generators/python.js.map +1 -1
package/dist/generators/templates/fullstack.d.ts +113 -0
package/dist/generators/templates/fullstack.d.ts.map +1 -0
package/dist/generators/templates/fullstack.js +1004 -0
package/dist/generators/templates/fullstack.js.map +1 -0
package/dist/generators/typescript.d.ts +19 -1
package/dist/generators/typescript.d.ts.map +1 -1
package/dist/generators/typescript.js +37 -20
package/dist/generators/typescript.js.map +1 -1
package/dist/state/index.d.ts +108 -0
package/dist/state/index.d.ts.map +1 -1
package/dist/state/index.js +551 -4
package/dist/state/index.js.map +1 -1
package/dist/state/registry.d.ts +52 -0
package/dist/state/registry.d.ts.map +1 -0
package/dist/state/registry.js +215 -0
package/dist/state/registry.js.map +1 -0
package/dist/types/cli.d.ts +8 -0
package/dist/types/cli.d.ts.map +1 -1
package/dist/types/cli.js.map +1 -1
package/dist/types/consensus.d.ts +186 -4
package/dist/types/consensus.d.ts.map +1 -1
package/dist/types/consensus.js +35 -3
package/dist/types/consensus.js.map +1 -1
package/dist/types/project.d.ts +76 -0
package/dist/types/project.d.ts.map +1 -1
package/dist/types/project.js +1 -1
package/dist/types/project.js.map +1 -1
package/dist/types/workflow.d.ts +217 -16
package/dist/types/workflow.d.ts.map +1 -1
package/dist/types/workflow.js +40 -1
package/dist/types/workflow.js.map +1 -1
package/dist/workflow/auto-fix.d.ts +45 -0
package/dist/workflow/auto-fix.d.ts.map +1 -0
package/dist/workflow/auto-fix.js +274 -0
package/dist/workflow/auto-fix.js.map +1 -0
package/dist/workflow/consensus.d.ts +70 -2
package/dist/workflow/consensus.d.ts.map +1 -1
package/dist/workflow/consensus.js +872 -17
package/dist/workflow/consensus.js.map +1 -1
package/dist/workflow/execution-mode.d.ts +10 -4
package/dist/workflow/execution-mode.d.ts.map +1 -1
package/dist/workflow/execution-mode.js +547 -58
package/dist/workflow/execution-mode.js.map +1 -1
package/dist/workflow/index.d.ts +14 -2
package/dist/workflow/index.d.ts.map +1 -1
package/dist/workflow/index.js +69 -6
package/dist/workflow/index.js.map +1 -1
package/dist/workflow/milestone-workflow.d.ts +34 -0
package/dist/workflow/milestone-workflow.d.ts.map +1 -0
package/dist/workflow/milestone-workflow.js +414 -0
package/dist/workflow/milestone-workflow.js.map +1 -0
package/dist/workflow/plan-mode.d.ts +80 -3
package/dist/workflow/plan-mode.d.ts.map +1 -1
package/dist/workflow/plan-mode.js +767 -49
package/dist/workflow/plan-mode.js.map +1 -1
package/dist/workflow/plan-storage.d.ts +386 -0
package/dist/workflow/plan-storage.d.ts.map +1 -0
package/dist/workflow/plan-storage.js +878 -0
package/dist/workflow/plan-storage.js.map +1 -0
package/dist/workflow/project-verification.d.ts +37 -0
package/dist/workflow/project-verification.d.ts.map +1 -0
package/dist/workflow/project-verification.js +381 -0
package/dist/workflow/project-verification.js.map +1 -0
package/dist/workflow/task-workflow.d.ts +37 -0
package/dist/workflow/task-workflow.d.ts.map +1 -0
package/dist/workflow/task-workflow.js +386 -0
package/dist/workflow/task-workflow.js.map +1 -0
package/dist/workflow/test-runner.d.ts +9 -0
package/dist/workflow/test-runner.d.ts.map +1 -1
package/dist/workflow/test-runner.js +101 -5
package/dist/workflow/test-runner.js.map +1 -1
package/dist/workflow/ui-designer.d.ts +82 -0
package/dist/workflow/ui-designer.d.ts.map +1 -0
package/dist/workflow/ui-designer.js +234 -0
package/dist/workflow/ui-designer.js.map +1 -0
package/dist/workflow/ui-setup.d.ts +58 -0
package/dist/workflow/ui-setup.d.ts.map +1 -0
package/dist/workflow/ui-setup.js +685 -0
package/dist/workflow/ui-setup.js.map +1 -0
package/dist/workflow/ui-verification.d.ts +114 -0
package/dist/workflow/ui-verification.d.ts.map +1 -0
package/dist/workflow/ui-verification.js +258 -0
package/dist/workflow/ui-verification.js.map +1 -0
package/dist/workflow/workflow-logger.d.ts +110 -0
package/dist/workflow/workflow-logger.d.ts.map +1 -0
package/dist/workflow/workflow-logger.js +267 -0
package/dist/workflow/workflow-logger.js.map +1 -0
package/dist/workflow/workspace-manager.d.ts +342 -0
package/dist/workflow/workspace-manager.d.ts.map +1 -0
package/dist/workflow/workspace-manager.js +733 -0
package/dist/workflow/workspace-manager.js.map +1 -0
package/package.json +2 -2
package/src/adapters/claude.ts +1067 -47
package/src/adapters/gemini.ts +373 -0
package/src/adapters/grok.ts +492 -0
package/src/adapters/openai.ts +48 -9
package/src/auth/claude.ts +120 -78
package/src/auth/gemini.ts +207 -0
package/src/auth/grok.ts +255 -0
package/src/auth/index.ts +47 -9
package/src/auth/keychain.ts +95 -28
package/src/auth/openai.ts +29 -36
package/src/cli/commands/auth.ts +89 -10
package/src/cli/commands/create.ts +13 -4
package/src/cli/interactive.ts +1774 -142
package/src/config/defaults.ts +19 -2
package/src/config/index.ts +36 -1
package/src/config/schema.ts +30 -1
package/src/generators/fullstack.ts +551 -0
package/src/generators/index.ts +25 -1
package/src/generators/python.ts +65 -20
package/src/generators/templates/fullstack.ts +1047 -0
package/src/generators/typescript.ts +69 -20
package/src/state/index.ts +713 -4
package/src/state/registry.ts +278 -0
package/src/types/cli.ts +8 -0
package/src/types/consensus.ts +197 -6
package/src/types/project.ts +82 -1
package/src/types/workflow.ts +90 -1
package/src/workflow/auto-fix.ts +340 -0
package/src/workflow/consensus.ts +1180 -16
package/src/workflow/execution-mode.ts +673 -74
package/src/workflow/index.ts +95 -6
package/src/workflow/milestone-workflow.ts +576 -0
package/src/workflow/plan-mode.ts +924 -50
package/src/workflow/plan-storage.ts +1282 -0
package/src/workflow/project-verification.ts +471 -0
package/src/workflow/task-workflow.ts +528 -0
package/src/workflow/test-runner.ts +120 -5
package/src/workflow/ui-designer.ts +337 -0
package/src/workflow/ui-setup.ts +797 -0
package/src/workflow/ui-verification.ts +357 -0
package/src/workflow/workflow-logger.ts +353 -0
package/src/workflow/workspace-manager.ts +912 -0
package/tests/config/config.test.ts +1 -1
package/tests/types/consensus.test.ts +3 -3
package/tests/workflow/plan-mode.test.ts +213 -0
package/tests/workflow/test-runner.test.ts +5 -3

package/src/workflow/consensus.ts CHANGED Viewed

@@ -1,13 +1,31 @@
 /**
  * Consensus workflow module
- * Handles the iterative consensus-building process between Claude and OpenAI
+ * Handles the iterative consensus-building process between Claude and OpenAI/Gemini
+ * with arbitration support when consensus cannot be reached
  */
-import type { ConsensusResult, ConsensusIteration, ConsensusConfig } from '../types/consensus.js';
+import type {
+  ConsensusResult,
+  ConsensusIteration,
+  ConsensusConfig,
+  ArbitrationResult,
+  AIProvider,
+  TaggedItem,
+  AppConsensusScores,
+  CorrectionRecord,
+} from '../types/consensus.js';
 import { DEFAULT_CONSENSUS_CONFIG } from '../types/consensus.js';
-import { requestConsensus } from '../adapters/openai.js';
+import { requestConsensus as requestOpenAIConsensus } from '../adapters/openai.js';
+import { requestConsensus as requestGeminiConsensus, requestArbitration as requestGeminiArbitration } from '../adapters/gemini.js';
+import { requestConsensus as requestGrokConsensus, requestArbitration as requestGrokArbitration } from '../adapters/grok.js';
 import { revisePlan } from '../adapters/claude.js';
 import { recordConsensusIteration } from '../state/index.js';
+import {
+  createPlanStorage,
+  type ReviewerFeedback,
+  type FullstackReviewerFeedback,
+  type FeedbackAppTarget,
+} from './plan-storage.js';
 /**
  * Options for consensus iteration
@@ -15,8 +33,15 @@ import { recordConsensusIteration } from '../state/index.js';
 export interface ConsensusOptions {
   projectDir: string;
   config?: Partial<ConsensusConfig>;
+  /** Whether this is a fullstack project (enables per-app tracking) */
+  isFullstack?: boolean;
+  /** Project language for revision prompts */
+  language?: 'python' | 'typescript' | 'fullstack';
   onIteration?: (iteration: number, result: ConsensusResult) => void;
   onRevision?: (iteration: number, revisedPlan: string) => void;
+  onConcerns?: (concerns: string[], recommendations: string[]) => void;
+  onArbitration?: (result: ArbitrationResult) => void;
+  onProgress?: (phase: string, message: string) => void;
 }
 /**
@@ -26,10 +51,109 @@ export interface ConsensusProcessResult {
   approved: boolean;
   finalPlan: string;
   finalScore: number;
+  bestPlan: string;
+  bestScore: number;
+  bestIteration: number;
   iterations: ConsensusIteration[];
   totalIterations: number;
+  finalConcerns: string[];
+  finalRecommendations: string[];
+  arbitrated: boolean;
+  arbitrationResult?: ArbitrationResult;
+  /** True if consensus timed out and we accepted the best available plan */
+  timedOut?: boolean;
 }
+/**
+ * Request consensus from the configured reviewer (OpenAI, Gemini, or Grok)
+ */
+async function requestReviewerConsensus(
+  plan: string,
+  context: string,
+  reviewer: AIProvider,
+  config: Partial<ConsensusConfig>
+): Promise<ConsensusResult> {
+  if (reviewer === 'gemini') {
+    return requestGeminiConsensus(plan, context, {
+      model: config.geminiModel,
+      temperature: config.temperature,
+      maxTokens: config.maxTokens,
+    });
+  }
+  if (reviewer === 'grok') {
+    return requestGrokConsensus(plan, context, {
+      model: config.grokModel,
+      temperature: config.temperature,
+      maxTokens: config.maxTokens,
+    });
+  }
+  return requestOpenAIConsensus(plan, context, config);
+}
+/**
+ * Request arbitration from the configured arbitrator (OpenAI, Gemini, or Grok)
+ */
+async function requestArbitratorDecision(
+  plan: string,
+  reviewerFeedback: string,
+  claudeFeedback: string,
+  iterations: number,
+  scores: number[],
+  arbitrator: AIProvider
+): Promise<ArbitrationResult> {
+  if (arbitrator === 'grok') {
+    return requestGrokArbitration(plan, reviewerFeedback, claudeFeedback, iterations, scores);
+  }
+  // Default to Gemini for arbitration (most capable at reasoning)
+  return requestGeminiArbitration(plan, reviewerFeedback, claudeFeedback, iterations, scores);
+}
+/**
+ * Check if the consensus process is "stuck" (not improving)
+ * Detects both:
+ * 1. Stagnation: scores within 5% of each other
+ * 2. Oscillation: scores going up and down without progress
+ */
+function isStuck(scores: number[], stuckIterations: number): boolean {
+  if (scores.length < stuckIterations) return false;
+  const recentScores = scores.slice(-stuckIterations);
+  const maxRecent = Math.max(...recentScores);
+  const minRecent = Math.min(...recentScores);
+  // Check 1: Stagnation - all recent scores are within 5% of each other
+  if ((maxRecent - minRecent) <= 5) {
+    return true;
+  }
+  // Check 2: Oscillation - detect if we're going up and down without making progress
+  // e.g., 70 -> 85 -> 75 -> 80 (oscillating around ~77.5)
+  if (recentScores.length >= 3) {
+    const avg = recentScores.reduce((a, b) => a + b, 0) / recentScores.length;
+    const deviations = recentScores.map(s => Math.abs(s - avg));
+    const avgDeviation = deviations.reduce((a, b) => a + b, 0) / deviations.length;
+    // If scores are oscillating around an average (avg deviation > 3% but range < 20%)
+    // and we're not trending upward, consider it stuck
+    if (avgDeviation > 3 && (maxRecent - minRecent) < 20) {
+      // Check if we're trending upward (last score should be close to max)
+      const lastScore = recentScores[recentScores.length - 1];
+      const firstScore = recentScores[0];
+      // Not improving if last score is not better than first
+      if (lastScore <= firstScore + 2) {
+        return true;
+      }
+    }
+  }
+  return false;
+}
+/**
+ * Default consensus timeout (15 minutes total)
+ */
+const DEFAULT_CONSENSUS_TIMEOUT_MS = 15 * 60 * 1000;
 /**
  * Format a plan for consensus review
  * Structures the plan in a way that's optimal for review
@@ -88,6 +212,7 @@ export function meetsThreshold(
 /**
  * Iterate until consensus is reached
+ * Supports configurable reviewer and arbitration when stuck
  *
  * @param initialPlan - The initial plan to review
  * @param context - Project context
@@ -102,24 +227,130 @@ export async function iterateUntilConsensus(
   const {
     projectDir,
     config = {},
+    isFullstack = false,
+    language: providedLanguage,
     onIteration,
     onRevision,
+    onConcerns,
+    onArbitration,
+    onProgress,
   } = options;
+  // Derive language from isFullstack if not explicitly provided
+  const language = providedLanguage || (isFullstack ? 'fullstack' : 'python');
   const {
     threshold = DEFAULT_CONSENSUS_CONFIG.threshold,
     maxIterations = DEFAULT_CONSENSUS_CONFIG.maxIterations,
+    reviewer = DEFAULT_CONSENSUS_CONFIG.reviewer,
+    arbitrator = DEFAULT_CONSENSUS_CONFIG.arbitrator,
+    enableArbitration = DEFAULT_CONSENSUS_CONFIG.enableArbitration,
+    arbitrationThreshold = DEFAULT_CONSENSUS_CONFIG.arbitrationThreshold,
+    stuckIterations = DEFAULT_CONSENSUS_CONFIG.stuckIterations,
   } = config;
   const iterations: ConsensusIteration[] = [];
+  const scores: number[] = [];
   let currentPlan = initialPlan;
   let iteration = 0;
+  // Track the best plan throughout the process
+  let bestPlan = initialPlan;
+  let bestScore = 0;
+  let bestIteration = 0;
+  let lastConcerns: string[] = [];
+  let lastRecommendations: string[] = [];
+  let lastAnalysis = '';
+  // Track arbitration attempts to prevent infinite loops
+  let arbitrationAttempts = 0;
+  // Track elapsed time to detect stuck processes
+  const startTime = Date.now();
+  const maxArbitrationAttempts = 2;
+  onProgress?.('consensus', `Using ${reviewer} as reviewer${enableArbitration ? `, ${arbitrator} as arbitrator` : ''}`);
   while (iteration < maxIterations) {
     iteration++;
-    // Request consensus review from OpenAI
-    const consensusResult = await requestConsensus(currentPlan, context, config);
+    // Check total elapsed time - if timing out, try arbitration before giving up
+    const totalElapsed = Date.now() - startTime;
+    if (totalElapsed > DEFAULT_CONSENSUS_TIMEOUT_MS && enableArbitration && arbitrationAttempts < maxArbitrationAttempts) {
+      onProgress?.('consensus', `Consensus timeout after ${Math.round(totalElapsed / 60000)} minutes - invoking arbitrator before accepting`);
+      try {
+        arbitrationAttempts++;
+        const arbitrationResult = await requestArbitratorDecision(
+          bestPlan,
+          lastAnalysis,
+          `Consensus timed out after ${Math.round(totalElapsed / 60000)} minutes. Best score: ${bestScore}%. Main concerns: ${lastConcerns.slice(0, 3).join('; ')}`,
+          iteration,
+          scores,
+          arbitrator
+        );
+        if (onArbitration) {
+          onArbitration(arbitrationResult);
+        }
+        // Accept arbitration result (we're out of time)
+        onProgress?.('arbitration', `Arbitrator decision: ${arbitrationResult.approved ? 'APPROVED' : 'REVISE'} with ${arbitrationResult.score}%`);
+        return {
+          approved: arbitrationResult.approved || arbitrationResult.score >= 80,
+          finalPlan: bestPlan,
+          finalScore: arbitrationResult.score,
+          bestPlan,
+          bestScore: arbitrationResult.score,
+          bestIteration,
+          iterations,
+          totalIterations: iteration - 1,
+          finalConcerns: arbitrationResult.minorConcerns || lastConcerns,
+          finalRecommendations: arbitrationResult.suggestedChanges || lastRecommendations,
+          arbitrated: true,
+          arbitrationResult,
+          timedOut: true,
+        };
+      } catch (arbError) {
+        onProgress?.('arbitration', `Arbitration failed on timeout: ${arbError instanceof Error ? arbError.message : 'Unknown error'}`);
+        // Fall through to accept best plan
+      }
+    }
+    // Hard timeout - no more arbitration attempts left
+    if (totalElapsed > DEFAULT_CONSENSUS_TIMEOUT_MS) {
+      onProgress?.('consensus', `Consensus timeout - accepting best plan with ${bestScore}%`);
+      return {
+        approved: bestScore >= arbitrationThreshold,
+        finalPlan: bestPlan,
+        finalScore: bestScore,
+        bestPlan,
+        bestScore,
+        bestIteration,
+        iterations,
+        totalIterations: iteration - 1,
+        finalConcerns: lastConcerns,
+        finalRecommendations: lastRecommendations,
+        arbitrated: false,
+        timedOut: true,
+      };
+    }
+    // Log iteration timing
+    const iterationStart = Date.now();
+    const elapsedMinutes = Math.round((iterationStart - startTime) / 60000);
+    onProgress?.('consensus', `Iteration ${iteration} starting (${elapsedMinutes}min elapsed)`);
+    // Request consensus review from configured reviewer
+    onProgress?.('consensus', `Requesting review from ${reviewer}...`);
+    const consensusResult = await requestReviewerConsensus(currentPlan, context, reviewer, config);
+    // Log iteration duration
+    const iterationDuration = Math.round((Date.now() - iterationStart) / 1000);
+    onProgress?.('consensus', `Review completed in ${iterationDuration}s - score: ${consensusResult.score}%`);
+    scores.push(consensusResult.score);
     // Record the iteration
     const iterationRecord: ConsensusIteration = {
@@ -134,54 +365,186 @@ export async function iterateUntilConsensus(
     // Save to project state
     await recordConsensusIteration(projectDir, iterationRecord);
-    // Notify callback
+    // Track best plan - only update if this score is better
+    if (consensusResult.score > bestScore) {
+      bestPlan = currentPlan;
+      bestScore = consensusResult.score;
+      bestIteration = iteration;
+    }
+    // Track concerns for output
+    lastConcerns = consensusResult.concerns || [];
+    lastRecommendations = consensusResult.recommendations || [];
+    lastAnalysis = consensusResult.analysis || '';
+    // Notify callbacks
     if (onIteration) {
       onIteration(iteration, consensusResult);
     }
+    if (onConcerns && (lastConcerns.length > 0 || lastRecommendations.length > 0)) {
+      onConcerns(lastConcerns, lastRecommendations);
+    }
     // Check if we've reached consensus
     if (meetsThreshold(consensusResult.score, threshold)) {
       return {
         approved: true,
         finalPlan: currentPlan,
         finalScore: consensusResult.score,
+        bestPlan: currentPlan,
+        bestScore: consensusResult.score,
+        bestIteration: iteration,
         iterations,
         totalIterations: iteration,
+        finalConcerns: [],
+        finalRecommendations: [],
+        arbitrated: false,
       };
     }
+    // Check if we're stuck and should trigger arbitration
+    if (enableArbitration &&
+        bestScore >= arbitrationThreshold &&
+        isStuck(scores, stuckIterations) &&
+        arbitrationAttempts < maxArbitrationAttempts) {
+      arbitrationAttempts++;
+      onProgress?.('arbitration', `Consensus stuck at ${bestScore}%, invoking ${arbitrator} arbitrator (attempt ${arbitrationAttempts}/${maxArbitrationAttempts})...`);
+      try {
+        const arbitrationResult = await requestArbitratorDecision(
+          bestPlan,
+          lastAnalysis,
+          `The plan has been revised ${iteration} times. Best score achieved: ${bestScore}%. The reviewer's main concerns are: ${lastConcerns.slice(0, 3).join('; ')}`,
+          iteration,
+          scores,
+          arbitrator
+        );
+        if (onArbitration) {
+          onArbitration(arbitrationResult);
+        }
+        // Accept if arbitrator approves OR if arbitrator gives a high score (>= 88%)
+        // This prevents infinite REVISE loops when the arbitrator is happy enough
+        const acceptArbitration = arbitrationResult.approved ||
+                                   arbitrationResult.score >= 88 ||
+                                   (arbitrationAttempts >= maxArbitrationAttempts && arbitrationResult.score >= 80);
+        if (acceptArbitration) {
+          const reason = arbitrationResult.approved
+            ? `Arbitrator approved plan with ${arbitrationResult.score}% confidence`
+            : `Arbitrator score ${arbitrationResult.score}% is acceptable - proceeding with best plan`;
+          onProgress?.('arbitration', reason);
+          return {
+            approved: true,
+            finalPlan: bestPlan,
+            finalScore: arbitrationResult.score,
+            bestPlan,
+            bestScore: arbitrationResult.score,
+            bestIteration,
+            iterations,
+            totalIterations: iteration,
+            finalConcerns: arbitrationResult.minorConcerns || [],
+            finalRecommendations: arbitrationResult.suggestedChanges || [],
+            arbitrated: true,
+            arbitrationResult,
+          };
+        } else {
+          onProgress?.('arbitration', `Arbitrator requests changes: ${arbitrationResult.suggestedChanges.slice(0, 2).join('; ')}`);
+          // Apply arbitrator's suggested changes
+          if (arbitrationResult.suggestedChanges.length > 0) {
+            onProgress?.('consensus', 'Applying arbitrator suggestions...');
+            const revisionResult = await revisePlan(
+              bestPlan,
+              arbitrationResult.reasoning,
+              arbitrationResult.suggestedChanges,
+              language
+            );
+            if (revisionResult.success && revisionResult.response) {
+              currentPlan = revisionResult.response;
+              // Reset stuck detection after arbitration revision
+              scores.length = 0;
+              scores.push(arbitrationResult.score);
+              onProgress?.('consensus', 'Plan revised based on arbitrator feedback');
+            } else {
+              onProgress?.('consensus', 'Revision failed, continuing with current plan');
+            }
+          }
+        }
+      } catch (error) {
+        onProgress?.('arbitration', `Arbitration failed: ${error instanceof Error ? error.message : 'Unknown error'}`);
+        // If we've tried arbitration and it failed, accept the best plan we have
+        if (arbitrationAttempts >= maxArbitrationAttempts && bestScore >= arbitrationThreshold) {
+          onProgress?.('arbitration', `Max arbitration attempts reached, accepting best plan with ${bestScore}%`);
+          return {
+            approved: true,
+            finalPlan: bestPlan,
+            finalScore: bestScore,
+            bestPlan,
+            bestScore,
+            bestIteration,
+            iterations,
+            totalIterations: iteration,
+            finalConcerns: lastConcerns,
+            finalRecommendations: lastRecommendations,
+            arbitrated: true,
+          };
+        }
+      }
+    }
     // If not at max iterations, revise the plan
     if (iteration < maxIterations) {
       const concerns = extractConcerns(consensusResult);
+      onProgress?.('consensus', 'Revising plan based on feedback...');
+      // Create a progress handler for revision
+      const revisionProgress = onProgress
+        ? (msg: string) => onProgress('consensus', `[revision] ${msg}`)
+        : undefined;
       // Use Claude to revise the plan
       const revisionResult = await revisePlan(
         currentPlan,
         consensusResult.analysis,
-        concerns
+        concerns,
+        language,
+        revisionProgress
       );
       if (revisionResult.success && revisionResult.response) {
+        // Only use the revised plan for the next iteration
+        // The best plan tracking above will decide if it's actually better
         currentPlan = revisionResult.response;
         if (onRevision) {
           onRevision(iteration, currentPlan);
         }
       } else {
-        // If revision fails, try to continue with current plan
+        // If revision fails, try to continue with best plan
         console.warn(`Plan revision failed at iteration ${iteration}:`, revisionResult.error);
+        currentPlan = bestPlan;
       }
     }
   }
   // Max iterations reached without consensus
-  const lastIteration = iterations[iterations.length - 1];
+  // Return the BEST plan we found, not the last one
   return {
     approved: false,
-    finalPlan: currentPlan,
-    finalScore: lastIteration?.result.score || 0,
+    finalPlan: bestPlan,
+    finalScore: bestScore,
+    bestPlan,
+    bestScore,
+    bestIteration,
     iterations,
     totalIterations: iteration,
+    finalConcerns: lastConcerns,
+    finalRecommendations: lastRecommendations,
+    arbitrated: false,
   };
 }
@@ -196,16 +559,31 @@ export function summarizeConsensusProcess(result: ConsensusProcessResult): strin
   lines.push(`## Consensus Summary`);
   lines.push('');
-  lines.push(`**Status:** ${result.approved ? 'APPROVED' : 'NOT APPROVED'}`);
+  lines.push(`**Status:** ${result.approved ? 'APPROVED' : 'NOT APPROVED'}${result.arbitrated ? ' (via arbitration)' : ''}`);
   lines.push(`**Final Score:** ${result.finalScore}%`);
+  lines.push(`**Best Score:** ${result.bestScore}% (iteration ${result.bestIteration})`);
   lines.push(`**Total Iterations:** ${result.totalIterations}`);
+  if (result.arbitrated && result.arbitrationResult) {
+    lines.push('');
+    lines.push(`### Arbitration Decision`);
+    lines.push(`- Decision: ${result.arbitrationResult.approved ? 'APPROVED' : 'REVISE'}`);
+    lines.push(`- Confidence: ${result.arbitrationResult.score}%`);
+    if (result.arbitrationResult.criticalConcerns.length > 0) {
+      lines.push(`- Critical Concerns: ${result.arbitrationResult.criticalConcerns.length}`);
+    }
+    if (result.arbitrationResult.minorConcerns.length > 0) {
+      lines.push(`- Minor Concerns: ${result.arbitrationResult.minorConcerns.length}`);
+    }
+  }
   lines.push('');
   lines.push(`### Iteration History`);
   lines.push('');
   for (const iteration of result.iterations) {
-    lines.push(`#### Iteration ${iteration.iteration}`);
+    const isBest = iteration.iteration === result.bestIteration;
+    lines.push(`#### Iteration ${iteration.iteration}${isBest ? ' (BEST)' : ''}`);
     lines.push(`- Score: ${iteration.result.score}%`);
     lines.push(`- Strengths: ${iteration.result.strengths?.length || 0}`);
     lines.push(`- Concerns: ${iteration.result.concerns?.length || 0}`);
@@ -213,13 +591,21 @@ export function summarizeConsensusProcess(result: ConsensusProcessResult): strin
   }
   if (!result.approved) {
-    const lastResult = result.iterations[result.iterations.length - 1]?.result;
-    if (lastResult?.concerns && lastResult.concerns.length > 0) {
+    if (result.finalConcerns && result.finalConcerns.length > 0) {
       lines.push(`### Remaining Concerns`);
       lines.push('');
-      for (const concern of lastResult.concerns) {
+      for (const concern of result.finalConcerns) {
         lines.push(`- ${concern}`);
       }
+      lines.push('');
+    }
+    if (result.finalRecommendations && result.finalRecommendations.length > 0) {
+      lines.push(`### Recommendations`);
+      lines.push('');
+      for (const rec of result.finalRecommendations) {
+        lines.push(`- ${rec}`);
+      }
     }
   }
@@ -297,3 +683,781 @@ export function getScoreTrend(
   if (diff < -5) return 'declining';
   return 'stable';
 }
+/**
+ * Options for optimized consensus
+ */
+export interface OptimizedConsensusOptions extends ConsensusOptions {
+  milestoneId: string;
+  milestoneName?: string;
+  taskId?: string;
+  taskName?: string;
+  /** Use parallel reviews from multiple providers */
+  parallelReviews?: boolean;
+  /** Additional reviewers beyond primary */
+  additionalReviewers?: AIProvider[];
+  /** Whether this is a fullstack project (enables per-app tracking) */
+  isFullstack?: boolean;
+}
+/**
+ * Result for fullstack consensus with per-app tracking
+ */
+export interface FullstackConsensusProcessResult extends ConsensusProcessResult {
+  /** Per-app scores */
+  appScores: AppConsensusScores;
+  /** Per-app approval status */
+  appApproved: {
+    frontend?: boolean;
+    backend?: boolean;
+    unified: boolean;
+  };
+  /** Tagged concerns by app */
+  taggedConcerns: TaggedItem[];
+  /** Tagged recommendations by app */
+  taggedRecommendations: TaggedItem[];
+  /** Corrections made during consensus */
+  corrections: CorrectionRecord[];
+}
+/**
+ * Collect feedback from a single reviewer
+ */
+async function collectReviewerFeedback(
+  plan: string,
+  context: string,
+  reviewer: AIProvider,
+  config: Partial<ConsensusConfig>,
+  onProgress?: (phase: string, message: string) => void
+): Promise<ReviewerFeedback> {
+  onProgress?.('consensus', `Requesting review from ${reviewer}...`);
+  const startTime = Date.now();
+  const result = await requestReviewerConsensus(plan, context, reviewer, config);
+  const duration = Math.round((Date.now() - startTime) / 1000);
+  onProgress?.('consensus', `${reviewer} review completed in ${duration}s - score: ${result.score}%`);
+  return {
+    reviewer,
+    score: result.score,
+    timestamp: new Date().toISOString(),
+    concerns: result.concerns || [],
+    recommendations: result.recommendations || [],
+    analysis: result.analysis || '',
+  };
+}
+/**
+ * Collect feedback from multiple reviewers in parallel
+ */
+async function collectAllFeedback(
+  plan: string,
+  context: string,
+  reviewers: AIProvider[],
+  config: Partial<ConsensusConfig>,
+  onProgress?: (phase: string, message: string) => void
+): Promise<ReviewerFeedback[]> {
+  onProgress?.('consensus', `Collecting feedback from ${reviewers.length} reviewer(s) in parallel...`);
+  const feedbackPromises = reviewers.map(reviewer =>
+    collectReviewerFeedback(plan, context, reviewer, config, onProgress)
+      .catch(error => {
+        onProgress?.('consensus', `${reviewer} review failed: ${error instanceof Error ? error.message : 'Unknown error'}`);
+        return null;
+      })
+  );
+  const results = await Promise.all(feedbackPromises);
+  return results.filter((f): f is ReviewerFeedback => f !== null);
+}
+/**
+ * Categorize a concern or recommendation by app target
+ * Analyzes text content to determine if it relates to frontend, backend, or unified
+ */
+function categorizeByContent(content: string): FeedbackAppTarget {
+  const lowerContent = content.toLowerCase();
+  // Frontend indicators
+  const frontendKeywords = [
+    'react', 'component', 'jsx', 'tsx', 'css', 'tailwind', 'ui', 'user interface',
+    'button', 'form', 'input', 'modal', 'page', 'router', 'navigation', 'state management',
+    'redux', 'zustand', 'vite', 'frontend', 'front-end', 'client', 'browser', 'dom',
+    'styling', 'layout', 'responsive', 'animation', 'hook', 'usestate', 'useeffect',
+    'shadcn', 'radix', 'tailwindcss', 'vitest', 'jest', 'testing-library', 'playwright',
+  ];
+  // Backend indicators
+  const backendKeywords = [
+    'fastapi', 'api', 'endpoint', 'route', 'database', 'sql', 'postgresql', 'neon',
+    'model', 'schema', 'migration', 'orm', 'sqlalchemy', 'pydantic', 'validation',
+    'authentication', 'authorization', 'jwt', 'token', 'middleware', 'backend', 'back-end',
+    'server', 'python', 'pytest', 'alembic', 'celery', 'redis', 'cache', 'queue',
+    'repository', 'service', 'crud', 'rest', 'graphql', 'websocket',
+  ];
+  // Count matches
+  let frontendMatches = 0;
+  let backendMatches = 0;
+  for (const keyword of frontendKeywords) {
+    if (lowerContent.includes(keyword)) {
+      frontendMatches++;
+    }
+  }
+  for (const keyword of backendKeywords) {
+    if (lowerContent.includes(keyword)) {
+      backendMatches++;
+    }
+  }
+  // Determine category
+  if (frontendMatches > backendMatches && frontendMatches >= 2) {
+    return 'frontend';
+  } else if (backendMatches > frontendMatches && backendMatches >= 2) {
+    return 'backend';
+  } else {
+    return 'unified';
+  }
+}
+/**
+ * Categorize all concerns and recommendations by app target
+ */
+function categorizeFeedbackItems(
+  concerns: string[],
+  recommendations: string[]
+): {
+  taggedConcerns: TaggedItem[];
+  taggedRecommendations: TaggedItem[];
+  appScores: { frontend: number; backend: number; unified: number };
+} {
+  const taggedConcerns: TaggedItem[] = concerns.map(concern => ({
+    app: categorizeByContent(concern),
+    content: concern,
+  }));
+  const taggedRecommendations: TaggedItem[] = recommendations.map(rec => ({
+    app: categorizeByContent(rec),
+    content: rec,
+  }));
+  // Count items per app for score calculation
+  const frontendConcerns = taggedConcerns.filter(c => c.app === 'frontend').length;
+  const backendConcerns = taggedConcerns.filter(c => c.app === 'backend').length;
+  const unifiedConcerns = taggedConcerns.filter(c => c.app === 'unified').length;
+  const frontendRecs = taggedRecommendations.filter(r => r.app === 'frontend').length;
+  const backendRecs = taggedRecommendations.filter(r => r.app === 'backend').length;
+  const unifiedRecs = taggedRecommendations.filter(r => r.app === 'unified').length;
+  // Calculate relative scores (more concerns = lower score)
+  const totalItems = taggedConcerns.length + taggedRecommendations.length;
+  const baseScore = totalItems > 0 ? 100 : 0;
+  return {
+    taggedConcerns,
+    taggedRecommendations,
+    appScores: {
+      frontend: Math.max(0, baseScore - (frontendConcerns + frontendRecs) * 5),
+      backend: Math.max(0, baseScore - (backendConcerns + backendRecs) * 5),
+      unified: Math.max(0, baseScore - (unifiedConcerns + unifiedRecs) * 5),
+    },
+  };
+}
+/**
+ * Calculate per-app scores from feedback
+ */
+function calculateAppScores(
+  allFeedback: ReviewerFeedback[],
+  taggedConcerns: TaggedItem[],
+  taggedRecommendations: TaggedItem[]
+): AppConsensusScores {
+  // Base score from average feedback score
+  const baseScore = allFeedback.length > 0
+    ? Math.round(allFeedback.reduce((sum, f) => sum + f.score, 0) / allFeedback.length)
+    : 0;
+  // Count concerns per app
+  const frontendConcerns = taggedConcerns.filter(c => c.app === 'frontend').length;
+  const backendConcerns = taggedConcerns.filter(c => c.app === 'backend').length;
+  const unifiedConcerns = taggedConcerns.filter(c => c.app === 'unified').length;
+  const frontendRecs = taggedRecommendations.filter(r => r.app === 'frontend').length;
+  const backendRecs = taggedRecommendations.filter(r => r.app === 'backend').length;
+  // Calculate app-specific scores
+  // More concerns = lower score (each concern/rec reduces score by 2 points)
+  const frontendScore = frontendConcerns > 0 || frontendRecs > 0
+    ? Math.max(0, baseScore - (frontendConcerns * 2 + frontendRecs))
+    : baseScore;
+  const backendScore = backendConcerns > 0 || backendRecs > 0
+    ? Math.max(0, baseScore - (backendConcerns * 2 + backendRecs))
+    : baseScore;
+  // Unified score is the base combined score
+  const unifiedScore = Math.max(0, baseScore - (unifiedConcerns * 2));
+  return {
+    frontend: frontendScore,
+    backend: backendScore,
+    unified: unifiedScore,
+  };
+}
+/**
+ * Optimized consensus process that batches feedback and reduces API calls
+ *
+ * Key optimizations:
+ * 1. Plans stored in files, not regenerated from scratch
+ * 2. Collects ALL reviewer feedback before revision
+ * 3. Claude revises ONCE per round with combined feedback
+ * 4. Parallel reviews when multiple reviewers configured
+ * 5. Per-app tracking for fullstack projects (frontend/backend/unified)
+ *
+ * @param initialPlan - The initial plan to seek consensus on
+ * @param context - Project context for review
+ * @param options - Consensus options including tracking info
+ * @returns Consensus process result (FullstackConsensusProcessResult for fullstack projects)
+ */
+export async function runOptimizedConsensusProcess(
+  initialPlan: string,
+  context: string,
+  options: OptimizedConsensusOptions
+): Promise<ConsensusProcessResult | FullstackConsensusProcessResult> {
+  const {
+    projectDir,
+    config = {},
+    onIteration,
+    onRevision,
+    onConcerns,
+    onArbitration,
+    onProgress,
+    milestoneId,
+    milestoneName,
+    taskId,
+    taskName,
+    parallelReviews = true,
+    additionalReviewers = [],
+    isFullstack = false,
+  } = options;
+  // Derive language from isFullstack for revision prompts
+  const language: 'python' | 'typescript' | 'fullstack' = isFullstack ? 'fullstack' : 'python';
+  const {
+    threshold = DEFAULT_CONSENSUS_CONFIG.threshold,
+    maxIterations = DEFAULT_CONSENSUS_CONFIG.maxIterations,
+    reviewer = DEFAULT_CONSENSUS_CONFIG.reviewer,
+    arbitrator = DEFAULT_CONSENSUS_CONFIG.arbitrator,
+    enableArbitration = DEFAULT_CONSENSUS_CONFIG.enableArbitration,
+    arbitrationThreshold = DEFAULT_CONSENSUS_CONFIG.arbitrationThreshold,
+    stuckIterations = DEFAULT_CONSENSUS_CONFIG.stuckIterations,
+  } = config;
+  // Initialize plan storage with fullstack support
+  const planStorage = createPlanStorage(projectDir, isFullstack);
+  await planStorage.initialize();
+  // Track per-app consensus for fullstack projects
+  const appScoresHistory: { frontend: number[]; backend: number[]; unified: number[] } = {
+    frontend: [],
+    backend: [],
+    unified: [],
+  };
+  const allTaggedConcerns: TaggedItem[] = [];
+  const allTaggedRecommendations: TaggedItem[] = [];
+  const corrections: CorrectionRecord[] = [];
+  // Determine all reviewers
+  const allReviewers: AIProvider[] = [reviewer, ...additionalReviewers.filter(r => r !== reviewer)];
+  const iterations: ConsensusIteration[] = [];
+  const scores: number[] = [];
+  let currentPlan = initialPlan;
+  let iteration = 0;
+  // Track the best plan
+  let bestPlan = initialPlan;
+  let bestScore = 0;
+  let bestIteration = 0;
+  let lastConcerns: string[] = [];
+  let lastRecommendations: string[] = [];
+  let lastAnalysis = '';
+  const startTime = Date.now();
+  onProgress?.('consensus', `Using optimized consensus with ${allReviewers.join(', ')} as reviewer(s)`);
+  onProgress?.('consensus', `Plan tracking: milestone=${milestoneId}${taskId ? `, task=${taskId}` : ''}`);
+  if (isFullstack) {
+    onProgress?.('consensus', `Fullstack mode enabled - tracking per-app consensus (frontend/backend/unified)`);
+  }
+  // Save initial plan to storage
+  await planStorage.savePlan(currentPlan, taskId ? 'task' : 'milestone', {
+    milestoneId,
+    milestoneName,
+    taskId,
+    taskName,
+  });
+  while (iteration < maxIterations) {
+    iteration++;
+    // Check timeout
+    const totalElapsed = Date.now() - startTime;
+    if (totalElapsed > DEFAULT_CONSENSUS_TIMEOUT_MS) {
+      onProgress?.('consensus', `Consensus timeout after ${Math.round(totalElapsed / 60000)} minutes`);
+      if (enableArbitration) {
+        try {
+          const arbitrationResult = await requestArbitratorDecision(
+            bestPlan,
+            lastAnalysis,
+            `Timeout. Best score: ${bestScore}%. Concerns: ${lastConcerns.slice(0, 3).join('; ')}`,
+            iteration,
+            scores,
+            arbitrator
+          );
+          if (onArbitration) onArbitration(arbitrationResult);
+          return {
+            approved: arbitrationResult.approved || arbitrationResult.score >= 80,
+            finalPlan: bestPlan,
+            finalScore: arbitrationResult.score,
+            bestPlan,
+            bestScore: arbitrationResult.score,
+            bestIteration,
+            iterations,
+            totalIterations: iteration - 1,
+            finalConcerns: arbitrationResult.minorConcerns || lastConcerns,
+            finalRecommendations: arbitrationResult.suggestedChanges || lastRecommendations,
+            arbitrated: true,
+            arbitrationResult,
+            timedOut: true,
+          };
+        } catch {
+          // Fall through to accept best plan
+        }
+      }
+      return {
+        approved: bestScore >= arbitrationThreshold,
+        finalPlan: bestPlan,
+        finalScore: bestScore,
+        bestPlan,
+        bestScore,
+        bestIteration,
+        iterations,
+        totalIterations: iteration - 1,
+        finalConcerns: lastConcerns,
+        finalRecommendations: lastRecommendations,
+        arbitrated: false,
+        timedOut: true,
+      };
+    }
+    const elapsedMinutes = Math.round((Date.now() - startTime) / 60000);
+    onProgress?.('consensus', `Iteration ${iteration} starting (${elapsedMinutes}min elapsed)`);
+    // Clear previous feedback for this round
+    await planStorage.clearFeedback(milestoneId, taskId);
+    // ============================================
+    // OPTIMIZATION: Collect ALL feedback in parallel
+    // ============================================
+    let allFeedback: ReviewerFeedback[];
+    if (parallelReviews && allReviewers.length > 1) {
+      allFeedback = await collectAllFeedback(currentPlan, context, allReviewers, config, onProgress);
+    } else {
+      // Sequential fallback
+      allFeedback = [];
+      for (const rev of allReviewers) {
+        const feedback = await collectReviewerFeedback(currentPlan, context, rev, config, onProgress);
+        allFeedback.push(feedback);
+      }
+    }
+    // Combine all concerns and recommendations
+    const allConcerns = [...new Set(allFeedback.flatMap(f => f.concerns))];
+    const allRecommendations = [...new Set(allFeedback.flatMap(f => f.recommendations))];
+    const combinedAnalysis = allFeedback.map(f => `[${f.reviewer}] ${f.analysis}`).join('\n\n');
+    lastConcerns = allConcerns;
+    lastRecommendations = allRecommendations;
+    // ============================================
+    // FULLSTACK: Categorize feedback by app target
+    // ============================================
+    let currentAppScores: AppConsensusScores = { unified: 0 };
+    let iterationTaggedConcerns: TaggedItem[] = [];
+    let iterationTaggedRecs: TaggedItem[] = [];
+    if (isFullstack) {
+      onProgress?.('consensus', 'Categorizing feedback by app (frontend/backend/unified)...');
+      // Categorize concerns and recommendations
+      const categorized = categorizeFeedbackItems(allConcerns, allRecommendations);
+      iterationTaggedConcerns = categorized.taggedConcerns;
+      iterationTaggedRecs = categorized.taggedRecommendations;
+      // Calculate per-app scores
+      currentAppScores = calculateAppScores(allFeedback, iterationTaggedConcerns, iterationTaggedRecs);
+      // Track scores history
+      appScoresHistory.frontend.push(currentAppScores.frontend || 0);
+      appScoresHistory.backend.push(currentAppScores.backend || 0);
+      appScoresHistory.unified.push(currentAppScores.unified);
+      // Accumulate tagged items for final result
+      allTaggedConcerns.push(...iterationTaggedConcerns);
+      allTaggedRecommendations.push(...iterationTaggedRecs);
+      // Log per-app breakdown
+      const frontendConcerns = iterationTaggedConcerns.filter(c => c.app === 'frontend').length;
+      const backendConcerns = iterationTaggedConcerns.filter(c => c.app === 'backend').length;
+      const unifiedConcerns = iterationTaggedConcerns.filter(c => c.app === 'unified').length;
+      onProgress?.('consensus', `Per-app concerns: FE=${frontendConcerns}, BE=${backendConcerns}, Unified=${unifiedConcerns}`);
+      onProgress?.('consensus', `Per-app scores: FE=${currentAppScores.frontend}%, BE=${currentAppScores.backend}%, Unified=${currentAppScores.unified}%`);
+      // Save feedback to per-app directories
+      for (const feedback of allFeedback) {
+        // Create fullstack feedback with tagged items
+        const fullstackFeedback: FullstackReviewerFeedback = {
+          ...feedback,
+          appScores: currentAppScores,
+          taggedConcerns: iterationTaggedConcerns.filter(c =>
+            feedback.concerns.some(fc => fc === c.content)
+          ),
+          taggedRecommendations: iterationTaggedRecs.filter(r =>
+            feedback.recommendations.some(fr => fr === r.content)
+          ),
+          isFullstack: true,
+        };
+        // Save to all app directories
+        await planStorage.saveFullstackFeedback(
+          fullstackFeedback,
+          taskId ? 'task' : 'milestone',
+          milestoneId,
+          taskId
+        );
+      }
+    } else {
+      // Non-fullstack: save feedback without app categorization
+      for (const feedback of allFeedback) {
+        await planStorage.saveFeedback(feedback, milestoneId, taskId);
+      }
+      currentAppScores = { unified: allFeedback.length > 0
+        ? Math.round(allFeedback.reduce((sum, f) => sum + f.score, 0) / allFeedback.length)
+        : 0 };
+    }
+    // Calculate combined score (average of all reviewers)
+    const combinedScore = allFeedback.length > 0
+      ? Math.round(allFeedback.reduce((sum, f) => sum + f.score, 0) / allFeedback.length)
+      : 0;
+    scores.push(combinedScore);
+    lastAnalysis = combinedAnalysis;
+    // Create consensus result for tracking
+    const consensusResult: ConsensusResult = {
+      score: combinedScore,
+      analysis: combinedAnalysis,
+      concerns: allConcerns,
+      recommendations: allRecommendations,
+      approved: combinedScore >= threshold,
+      strengths: [],
+      rawResponse: combinedAnalysis,
+    };
+    // Record iteration
+    const iterationRecord: ConsensusIteration = {
+      iteration,
+      plan: currentPlan,
+      timestamp: new Date().toISOString(),
+      result: consensusResult,
+    };
+    iterations.push(iterationRecord);
+    if (onIteration) onIteration(iteration, consensusResult);
+    if (onConcerns) onConcerns(allConcerns, allRecommendations);
+    // Update best plan tracking
+    if (combinedScore > bestScore) {
+      bestScore = combinedScore;
+      bestPlan = currentPlan;
+      bestIteration = iteration;
+    }
+    // Save plan with updated score (including per-app scores for fullstack)
+    await planStorage.savePlan(currentPlan, taskId ? 'task' : 'milestone', {
+      milestoneId,
+      milestoneName,
+      taskId,
+      taskName,
+      score: combinedScore,
+      frontendScore: isFullstack ? currentAppScores.frontend : undefined,
+      backendScore: isFullstack ? currentAppScores.backend : undefined,
+      unifiedScore: isFullstack ? currentAppScores.unified : undefined,
+    });
+    // Record correction for fullstack tracking
+    if (isFullstack && iteration > 1) {
+      const previousScore = scores.length >= 2 ? scores[scores.length - 2] : 0;
+      const correction: CorrectionRecord = {
+        id: `correction-${iteration}`,
+        timestamp: new Date().toISOString(),
+        app: 'unified', // Top-level correction
+        previousScore,
+        newScore: combinedScore,
+        concerns: lastConcerns.slice(0, 5),
+        changes: lastRecommendations.slice(0, 3),
+        reviewer,
+      };
+      corrections.push(correction);
+      await planStorage.recordCorrection(
+        taskId ? 'task' : 'milestone',
+        correction,
+        milestoneId,
+        taskId
+      );
+    }
+    // Record in project state
+    await recordConsensusIteration(projectDir, iterationRecord);
+    onProgress?.('consensus', `Combined score: ${combinedScore}% (from ${allFeedback.length} reviewer(s))`);
+    // Check if consensus reached
+    if (combinedScore >= threshold) {
+      onProgress?.('consensus', `Consensus reached at ${combinedScore}%`);
+      await planStorage.updateStatus('approved', taskId ? 'task' : 'milestone', milestoneId, taskId);
+      // Update per-app approval status for fullstack
+      if (isFullstack) {
+        const feApproved = (currentAppScores.frontend || 0) >= threshold;
+        const beApproved = (currentAppScores.backend || 0) >= threshold;
+        await planStorage.updateAppApproval(taskId ? 'task' : 'milestone', 'frontend', feApproved, currentAppScores.frontend || 0, milestoneId, taskId);
+        await planStorage.updateAppApproval(taskId ? 'task' : 'milestone', 'backend', beApproved, currentAppScores.backend || 0, milestoneId, taskId);
+        await planStorage.updateAppApproval(taskId ? 'task' : 'milestone', 'unified', true, currentAppScores.unified, milestoneId, taskId);
+        onProgress?.('consensus', `Per-app approval: FE=${feApproved}, BE=${beApproved}, Unified=true`);
+        return {
+          approved: true,
+          finalPlan: currentPlan,
+          finalScore: combinedScore,
+          bestPlan: currentPlan,
+          bestScore: combinedScore,
+          bestIteration: iteration,
+          iterations,
+          totalIterations: iteration,
+          finalConcerns: allConcerns,
+          finalRecommendations: allRecommendations,
+          arbitrated: false,
+          // Fullstack-specific fields
+          appScores: currentAppScores,
+          appApproved: {
+            frontend: feApproved,
+            backend: beApproved,
+            unified: true,
+          },
+          taggedConcerns: allTaggedConcerns,
+          taggedRecommendations: allTaggedRecommendations,
+          corrections,
+        } as FullstackConsensusProcessResult;
+      }
+      return {
+        approved: true,
+        finalPlan: currentPlan,
+        finalScore: combinedScore,
+        bestPlan: currentPlan,
+        bestScore: combinedScore,
+        bestIteration: iteration,
+        iterations,
+        totalIterations: iteration,
+        finalConcerns: allConcerns,
+        finalRecommendations: allRecommendations,
+        arbitrated: false,
+      };
+    }
+    // Check if stuck
+    if (isStuck(scores, stuckIterations) && enableArbitration) {
+      onProgress?.('consensus', `Consensus stuck - invoking ${arbitrator} for arbitration`);
+      try {
+        const arbitrationResult = await requestArbitratorDecision(
+          bestPlan,
+          combinedAnalysis,
+          `Stuck after ${iteration} iterations. Scores: ${scores.slice(-stuckIterations).join(', ')}`,
+          iteration,
+          scores,
+          arbitrator
+        );
+        if (onArbitration) onArbitration(arbitrationResult);
+        if (arbitrationResult.approved || arbitrationResult.score >= arbitrationThreshold) {
+          onProgress?.('arbitration', `Arbitrator approved with ${arbitrationResult.score}%`);
+          await planStorage.updateStatus('approved', taskId ? 'task' : 'milestone', milestoneId, taskId);
+          if (isFullstack) {
+            const feApproved = (currentAppScores.frontend || 0) >= arbitrationThreshold;
+            const beApproved = (currentAppScores.backend || 0) >= arbitrationThreshold;
+            return {
+              approved: true,
+              finalPlan: bestPlan,
+              finalScore: arbitrationResult.score,
+              bestPlan,
+              bestScore: arbitrationResult.score,
+              bestIteration,
+              iterations,
+              totalIterations: iteration,
+              finalConcerns: arbitrationResult.minorConcerns || allConcerns,
+              finalRecommendations: arbitrationResult.suggestedChanges || allRecommendations,
+              arbitrated: true,
+              arbitrationResult,
+              // Fullstack-specific fields
+              appScores: currentAppScores,
+              appApproved: {
+                frontend: feApproved,
+                backend: beApproved,
+                unified: true,
+              },
+              taggedConcerns: allTaggedConcerns,
+              taggedRecommendations: allTaggedRecommendations,
+              corrections,
+            } as FullstackConsensusProcessResult;
+          }
+          return {
+            approved: true,
+            finalPlan: bestPlan,
+            finalScore: arbitrationResult.score,
+            bestPlan,
+            bestScore: arbitrationResult.score,
+            bestIteration,
+            iterations,
+            totalIterations: iteration,
+            finalConcerns: arbitrationResult.minorConcerns || allConcerns,
+            finalRecommendations: arbitrationResult.suggestedChanges || allRecommendations,
+            arbitrated: true,
+            arbitrationResult,
+          };
+        }
+      } catch (arbError) {
+        onProgress?.('arbitration', `Arbitration failed: ${arbError instanceof Error ? arbError.message : 'Unknown error'}`);
+      }
+    }
+    // ============================================
+    // OPTIMIZATION: Single revision with ALL feedback
+    // ============================================
+    if (iteration < maxIterations) {
+      onProgress?.('consensus', `Revising plan with combined feedback from ${allFeedback.length} reviewer(s)...`);
+      const revisionProgress = onProgress
+        ? (msg: string) => onProgress('consensus', `[revision] ${msg}`)
+        : undefined;
+      // Use Claude to revise with ALL combined feedback (single API call)
+      const revisionResult = await revisePlan(
+        currentPlan,
+        combinedAnalysis,
+        allConcerns,
+        language,
+        revisionProgress
+      );
+      if (revisionResult.success && revisionResult.response) {
+        currentPlan = revisionResult.response;
+        // Save revised plan
+        await planStorage.savePlan(currentPlan, taskId ? 'task' : 'milestone', {
+          milestoneId,
+          milestoneName,
+          taskId,
+          taskName,
+        });
+        if (onRevision) onRevision(iteration, currentPlan);
+      } else {
+        onProgress?.('consensus', `Revision failed, continuing with best plan`);
+        currentPlan = bestPlan;
+      }
+    }
+  }
+  // Max iterations reached
+  await planStorage.updateStatus('reviewing', taskId ? 'task' : 'milestone', milestoneId, taskId);
+  // Final per-app scores from history
+  const finalAppScores: AppConsensusScores = isFullstack ? {
+    frontend: appScoresHistory.frontend.length > 0
+      ? appScoresHistory.frontend[appScoresHistory.frontend.length - 1]
+      : undefined,
+    backend: appScoresHistory.backend.length > 0
+      ? appScoresHistory.backend[appScoresHistory.backend.length - 1]
+      : undefined,
+    unified: appScoresHistory.unified.length > 0
+      ? appScoresHistory.unified[appScoresHistory.unified.length - 1]
+      : bestScore,
+  } : { unified: bestScore };
+  if (isFullstack) {
+    const feApproved = (finalAppScores.frontend || 0) >= threshold;
+    const beApproved = (finalAppScores.backend || 0) >= threshold;
+    return {
+      approved: false,
+      finalPlan: bestPlan,
+      finalScore: bestScore,
+      bestPlan,
+      bestScore,
+      bestIteration,
+      iterations,
+      totalIterations: iteration,
+      finalConcerns: lastConcerns,
+      finalRecommendations: lastRecommendations,
+      arbitrated: false,
+      // Fullstack-specific fields
+      appScores: finalAppScores,
+      appApproved: {
+        frontend: feApproved,
+        backend: beApproved,
+        unified: bestScore >= threshold,
+      },
+      taggedConcerns: allTaggedConcerns,
+      taggedRecommendations: allTaggedRecommendations,
+      corrections,
+    } as FullstackConsensusProcessResult;
+  }
+  return {
+    approved: false,
+    finalPlan: bestPlan,
+    finalScore: bestScore,
+    bestPlan,
+    bestScore,
+    bestIteration,
+    iterations,
+    totalIterations: iteration,
+    finalConcerns: lastConcerns,
+    finalRecommendations: lastRecommendations,
+    arbitrated: false,
+  };
+}