npm - kiro-spec-engine - Versions diffs - 1.2.2 → 1.3.0 - Mend

kiro-spec-engine 1.2.2 → 1.3.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (49) hide show

package/CHANGELOG.md +91 -0
package/README.md +172 -0
package/bin/kiro-spec-engine.js +62 -0
package/docs/adoption-guide.md +506 -0
package/docs/agent-hooks-analysis.md +815 -0
package/docs/architecture.md +706 -0
package/docs/cross-tool-guide.md +554 -0
package/docs/developer-guide.md +615 -0
package/docs/manual-workflows-guide.md +417 -0
package/docs/steering-strategy-guide.md +196 -0
package/docs/upgrade-guide.md +632 -0
package/lib/adoption/detection-engine.js +14 -4
package/lib/commands/adopt.js +117 -3
package/lib/commands/context.js +99 -0
package/lib/commands/prompt.js +105 -0
package/lib/commands/status.js +225 -0
package/lib/commands/task.js +199 -0
package/lib/commands/watch.js +569 -0
package/lib/commands/workflows.js +240 -0
package/lib/commands/workspace.js +189 -0
package/lib/context/context-exporter.js +378 -0
package/lib/context/prompt-generator.js +482 -0
package/lib/steering/adoption-config.js +164 -0
package/lib/steering/steering-manager.js +289 -0
package/lib/task/task-claimer.js +430 -0
package/lib/utils/tool-detector.js +383 -0
package/lib/watch/action-executor.js +458 -0
package/lib/watch/event-debouncer.js +323 -0
package/lib/watch/execution-logger.js +550 -0
package/lib/watch/file-watcher.js +499 -0
package/lib/watch/presets.js +266 -0
package/lib/watch/watch-manager.js +533 -0
package/lib/workspace/workspace-manager.js +370 -0
package/lib/workspace/workspace-sync.js +356 -0
package/package.json +4 -1
package/template/.kiro/tools/backup_manager.py +295 -0
package/template/.kiro/tools/configuration_manager.py +218 -0
package/template/.kiro/tools/document_evaluator.py +550 -0
package/template/.kiro/tools/enhancement_logger.py +168 -0
package/template/.kiro/tools/error_handler.py +335 -0
package/template/.kiro/tools/improvement_identifier.py +444 -0
package/template/.kiro/tools/modification_applicator.py +737 -0
package/template/.kiro/tools/quality_gate_enforcer.py +207 -0
package/template/.kiro/tools/quality_scorer.py +305 -0
package/template/.kiro/tools/report_generator.py +154 -0
package/template/.kiro/tools/ultrawork_enhancer_refactored.py +0 -0
package/template/.kiro/tools/ultrawork_enhancer_v2.py +463 -0
package/template/.kiro/tools/ultrawork_enhancer_v3.py +606 -0
package/template/.kiro/tools/workflow_quality_gate.py +100 -0

package/template/.kiro/tools/ultrawork_enhancer_v3.py ADDED Viewed

@@ -0,0 +1,606 @@
+#!/usr/bin/env python3
+"""
+Ultrawork Enhancer V3 - 主控制器（带收敛控制）
+负责协调文档增强过程，管理改进循环，强制收敛条件
+"""
+import os
+from typing import Optional, List, Tuple
+from dataclasses import dataclass, field
+from datetime import datetime
+from document_evaluator import DocumentEvaluator, QualityAssessment
+from improvement_identifier import ImprovementIdentifier, Improvement
+from modification_applicator import ModificationApplicator, ModificationResult
+from quality_scorer import QualityScorer, ScoringResult
+from backup_manager import BackupManager, BackupInfo
+@dataclass
+class EnhancementResult:
+    """增强结果"""
+    success: bool
+    document_type: str  # 'requirements', 'design', 'tasks'
+    initial_score: float
+    final_score: float
+    iterations: int
+    improvements_applied: List[Improvement] = field(default_factory=list)
+    improvements_failed: List[Tuple[Improvement, Exception]] = field(default_factory=list)
+    stopping_reason: str = ""  # 'threshold_reached', 'max_iterations', 'plateau', 'no_improvements'
+    modification_report: str = ""
+    timestamp: datetime = field(default_factory=datetime.now)
+    score_history: List[float] = field(default_factory=list)
+class UltraworkEnhancerV3:
+    """
+    Ultrawork 增强器 V3 - 主控制器
+    集成所有核心组件，管理改进循环，强制收敛条件
+    """
+    def __init__(self,
+                 quality_threshold: float = 9.0,
+                 max_iterations: int = 10,
+                 plateau_iterations: int = 3,
+                 min_score_improvement: float = 0.1,
+                 create_backups: bool = True,
+                 cleanup_backups_on_success: bool = True):
+        """
+        初始化增强器
+        Args:
+            quality_threshold: 质量阈值 (0-10)
+            max_iterations: 最大迭代次数
+            plateau_iterations: 平台期迭代次数（连续N次无改进则停止）
+            min_score_improvement: 最小分数改进（低于此值视为无改进）
+            create_backups: 是否创建备份
+            cleanup_backups_on_success: 成功后是否清理备份
+        """
+        self.quality_threshold = quality_threshold
+        self.max_iterations = max_iterations
+        self.plateau_iterations = plateau_iterations
+        self.min_score_improvement = min_score_improvement
+        self.create_backups = create_backups
+        self.cleanup_backups_on_success = cleanup_backups_on_success
+        # 初始化核心组件
+        self.evaluator = DocumentEvaluator()
+        self.identifier = ImprovementIdentifier()
+        self.applicator = ModificationApplicator()
+        self.scorer = QualityScorer()
+        self.backup_manager = BackupManager()
+    def set_quality_threshold(self, threshold: float):
+        """设置质量阈值"""
+        if not 0.0 <= threshold <= 10.0:
+            raise ValueError(f"Threshold must be between 0.0 and 10.0, got {threshold}")
+        self.quality_threshold = threshold
+    def set_max_iterations(self, max_iter: int):
+        """设置最大迭代次数"""
+        if not 1 <= max_iter <= 100:
+            raise ValueError(f"Max iterations must be between 1 and 100, got {max_iter}")
+        self.max_iterations = max_iter
+    def enhance_requirements_quality(self, requirements_path: str) -> EnhancementResult:
+        """
+        增强 Requirements 文档质量
+        Args:
+            requirements_path: Requirements 文档路径
+        Returns:
+            EnhancementResult: 增强结果
+        """
+        print(f"\n{'='*60}")
+        print(f"Enhancing Requirements: {requirements_path}")
+        print(f"{'='*60}\n")
+        # 读取文档
+        try:
+            with open(requirements_path, 'r', encoding='utf-8') as f:
+                content = f.read()
+        except Exception as e:
+            return EnhancementResult(
+                success=False,
+                document_type='requirements',
+                initial_score=0.0,
+                final_score=0.0,
+                iterations=0,
+                stopping_reason=f"file_read_error: {e}"
+            )
+        # 初始评估
+        initial_assessment = self.evaluator.assess_requirements_quality(content)
+        initial_score = initial_assessment.score
+        print(f"Initial Score: {initial_score:.2f}/10")
+        print(f"Language: {initial_assessment.language}")
+        print(f"Missing Sections: {initial_assessment.missing_sections}")
+        print(f"Issues: {len(initial_assessment.issues)}\n")
+        # 检查是否已达到阈值
+        if initial_score >= self.quality_threshold:
+            print(f"✓ Already meets quality threshold ({self.quality_threshold})")
+            return EnhancementResult(
+                success=True,
+                document_type='requirements',
+                initial_score=initial_score,
+                final_score=initial_score,
+                iterations=0,
+                stopping_reason='threshold_reached',
+                score_history=[initial_score]
+            )
+        # 创建备份
+        backup_id = None
+        if self.create_backups:
+            try:
+                backup_id = self.backup_manager.create_backup(
+                    requirements_path,
+                    reason="requirements_enhancement"
+                )
+                print(f"✓ Created backup: {backup_id}\n")
+            except Exception as e:
+                print(f"✗ Failed to create backup: {e}")
+                print("  Aborting enhancement to preserve document integrity\n")
+                return EnhancementResult(
+                    success=False,
+                    document_type='requirements',
+                    initial_score=initial_score,
+                    final_score=initial_score,
+                    iterations=0,
+                    stopping_reason=f"backup_failed: {e}"
+                )
+        # 开始改进循环
+        current_content = content
+        current_score = initial_score
+        score_history = [initial_score]
+        all_applied = []
+        all_failed = []
+        iteration = 0
+        plateau_count = 0
+        while iteration < self.max_iterations:
+            iteration += 1
+            print(f"\n--- Iteration {iteration}/{self.max_iterations} ---")
+            # 评估当前质量
+            assessment = self.evaluator.assess_requirements_quality(current_content)
+            # 识别改进
+            improvements = self.identifier.identify_requirements_improvements(
+                current_content,
+                assessment
+            )
+            if not improvements:
+                print("✓ No more improvements identified")
+                stopping_reason = 'no_improvements'
+                break
+            print(f"Identified {len(improvements)} improvements")
+            # 应用改进
+            result = self.applicator.apply_requirements_improvements(
+                current_content,
+                improvements,
+                language=assessment.language
+            )
+            print(f"Applied {len(result.applied_improvements)} improvements")
+            print(f"Failed {len(result.failed_improvements)} improvements")
+            # 更新内容
+            current_content = result.modified_content
+            all_applied.extend(result.applied_improvements)
+            all_failed.extend(result.failed_improvements)
+            # 重新评估
+            new_assessment = self.evaluator.assess_requirements_quality(current_content)
+            new_score = new_assessment.score
+            score_history.append(new_score)
+            score_delta = new_score - current_score
+            print(f"Score: {current_score:.2f} → {new_score:.2f} (Δ{score_delta:+.2f})")
+            # 检查收敛条件
+            # 1. 达到阈值
+            if new_score >= self.quality_threshold:
+                print(f"\n✓ Quality threshold reached ({self.quality_threshold})")
+                stopping_reason = 'threshold_reached'
+                current_score = new_score
+                break
+            # 2. 分数无改进（平台期）
+            if score_delta < self.min_score_improvement:
+                plateau_count += 1
+                print(f"⚠ Plateau detected ({plateau_count}/{self.plateau_iterations})")
+                if plateau_count >= self.plateau_iterations:
+                    print(f"\n✓ Plateau reached ({self.plateau_iterations} iterations without improvement)")
+                    stopping_reason = 'plateau'
+                    current_score = new_score
+                    break
+            else:
+                plateau_count = 0  # 重置平台期计数
+            current_score = new_score
+        # 检查是否达到最大迭代次数
+        if iteration >= self.max_iterations:
+            print(f"\n✓ Max iterations reached ({self.max_iterations})")
+            stopping_reason = 'max_iterations'
+        # 保存增强后的文档
+        try:
+            with open(requirements_path, 'w', encoding='utf-8') as f:
+                f.write(current_content)
+            print(f"\n✓ Saved enhanced document to {requirements_path}")
+            # 清理备份（如果成功且配置为清理）
+            if backup_id and self.cleanup_backups_on_success:
+                if self.backup_manager.cleanup_backup(backup_id):
+                    print(f"✓ Cleaned up backup: {backup_id}")
+        except Exception as e:
+            print(f"\n✗ Failed to save document: {e}")
+            # 尝试恢复备份
+            if backup_id:
+                try:
+                    self.backup_manager.restore_backup(backup_id)
+                    print(f"✓ Restored from backup: {backup_id}")
+                except Exception as restore_error:
+                    print(f"✗ Failed to restore backup: {restore_error}")
+            return EnhancementResult(
+                success=False,
+                document_type='requirements',
+                initial_score=initial_score,
+                final_score=current_score,
+                iterations=iteration,
+                improvements_applied=all_applied,
+                improvements_failed=all_failed,
+                stopping_reason=f"file_write_error: {e}",
+                score_history=score_history
+            )
+        # 生成报告
+        print(f"\n{'='*60}")
+        print(f"Enhancement Complete")
+        print(f"{'='*60}")
+        print(f"Initial Score: {initial_score:.2f}/10")
+        print(f"Final Score: {current_score:.2f}/10")
+        print(f"Improvement: +{current_score - initial_score:.2f}")
+        print(f"Iterations: {iteration}")
+        print(f"Stopping Reason: {stopping_reason}")
+        print(f"Applied Improvements: {len(all_applied)}")
+        print(f"Failed Improvements: {len(all_failed)}")
+        print(f"{'='*60}\n")
+        return EnhancementResult(
+            success=True,
+            document_type='requirements',
+            initial_score=initial_score,
+            final_score=current_score,
+            iterations=iteration,
+            improvements_applied=all_applied,
+            improvements_failed=all_failed,
+            stopping_reason=stopping_reason,
+            score_history=score_history
+        )
+    def enhance_design_completeness(self, design_path: str, requirements_path: str) -> EnhancementResult:
+        """
+        增强 Design 文档完整性
+        Args:
+            design_path: Design 文档路径
+            requirements_path: Requirements 文档路径
+        Returns:
+            EnhancementResult: 增强结果
+        """
+        print(f"\n{'='*60}")
+        print(f"Enhancing Design: {design_path}")
+        print(f"{'='*60}\n")
+        # 读取文档
+        try:
+            with open(design_path, 'r', encoding='utf-8') as f:
+                design_content = f.read()
+            with open(requirements_path, 'r', encoding='utf-8') as f:
+                requirements_content = f.read()
+        except Exception as e:
+            return EnhancementResult(
+                success=False,
+                document_type='design',
+                initial_score=0.0,
+                final_score=0.0,
+                iterations=0,
+                stopping_reason=f"file_read_error: {e}"
+            )
+        # 初始评估
+        initial_assessment = self.evaluator.assess_design_quality(
+            design_content,
+            requirements_content
+        )
+        initial_score = initial_assessment.score
+        print(f"Initial Score: {initial_score:.2f}/10")
+        print(f"Language: {initial_assessment.language}")
+        print(f"Missing Sections: {initial_assessment.missing_sections}")
+        print(f"Issues: {len(initial_assessment.issues)}\n")
+        # 检查是否已达到阈值
+        if initial_score >= self.quality_threshold:
+            print(f"✓ Already meets quality threshold ({self.quality_threshold})")
+            return EnhancementResult(
+                success=True,
+                document_type='design',
+                initial_score=initial_score,
+                final_score=initial_score,
+                iterations=0,
+                stopping_reason='threshold_reached',
+                score_history=[initial_score]
+            )
+        # 创建备份
+        backup_id = None
+        if self.create_backups:
+            try:
+                backup_id = self.backup_manager.create_backup(
+                    design_path,
+                    reason="design_enhancement"
+                )
+                print(f"✓ Created backup: {backup_id}\n")
+            except Exception as e:
+                print(f"✗ Failed to create backup: {e}")
+                print("  Aborting enhancement to preserve document integrity\n")
+                return EnhancementResult(
+                    success=False,
+                    document_type='design',
+                    initial_score=initial_score,
+                    final_score=initial_score,
+                    iterations=0,
+                    stopping_reason=f"backup_failed: {e}"
+                )
+        # 开始改进循环
+        current_content = design_content
+        current_score = initial_score
+        score_history = [initial_score]
+        all_applied = []
+        all_failed = []
+        iteration = 0
+        plateau_count = 0
+        while iteration < self.max_iterations:
+            iteration += 1
+            print(f"\n--- Iteration {iteration}/{self.max_iterations} ---")
+            # 评估当前质量
+            assessment = self.evaluator.assess_design_quality(
+                current_content,
+                requirements_content
+            )
+            # 识别改进
+            improvements = self.identifier.identify_design_improvements(
+                current_content,
+                requirements_content,
+                assessment
+            )
+            if not improvements:
+                print("✓ No more improvements identified")
+                stopping_reason = 'no_improvements'
+                break
+            print(f"Identified {len(improvements)} improvements")
+            # 应用改进
+            result = self.applicator.apply_design_improvements(
+                current_content,
+                improvements,
+                requirements_content,
+                language=assessment.language
+            )
+            print(f"Applied {len(result.applied_improvements)} improvements")
+            print(f"Failed {len(result.failed_improvements)} improvements")
+            # 更新内容
+            current_content = result.modified_content
+            all_applied.extend(result.applied_improvements)
+            all_failed.extend(result.failed_improvements)
+            # 重新评估
+            new_assessment = self.evaluator.assess_design_quality(
+                current_content,
+                requirements_content
+            )
+            new_score = new_assessment.score
+            score_history.append(new_score)
+            score_delta = new_score - current_score
+            print(f"Score: {current_score:.2f} → {new_score:.2f} (Δ{score_delta:+.2f})")
+            # 检查收敛条件
+            # 1. 达到阈值
+            if new_score >= self.quality_threshold:
+                print(f"\n✓ Quality threshold reached ({self.quality_threshold})")
+                stopping_reason = 'threshold_reached'
+                current_score = new_score
+                break
+            # 2. 分数无改进（平台期）
+            if score_delta < self.min_score_improvement:
+                plateau_count += 1
+                print(f"⚠ Plateau detected ({plateau_count}/{self.plateau_iterations})")
+                if plateau_count >= self.plateau_iterations:
+                    print(f"\n✓ Plateau reached ({self.plateau_iterations} iterations without improvement)")
+                    stopping_reason = 'plateau'
+                    current_score = new_score
+                    break
+            else:
+                plateau_count = 0
+            current_score = new_score
+        # 检查是否达到最大迭代次数
+        if iteration >= self.max_iterations:
+            print(f"\n✓ Max iterations reached ({self.max_iterations})")
+            stopping_reason = 'max_iterations'
+        # 保存增强后的文档
+        try:
+            with open(design_path, 'w', encoding='utf-8') as f:
+                f.write(current_content)
+            print(f"\n✓ Saved enhanced document to {design_path}")
+            # 清理备份（如果成功且配置为清理）
+            if backup_id and self.cleanup_backups_on_success:
+                if self.backup_manager.cleanup_backup(backup_id):
+                    print(f"✓ Cleaned up backup: {backup_id}")
+        except Exception as e:
+            print(f"\n✗ Failed to save document: {e}")
+            # 尝试恢复备份
+            if backup_id:
+                try:
+                    self.backup_manager.restore_backup(backup_id)
+                    print(f"✓ Restored from backup: {backup_id}")
+                except Exception as restore_error:
+                    print(f"✗ Failed to restore backup: {restore_error}")
+            return EnhancementResult(
+                success=False,
+                document_type='design',
+                initial_score=initial_score,
+                final_score=current_score,
+                iterations=iteration,
+                improvements_applied=all_applied,
+                improvements_failed=all_failed,
+                stopping_reason=f"file_write_error: {e}",
+                score_history=score_history
+            )
+        # 生成报告
+        print(f"\n{'='*60}")
+        print(f"Enhancement Complete")
+        print(f"{'='*60}")
+        print(f"Initial Score: {initial_score:.2f}/10")
+        print(f"Final Score: {current_score:.2f}/10")
+        print(f"Improvement: +{current_score - initial_score:.2f}")
+        print(f"Iterations: {iteration}")
+        print(f"Stopping Reason: {stopping_reason}")
+        print(f"Applied Improvements: {len(all_applied)}")
+        print(f"Failed Improvements: {len(all_failed)}")
+        print(f"{'='*60}\n")
+        return EnhancementResult(
+            success=True,
+            document_type='design',
+            initial_score=initial_score,
+            final_score=current_score,
+            iterations=iteration,
+            improvements_applied=all_applied,
+            improvements_failed=all_failed,
+            stopping_reason=stopping_reason,
+            score_history=score_history
+        )
+    def validate_tasks_completeness(self, tasks_path: str) -> EnhancementResult:
+        """
+        验证 Tasks 文档完整性
+        Args:
+            tasks_path: Tasks 文档路径
+        Returns:
+            EnhancementResult: 验证结果
+        """
+        print(f"\n{'='*60}")
+        print(f"Validating Tasks: {tasks_path}")
+        print(f"{'='*60}\n")
+        # 读取文档
+        try:
+            with open(tasks_path, 'r', encoding='utf-8') as f:
+                content = f.read()
+        except Exception as e:
+            return EnhancementResult(
+                success=False,
+                document_type='tasks',
+                initial_score=0.0,
+                final_score=0.0,
+                iterations=0,
+                stopping_reason=f"file_read_error: {e}"
+            )
+        # 评估
+        assessment = self.evaluator.assess_tasks_quality(content)
+        score = assessment.score
+        print(f"Completion Score: {score:.2f}/10")
+        print(f"Issues: {assessment.issues}\n")
+        # Tasks 文档不需要增强，只需要验证
+        return EnhancementResult(
+            success=True,
+            document_type='tasks',
+            initial_score=score,
+            final_score=score,
+            iterations=0,
+            stopping_reason='validation_only',
+            score_history=[score]
+        )
+def main():
+    """命令行入口"""
+    import sys
+    if len(sys.argv) < 3:
+        print("Usage: python ultrawork_enhancer_v3.py <command> <path> [requirements_path]")
+        print("Commands:")
+        print("  requirements <path>              - Enhance requirements document")
+        print("  design <path> <requirements>     - Enhance design document")
+        print("  tasks <path>                     - Validate tasks document")
+        sys.exit(1)
+    command = sys.argv[1]
+    path = sys.argv[2]
+    enhancer = UltraworkEnhancerV3()
+    if command == 'requirements':
+        result = enhancer.enhance_requirements_quality(path)
+    elif command == 'design':
+        if len(sys.argv) < 4:
+            print("Error: design command requires requirements path")
+            sys.exit(1)
+        requirements_path = sys.argv[3]
+        result = enhancer.enhance_design_completeness(path, requirements_path)
+    elif command == 'tasks':
+        result = enhancer.validate_tasks_completeness(path)
+    else:
+        print(f"Error: Unknown command '{command}'")
+        sys.exit(1)
+    # 返回退出码
+    sys.exit(0 if result.success else 1)
+if __name__ == '__main__':
+    main()

package/template/.kiro/tools/workflow_quality_gate.py ADDED Viewed

@@ -0,0 +1,100 @@
+#!/usr/bin/env python3
+"""
+Workflow Quality Gate - Spec 创建工作流集成脚本
+用于在 requirements-first-workflow subagent 中调用质量门控
+"""
+import sys
+import os
+from pathlib import Path
+from quality_gate_enforcer import QualityGateEnforcer, GateResult
+def main():
+    """
+    命令行入口 - 供 subagent 调用
+    Usage:
+        python workflow_quality_gate.py requirements <path>
+        python workflow_quality_gate.py design <design_path> <requirements_path>
+        python workflow_quality_gate.py tasks <path>
+    Exit Codes:
+        0 - Quality gate passed
+        1 - Quality gate failed
+        2 - Error occurred
+    """
+    if len(sys.argv) < 3:
+        print("Error: Insufficient arguments", file=sys.stderr)
+        print("Usage: workflow_quality_gate.py <stage> <path> [requirements_path]", file=sys.stderr)
+        sys.exit(2)
+    stage = sys.argv[1].lower()
+    doc_path = sys.argv[2]
+    # 验证文件存在
+    if not os.path.exists(doc_path):
+        print(f"Error: File not found: {doc_path}", file=sys.stderr)
+        sys.exit(2)
+    try:
+        # 创建质量门控器
+        enforcer = QualityGateEnforcer(
+            requirements_threshold=9.0,
+            design_threshold=9.0,
+            tasks_threshold=8.0
+        )
+        # 执行质量门检查
+        if stage == 'requirements':
+            result = enforcer.check_requirements_gate(doc_path)
+        elif stage == 'design':
+            if len(sys.argv) < 4:
+                print("Error: Design gate requires requirements path", file=sys.stderr)
+                sys.exit(2)
+            requirements_path = sys.argv[3]
+            if not os.path.exists(requirements_path):
+                print(f"Error: Requirements file not found: {requirements_path}", file=sys.stderr)
+                sys.exit(2)
+            result = enforcer.check_design_gate(doc_path, requirements_path)
+        elif stage == 'tasks':
+            result = enforcer.check_tasks_gate(doc_path)
+        else:
+            print(f"Error: Unknown stage '{stage}'", file=sys.stderr)
+            print("Valid stages: requirements, design, tasks", file=sys.stderr)
+            sys.exit(2)
+        # 输出结果
+        print(f"\n{'='*60}")
+        print(f"Quality Gate Result: {stage.upper()}")
+        print(f"{'='*60}")
+        print(f"Status: {'PASSED ✓' if result.passed else 'FAILED ✗'}")
+        print(f"Score: {result.score:.2f}/10")
+        print(f"Threshold: {result.threshold}/10")
+        if result.enhancement_result:
+            print(f"\nEnhancement Details:")
+            print(f"  Initial Score: {result.enhancement_result.initial_score:.2f}/10")
+            print(f"  Final Score: {result.enhancement_result.final_score:.2f}/10")
+            print(f"  Improvement: +{result.enhancement_result.improvement:.2f}")
+            print(f"  Iterations: {result.enhancement_result.iterations}")
+            print(f"  Stopping Reason: {result.enhancement_result.stopping_reason}")
+        print(f"{'='*60}\n")
+        # 返回退出码
+        sys.exit(0 if result.passed else 1)
+    except Exception as e:
+        print(f"Error: {str(e)}", file=sys.stderr)
+        import traceback
+        traceback.print_exc(file=sys.stderr)
+        sys.exit(2)
+if __name__ == '__main__':
+    main()