npm - openmatrix - Versions diffs - 0.2.25 → 0.2.27 - Mend

openmatrix 0.2.25 → 0.2.27

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (29) hide show

package/README.md +155 -595
package/dist/agents/agent-runner.d.ts +5 -1
package/dist/agents/agent-runner.js +53 -3
package/dist/cli/commands/complete.js +13 -1
package/dist/cli/commands/start.js +28 -14
package/dist/cli/commands/status.js +13 -1
package/dist/storage/file-store.d.ts +8 -0
package/dist/storage/file-store.js +30 -0
package/dist/storage/state-manager.d.ts +115 -0
package/dist/storage/state-manager.js +269 -46
package/package.json +1 -1
package/skills/approve.md +1 -1
package/skills/auto.md +39 -14
package/skills/brainstorm.md +1 -5
package/skills/check.md +1 -1
package/skills/debug.md +692 -765
package/skills/deploy.md +1 -1
package/skills/feature.md +17 -14
package/skills/meeting.md +1 -1
package/skills/om.md +74 -8
package/skills/openmatrix.md +5 -14
package/skills/plan.md +54 -19
package/skills/report.md +1 -1
package/skills/research.md +16 -1
package/skills/resume.md +3 -5
package/skills/retry.md +1 -1
package/skills/start.md +193 -54
package/skills/status.md +1 -1
package/skills/test.md +105 -8

package/skills/start.md CHANGED Viewed

@@ -37,14 +37,9 @@ description: "Use when starting a new development task cycle with interactive qu
 </INTENT-JUDGMENT>
 <NO-OTHER-SKILLS>
-**绝对禁止**调用以下任何技能或工具：
-- gsd-executor、gsd:* 等 GSD 相关技能
-- superpowers:* 等 superpowers 相关技能
-- 任何其他任务编排相关的 Agent 或工具
+本 skill 与其他任务编排技能功能重叠，请勿同时使用。
-**Step 9 只能使用 Agent 工具** — 直接调用 Agent，不通过任何中间层。
-违规调用将导致执行失败。
+**Step 9 使用 Agent 工具执行子任务。**
 **相关技能**: `/om:brainstorm` (需求探索) | `/om:plan` (方案生成) | `/om:auto` (全自动) | `/om:meeting` (阻塞处理) | `/om:status` (状态查看) | `/om:report` (报告)
 </NO-OTHER-SKILLS>
@@ -57,7 +52,7 @@ Step 1:  初始化 .openmatrix 目录
 Step 2:  验证前置条件（plan.md + tasks-input.json 必须已存在）
 Step 3:  智能分析任务类型（开发/非开发）
 Step 4:  提交文档（git add docs/ + 所有 .md 文件, commit）
-Step 5:  必选问题（开发任务:质量+E2E+模式; 非开发:仅模式）<- 不可跳过
+Step 5:  必选问题（开发任务:质量等级; 严格模式可选E2E; 非开发:跳过）<- 不可跳过
 Step 6:  可选问题（仅复杂开发任务）+ 展示执行计划
 Step 7:  调用 openmatrix start --tasks-json                <- 必须完成，不可跳过
 Step 8:  从 CLI 返回结果中读取 subagentTasks 列表           <- 必须完成
@@ -67,25 +62,51 @@ Step 9:  逐个执行 subagentTasks（调用 Agent 工具）          <- 只有
 **违反以下任一规则将导致任务执行失败：**
 - **禁止在 Step 9 之前写任何业务代码** — 所有代码必须在 Step 9 通过 Agent 执行
-- **禁止跳过 Step 5 必选问题** — 开发任务必须选质量/E2E/模式，非开发任务必须选模式
+- **禁止跳过 Step 5 必选问题** — 开发任务必须选质量等级，非开发任务无需问答
 - **禁止跳过 Step 7** — 必须调用 CLI，不能用其他方式代替
 - **禁止自行规划 Phase** — 任务由 CLI 的 TaskPlanner 拆分，AI 只提取 goals
 - **禁止用 Bash/npm/write 直接写业务代码** — 业务代码只能通过 Step 9 的 Agent 执行
-- **禁止调用 gsd-executor 或其他编排技能** — 必须用原生 Agent 工具
 - **禁止在 start 中生成 plan** — plan 由 /om:plan 生成，start 只负责执行
+- **使用 Agent 工具执行子任务** — 不通过其他编排系统
 </MANDATORY-EXECUTION-ORDER>
+<IRON-LAW>
+**NO PRODUCTION CODE WITHOUT QUALITY GATES FIRST**
+跳过了必选问题？停止。重新开始。
+写了代码但没跑测试？删除。重新开始。
+这不是建议。这是铁律。
+</IRON-LAW>
+<RED-FLAGS>
+这些想法意味着停止：
+| 想法 | 真相 |
+|-----|------|
+| "先写代码，测试稍后" | 跳过铁律 = 质量无保证 |
+| "这个任务很简单" | 简单任务也要质量门禁 |
+| "手动验证就够了" | 手动验证不可重复 |
+| "质量级别不重要" | 质量级别决定代码可信度 |
+| "跳过问答更快" | 跳过问答 = 跳过铁律 |
+| "我知道该选什么" | 必选问题不可跳过 |
+| "执行模式无所谓" | 执行模式决定审批节点 |
+</RED-FLAGS>
 <objective>
 读取已有的 plan.md + tasks-input.json，通过必选问答确定执行配置（开发任务还需确定质量等级、E2E测试），确认后通过 CLI 拆分任务并执行。
 本 Skill 只做执行，不做方案生成。如果 plan.md 或 tasks-input.json 不存在，引导用户先执行 /om:plan。
-**Step 5 必选问题不可跳过** — 开发任务必须选择：
-1. 质量等级 (strict/balanced/fast)
-2. E2E 测试 (当选择 strict/balanced 时)
-3. 执行模式 (全自动/关键节点确认/每阶段确认)
+**Step 5 必选问题（开发任务）：**
+1. 质量等级（严格模式/平衡模式/快速模式）
+2. E2E 测试（仅严格模式可选，其他模式自动跳过）
+3. 执行模式根据质量等级自动推断（无需问答）
-非开发任务（文档、配置等）只需选择执行模式。
+**非开发任务**（文档、配置等）无需问答，直接使用全自动执行。
 </objective>
 <process>
@@ -131,13 +152,27 @@ git init
 ### Step 2: 验证前置条件
-**检查 plan.md 和 tasks-input.json 是否已存在：**
+**先获取当前 runId：**
+```bash
+cat .openmatrix/current.json 2>/dev/null || echo '{"runId":"run-default"}'
+```
+从返回结果提取 `runId`，后续文件检测和读取都使用 `.openmatrix/{runId}/` 目录。
+**检查 plan.md 和 tasks-input.json 是否已存在（使用 runId）：**
+```bash
+cat .openmatrix/${runId}/tasks-input.json 2>/dev/null || echo "NOT_FOUND"
+cat .openmatrix/${runId}/plan.md 2>/dev/null || echo "NOT_FOUND"
+```
+**或通过 CLI 检查（推荐）：**
 ```bash
-cat .openmatrix/tasks-input.json 2>/dev/null || echo "NOT_FOUND"
-cat .openmatrix/plan.md 2>/dev/null || echo "NOT_FOUND"
+openmatrix status --json | jq '.files'
 ```
+返回 `{hasPlan: true, hasTasksInput: true, hasResearchContext: false}` 等。
 | 情况 | 处理方式 |
 |------|---------|
 | 两个都存在 | 读取内容，继续 Step 3 |
@@ -149,7 +184,7 @@ cat .openmatrix/plan.md 2>/dev/null || echo "NOT_FOUND"
 **如果都存在，读取 tasks-input.json：**
 ```bash
-cat .openmatrix/tasks-input.json
+cat .openmatrix/${runId}/tasks-input.json
 ```
 提取关键字段：`title`、`goals`、`goalTypes`、`goalComplexity`。
@@ -157,7 +192,7 @@ cat .openmatrix/tasks-input.json
 **检测研究上下文：**
 ```bash
-cat .openmatrix/research/context.json 2>/dev/null || echo "NO_RESEARCH"
+cat .openmatrix/${runId}/research/context.json 2>/dev/null || echo "NO_RESEARCH"
 ```
 如果检测到研究上下文，告知用户并将 `--research-context` 参数传递给 CLI。
@@ -191,7 +226,8 @@ git ls-files --others --exclude-standard | grep -E '\.md$|^docs/' 2>/dev/null
 如果有文档变更（未追踪或未提交），执行提交：
 ```bash
-git add docs/ .openmatrix/*.md CLAUDE.md README.md README_EN.md
+git add docs/ CLAUDE.md README.md README_EN.md
+# 注意：plan.md 和 tasks-input.json 在 .openmatrix/{runId}/ 目录，被 gitignore，不提交
 git commit -m "$(cat <<'EOF'
 docs: 更新项目文档
@@ -212,9 +248,9 @@ EOF
 | goalTypes | 需要询问 |
 |-----------|---------|
-| `development` | 5.1 质量等级 -> 5.2 E2E -> 5.3 执行模式 |
-| `testing` | 仅 5.3 执行模式 |
-| `documentation` / `other` | 仅 5.3 执行模式 |
+| `development` | 5.1 质量等级 -> 5.2 E2E（仅严格模式可选） |
+| `testing` | 无需问答，直接进入 Step 7 |
+| `documentation` / `other` | 无需问答，直接进入 Step 7 |
 #### 5.1 质量等级（仅 `goalTypes: development`）
@@ -224,11 +260,21 @@ AskUserQuestion: `header: "质量等级"`, `multiSelect: false`
 | label | description |
 |-------|-------------|
-| `strict` | TDD + >80%覆盖率 + 严格Lint + 安全扫描 — 生产级代码 |
-| `balanced (推荐)` | >60%覆盖率 + Lint + 安全扫描 — 日常开发 |
-| `fast` | 无质量门禁 — 快速原型/验证 |
+| `严格模式` | TDD + >80%覆盖率 + 严格Lint + 安全扫描 — 生产级代码 |
+| `平衡模式 (推荐)` | >60%覆盖率 + Lint + 安全扫描 — 日常开发 |
+| `快速模式` | 无质量门禁 — 快速原型/验证 |
+**质量等级选择后的自动推断规则：**
+| 模式 | E2E | AI 验收 | 执行方式 |
+|-----|-----|---------|---------|
+| 严格模式 | 可选问一句（Step 5.2） | 必须 | TDD（先测试后开发） |
+| 平衡模式 | 不需要（自动跳过） | 必须 | 先开发后测试 |
+| 快速模式 | 不需要（自动跳过） | 不需要 | 直接开发 |
-#### 5.2 E2E 测试（仅 `development` 且选 strict/balanced，选 `fast` 跳过）
+#### 5.2 E2E 测试（仅 `严格模式` 可选，其他模式自动跳过）
+**只有选择「严格模式」时才询问此问题，平衡模式和快速模式自动推断为「不需要」。**
 AskUserQuestion: `header: "E2E 测试"`, `multiSelect: false`
@@ -240,17 +286,25 @@ AskUserQuestion: `header: "E2E 测试"`, `multiSelect: false`
 | `视觉验证` | 需要浏览器可视化验证，可检查页面样式和布局 |
 | `不需要` | 仅进行单元测试和集成测试，节省时间 |
-#### 5.3 执行模式（所有任务必选）
+#### 执行模式自动推断
-AskUserQuestion: `header: "执行模式"`, `multiSelect: false`
+**执行模式不再通过问答选择，而是根据质量等级自动推断：**
-**question:** 选择执行模式（控制 AI 执行过程中的审批节点）
+- **严格模式** → 全自动执行 + TDD 流程
+- **平衡模式** → 全自动执行 + 先开发后测试
+- **快速模式** → 全自动执行 + 直接开发
-| label | description |
-|-------|-------------|
-| `全自动执行 (推荐)` | 全自动执行，无需人工审批，遇到阻塞自动 Meeting |
-| `关键节点确认` | plan/merge/deploy 时暂停确认 |
-| `每阶段确认` | 每个阶段（develop/verify/accept）完成后暂停 |
+**非开发任务**（testing/documentation/other）默认使用「全自动执行」。
+#### 常见借口
+| 借口 | 真相 |
+|-----|------|
+| "只是个小功能，不用问这么多" | 小功能也要质量门禁 |
+| "我知道该选什么级别" | 必选问题不可跳过 |
+| "E2E测试浪费时间" | E2E测试由你决定，不是默认跳过 |
+| "我会手动检查代码" | AI验收比手动检查更系统 |
+| "这太复杂了，简化流程" | 流程设计有目的，简化=降低质量 |
 ### Step 6: 可选问题（仅复杂任务）
@@ -275,43 +329,71 @@ Goals:
   Goals: N 个（将生成 N个开发 + N个测试 + 审查）
   质量级别: xxx
   E2E 测试: 功能测试 / 视觉验证 / 不启用
-  技术方案: .openmatrix/plan.md
+  技术方案: .openmatrix/{runId}/plan.md
 ```
 ### Step 7: 调用 CLI 创建任务（不可跳过）
-**根据任务类型选择正确的 CLI 调用：**
+**CLI 自动从当前 runId 目录读取 tasks-input.json 和 plan.md。**
+**根据质量等级自动设置执行参数：**
+| 质量等级 | CLI 参数 | 执行方式 |
+|---------|---------|---------|
+| 严格模式 | `--quality strict --mode auto` | TDD 流程 |
+| 平衡模式 | `--quality balanced --mode auto` | 先开发后测试 |
+| 快速模式 | `--quality fast --mode auto` | 直接开发 |
 **开发任务**（有质量等级选择）：
 ```bash
-openmatrix start --tasks-json @.openmatrix/tasks-input.json --quality <质量等级> --mode <执行模式> --json
+openmatrix start --tasks-json @tasks-input.json --quality <质量等级> --mode auto --json
 ```
-如果存在 `.openmatrix/research/context.json`，增加 `--research-context` 参数：
+如果存在研究上下文（`.openmatrix/{runId}/research/context.json`），增加 `--research-context` 参数：
 ```bash
-openmatrix start --tasks-json @.openmatrix/tasks-input.json --research-context @.openmatrix/research/context.json --quality <质量等级> --mode <执行模式> --json
+openmatrix start --tasks-json @tasks-input.json --research-context @research/context.json --quality <质量等级> --mode auto --json
 ```
 如果启用了 E2E 测试（功能测试），加上 `--e2e-tests`：
 ```bash
-openmatrix start --tasks-json @.openmatrix/tasks-input.json --quality balanced --mode auto --e2e-tests --json
+openmatrix start --tasks-json @tasks-input.json --quality strict --mode auto --e2e-tests --json
 ```
 如果选择了视觉验证，加上 `--e2e-tests --e2e-type visual`：
 ```bash
-openmatrix start --tasks-json @.openmatrix/tasks-input.json --quality balanced --mode auto --e2e-tests --e2e-type visual --json
+openmatrix start --tasks-json @tasks-input.json --quality strict --mode auto --e2e-tests --e2e-type visual --json
 ```
-**非开发任务**（无质量等级）：
+**非开发任务**（无质量等级，默认全自动执行）：
 ```bash
-openmatrix start --tasks-json @.openmatrix/tasks-input.json --mode <执行模式> --json
+openmatrix start --tasks-json @tasks-input.json --mode auto --json
 ```
+**注意**: `@tasks-input.json` 表示 CLI 自动从当前 runId 目录读取。CLI 会自动检测 `current.json` 定位 runId。
 此命令返回 JSON 包含 `subagentTasks` 列表。
 ### Step 8: 读取 subagentTasks
-CLI 返回 JSON 中 `subagentTasks` 数组包含待执行任务。
+CLI 返回 JSON 中 `subagentTasks` 数组包含待执行任务：
+```json
+{
+  "status": "tasks_ready",
+  "subagentTasks": [
+    {
+      "taskId": "TASK-001",
+      "agentType": "coder",
+      "title": "实现登录功能",
+      "description": "...",
+      "prompt": "完整任务提示词...",
+      "timeout": 300000
+    }
+  ]
+}
+```
+提取每个任务的 `taskId`、`agentType`、`title`、`prompt`，供 Step 9 执行。
 ## === 执行阶段（只有此阶段才能写业务代码）===
@@ -390,6 +472,53 @@ AskUserQuestion: `header: "歧义确认"`, `multiSelect: false`
 #### 9.3 执行 Agent 任务
+**Skill 感知执行：**
+执行每个任务前，AI 应根据任务内容判断是否需要调用相关 skill 来增强执行质量。
+可用 skill 列表（AI 自行判断是否适用）：
+- `om:test` — 测试生成与验证循环
+- `frontend-design` — 前端/UI 设计与实现
+- `om:research` — 领域研究
+- 其他已安装的 skill
+**判断流程：**
+1. 读取任务的 `agentType`、`title`、`description`
+2. AI 自行判断该任务是否匹配某个 skill 的触发条件
+3. 如果匹配，在 Agent prompt 中注入该 skill 的核心指令或先调用对应 CLI 获取上下文数据
+4. 如果不匹配任何 skill，直接执行
+**tester 任务验证循环（om:test 逻辑）：**
+当 AI 判断任务需要 om:test 流程时：
+1. 先调用 CLI 获取项目测试配置：
+```bash
+openmatrix test --json
+```
+2. 调用 Agent 生成测试（prompt 中已包含原始扫描数据）：
+```typescript
+Agent({
+  subagent_type: task.subagent_type,
+  description: task.description,
+  prompt: task.prompt + "\n\n⚠️ 完成后请输出简短摘要（不超过3行）：\n1. 关键决策\n2. 创建/修改的文件\n3. 对后续任务的建议\n\n🚫 **禁止执行以下 Git 命令**：\n- ❌ git commit\n- ❌ git checkout/merge/pull/push/rebase/branch\n\n✅ 允许：git status, git diff, git log",
+  run_in_background: true
+})
+```
+3. Agent 完成后，自动验证测试：
+```bash
+npm test -- --run 2>&1
+```
+4. 验证失败时自动重试（最多 3 次）：
+   - 将失败输出传给新 Agent 修复测试
+   - 重新验证
+   - 3 次失败后标记为 blocked，创建 Meeting
+**默认执行方式（无特殊 skill 匹配时）：**
 ```typescript
 Agent({
   subagent_type: task.subagent_type,
@@ -406,7 +535,7 @@ Agent({
 openmatrix complete TASK-XXX --success --summary "关键决策: xxx; 创建文件: xxx"
 ```
-2. **全局上下文文件** — 所有任务的上下文累积在 `.openmatrix/context.md`:
+2. **全局上下文文件** — 所有任务的上下文累积在 `.openmatrix/{runId}/context.md`:
    - 每次任务完成后，通过 `--summary` 参数追加写入
    - 后续 Agent 可读取此文件了解前序任务的决策和发现
@@ -516,18 +645,20 @@ $ARGUMENTS
 ```
 start 和 auto 在同一位置，区别在于 start 有交互审批，auto 零交互。前置条件：
-- `.openmatrix/plan.md` — 技术方案（由 /om:plan 生成）
-- `.openmatrix/tasks-input.json` — 结构化元数据（由 /om:plan 生成）
+- `.openmatrix/{runId}/plan.md` — 技术方案（由 /om:plan 生成）
+- `.openmatrix/{runId}/tasks-input.json` — 结构化元数据（由 /om:plan 生成）
+CLI 自动通过 `current.json` 定位当前 runId。
 如果前置条件不满足，引导用户执行 `/om:plan`。
 ## 质量级别
-| 级别 | TDD | 覆盖率 | Lint | 安全 |
-|------|:---:|:------:|:----:|:----:|
-| strict | Y | >80% | Y | Y |
-| balanced | N | >60% | Y | Y |
-| fast | N | 无 | N | N |
+| 级别 | TDD | 覆盖率 | Lint | 安全 | 执行方式 |
+|------|:---:|:------:|:----:|:----:|:--------:|
+| 严格模式 | Y | >80% | Y | Y | TDD |
+| 平衡模式 | N | >60% | Y | Y | 先开发后测试 |
+| 快速模式 | N | 无 | N | N | 直接开发 |
 ## 执行流程
@@ -537,6 +668,14 @@ Step 1-2: 初始化 + 验证前置条件 -> Step 3-4: 分析类型 + 提交文
 -> Step 9: Agent 逐个执行 (只有这里写代码)
 ```
+## 自动推断规则
+| 质量等级 | E2E 问题 | AI 验收 | 执行模式 |
+|---------|---------|---------|---------|
+| 严格模式 | 可选问一句 | 必须 | 全自动 + TDD |
+| 平衡模式 | 不需要 | 必须 | 全自动 + 先开发后测试 |
+| 快速模式 | 不需要 | 不需要 | 全自动 + 直接开发 |
 ## Git 提交格式
 ```

package/skills/status.md CHANGED Viewed

@@ -35,7 +35,7 @@ description: "Use when checking task execution progress, run status, completion
 </INTENT-JUDGMENT>
 <NO-OTHER-SKILLS>
-执行此技能时，不得调用 superpowers、gsd 或其他任务编排相关的技能。OpenMatrix 独立运行，不依赖外部任务编排系统。
+本 skill 与其他任务编排技能功能重叠，请勿同时使用。
 </NO-OTHER-SKILLS>
 <objective>

package/skills/test.md CHANGED Viewed

@@ -36,13 +36,9 @@ priority: high
 </INTENT-JUDGMENT>
 <NO-OTHER-SKILLS>
-**绝对禁止**调用以下技能：
-- ❌ superpowers:test-driven-development → 你已经在 om:test 中了
-- ❌ superpowers:* → 全部被 OpenMatrix 替代
-- ❌ gsd:* → 全部被 OpenMatrix 替代
-- ❌ 任何其他任务编排相关的技能
+本 skill 与其他任务编排技能功能重叠，请勿同时使用。
-**测试生成阶段只能使用 Agent 工具** — 直接调用 Agent，不通过任何中间层。
+**测试生成阶段使用 Agent 工具执行。**
 </NO-OTHER-SKILLS>
 <MANDATORY-EXECUTION-ORDER>
@@ -67,6 +63,95 @@ Step 8:  输出测试报告
 **铁律：验证失败自动循环，最多 3 次，超过必须暂停**
 </MANDATORY-EXECUTION-ORDER>
+<IRON-LAW>
+## 铁律：没有失败的测试，不许写生产代码
+**NO PRODUCTION CODE WITHOUT A FAILING TEST FIRST**
+在测试前写了代码？删除。重新开始。
+没有例外：
+- 不要保留作为"参考"
+- 不要"写测试时适应它"
+- 不要看它
+删除意味着删除。
+## Why Order Matters
+### "我会在实现后写测试来验证工作"
+实现后写的测试立即通过。立即通过什么也证明不了：
+- 可能测试错误的东西
+- 可能测试实现，不是行为
+- 可能遗漏你忘记的边界情况
+- 你从未看到它捕获 bug
+测试优先强制你看到测试失败，证明它确实测试某些东西。
+### "我手动测试了所有边界情况"
+手动测试是临时的。你以为测试了所有东西但：
+- 没有测试记录
+- 代码变化时无法重跑
+- 压力下容易忘记情况
+- "我试过了" ≠ 全面
+自动化测试是系统的。每次运行相同方式。
+### "删除 X 小时工作是浪费"
+沉没成本谬误。时间已经没了。现在选择：
+- 删除并用 TDD 重写（X+小时，高信心）
+- 保留并在后加测试（30分钟，低信心，可能 bug）
+"浪费"是保留不能信任的代码。无真实测试的工作代码是技术债务。
+## Good vs Bad Tests
+| 质量 | Good | Bad |
+|-----|------|-----|
+| **最小化** | 一件事。名字有"and"？拆分。 | `test('validates email and domain and whitespace')` |
+| **清晰** | 名字描述行为 | `test('test1')` |
+| **展示意图** | 展示期望 API | 模糊代码该做什么 |
+| **真实代码** | 无 mock（除非不可避免） | Mock 一切 |
+### Good Example
+```typescript
+test('重试失败操作 3 次', async () => {
+  let attempts = 0;
+  const operation = () => {
+    attempts++;
+    if (attempts < 3) throw new Error('fail');
+    return 'success';
+  };
+  const result = await retryOperation(operation);
+  expect(result).toBe('success');
+  expect(attempts).toBe(3);
+});
+```
+一件事，测试真实行为，清晰名字。
+### Bad Example
+```typescript
+test('retry works', async () => {
+  const mock = jest.fn()
+    .mockRejectedValueOnce(new Error())
+    .mockRejectedValueOnce(new Error())
+    .mockResolvedValueOnce('success');
+  await retryOperation(mock);
+  expect(mock).toHaveBeenCalledTimes(3);
+});
+```
+模糊名字，测试 mock 不是代码。
+</IRON-LAW>
 <objective>
 智能测试生成 - 从业务角度分析代码逻辑，发现测试缺失，自动生成并验证测试。遵循 OpenMatrix 分层原则：CLI 收集原始数据，AI 分析并生成测试。
 </objective>
@@ -682,6 +767,8 @@ Step 8: 输出测试报告
 **最大重试 3 次，超过必须暂停检查配置**
+**没有失败的测试，不许写生产代码（参见 IRON-LAW 区块）**
 ## 红线
 - 3 次生成失败 → 暂停，检查测试框架配置
@@ -703,8 +790,18 @@ Step 8: 输出测试报告
 - "跳过自动验证"
 - 只测试函数调用而不是业务场景
 - 生成的测试与项目风格不一致
-**所有这些意味着：停止。回到 Step 2 或执行自动验证循环。**
+- "我先写实现，再补测试"
+- "这个测试一次就能过，不用看失败"
+- "测试代码不重要，能过就行"
+- "边界情况太多了，只测主流程"
+- "删除这个失败的测试用例算了"
+- "Mock 返回什么都行，只要测试通过"
+- 测试名字描述实现细节而非业务行为
+- 一个测试验证多个不相关的事情
+- 测试依赖执行顺序或共享状态
+- 使用 `any` 类型绕过类型检查
+**这些都意味着：停止。回到 Step 2 或执行自动验证循环。**
 ## 测试生成原则