create-ai-project 1.23.0 → 1.23.2
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/.claude/agents-en/acceptance-test-generator.md +15 -1
- package/.claude/agents-en/code-reviewer.md +11 -14
- package/.claude/agents-en/document-reviewer.md +21 -1
- package/.claude/agents-en/integration-test-reviewer.md +17 -1
- package/.claude/agents-en/quality-fixer-frontend.md +47 -31
- package/.claude/agents-en/quality-fixer.md +40 -25
- package/.claude/agents-en/task-decomposer.md +10 -0
- package/.claude/agents-en/task-executor-frontend.md +49 -14
- package/.claude/agents-en/task-executor.md +44 -18
- package/.claude/agents-en/work-planner.md +6 -0
- package/.claude/agents-ja/acceptance-test-generator.md +16 -2
- package/.claude/agents-ja/code-reviewer.md +11 -14
- package/.claude/agents-ja/document-reviewer.md +21 -1
- package/.claude/agents-ja/integration-test-reviewer.md +17 -1
- package/.claude/agents-ja/quality-fixer-frontend.md +47 -31
- package/.claude/agents-ja/quality-fixer.md +40 -25
- package/.claude/agents-ja/task-decomposer.md +10 -0
- package/.claude/agents-ja/task-executor-frontend.md +51 -16
- package/.claude/agents-ja/task-executor.md +45 -19
- package/.claude/agents-ja/work-planner.md +6 -0
- package/.claude/commands-en/front-build.md +14 -1
- package/.claude/commands-en/front-plan.md +15 -2
- package/.claude/commands-en/plan.md +15 -1
- package/.claude/commands-ja/front-build.md +14 -1
- package/.claude/commands-ja/front-plan.md +14 -1
- package/.claude/commands-ja/plan.md +15 -1
- package/.claude/skills-en/documentation-criteria/references/plan-template.md +20 -0
- package/.claude/skills-en/documentation-criteria/references/task-template.md +12 -0
- package/.claude/skills-en/subagents-orchestration-guide/SKILL.md +11 -9
- package/.claude/skills-ja/documentation-criteria/references/plan-template.md +20 -0
- package/.claude/skills-ja/documentation-criteria/references/task-template.md +12 -0
- package/.claude/skills-ja/subagents-orchestration-guide/SKILL.md +11 -9
- package/CHANGELOG.md +21 -0
- package/package.json +1 -1
|
@@ -38,6 +38,9 @@ Design Doc、UI Spec、PRD、ADR(提供されている場合)を読み込み
|
|
|
38
38
|
**全アプローチ共通**:
|
|
39
39
|
- **検証戦略の要約を作業計画書ヘッダーに記載**(後続タスクへの参照用)
|
|
40
40
|
- **採用した品質保証メカニズムを作業計画書ヘッダーに記載**(後続タスクへの参照用) — 各メカニズムについてツール名、検証内容、設定パス、カバー範囲(Design Docのファイルパスまたはディレクトリプレフィックス、スコープが限定されない場合は "project-wide")を記載
|
|
41
|
+
- **証明戦略を作業計画書ヘッダーに記載**(plan template参照) — 証明義務の出所(スケルトンが提供される場合はテストスケルトンの注釈、なければ各ACの主要な故障モード)を明示し、主張を実装する各タスクが下流レビュー用に Proof Obligations を記録する旨を記載する
|
|
42
|
+
- **レビュースコープを作業計画書ヘッダーに記録** — 実装前の新規計画では Design Doc とタスク対象ファイルから導出した変更予定ファイルの範囲、既存作業に対する改訂計画ではベースブランチと diff範囲 — を記録し、作業計画書レビューと下流検証が同一スコープを共有できるようにする
|
|
43
|
+
- **故障モードチェックリストを作業計画書に含める**(plan template参照) — ドメイン非依存の8つの故障カテゴリ(same-value, no-op, empty input, invalid option, missing config, unavailable boundary, shared-state dependency, rollback-only visibility)をすべて列挙し、該当するものに印を付け、該当する各カテゴリをカバーするタスクにマッピングする。エントリにはプロジェクト固有の名称を含めない
|
|
41
44
|
- 検証戦略の検証タイミングに対応するフェーズに検証タスクを配置
|
|
42
45
|
- テストスケルトンが提供されている場合、統合テスト実装を対応するフェーズに配置し、E2Eテスト実行を最終フェーズに配置
|
|
43
46
|
- テストスケルトンが提供されていない場合、Design Docの受入条件に基づくテスト実装タスクを含める
|
|
@@ -361,6 +364,9 @@ Design Docの技術的依存関係と実装アプローチに基づいてフェ
|
|
|
361
364
|
- [ ] 全行が少なくとも1つのカバータスクにマッピングされている
|
|
362
365
|
- [ ] 計画書ヘッダーに `Implementation Readiness: pending` を含める(medium / large のみ)
|
|
363
366
|
- [ ] Design Docから検証戦略を抽出し計画書ヘッダーに記載
|
|
367
|
+
- [ ] 計画書ヘッダーに証明戦略を記載(証明義務の出所 + タスクごとの伝播ルール)
|
|
368
|
+
- [ ] 計画書ヘッダーにレビュースコープを記録(ベースブランチ / diff範囲 / 変更ファイル範囲)
|
|
369
|
+
- [ ] 故障モードチェックリストを含め、該当カテゴリをカバーするタスクにマッピングし、プロジェクト固有の名称を含めない
|
|
364
370
|
- [ ] Design Docから採用済み品質保証メカニズムを抽出し計画書ヘッダーに記載
|
|
365
371
|
- [ ] フェーズ構成が実装アプローチと整合(垂直 → 価値単位フェーズ、水平 → レイヤーフェーズ)
|
|
366
372
|
- [ ] 早期検証ポイントをPhase 1に配置(検証戦略で指定されている場合)
|
|
@@ -59,9 +59,22 @@ Analyze the Consumed Task Set and determine the action required. Note: when `$AR
|
|
|
59
59
|
|-------|----------|-------------|
|
|
60
60
|
| Tasks exist | Consumed Task Set is non-empty | User's execution instruction serves as batch approval → Enter autonomous execution immediately |
|
|
61
61
|
| No tasks + plan supplied via `$ARGUMENTS` | `$ARGUMENTS` provided AND Consumed Task Set empty | Confirm with user → run task-decomposer (which will emit `*-frontend-task-*.md` per the frontend naming rule) |
|
|
62
|
-
| Neither exists + Design Doc exists + `$ARGUMENTS` provided | `$ARGUMENTS` provided, no plan, no Consumed Task Set, but docs/design/*.md exists | Invoke work-planner to create work plan from Design Doc, then
|
|
62
|
+
| Neither exists + Design Doc exists + `$ARGUMENTS` provided | `$ARGUMENTS` provided, no plan, no Consumed Task Set, but docs/design/*.md exists | Invoke work-planner to create work plan from Design Doc, then run **Work Plan Review** (see below) before task decomposition |
|
|
63
63
|
| Neither exists | No `$ARGUMENTS`, no plan, no Consumed Task Set, no Design Doc | Report missing prerequisites to user and stop |
|
|
64
64
|
|
|
65
|
+
## Work Plan Review (when this recipe created the plan)
|
|
66
|
+
|
|
67
|
+
When the decision flow above created the work plan from a Design Doc, review it before decomposition:
|
|
68
|
+
|
|
69
|
+
1. Invoke document-reviewer using Agent tool:
|
|
70
|
+
- `subagent_type`: "document-reviewer"
|
|
71
|
+
- `description`: "Work plan review"
|
|
72
|
+
- `prompt`: "doc_type: WorkPlan target: docs/plans/[plan-name].md design_doc: [the Design Doc path]. Review semantic traceability to the Design Doc, early verification placement, real-boundary verification coverage, Failure Mode Checklist, and Review Scope."
|
|
73
|
+
2. Branch on the reviewer's `verdict.decision`:
|
|
74
|
+
- `needs_revision` → re-invoke work-planner (update) with the findings and re-review until `approved`/`approved_with_conditions`
|
|
75
|
+
- `rejected` → stop before task decomposition and escalate to the user
|
|
76
|
+
3. Present the reviewed plan for batch approval before task decomposition.
|
|
77
|
+
|
|
65
78
|
## Task Decomposition Phase (Conditional)
|
|
66
79
|
|
|
67
80
|
When the Consumed Task Set is empty:
|
|
@@ -23,6 +23,7 @@ description: Create frontend work plan from design document and obtain plan appr
|
|
|
23
23
|
- Design document selection
|
|
24
24
|
- Test skeleton generation with acceptance-test-generator
|
|
25
25
|
- Work plan creation with work-planner
|
|
26
|
+
- Work plan review with document-reviewer
|
|
26
27
|
- Plan approval obtainment
|
|
27
28
|
|
|
28
29
|
**Responsibility Boundary**: This command completes with work plan approval.
|
|
@@ -59,8 +60,20 @@ Invoke work-planner using Agent tool:
|
|
|
59
60
|
`prompt`: "Create work plan from Design Doc at [path]."
|
|
60
61
|
|
|
61
62
|
- Follow subagents-orchestration-guide Prompt Construction Rule for additional prompt parameters
|
|
62
|
-
|
|
63
|
-
|
|
63
|
+
|
|
64
|
+
### Step 4: Work Plan Review
|
|
65
|
+
Invoke document-reviewer to review the work plan:
|
|
66
|
+
- `subagent_type`: "document-reviewer"
|
|
67
|
+
- `description`: "Work plan review"
|
|
68
|
+
- `prompt`: "doc_type: WorkPlan target: docs/plans/[plan-name].md design_doc: [the Design Doc path selected in Step 1]. Review semantic traceability to the Design Doc, early verification placement, real-boundary verification coverage, Failure Mode Checklist, and Review Scope."
|
|
69
|
+
- The work plan is a derivation of the Design Doc, so plan-fidelity findings are resolved without user input. Branch on the reviewer's `verdict.decision`:
|
|
70
|
+
- `needs_revision`: re-invoke work-planner in update mode with the findings and re-review, repeating until `approved` or `approved_with_conditions`
|
|
71
|
+
- `approved` / `approved_with_conditions`: proceed to Step 5
|
|
72
|
+
- `rejected`: escalate to the user
|
|
73
|
+
|
|
74
|
+
### Step 5: Present for Approval
|
|
75
|
+
- Present the reviewed work plan to the user for batch approval. If the user requests changes, re-invoke work-planner with revised parameters and re-run Step 4.
|
|
76
|
+
- Highlight steps with unclear scope or external dependencies and ask the user to confirm
|
|
64
77
|
|
|
65
78
|
**Scope**: Up to work plan creation and obtaining approval for plan content.
|
|
66
79
|
|
|
@@ -23,6 +23,7 @@ description: Create work plan from design document and obtain plan approval
|
|
|
23
23
|
- Design document selection
|
|
24
24
|
- E2E test skeleton generation (optional, with user confirmation)
|
|
25
25
|
- Work plan creation with work-planner
|
|
26
|
+
- Work plan review with document-reviewer
|
|
26
27
|
- Plan approval obtainment
|
|
27
28
|
|
|
28
29
|
**Responsibility Boundary**: This command completes with work plan approval.
|
|
@@ -55,7 +56,20 @@ Follow subagents-orchestration-guide skill strictly and create work plan with th
|
|
|
55
56
|
`prompt`: "Create work plan from Design Doc at [path]."
|
|
56
57
|
|
|
57
58
|
- Follow subagents-orchestration-guide Prompt Construction Rule for additional prompt parameters
|
|
58
|
-
|
|
59
|
+
|
|
60
|
+
4. **Work Plan Review**
|
|
61
|
+
Invoke document-reviewer to review the work plan:
|
|
62
|
+
- `subagent_type`: "document-reviewer"
|
|
63
|
+
- `description`: "Work plan review"
|
|
64
|
+
- `prompt`: "doc_type: WorkPlan target: docs/plans/[plan-name].md design_doc: [the Design Doc path selected in Step 1]. Review semantic traceability to the Design Doc, early verification placement, real-boundary verification coverage, Failure Mode Checklist, and Review Scope."
|
|
65
|
+
- The work plan is a derivation of the Design Doc, so plan-fidelity findings are resolved without user input. Branch on the reviewer's `verdict.decision`:
|
|
66
|
+
- `needs_revision`: re-invoke work-planner in update mode with the findings and re-review, repeating until `approved` or `approved_with_conditions`
|
|
67
|
+
- `approved` / `approved_with_conditions`: proceed to Step 5
|
|
68
|
+
- `rejected`: escalate to the user
|
|
69
|
+
|
|
70
|
+
5. **Present for Approval**
|
|
71
|
+
- Present the reviewed work plan to the user for batch approval. If the user requests changes, re-invoke work-planner with revised parameters and re-run Step 4.
|
|
72
|
+
- Highlight steps with unclear scope or external dependencies and ask the user to confirm
|
|
59
73
|
|
|
60
74
|
Create a work plan from the selected design document, clarifying specific implementation steps and risks.
|
|
61
75
|
|
|
@@ -59,9 +59,22 @@ Consumed Task Set を確認し、適切な対応を決定する。注: `$ARGUMEN
|
|
|
59
59
|
|------|------|--------------|
|
|
60
60
|
| タスク存在 | Consumed Task Set が非空 | ユーザーの実行指示をバッチ承認として自律実行へ移行 |
|
|
61
61
|
| タスクなし + `$ARGUMENTS`で計画書指定 | `$ARGUMENTS`が提供され Consumed Task Set が空 | ユーザーに確認 → task-decomposer実行(frontend命名ルールにより `*-frontend-task-*.md` を出力する) |
|
|
62
|
-
| どちらもなし+Design Docあり + `$ARGUMENTS`提供 | `$ARGUMENTS`が提供され、計画書なし、Consumed Task Setなし、ただし docs/design/*.md が存在 | work-plannerでDesign Doc
|
|
62
|
+
| どちらもなし+Design Docあり + `$ARGUMENTS`提供 | `$ARGUMENTS`が提供され、計画書なし、Consumed Task Setなし、ただし docs/design/*.md が存在 | work-plannerでDesign Docから作業計画書を作成し、タスク分解の前に**作業計画書レビュー**(下記参照)を行う |
|
|
63
63
|
| どちらもなし | `$ARGUMENTS`なし、計画書なし、Consumed Task Setなし、Design Docなし | 前提条件未達成をユーザーに報告して停止 |
|
|
64
64
|
|
|
65
|
+
## 作業計画書レビュー(本レシピが計画書を作成した場合)
|
|
66
|
+
|
|
67
|
+
上記の判断フローでDesign Docから作業計画書を作成した場合、タスク分解の前にレビューする:
|
|
68
|
+
|
|
69
|
+
1. Agentツールでdocument-reviewerを呼び出す:
|
|
70
|
+
- `subagent_type`: "document-reviewer"
|
|
71
|
+
- `description`: "作業計画書レビュー"
|
|
72
|
+
- `prompt`: "doc_type: WorkPlan target: docs/plans/[plan-name].md design_doc: [Design Docのパス]。Design Docへの意味的トレーサビリティ、早期検証の配置、実境界での検証カバレッジ、故障モードチェックリスト、レビュースコープをレビューする。"
|
|
73
|
+
2. reviewerの `verdict.decision` で分岐する:
|
|
74
|
+
- `needs_revision` → 所見を渡してwork-plannerをupdateモードで再実行し、`approved`/`approved_with_conditions` になるまで再レビューする
|
|
75
|
+
- `rejected` → タスク分解の前に停止しユーザーにエスカレーションする
|
|
76
|
+
3. レビュー済みの計画書をタスク分解の前にバッチ承認のため提示する。
|
|
77
|
+
|
|
65
78
|
## タスク分解フェーズ(条件付き)
|
|
66
79
|
|
|
67
80
|
Consumed Task Set が空の場合:
|
|
@@ -23,6 +23,7 @@ description: 設計ドキュメントからフロントエンド作業計画書
|
|
|
23
23
|
- 設計書の選択
|
|
24
24
|
- acceptance-test-generatorによるテストスケルトン生成
|
|
25
25
|
- work-plannerによる作業計画書作成
|
|
26
|
+
- document-reviewerによる作業計画書レビュー
|
|
26
27
|
- 計画承認の取得
|
|
27
28
|
|
|
28
29
|
**責務境界**: このコマンドは作業計画書承認で責務完了。
|
|
@@ -59,7 +60,19 @@ Agentツールでwork-plannerを呼び出す:
|
|
|
59
60
|
`prompt`: "[パス]のDesign Docから作業計画を作成。"
|
|
60
61
|
|
|
61
62
|
- subagents-orchestration-guideのPrompt Construction Ruleに従い追加パラメータを構成
|
|
62
|
-
|
|
63
|
+
|
|
64
|
+
### Step 4: 作業計画書レビュー
|
|
65
|
+
document-reviewerを呼び出し作業計画書をレビューする:
|
|
66
|
+
- `subagent_type`: "document-reviewer"
|
|
67
|
+
- `description`: "作業計画書レビュー"
|
|
68
|
+
- `prompt`: "doc_type: WorkPlan target: docs/plans/[plan-name].md design_doc: [ステップ1で選択したDesign Docのパス]。Design Docへの意味的トレーサビリティ、早期検証の配置、実境界での検証カバレッジ、故障モードチェックリスト、レビュースコープをレビューする。"
|
|
69
|
+
- 作業計画書はDesign Docの派生物であるため、計画の忠実性に関する指摘はユーザー入力なしで解消する。reviewerの `verdict.decision` で分岐する:
|
|
70
|
+
- `needs_revision`: 所見を渡してwork-plannerをupdateモードで再実行し、`approved`/`approved_with_conditions` になるまで再レビューを繰り返す
|
|
71
|
+
- `approved` / `approved_with_conditions`: ステップ5へ進む
|
|
72
|
+
- `rejected`: ユーザーにエスカレーションする
|
|
73
|
+
|
|
74
|
+
### Step 5: 承認のための提示
|
|
75
|
+
- レビュー済みの作業計画書をユーザーにバッチ承認のため提示する。変更要望があればwork-plannerを修正パラメータで再実行し、ステップ4を再実行する。
|
|
63
76
|
- スコープが不明確なステップや外部依存があるステップを強調し、ユーザーに確認を求める
|
|
64
77
|
|
|
65
78
|
**スコープ**: 作業計画書作成と計画内容の承認取得まで。
|
|
@@ -23,6 +23,7 @@ description: 設計書から作業計画書を作成し計画承認を取得
|
|
|
23
23
|
- 設計書の選択
|
|
24
24
|
- E2Eテストスケルトン生成(オプション、ユーザー確認後)
|
|
25
25
|
- work-plannerによる作業計画書作成
|
|
26
|
+
- document-reviewerによる作業計画書レビュー
|
|
26
27
|
- 計画承認の取得
|
|
27
28
|
|
|
28
29
|
**責務境界**: このコマンドは作業計画書承認で責務完了。
|
|
@@ -55,7 +56,20 @@ description: 設計書から作業計画書を作成し計画承認を取得
|
|
|
55
56
|
`prompt`: "[パス]のDesign Docから作業計画を作成。"
|
|
56
57
|
|
|
57
58
|
- subagents-orchestration-guideのプロンプト構成ルールに従い追加パラメータを設定
|
|
58
|
-
|
|
59
|
+
|
|
60
|
+
4. **作業計画書レビュー**
|
|
61
|
+
document-reviewerを呼び出し作業計画書をレビューする:
|
|
62
|
+
- `subagent_type`: "document-reviewer"
|
|
63
|
+
- `description`: "作業計画書レビュー"
|
|
64
|
+
- `prompt`: "doc_type: WorkPlan target: docs/plans/[plan-name].md design_doc: [ステップ1で選択したDesign Docのパス]。Design Docへの意味的トレーサビリティ、早期検証の配置、実境界での検証カバレッジ、故障モードチェックリスト、レビュースコープをレビューする。"
|
|
65
|
+
- 作業計画書はDesign Docの派生物であるため、計画の忠実性に関する指摘はユーザー入力なしで解消する。reviewerの `verdict.decision` で分岐する:
|
|
66
|
+
- `needs_revision`: 所見を渡してwork-plannerをupdateモードで再実行し、`approved`/`approved_with_conditions` になるまで再レビューを繰り返す
|
|
67
|
+
- `approved` / `approved_with_conditions`: ステップ5へ進む
|
|
68
|
+
- `rejected`: ユーザーにエスカレーションする
|
|
69
|
+
|
|
70
|
+
5. **承認のための提示**
|
|
71
|
+
- レビュー済みの作業計画書をユーザーにバッチ承認のため提示する。変更要望があればwork-plannerを修正パラメータで再実行し、ステップ4を再実行する。
|
|
72
|
+
- スコープが不明確なステップや外部依存があるステップを強調し、ユーザーに確認を求める
|
|
59
73
|
|
|
60
74
|
選択された設計書から作業計画書を作成し、実装の具体的なステップとリスクを明確にします。
|
|
61
75
|
|
|
@@ -4,6 +4,7 @@ Created Date: YYYY-MM-DD
|
|
|
4
4
|
Type: feature|fix|refactor
|
|
5
5
|
Estimated Impact: X files
|
|
6
6
|
Related Issue/PR: #XXX (if any)
|
|
7
|
+
Review Scope: [planned-files scope derived from Design Doc and task targets; for a revision plan over existing work, base branch + diff range]
|
|
7
8
|
<!-- The line below is medium / large only — small scale uses task-template instead of this plan-template. Keep the value line free of trailing comments so downstream parsers can extract the bare status (pending | ready | escalated). -->
|
|
8
9
|
Implementation Readiness: pending
|
|
9
10
|
|
|
@@ -26,6 +27,10 @@ Implementation Readiness: pending
|
|
|
26
27
|
- **Success criteria**: [extracted from Design Doc]
|
|
27
28
|
- **Failure response**: [extracted from Design Doc]
|
|
28
29
|
|
|
30
|
+
### Proof Strategy
|
|
31
|
+
- **Proof obligation source**: [test skeleton annotations (primary failure mode, proof obligation) when skeletons exist; otherwise each AC's primary failure mode]
|
|
32
|
+
- **Per-task propagation**: every task that implements a claim records Proof Obligations (see task template) so downstream review can judge whether the tests prove the claim, not merely run
|
|
33
|
+
|
|
29
34
|
## Quality Assurance Mechanisms (from Design Doc)
|
|
30
35
|
|
|
31
36
|
Adopted quality gates for the change area. Each task in this plan must satisfy these mechanisms.
|
|
@@ -48,6 +53,21 @@ Maps each Design Doc technical requirement to the covering task(s). One row per
|
|
|
48
53
|
|
|
49
54
|
**Gap Status values**: `covered` (task exists), `gap` (no task — requires justification in Notes, user confirmation required before plan approval)
|
|
50
55
|
|
|
56
|
+
## Failure Mode Checklist
|
|
57
|
+
|
|
58
|
+
Domain-independent failure categories this implementation must guard against. Enumerate all eight categories, mark each in the Applies? column as yes/no, and list a covering task for each that applies; keep entries free of project-specific names.
|
|
59
|
+
|
|
60
|
+
| Category | Applies? | Covered By Task(s) |
|
|
61
|
+
|---|---|---|
|
|
62
|
+
| same-value | yes/no | [Phase X Task Y] |
|
|
63
|
+
| no-op | yes/no | |
|
|
64
|
+
| empty input | yes/no | |
|
|
65
|
+
| invalid option | yes/no | |
|
|
66
|
+
| missing config | yes/no | |
|
|
67
|
+
| unavailable boundary | yes/no | |
|
|
68
|
+
| shared-state dependency | yes/no | |
|
|
69
|
+
| rollback-only visibility | yes/no | |
|
|
70
|
+
|
|
51
71
|
## UI Spec Component → Task Mapping
|
|
52
72
|
|
|
53
73
|
Include this section when a UI Spec is among the inputs. Maps each component documented in the UI Spec to the task(s) that implement it. task-decomposer reads this table to populate each task's Investigation Targets with the corresponding UI Spec section. Omit the section when no UI Spec exists.
|
|
@@ -56,9 +56,21 @@ Each row is an ADR decision the implementation in this task must comply with.
|
|
|
56
56
|
- **Failure response**: [What to do if verification fails — e.g., "reassess approach before proceeding", "escalate to user"]
|
|
57
57
|
- **Verification level**: [L1: Functional operation as end-user feature / L2: New tests added and passing / L3: Code builds without errors]
|
|
58
58
|
|
|
59
|
+
## Proof Obligations
|
|
60
|
+
(One entry per AC or claim this task implements. Derived from test skeleton annotations when present, otherwise from the AC's primary failure mode. Each test must prove its claim. Repeat the block below once per claim; the heading carries the AC ID or claim ID so downstream review can resolve coverage per claim.)
|
|
61
|
+
|
|
62
|
+
### Obligation: [AC ID or claim ID]
|
|
63
|
+
- **Claim**: [the behavior the AC promises]
|
|
64
|
+
- **Primary failure mode**: [the regression the test turns red on]
|
|
65
|
+
- **Boundary to exercise**: [public/integration boundary the test traverses, or "in-process unit"]
|
|
66
|
+
- **State assertion**: [observable state before → action → after for state-changing claims; "N/A" otherwise]
|
|
67
|
+
- **Mock boundary rationale**: [which boundaries may be mocked and why; "none" when all real]
|
|
68
|
+
- **Residual**: [what this proof leaves unestablished, if any]
|
|
69
|
+
|
|
59
70
|
## Completion Criteria
|
|
60
71
|
- [ ] All added tests pass
|
|
61
72
|
- [ ] Operation verified per Operation Verification Methods above
|
|
73
|
+
- [ ] Each Proof Obligation is met: the test turns red under its primary failure mode and exercises the stated boundary
|
|
62
74
|
- [ ] Deliverables created (for research/design tasks)
|
|
63
75
|
- [ ] (When Binding Decisions exist) Every Compliance Check evaluates to `Y` against the final implementation, with evidence recorded in Investigation Notes (file:line, test result, or command output)
|
|
64
76
|
|
|
@@ -156,9 +156,9 @@ Subagents respond in JSON format. Key fields for orchestrator decisions:
|
|
|
156
156
|
| codebase-analyzer | analysisScope.categoriesDetected, dataModel.detected, qualityAssurance (mechanisms[], domainConstraints[]), focusAreas[], existingElements count, limitations | Pass focusAreas to technical-designer as context |
|
|
157
157
|
| ui-analyzer | externalResources (status, per-axis fetch_status), componentStructure[], propsPatterns[], cssLayout[], stateDisplay[], focusAreas[], candidateWriteSet[], limitations | Pass the ui-analyzer JSON to ui-spec-designer and technical-designer-frontend; each consumes the fields named in its own input declaration |
|
|
158
158
|
| code-verifier | status (consistent/mostly_consistent/needs_review/inconsistent), consistencyScore, discrepancies[], reverseCoverage (dataOperationsInCode, testBoundariesSectionPresent). Pre-implementation: verifies Design Doc claims against existing codebase. Post-implementation: verifies implementation consistency against Design Doc (pass `code_paths` scoped to changed files) | Flag discrepancies for document-reviewer |
|
|
159
|
-
| task-executor | Input: `task_file` (required in orchestrated flows); optional Fix Mode signals `requiredFixes` or `incompleteImplementations` — when either is non-empty, skip `task_already_completed` and extend allowed list with each item's `file_path` / `location` (parse `location` as `file[:line]`)
|
|
160
|
-
| quality-fixer | Input: `task_file` (path to current task file — always pass this in orchestrated flows), `filesModified` (extract from the upstream implementation step's response — passes the task's write set as the primary scope for stub-detection; falls back to `git diff HEAD` when omitted). Status: approved/stub_detected/blocked. `stub_detected` → route back to the implementation step
|
|
161
|
-
| document-reviewer |
|
|
159
|
+
| task-executor | Input: `task_file` (required in orchestrated flows); optional Fix Mode signals `requiredFixes` or `incompleteImplementations` — when either is non-empty, skip `task_already_completed` and extend allowed list with each item's `file_path` / `location` (parse `location` as `file[:line]`); each `incompleteImplementations[]` entry may carry `type: "missing_logic" \| "hollow_test"` and the executor branches its fix action by `type`. Output: status (escalation_needed/completed), filesModified[], testsAdded, requiresTestReview, runnableCheck{level, executed, command, result, substance, substanceIssue, reason}, escalation_type ∈ {task_file_not_found, task_already_completed, target_files_missing, design_compliance_violation, similar_function_found, similar_component_found, investigation_target_not_found, out_of_scope_file, dependency_version_uncertain, binding_decision_violation, test_environment_not_ready}. | On escalation_needed: handle by escalation_type |
|
|
160
|
+
| quality-fixer | Input: `task_file` (path to current task file — always pass this in orchestrated flows), `filesModified` (extract from the upstream implementation step's response — passes the task's write set as the primary scope for stub-detection; falls back to `git diff HEAD` when omitted), `runnableCheck` (extract from the upstream implementation step's response — passes the test execution evidence including `substance` and `substanceIssue` so the substance check has the runtime signal; omit when the upstream did not run tests). Status: approved/stub_detected/blocked. `stub_detected` → `incompleteImplementations[]` items carry `type: "missing_logic" \| "hollow_test"`; route back to the implementation step (which branches its fix action on `type`), then re-run quality-fixer. `blocked` → see quality-fixer blocked handling below | On stub_detected: re-invoke the implementation step. On blocked: see handling below |
|
|
161
|
+
| document-reviewer | verdict.decision (approved/approved_with_conditions/needs_revision/rejected) | Proceed on approved/approved_with_conditions; request fixes on needs_revision; escalate on rejected |
|
|
162
162
|
| design-sync | sync_status (NO_CONFLICTS/CONFLICTS_FOUND) | On CONFLICTS_FOUND: present conflicts to user before proceeding |
|
|
163
163
|
| integration-test-reviewer | status (approved/needs_revision/blocked), requiredFixes | On needs_revision: re-invoke the routed executor in Fix Mode with the same task_file and requiredFixes[] |
|
|
164
164
|
| security-reviewer | status (approved/approved_with_notes/needs_revision/blocked), findings, notes, requiredFixes | On needs_revision: create a consolidated fix task file with the affected file paths from `requiredFixes[].location` populated into Target Files, then invoke the routed executor in Fix Mode with that task_file and the `requiredFixes[]` array, then quality-fixer, then re-invoke security-reviewer to verify resolution. On blocked: escalate to user with the blocking findings — fix is not within the agent layer's authority |
|
|
@@ -175,7 +175,7 @@ When quality-fixer returns `status: "blocked"`, discriminate by `reason`:
|
|
|
175
175
|
When receiving new features or change requests, I first request requirement analysis from requirement-analyzer.
|
|
176
176
|
According to scale determination:
|
|
177
177
|
|
|
178
|
-
### Large Scale (6+ Files) -
|
|
178
|
+
### Large Scale (6+ Files) - 14 Steps (backend) / 16 Steps (frontend/fullstack)
|
|
179
179
|
|
|
180
180
|
1. requirement-analyzer → Requirement analysis + Check existing PRD **[Stop]**
|
|
181
181
|
2. prd-creator → PRD creation
|
|
@@ -190,10 +190,11 @@ According to scale determination:
|
|
|
190
190
|
11. document-reviewer → Design Doc review (pass code-verifier results as code_verification; cross-layer: per Design Doc)
|
|
191
191
|
12. design-sync → Consistency verification **[Stop: Design Doc Approval]**
|
|
192
192
|
13. acceptance-test-generator → Test skeleton generation, pass to work-planner (*1)
|
|
193
|
-
14. work-planner → Work plan creation
|
|
194
|
-
15.
|
|
193
|
+
14. work-planner → Work plan creation
|
|
194
|
+
15. document-reviewer → Work plan review (doc_type: WorkPlan; pass the Design Doc path so AC/contract/state coverage is traceable). On `needs_revision`: re-invoke work-planner (update) and re-review until `approved`/`approved_with_conditions` — the plan is a derivation of the Design Doc, so plan-fidelity findings need no user adjudication. On `rejected`: escalate to user. **[Stop: Batch approval]**
|
|
195
|
+
16. task-decomposer → Autonomous execution → Completion report
|
|
195
196
|
|
|
196
|
-
### Medium Scale (3-5 Files) -
|
|
197
|
+
### Medium Scale (3-5 Files) - 10 Steps (backend) / 12 Steps (frontend/fullstack)
|
|
197
198
|
|
|
198
199
|
1. requirement-analyzer → Requirement analysis **[Stop]**
|
|
199
200
|
2. **(frontend/fullstack only)** Ask user for prototype code → ui-spec-designer → UI Spec creation (UI Spec informs component structure for technical design)
|
|
@@ -204,8 +205,9 @@ According to scale determination:
|
|
|
204
205
|
7. document-reviewer → Design Doc review (pass code-verifier results as code_verification; cross-layer: per Design Doc)
|
|
205
206
|
8. design-sync → Consistency verification **[Stop: Design Doc Approval]**
|
|
206
207
|
9. acceptance-test-generator → Test skeleton generation, pass to work-planner (*1)
|
|
207
|
-
10. work-planner → Work plan creation
|
|
208
|
-
11.
|
|
208
|
+
10. work-planner → Work plan creation
|
|
209
|
+
11. document-reviewer → Work plan review (doc_type: WorkPlan; pass the Design Doc path so AC/contract/state coverage is traceable). On `needs_revision`: re-invoke work-planner (update) and re-review until `approved`/`approved_with_conditions` — the plan is a derivation of the Design Doc, so plan-fidelity findings need no user adjudication. On `rejected`: escalate to user. **[Stop: Batch approval]**
|
|
210
|
+
12. task-decomposer → Autonomous execution → Completion report
|
|
209
211
|
|
|
210
212
|
### Small Scale (1-2 Files) - 2 Steps
|
|
211
213
|
|
|
@@ -4,6 +4,7 @@
|
|
|
4
4
|
種別: feature|fix|refactor
|
|
5
5
|
想定影響範囲: Xファイル
|
|
6
6
|
関連Issue/PR: #XXX(該当する場合)
|
|
7
|
+
レビュースコープ: [Design Docとタスク対象から導出した変更予定ファイルの範囲。既存作業に対する改訂計画の場合はベースブランチ + diff範囲]
|
|
7
8
|
<!-- 下記の行はmedium / large規模のみ — small規模はこのplan-templateではなくtask-templateを使用する。値の行は末尾コメントを付けず、下流のパーサがbare statusの抽出(pending | ready | escalated)を行えるように保つこと。 -->
|
|
8
9
|
Implementation Readiness: pending
|
|
9
10
|
|
|
@@ -26,6 +27,10 @@ Implementation Readiness: pending
|
|
|
26
27
|
- **成功基準**: [Design Docから抽出]
|
|
27
28
|
- **失敗時の対応**: [Design Docから抽出]
|
|
28
29
|
|
|
30
|
+
### 証明戦略
|
|
31
|
+
- **証明義務の出所**: [スケルトンが存在する場合はテストスケルトンの注釈(主要な故障モード、証明義務)。存在しない場合は各ACの主要な故障モード]
|
|
32
|
+
- **タスクごとの伝播**: 主張を実装する各タスクは Proof Obligations(task template参照)を記録し、下流のレビューがテストが主張を証明しているか(単に実行されるだけでないか)を判定できるようにする
|
|
33
|
+
|
|
29
34
|
## 品質保証メカニズム(Design Docより)
|
|
30
35
|
|
|
31
36
|
変更対象領域で採用された品質ゲート。本計画の各タスクはこれらのメカニズムを満たす必要がある。
|
|
@@ -48,6 +53,21 @@ Design Docの各技術要件をカバーするタスクへのマッピング。
|
|
|
48
53
|
|
|
49
54
|
**ギャップステータス値**: `covered`(タスクあり)、`gap`(タスクなし — 備考に理由必須、計画承認前にユーザー確認が必要)
|
|
50
55
|
|
|
56
|
+
## 故障モードチェックリスト
|
|
57
|
+
|
|
58
|
+
この実装が防ぐべきドメイン非依存の故障カテゴリ。8カテゴリすべてを列挙し、各カテゴリの該当列に yes/no を記入し、該当する各カテゴリにカバーするタスクを挙げる。エントリにはプロジェクト固有の名称を含めない。
|
|
59
|
+
|
|
60
|
+
| カテゴリ | 該当? | カバーするタスク |
|
|
61
|
+
|---|---|---|
|
|
62
|
+
| same-value | yes/no | [Phase X タスクY] |
|
|
63
|
+
| no-op | yes/no | |
|
|
64
|
+
| empty input | yes/no | |
|
|
65
|
+
| invalid option | yes/no | |
|
|
66
|
+
| missing config | yes/no | |
|
|
67
|
+
| unavailable boundary | yes/no | |
|
|
68
|
+
| shared-state dependency | yes/no | |
|
|
69
|
+
| rollback-only visibility | yes/no | |
|
|
70
|
+
|
|
51
71
|
## UI Specコンポーネント → タスクマッピング
|
|
52
72
|
|
|
53
73
|
入力にUI Specが含まれる場合のみ本セクションを記載する。UI Specに記述された各コンポーネントを実装するタスクへのマッピング。task-decomposerはこの表を読み込み、対応するUI Specセクションを各タスクのInvestigation Targetsに伝播させる。UI Specがない場合は本セクションを省略する。
|
|
@@ -56,9 +56,21 @@ Metadata:
|
|
|
56
56
|
- **失敗時の対応**: [検証失敗時の対処 — 例: 「続行前にアプローチを再評価」「ユーザーにエスカレーション」]
|
|
57
57
|
- **検証レベル**: [L1: エンドユーザー機能としての動作確認 / L2: 新規テスト追加・パス / L3: ビルドエラーなし]
|
|
58
58
|
|
|
59
|
+
## Proof Obligations
|
|
60
|
+
(このタスクが実装するACまたは主張ごとに1エントリ。スケルトンの注釈がある場合はそこから、なければACの主要な故障モードから導出する。各テストは主張を証明すること。下記ブロックを主張ごとに繰り返し、見出しにAC IDまたは主張IDを記載して下流のレビューが主張ごとにカバレッジを解決できるようにする。)
|
|
61
|
+
|
|
62
|
+
### Obligation: [AC IDまたは主張ID]
|
|
63
|
+
- **主張**: [ACが約束する振る舞い]
|
|
64
|
+
- **主要な故障モード**: [テストがレッドになるリグレッション]
|
|
65
|
+
- **検証する境界**: [テストが通過する公開/統合境界、または "in-process unit"]
|
|
66
|
+
- **状態アサーション**: [状態変更を伴う主張では 操作前 → 操作 → 操作後 の観察可能な状態。それ以外は "N/A"]
|
|
67
|
+
- **モック境界の根拠**: [どの境界をモックしてよいか、その理由。すべて実物なら "none"]
|
|
68
|
+
- **残余**: [この証明で未確立のまま残る事項があれば記載]
|
|
69
|
+
|
|
59
70
|
## Completion Criteria
|
|
60
71
|
- [ ] 追加した全テストがパス
|
|
61
72
|
- [ ] Operation Verification Methods に基づく動作確認完了
|
|
73
|
+
- [ ] 各 Proof Obligation が満たされている: テストが主要な故障モードでレッドになり、指定された境界を通過する
|
|
62
74
|
- [ ] 成果物作成完了(調査・設計タスクの場合)
|
|
63
75
|
- [ ] (Binding Decisionsがある場合)全てのCompliance Checkが最終実装に対して`Y`と評価され、根拠(file:line、テスト結果、またはコマンド出力)がInvestigation Notesに記録されている
|
|
64
76
|
|
|
@@ -154,9 +154,9 @@ description: サブエージェントのタスク分担と連携を調整。規
|
|
|
154
154
|
| codebase-analyzer | analysisScope.categoriesDetected, dataModel.detected, qualityAssurance (mechanisms[], domainConstraints[]), focusAreas[], existingElements count, limitations | focusAreasをtechnical-designerにコンテキストとして渡す |
|
|
155
155
|
| ui-analyzer | externalResources (status, per-axis fetch_status), componentStructure[], propsPatterns[], cssLayout[], stateDisplay[], focusAreas[], candidateWriteSet[], limitations | ui-analyzerのJSONをui-spec-designerとtechnical-designer-frontendに渡す。各エージェントは自身の入力宣言に記載されたフィールドを使う |
|
|
156
156
|
| code-verifier | status (consistent/mostly_consistent/needs_review/inconsistent), consistencyScore, discrepancies[], reverseCoverage (dataOperationsInCode, testBoundariesSectionPresent). 実装前: Design Docの主張を既存コードに対して検証。実装後: 実装のDesign Doc整合性を検証(`code_paths`で変更ファイルにスコープ) | discrepanciesをdocument-reviewerに連携 |
|
|
157
|
-
| task-executor | 入力: `task_file`(オーケストレーションフローでは必須); 任意の Fix Mode シグナル `requiredFixes` または `incompleteImplementations` — いずれかが非空の場合、`task_already_completed` チェックをスキップし、各項目の `file_path` / `location`(`location` は `file[:line]`
|
|
158
|
-
| quality-fixer | 入力: `task_file`(現在のタスクファイルパス — オーケストレーションフローでは常に渡す)、`filesModified`(上流の実装ステップのレスポンスから抽出 — 当該タスクの書き込み集合を未完成実装検出の主要スコープとして渡す。省略時は `git diff HEAD`
|
|
159
|
-
| document-reviewer |
|
|
157
|
+
| task-executor | 入力: `task_file`(オーケストレーションフローでは必須); 任意の Fix Mode シグナル `requiredFixes` または `incompleteImplementations` — いずれかが非空の場合、`task_already_completed` チェックをスキップし、各項目の `file_path` / `location`(`location` は `file[:line]` として解釈)で許可リストを拡張する。`incompleteImplementations[]` の各エントリは `type: "missing_logic" \| "hollow_test"` を持ち得て、executor は `type` で修正アクションを分岐する。出力: status (escalation_needed/completed), filesModified[], testsAdded, requiresTestReview, runnableCheck{level, executed, command, result, substance, substanceIssue, reason}, escalation_type ∈ {task_file_not_found, task_already_completed, target_files_missing, design_compliance_violation, similar_function_found, similar_component_found, investigation_target_not_found, out_of_scope_file, dependency_version_uncertain, binding_decision_violation, test_environment_not_ready} | escalation_needed時: escalation_type別に対応 |
|
|
158
|
+
| quality-fixer | 入力: `task_file`(現在のタスクファイルパス — オーケストレーションフローでは常に渡す)、`filesModified`(上流の実装ステップのレスポンスから抽出 — 当該タスクの書き込み集合を未完成実装検出の主要スコープとして渡す。省略時は `git diff HEAD` にフォールバック)、`runnableCheck`(上流の実装ステップのレスポンスから抽出 — `substance` と `substanceIssue` を含むテスト実行のエビデンスを渡し、Substance チェックが実行時のシグナルを受け取れるようにする。上流がテストを実行していない場合は省略可)。Status: approved/stub_detected/blocked。`stub_detected` → `incompleteImplementations[]` の各エントリは `type: "missing_logic" \| "hollow_test"` を持ち、`type` で executor 側の修正アクションを分岐させた上で上流の実装ステップに差し戻し、本実装完了後にquality-fixerを再実行。`blocked` → 下記quality-fixer blockedハンドリング参照 | stub_detected: 実装ステップを再実行。blocked: 下記参照 |
|
|
159
|
+
| document-reviewer | verdict.decision (approved/approved_with_conditions/needs_revision/rejected) | approved/approved_with_conditionsで次へ。needs_revisionで修正依頼。rejectedでエスカレーション |
|
|
160
160
|
| design-sync | sync_status (NO_CONFLICTS/CONFLICTS_FOUND) | CONFLICTS_FOUND時: 矛盾をユーザーに提示してから進む |
|
|
161
161
|
| integration-test-reviewer | status (approved/needs_revision/blocked), requiredFixes | needs_revision時: 同じ task_file と requiredFixes[] を渡してルーティング先の executor を Fix Mode で再実行 |
|
|
162
162
|
| security-reviewer | status (approved/approved_with_notes/needs_revision/blocked), findings, notes, requiredFixes | needs_revision時: `requiredFixes[].location` から影響ファイルパスを抽出して Target Files に投入した統合修正タスクファイルを作成し、その task_file と `requiredFixes[]` 配列を渡してルーティング先の executor を Fix Mode で起動。続いて quality-fixer を実行し、最後に security-reviewer を再起動して解消を検証する。blocked 時: ブロッキング findings を添えてユーザーにエスカレーション — エージェント層の権限外の修正である |
|
|
@@ -170,7 +170,7 @@ quality-fixerが `status: "blocked"` を返した場合、`reason`で判別:
|
|
|
170
170
|
|
|
171
171
|
## 作業計画時の基本フロー
|
|
172
172
|
|
|
173
|
-
### 大規模(6ファイル以上) -
|
|
173
|
+
### 大規模(6ファイル以上) - 14ステップ(バックエンド) / 16ステップ(フロントエンド/フルスタック)
|
|
174
174
|
|
|
175
175
|
1. requirement-analyzer → 要件分析 + 既存PRD確認 **[停止]**
|
|
176
176
|
2. prd-creator → PRD作成
|
|
@@ -185,10 +185,11 @@ quality-fixerが `status: "blocked"` を返した場合、`reason`で判別:
|
|
|
185
185
|
11. document-reviewer → Design Docレビュー(code-verifier結果をcode_verificationとして入力。レイヤー横断時: Design Doc毎に実行)
|
|
186
186
|
12. design-sync → 整合性検証 **[停止: Design Doc承認]**
|
|
187
187
|
13. acceptance-test-generator → テストスケルトン生成、work-plannerに渡す (*1)
|
|
188
|
-
14. work-planner → 作業計画書作成
|
|
189
|
-
15.
|
|
188
|
+
14. work-planner → 作業計画書作成
|
|
189
|
+
15. document-reviewer → 作業計画書レビュー(doc_type: WorkPlan。AC/コントラクト/状態のカバレッジをトレースできるようDesign Docのパスを渡す)。`needs_revision` の場合: work-plannerを(updateで)再実行し `approved`/`approved_with_conditions` になるまで再レビューする — 作業計画書はDesign Docの派生物であるため、計画の忠実性に関する指摘にユーザー裁定は不要。`rejected` の場合: ユーザーにエスカレーション。 **[停止: 一括承認]**
|
|
190
|
+
16. task-decomposer → 自律実行 → 完了報告
|
|
190
191
|
|
|
191
|
-
### 中規模(3-5ファイル) -
|
|
192
|
+
### 中規模(3-5ファイル) - 10ステップ(バックエンド) / 12ステップ(フロントエンド/フルスタック)
|
|
192
193
|
|
|
193
194
|
1. requirement-analyzer → 要件分析 **[停止]**
|
|
194
195
|
2. **(フロントエンド/フルスタックのみ)** プロトタイプコードの有無を確認 → ui-spec-designer → UI Spec作成(コンポーネント構造が技術設計に反映されるため先に実施)
|
|
@@ -199,8 +200,9 @@ quality-fixerが `status: "blocked"` を返した場合、`reason`で判別:
|
|
|
199
200
|
7. document-reviewer → Design Docレビュー(code-verifier結果をcode_verificationとして入力。レイヤー横断時: Design Doc毎に実行)
|
|
200
201
|
8. design-sync → 整合性検証 **[停止: Design Doc承認]**
|
|
201
202
|
9. acceptance-test-generator → テストスケルトン生成、work-plannerに渡す (*1)
|
|
202
|
-
10. work-planner → 作業計画書作成
|
|
203
|
-
11.
|
|
203
|
+
10. work-planner → 作業計画書作成
|
|
204
|
+
11. document-reviewer → 作業計画書レビュー(doc_type: WorkPlan。AC/コントラクト/状態のカバレッジをトレースできるようDesign Docのパスを渡す)。`needs_revision` の場合: work-plannerを(updateで)再実行し `approved`/`approved_with_conditions` になるまで再レビューする — 作業計画書はDesign Docの派生物であるため、計画の忠実性に関する指摘にユーザー裁定は不要。`rejected` の場合: ユーザーにエスカレーション。 **[停止: 一括承認]**
|
|
205
|
+
12. task-decomposer → 自律実行 → 完了報告
|
|
204
206
|
|
|
205
207
|
### 小規模(1-2ファイル) - 2ステップ
|
|
206
208
|
|
package/CHANGELOG.md
CHANGED
|
@@ -5,6 +5,27 @@ All notable changes to this project will be documented in this file.
|
|
|
5
5
|
The format is based on [Keep a Changelog](https://keepachangelog.com/en/1.1.0/),
|
|
6
6
|
and this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0.html).
|
|
7
7
|
|
|
8
|
+
## [1.23.2] - 2026-06-01
|
|
9
|
+
|
|
10
|
+
### Added
|
|
11
|
+
|
|
12
|
+
- **Proof-quality review gate** (agents, skills) — Verification is raised from "tests exist" to "tests prove the claim's primary failure mode." `acceptance-test-generator` emits `Primary failure mode` / `Proof obligation` annotations on every skeleton; `work-planner`, `task-decomposer`, plan-template, and task-template carry per-claim Proof Obligations into task files; `integration-test-reviewer` adds a Claim Proof Adequacy check with a `proof_insufficient` issue type; `code-reviewer` requires AC-coverage tests to turn red under the recorded primary failure mode and exercise the claimed boundary directly
|
|
13
|
+
- **Planning-fidelity review gate** (agents, commands, skills) — The work plan now gets the same automated review the Design Doc does, before implementation starts. `document-reviewer` gains a `WorkPlan` doc_type semantic gate (Design-to-Plan traceability, early-verification placement, real-boundary coverage, Failure Mode Checklist, Review Scope) with a verdict mapping and a `design_doc` input; `work-planner` and plan-template add a Proof Strategy, Review Scope, and Failure Mode Checklist; the plan / front-plan recipes review the plan and self-heal `needs_revision` (re-plan and re-review) while escalating `rejected`; front-build reviews a plan it creates from a Design Doc before decomposition; `subagents-orchestration-guide` wires WorkPlan review into the Medium/Large planning flow and moves the `document-reviewer` output contract to `verdict.decision`
|
|
14
|
+
|
|
15
|
+
## [1.23.1] - 2026-05-28
|
|
16
|
+
|
|
17
|
+
### Added
|
|
18
|
+
|
|
19
|
+
- **Acceptance evidence discipline** (agents, skills) — Substance check rejects cited test evidence that is hollow (skipped, TODO-only, always-true, or 0-match). `task-executor` reports `runnableCheck.substance` / `substanceIssue`; `quality-fixer` gates on it and routes unrecoverable hollow tests via `stub_detected` with new `incompleteImplementations[].type` (`missing_logic` / `hollow_test`). `code-reviewer` §3-3 and `integration-test-reviewer` add matching inspection criteria
|
|
20
|
+
- **`test_environment_not_ready` escalation** (agents, skills) — `task-executor` / `-frontend` escalate with a typed reason when the required test toolchain is unavailable. Registered in `subagents-orchestration-guide`
|
|
21
|
+
- **Frontend executor symmetry** (agents) — `task-executor-frontend` gains Reference Representativeness (IF-THEN by repository-wide file count) and `dependency_version_uncertain` escalation, matching the backend executor
|
|
22
|
+
|
|
23
|
+
### Changed
|
|
24
|
+
|
|
25
|
+
- **Reference Representativeness rule** (agents, skills) — Rewritten as explicit IF-THEN (3+ adopt / 1-2 investigate canonical-vs-legacy / 0 justify) so a canonical pattern with only 1-2 nearby files can still be adopted instead of being forced to escalate
|
|
26
|
+
- **Frontend quality-fixer guidance** (agents) — Replace obsolete patterns (manual `cleanup()`, snapshot-first thinking) with current RTL practice (auto-cleanup, behavior assertions over snapshots, mock at the existing network boundary)
|
|
27
|
+
- **Prompt tightening** (agents, skills) — Compressed Similar Function / Component Duplication Check; removed redundant Special Considerations (`code-reviewer`) and Important Principles (`quality-fixer`); added a Policy References hub to Fix Execution Policy; split `quality-fixer` `blocked` example into Variant A (specification conflict) and Variant B (missing prerequisites); `subagents-orchestration-guide` task-executor Output and quality-fixer Input contracts updated to carry `runnableCheck` through
|
|
28
|
+
|
|
8
29
|
## [1.23.0] - 2026-05-22
|
|
9
30
|
|
|
10
31
|
### Added
|
package/package.json
CHANGED
|
@@ -1,6 +1,6 @@
|
|
|
1
1
|
{
|
|
2
2
|
"name": "create-ai-project",
|
|
3
|
-
"version": "1.23.
|
|
3
|
+
"version": "1.23.2",
|
|
4
4
|
"packageManager": "npm@10.8.2",
|
|
5
5
|
"description": "TypeScript boilerplate with skills and sub-agents for Claude Code. Prevents context exhaustion through role-based task splitting.",
|
|
6
6
|
"keywords": [
|