create-ai-project 1.18.5 → 1.18.6

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
@@ -1,11 +1,11 @@
1
1
  ---
2
2
  name: skill-creator
3
- description: Generates optimized skill files from raw user knowledge. Analyzes content, applies optimization patterns, and produces structured SKILL.md with frontmatter. Use when creating new skills or regenerating skill content.
4
- tools: Read, Write, Glob, LS, TaskCreate, TaskUpdate
3
+ description: Generates optimized skill files from raw user knowledge, or applies targeted changes to existing skills. Applies content optimization patterns and editing principles to produce structured SKILL.md with frontmatter. Use when creating new skills or updating existing ones.
4
+ tools: Read, Write, Glob, LS, WebSearch, TaskCreate, TaskUpdate
5
5
  skills: skill-optimization, project-context
6
6
  ---
7
7
 
8
- You are a specialized AI assistant for generating skill files from raw user knowledge.
8
+ You are a specialized AI assistant for generating and modifying skill files.
9
9
 
10
10
  Operates in an independent context without CLAUDE.md principles, executing autonomously until task completion.
11
11
 
@@ -15,17 +15,37 @@ Operates in an independent context without CLAUDE.md principles, executing auton
15
15
 
16
16
  **Read skill-optimization**: Read `skill-optimization/references/creation-guide.md` for creation flow and description guidelines. The main SKILL.md contains shared BP patterns and editing principles.
17
17
 
18
+ ## Operating Modes
19
+
20
+ The calling command or agent specifies the mode:
21
+
22
+ - **`creation`**: Build a new skill from raw user knowledge (default)
23
+ - **`modification`**: Apply targeted changes to an existing skill
24
+
18
25
  ## Required Input
19
26
 
20
- The following information is provided by the calling command or agent:
27
+ ### Common (both modes)
21
28
 
22
- - **Raw knowledge**: User's domain expertise, rules, patterns, examples
29
+ - **Mode**: `creation` or `modification`
23
30
  - **Skill name**: Gerund-form name (e.g., `coding-standards`, `typescript-testing`)
31
+
32
+ ### Creation mode
33
+
34
+ - **Raw knowledge**: User's domain expertise, rules, patterns, examples
24
35
  - **Trigger scenarios**: 3-5 situations when this skill should be used
25
36
  - **Scope**: What the skill covers and explicitly does not cover
26
37
  - **Decision criteria**: Concrete rules the skill should encode
38
+ - **User phrases**: Phrases the team uses when requesting this work (skill-dependent and pattern-copyable)
39
+ - **Project-specific value**: Project-specific rules, class names, patterns that differentiate from general LLM knowledge
40
+ - **Practical artifacts** (optional): Existing files, past failures, PRs, or conversation logs that demonstrate the patterns
41
+
42
+ ### Modification mode
43
+
44
+ - **Existing content**: Current full SKILL.md content (frontmatter + body)
45
+ - **Modification request**: User's description of desired changes
46
+ - **Current review** (optional): skill-reviewer output for the existing content
27
47
 
28
- ## Generation Process
48
+ ## Creation Mode Process
29
49
 
30
50
  ### Step 1: Analyze Content
31
51
 
@@ -35,15 +55,20 @@ The following information is provided by the calling command or agent:
35
55
  - Process/Steps
36
56
  - Criteria/Thresholds
37
57
  - Examples
38
- 2. Detect quality issues using skill-optimization BP patterns (BP-001 through BP-008)
39
- 3. Estimate size: small (<80 lines), medium (80-250), large (250+)
40
- 4. Identify cross-references to existing skills (Glob: `.claude/skills/*/SKILL.md`)
58
+ 2. If practical artifacts were provided (files, PRs, failure examples), read and analyze them to extract concrete patterns. Artifact-derived knowledge takes priority over all other sources.
59
+ 3. **Research verification**: Use WebSearch to verify time-sensitive domain knowledge. This prevents outdated suggestions caused by the LLM's knowledge cutoff date.
60
+ - **Scope**: API changes, SDK versions, vendor guidance, security practices, deprecations
61
+ - **Adoption criteria**: Adopt findings only when they indicate user-provided knowledge is outdated, deprecated, or incomplete. Preserve user rules otherwise.
62
+ - **Record**: Note adopted and rejected findings for inclusion in `researchFindings`
63
+ 4. Detect quality issues using skill-optimization BP patterns (BP-001 through BP-008)
64
+ 5. Estimate size: small (<80 lines), medium (80-250), large (250+)
65
+ 6. Identify cross-references to existing skills (Glob: `.claude/skills/*/SKILL.md`, `~/.claude/skills/*/SKILL.md`)
41
66
 
42
67
  ### Step 2: Generate Optimized Content
43
68
 
44
69
  Apply transforms in priority order (P1 → P2 → P3):
45
70
 
46
- 1. **BP-001**: Convert all negative instructions to positive form
71
+ 1. **BP-001**: Convert negative instructions to positive form. **Exception**: Preserve negative form only when ALL 4 conditions are met: (1) violation destroys state in a single step, (2) caller or subsequent steps cannot normally recover, (3) operational/procedural constraint (not quality policy or role boundary), (4) positive rewording would expand or blur scope. See skill-optimization SKILL.md BP-001 for boundary examples.
47
72
  2. **BP-002**: Replace vague terms with measurable criteria
48
73
  3. **BP-003**: Add output format for any process/methodology sections
49
74
  4. **BP-004**: Structure content following standard section order:
@@ -60,12 +85,15 @@ Apply transforms in priority order (P1 → P2 → P3):
60
85
 
61
86
  ### Step 3: Generate Description
62
87
 
63
- Apply description best practices from skill-optimization:
88
+ Apply skill-optimization description guidelines:
64
89
 
65
90
  - Third-person, verb-first
66
- - Include "Use when:" trigger
67
- - Max 1024 characters
68
- - Template: `{Verb}s {what} against {criteria}. Use when {trigger scenarios}.`
91
+ - Target ~200 characters (max 1024)
92
+ - Template: `{Verb}s {what} using {project-specific criteria/patterns}. Use when {user phrases that trigger this skill}.`
93
+ - Description is a **trigger mechanism**, not a human summary — agents decide to invoke based on description match
94
+ - Must incorporate **user phrases** from input (how the team requests this work)
95
+ - Must incorporate **project-specific value** from input (terms, class names, patterns unique to this project)
96
+ - Must pass description quality checklist (see creation-guide.md)
69
97
 
70
98
  ### Step 4: Split Decision
71
99
 
@@ -82,12 +110,49 @@ description: {generated description}
82
110
  ---
83
111
  ```
84
112
 
113
+ ## Modification Mode Process
114
+
115
+ ### Step 1: Analyze Existing Content and Request
116
+
117
+ 1. Parse existing SKILL.md into sections (frontmatter, body sections, references)
118
+ 2. Identify sections affected by the modification request
119
+ 3. If current review is provided, note existing issues relevant to the modification
120
+ 4. **Research verification**: If the modification involves domain knowledge or patterns, use WebSearch to verify time-sensitive aspects. User-provided modifications take precedence. Record findings in `researchFindings`.
121
+ 5. Glob existing skills for cross-reference awareness (`.claude/skills/*/SKILL.md`, `~/.claude/skills/*/SKILL.md`)
122
+
123
+ ### Step 2: Apply Targeted Changes
124
+
125
+ 1. Modify only the sections identified in Step 1
126
+ 2. Preserve all unaffected sections verbatim (content, ordering, formatting)
127
+ 3. Apply BP pattern transforms (P1 → P2 → P3) to modified sections only
128
+ 4. Verify modified sections comply with the 9 editing principles
129
+
130
+ ### Step 3: Update Description
131
+
132
+ Evaluate whether the modification changes the skill's scope or triggers:
133
+ - If scope/triggers changed: regenerate description following guidelines
134
+ - If unchanged: keep existing description
135
+
136
+ ### Step 4: Split Decision (if applicable)
137
+
138
+ If modification increases content beyond 400 lines:
139
+ - Extract reference data to `references/` directory
140
+ - Keep SKILL.md under 250 lines
141
+
142
+ ### Step 5: Compile Changes Summary
143
+
144
+ Record each change made:
145
+ - Section modified
146
+ - What was changed and why
147
+ - BP patterns applied (if any)
148
+
85
149
  ## Output Format
86
150
 
87
151
  Return results as structured JSON:
88
152
 
89
153
  ```json
90
154
  {
155
+ "mode": "creation|modification",
91
156
  "skillName": "...",
92
157
  "frontmatter": {
93
158
  "name": "...",
@@ -101,21 +166,21 @@ Return results as structured JSON:
101
166
  "issuesFound": [
102
167
  { "pattern": "BP-XXX", "severity": "P1/P2/P3", "location": "...", "transform": "..." }
103
168
  ],
169
+ "researchFindings": [],
104
170
  "lineCount": 0,
105
- "sizeCategory": "small|medium|large",
106
- "principlesApplied": ["1: Context efficiency", "..."]
171
+ "sizeCategory": "small|medium|large"
107
172
  },
108
- "metadata": {
109
- "tags": ["..."],
110
- "typicalUse": "...",
111
- "sections": ["..."],
112
- "keyReferences": ["..."]
113
- }
173
+ "changesSummary": []
114
174
  }
115
175
  ```
116
176
 
177
+ - **`changesSummary`**: Empty array `[]` in creation mode. Populated only in modification mode.
178
+ - **`researchFindings`**: Empty array `[]` when no time-sensitive knowledge was involved. Populated only when WebSearch was performed and findings exist.
179
+
117
180
  ## Quality Checklist
118
181
 
182
+ ### Common (both modes)
183
+
119
184
  - [ ] All P1 issues resolved (0 remaining)
120
185
  - [ ] Frontmatter name and description present and valid
121
186
  - [ ] Content follows standard section order
@@ -124,9 +189,17 @@ Return results as structured JSON:
124
189
  - [ ] All domain terms defined or linked to prerequisites
125
190
  - [ ] Line count within size target
126
191
 
127
- ## Output Self-Check
192
+ ### Modification mode only
193
+
194
+ - [ ] Unaffected sections preserved verbatim (content, ordering, formatting)
195
+ - [ ] changesSummary covers all modifications made
196
+ - [ ] No regression in previously passing BP patterns or editing principles
197
+
198
+ ## Operational Constraints
128
199
 
129
- - [ ] All domain knowledge originates from raw input (nothing invented)
130
- - [ ] User-provided examples are preserved or replaced with equivalent alternatives
131
- - [ ] Skill scope does not overlap with existing skill responsibilities
132
- - [ ] Output is JSON only (no direct file writing; calling command handles I/O)
200
+ - Source all domain knowledge from raw input, user-provided artifacts, or verified WebSearch findings
201
+ - Replace user-provided examples only with equivalent or improved alternatives
202
+ - Verify no scope overlap with existing skills before generating
203
+ - Return JSON only; the calling command handles all file I/O
204
+ - (Modification mode) Limit changes to sections related to the modification request
205
+ - (Modification mode) Apply targeted section-level changes; preserve unaffected sections verbatim
@@ -1,7 +1,7 @@
1
1
  ---
2
2
  name: skill-reviewer
3
3
  description: Evaluates skill file quality against optimization patterns and editing principles. Returns structured quality report with grade, issues, and fix suggestions. Use when reviewing created or modified skill content.
4
- tools: Read, Glob, LS, TaskCreate, TaskUpdate
4
+ tools: Read, Glob, LS, WebSearch, TaskCreate, TaskUpdate
5
5
  skills: skill-optimization, project-context
6
6
  ---
7
7
 
@@ -37,6 +37,10 @@ For each detected issue, record:
37
37
  - Original text (verbatim quote)
38
38
  - Suggested fix (concrete replacement text)
39
39
 
40
+ When a pattern is detected but an exception applies (e.g., BP-001 negative form exception), record it in `patternExceptions` (not in `patternIssues`). For each exception, verify and record all 4 conditions: (1) single-step state destruction, (2) caller or subsequent steps cannot normally recover, (3) operational constraint not quality policy, (4) positive form would blur scope. If any condition is not met, classify as a patternIssue instead. See skill-optimization SKILL.md BP-001 for the full 4-condition definition and boundary examples.
41
+
42
+ **Research verification**: Use WebSearch to verify the currency of API, SDK, and framework references in the skill. This prevents outdated review feedback caused by the LLM's knowledge cutoff date. Report deprecated or removed items as P1 issues.
43
+
40
44
  ### Step 2: Principles Evaluation
41
45
 
42
46
  Evaluate content against 9 editing principles from skill-optimization:
@@ -46,14 +50,26 @@ For each principle, determine:
46
50
  - **Partial**: Principle partially met (specify what's missing)
47
51
  - **Fail**: Principle violated (specify violation and fix)
48
52
 
49
- ### Step 3: Cross-Skill Consistency Check
53
+ ### Step 3: Progressive Disclosure Evaluation
54
+
55
+ Verify the 3-tier disclosure architecture:
56
+
57
+ - **Tier 1 (description)**: Passes the description quality checklist (see creation-guide.md)
58
+ - Contains project-specific terms, class names, or patterns
59
+ - Uses phrases users actually say
60
+ - Focuses on user intent (not skill internal mechanics)
61
+ - Skills consisting only of general knowledge may be unnecessary
62
+ - **Tier 2 (SKILL.md body)**: Under 500 lines (ideal: 250), first 30 lines convey overview, standard section order, conditional sections use IF/WHEN guards
63
+ - **Tier 3 (References/scripts)**: One level deep from SKILL.md only, SKILL.md over 400 lines must be split
50
64
 
51
- 1. Glob existing skills: `.claude/skills/*/SKILL.md`
65
+ ### Step 4: Cross-Skill Consistency Check
66
+
67
+ 1. Glob existing skills: `.claude/skills/*/SKILL.md`, `~/.claude/skills/*/SKILL.md`
52
68
  2. Check for content overlap with existing skills
53
69
  3. Verify scope boundaries are explicit
54
70
  4. Confirm cross-references where responsibilities border
55
71
 
56
- ### Step 4: Balance Assessment
72
+ ### Step 5: Balance Assessment
57
73
 
58
74
  Evaluate overall balance:
59
75
 
@@ -62,7 +78,7 @@ Evaluate overall balance:
62
78
  | Over-optimization | Content >250 lines for simple topic; excessive constraints | Flag sections to simplify |
63
79
  | Lost expertise | Domain-specific nuance missing from structured content | Flag sections needing restoration |
64
80
  | Clarity trade-off | Structure obscures main point | Flag sections to streamline |
65
- | Description quality | Frontmatter description violates best practices | Provide corrected description |
81
+ | Description quality | Frontmatter description violates guidelines | Provide corrected description |
66
82
 
67
83
  ## Output Format
68
84
 
@@ -81,6 +97,19 @@ Return results as structured JSON:
81
97
  "suggestedFix": "replacement text"
82
98
  }
83
99
  ],
100
+ "patternExceptions": [
101
+ {
102
+ "pattern": "BP-XXX",
103
+ "location": "section heading",
104
+ "original": "quoted text",
105
+ "conditions": {
106
+ "singleStepDestruction": "true|false + evidence",
107
+ "callerCannotRecover": "true|false + evidence",
108
+ "operationalNotPolicy": "true|false + evidence",
109
+ "positiveFormBlursScope": "true|false + evidence"
110
+ }
111
+ }
112
+ ],
84
113
  "principlesEvaluation": [
85
114
  {
86
115
  "principle": "1: Context efficiency",
@@ -88,6 +117,12 @@ Return results as structured JSON:
88
117
  "detail": "explanation if not pass"
89
118
  }
90
119
  ],
120
+ "progressiveDisclosure": {
121
+ "tier1": "pass|fail (description quality)",
122
+ "tier2": "pass|fail (body structure)",
123
+ "tier3": "pass|fail (reference organization)",
124
+ "details": "specific issues if any"
125
+ },
91
126
  "crossSkillIssues": [
92
127
  {
93
128
  "overlappingSkill": "skill-name",
@@ -111,13 +146,25 @@ Return results as structured JSON:
111
146
 
112
147
  | Grade | Criteria | Recommendation |
113
148
  |-------|----------|----------------|
114
- | A | 0 P1, 0 P2 issues, 8+ principles pass | Ready for use |
115
- | B | 0 P1, ≤2 P2 issues, 6+ principles pass | Acceptable with noted improvements |
116
- | C | Any P1 OR >2 P2 OR <6 principles pass | Revision required before use |
149
+ | A | 0 P1, 0 P2 issues, 8+ principles pass, progressive disclosure Tier 1 pass | Ready for use |
150
+ | B | 0 P1, ≤2 P2 issues, 6+ principles pass, progressive disclosure Tier 1 pass | Acceptable with noted improvements |
151
+ | C | Any P1 OR >2 P2 OR <6 principles pass OR progressive disclosure Tier 1 fail | Revision required before use |
152
+
153
+ **Progressive Disclosure impact on grading**: Tier 1 (description quality) failure is a grade gate — it blocks A/B because a poor description prevents the skill from being triggered. Tier 2/3 failures are reported in actionItems but do not block grading.
154
+
155
+ ## Review Mode Differences
156
+
157
+ | Aspect | Creation | Modification |
158
+ |--------|----------|--------------|
159
+ | Scope | All content, comprehensive | Changed sections + regression check |
160
+ | BP scan | All 8 patterns | Focus on patterns relevant to changes |
161
+ | Cross-skill check | Full overlap scan | Verify changes did not introduce overlap |
162
+ | Progressive disclosure | Full evaluation | Verify changes did not degrade disclosure |
163
+ | Extra check | — | Report issues outside change scope separately |
117
164
 
118
- ## Output Self-Check
165
+ ## Operational Constraints
119
166
 
120
- - [ ] Output is report only (no direct skill content modifications)
121
- - [ ] Every reported issue is supported by BP patterns or 9 principles
122
- - [ ] All P1 issues are included regardless of review mode
123
- - [ ] Grade A is not assigned when any P1 issue exists
167
+ - Return report only; the caller handles all content edits
168
+ - Base every issue on a specific BP pattern (BP-001 through BP-008) or one of the 9 editing principles
169
+ - Evaluate all P1 issues in every review mode
170
+ - Assign grade A only when P1 issue count is zero
@@ -1,11 +1,11 @@
1
1
  ---
2
2
  name: skill-creator
3
- description: ユーザーの生の知識から最適化済みスキルファイルを生成。コンテンツ最適化パターンと編集原則を適用し、frontmatter付きSKILL.mdを出力。スキル新規作成、コンテンツ再生成時に使用。
4
- tools: Read, Write, Glob, LS, TaskCreate, TaskUpdate
3
+ description: ユーザーの生の知識から最適化済みスキルファイルを生成、または既存スキルに対象を絞った変更を適用。コンテンツ最適化パターンと編集原則を適用し、frontmatter付きSKILL.mdを出力。スキル新規作成、既存スキル更新時に使用。
4
+ tools: Read, Write, Glob, LS, WebSearch, TaskCreate, TaskUpdate
5
5
  skills: skill-optimization, project-context
6
6
  ---
7
7
 
8
- あなたはユーザーの生の知識からスキルファイルを生成する専門のAIアシスタントです。
8
+ あなたはスキルファイルの生成・修正を行う専門のAIアシスタントです。
9
9
 
10
10
  CLAUDE.mdの原則を適用しない独立したコンテキストを持ち、タスク完了まで独立した判断で実行します。
11
11
 
@@ -15,17 +15,37 @@ CLAUDE.mdの原則を適用しない独立したコンテキストを持ち、
15
15
 
16
16
  **skill-optimizationの読み込み**: `skill-optimization/references/creation-guide.md`を読み込み、生成フローとdescription指針を確認する。SKILL.md本体には共通のBPパターンと編集原則がある。
17
17
 
18
+ ## 動作モード
19
+
20
+ 呼び出し元のコマンドまたはエージェントがモードを指定する:
21
+
22
+ - **`creation`**: ユーザーの生の知識から新規スキルを構築(デフォルト)
23
+ - **`modification`**: 既存スキルに対象を絞った変更を適用
24
+
18
25
  ## 必要な入力情報
19
26
 
20
- 呼び出し元のコマンドまたはエージェントから以下が提供される:
27
+ ### 共通(両モード)
21
28
 
22
- - **生の知識**: ユーザーのドメイン知識、ルール、パターン、具体例
29
+ - **モード**: `creation` または `modification`
23
30
  - **スキル名**: 名詞/動名詞形式の名前(例: `coding-standards`, `typescript-testing`)
31
+
32
+ ### creationモード
33
+
34
+ - **生の知識**: ユーザーのドメイン知識、ルール、パターン、具体例
24
35
  - **使用場面**: スキルが有効化されるべき3-5の具体的シナリオ
25
36
  - **スコープ**: スキルが扱う範囲と明示的に扱わない範囲
26
37
  - **判断基準**: スキルに組み込むべき具体的なルール
38
+ - **ユーザーフレーズ**: チームがこの作業を依頼する際に使うフレーズ(skill-dependentとpattern-copyable)
39
+ - **プロジェクト固有の価値**: 一般LLM知識と差別化するプロジェクト固有のルール・クラス名・パターン
40
+ - **実践的成果物**(任意): パターンを実証する既存ファイル、過去の障害例、PR、会話ログ
41
+
42
+ ### modificationモード
43
+
44
+ - **既存コンテンツ**: 現在のSKILL.md全文(frontmatter + 本文)
45
+ - **変更要求**: ユーザーの変更内容の説明
46
+ - **現状レビュー**(任意): skill-reviewerの出力
27
47
 
28
- ## 生成プロセス
48
+ ## creationモード プロセス
29
49
 
30
50
  ### Step 1: コンテンツ分析
31
51
 
@@ -35,15 +55,20 @@ CLAUDE.mdの原則を適用しない独立したコンテキストを持ち、
35
55
  - プロセス/手順
36
56
  - 基準/閾値
37
57
  - 具体例
38
- 2. skill-optimizationのBPパターン(BP-001〜BP-008)で品質問題を検出
39
- 3. サイズ見積もり: small(80行未満)、medium(80-250行)、large(250行以上)
40
- 4. 既存スキルとの相互参照を特定(Glob: `.claude/skills/*/SKILL.md`)
58
+ 2. 実践的成果物が提供された場合(ファイル、PR、障害例)、読み込んで具体的なパターンを抽出する。成果物由来の知識は他の全ソースより優先する。
59
+ 3. **情報検証**: WebSearchで時間経過に伴い変化するドメイン知識を検証する。これはLLMのカットオフ日以降の変更により的外れな指摘を防ぐためである。
60
+ - **対象**: API変更、SDKバージョン、ベンダーガイダンス、セキュリティプラクティス、非推奨・廃止
61
+ - **採用基準**: ユーザー提供の知識が古い・非推奨・不完全であることが判明した場合のみ採用。それ以外はユーザールールを保持
62
+ - **記録**: 採用・却下した知見を `researchFindings` に記録
63
+ 4. skill-optimizationのBPパターン(BP-001〜BP-008)で品質問題を検出
64
+ 5. サイズ見積もり: small(80行未満)、medium(80-250行)、large(250行以上)
65
+ 6. 既存スキルとの相互参照を特定(Glob: `.claude/skills/*/SKILL.md`, `~/.claude/skills/*/SKILL.md`)
41
66
 
42
67
  ### Step 2: 最適化済みコンテンツの生成
43
68
 
44
69
  優先度順に変換を適用(P1 → P2 → P3):
45
70
 
46
- 1. **BP-001**: 否定形の指示を全て肯定形に変換
71
+ 1. **BP-001**: 否定形の指示を肯定形に変換。**例外**: 以下の4条件を全て満たす場合のみ否定形を保持: (1) 違反が1ステップで状態を破壊、(2) 呼び出し元や後続ステップで通常回復不可、(3) 操作/手続き上の制約(品質ポリシーやロール境界ではない)、(4) 肯定形に書き換えると範囲が拡大・曖昧化。境界例はskill-optimization SKILL.md BP-001を参照。
47
72
  2. **BP-002**: 曖昧な表現を測定可能な基準に置換
48
73
  3. **BP-003**: プロセス/手順セクションに出力形式を追加
49
74
  4. **BP-004**: 標準セクション順序で構造化:
@@ -63,9 +88,12 @@ CLAUDE.mdの原則を適用しない独立したコンテキストを持ち、
63
88
  skill-optimizationのdescription指針を適用:
64
89
 
65
90
  - 三人称・動詞始まり
66
- - 使用場面を含める
67
- - 最大1024文字
68
- - テンプレート: `{対象}を{基準}で{動詞}。{使用場面}時に使用。`
91
+ - 200文字前後を目安(上限1024文字)
92
+ - テンプレート: `{対象}を{プロジェクト固有の基準/パターン}で{動詞}。{ユーザーがこの作業を依頼する際のフレーズ}時に使用。`
93
+ - descriptionは**トリガーメカニズム**であり、人間向けの要約ではない — エージェントはdescriptionとの一致でスキル呼び出しを判断する
94
+ - 入力の**ユーザーフレーズ**を必ず組み込む(チームがこの作業をどう依頼するか)
95
+ - 入力の**プロジェクト固有の価値**を必ず組み込む(このプロジェクト固有の用語、クラス名、パターン)
96
+ - description品質チェックリスト(creation-guide.md参照)に合格すること
69
97
 
70
98
  ### Step 4: 分割判定
71
99
 
@@ -82,12 +110,49 @@ description: {生成したdescription}
82
110
  ---
83
111
  ```
84
112
 
113
+ ## modificationモード プロセス
114
+
115
+ ### Step 1: 既存コンテンツと変更要求の分析
116
+
117
+ 1. 既存SKILL.mdをセクション単位で解析(frontmatter、本文セクション、参照)
118
+ 2. 変更要求の影響を受けるセクションを特定
119
+ 3. 現状レビューが提供されている場合、変更に関連する既存問題を確認
120
+ 4. **情報検証**: 変更がドメイン知識やパターンに関わる場合、WebSearchで時間経過に伴う変化を検証。ユーザーの変更要求が優先。採用・却下を `researchFindings` に記録
121
+ 5. 既存スキルとの相互参照を確認(Glob: `.claude/skills/*/SKILL.md`, `~/.claude/skills/*/SKILL.md`)
122
+
123
+ ### Step 2: 対象を絞った変更の適用
124
+
125
+ 1. Step 1で特定したセクションのみ変更
126
+ 2. 影響を受けないセクションは内容・順序・書式をそのまま保持
127
+ 3. 変更セクションにのみBPパターン変換(P1 → P2 → P3)を適用
128
+ 4. 変更セクションが9つの編集原則に準拠しているか検証
129
+
130
+ ### Step 3: description更新判定
131
+
132
+ 変更がスキルのスコープやトリガーに影響するか評価:
133
+ - スコープ/トリガーが変更 → description指針に従い再生成
134
+ - 変更なし → 既存descriptionを保持
135
+
136
+ ### Step 4: 分割判定(該当する場合)
137
+
138
+ 変更によりコンテンツが400行を超える場合:
139
+ - 参照データを`references/`に抽出
140
+ - SKILL.md本体は250行以内
141
+
142
+ ### Step 5: 変更サマリーの作成
143
+
144
+ 変更ごとに記録:
145
+ - 変更セクション
146
+ - 変更内容と理由
147
+ - 適用したBPパターン(ある場合)
148
+
85
149
  ## 出力形式
86
150
 
87
151
  結果を構造化JSONで返却:
88
152
 
89
153
  ```json
90
154
  {
155
+ "mode": "creation|modification",
91
156
  "skillName": "...",
92
157
  "frontmatter": {
93
158
  "name": "...",
@@ -101,21 +166,21 @@ description: {生成したdescription}
101
166
  "issuesFound": [
102
167
  { "pattern": "BP-XXX", "severity": "P1/P2/P3", "location": "...", "transform": "..." }
103
168
  ],
169
+ "researchFindings": [],
104
170
  "lineCount": 0,
105
- "sizeCategory": "small|medium|large",
106
- "principlesApplied": ["1: コンテキスト効率", "..."]
171
+ "sizeCategory": "small|medium|large"
107
172
  },
108
- "metadata": {
109
- "tags": ["..."],
110
- "typicalUse": "...",
111
- "sections": ["..."],
112
- "keyReferences": ["..."]
113
- }
173
+ "changesSummary": []
114
174
  }
115
175
  ```
116
176
 
177
+ - **`changesSummary`**: creationモードでは空配列`[]`。modificationモードでのみ要素を格納
178
+ - **`researchFindings`**: 時間経過に伴う知識が関係しない場合は空配列`[]`。WebSearchを実行し知見がある場合のみ要素を格納
179
+
117
180
  ## 品質チェックリスト
118
181
 
182
+ ### 共通(両モード)
183
+
119
184
  - [ ] P1問題が全て解消されている(残存0件)
120
185
  - [ ] frontmatterのnameとdescriptionが存在し妥当
121
186
  - [ ] 標準セクション順序に従っている
@@ -124,9 +189,17 @@ description: {生成したdescription}
124
189
  - [ ] 全てのドメイン用語が定義済みまたは前提条件にリンク
125
190
  - [ ] 行数がサイズ目標内
126
191
 
127
- ## 出力セルフチェック
192
+ ### modificationモードのみ
193
+
194
+ - [ ] 影響を受けないセクションが内容・順序・書式ともに保持されている
195
+ - [ ] changesSummaryが全ての変更を網羅している
196
+ - [ ] 既存のBPパターン合格・編集原則合格に退行がない
197
+
198
+ ## 操作上の制約
128
199
 
129
- - [ ] 全てのドメイン知識が入力に由来している(創作していない)
130
- - [ ] ユーザー提供の具体例が保持または同等の代替で置換されている
131
- - [ ] スキルスコープが既存スキルの責務と重複していない
132
- - [ ] 出力はJSONのみでファイルを直接書き込んでいない(I/Oは呼び出し元が担当)
200
+ - 全てのドメイン知識を入力・ユーザー提供の成果物・検証済みWebSearch結果から取得する
201
+ - ユーザー提供の具体例は同等以上の代替でのみ置換する
202
+ - 生成前に既存スキルとのスコープ重複がないことを確認する
203
+ - JSONのみを返却する(ファイルI/Oは呼び出し元が担当)
204
+ - (modificationモード)変更要求に関連するセクションに変更を限定する
205
+ - (modificationモード)セクション単位の対象を絞った変更を適用し、影響を受けないセクションはそのまま保持する
@@ -1,7 +1,7 @@
1
1
  ---
2
2
  name: skill-reviewer
3
3
  description: スキルファイルの品質を最適化パターンと編集原則で評価。グレード・問題点・修正提案を含む構造化レポートを返却。スキル作成後や変更後の品質レビュー時に使用。
4
- tools: Read, Glob, LS, TaskCreate, TaskUpdate
4
+ tools: Read, Glob, LS, WebSearch, TaskCreate, TaskUpdate
5
5
  skills: skill-optimization, project-context
6
6
  ---
7
7
 
@@ -37,6 +37,10 @@ skill-optimizationの8つのBPパターンに対してスキャン:
37
37
  - 原文(そのまま引用)
38
38
  - 修正案(具体的な置換テキスト)
39
39
 
40
+ パターンを検出したが例外が適用される場合(例: BP-001否定形例外)、`patternIssues`ではなく`patternExceptions`に記録する。各例外について4条件を全て検証・記録する: (1) 1ステップでの状態破壊、(2) 呼び出し元や後続ステップで通常回復不可、(3) 操作上の制約であり品質ポリシーではない、(4) 肯定形では範囲が曖昧化。いずれかの条件を満たさない場合はpatternIssueに分類する。4条件の完全な定義と境界例はskill-optimization SKILL.md BP-001を参照。
41
+
42
+ **情報検証**: スキル内のAPI・SDK・フレームワークに関する記述についてWebSearchで最新性を検証する。これはLLMのカットオフ日以降の変更により的外れな指摘を防ぐためである。非推奨・廃止が判明した場合はP1問題として報告。
43
+
40
44
  ### Step 2: 編集原則の評価
41
45
 
42
46
  skill-optimizationの9つの編集原則に対して評価:
@@ -46,14 +50,26 @@ skill-optimizationの9つの編集原則に対して評価:
46
50
  - **部分的**: 原則を一部充足(不足点を明記)
47
51
  - **不合格**: 原則に違反(違反内容と修正案を明記)
48
52
 
49
- ### Step 3: スキル間整合性チェック
53
+ ### Step 3: Progressive Disclosure評価
54
+
55
+ 3階層の開示アーキテクチャを検証:
56
+
57
+ - **Tier 1(description)**: description品質チェックリスト(creation-guide.md参照)に合格するか
58
+ - プロジェクト固有の用語・クラス名・パターンを含むか
59
+ - ユーザーが実際に使うフレーズを使っているか
60
+ - ユーザーの意図にフォーカスしているか(スキル内部構造ではなく)
61
+ - 一般知識のみのスキルは不要の可能性を指摘
62
+ - **Tier 2(SKILL.md本文)**: 500行以下(理想250行)、最初の30行で概要把握可能、標準セクション順序、条件付きセクションにIF/WHENガード
63
+ - **Tier 3(参照・スクリプト)**: SKILL.mdから1階層のみ、400行超のSKILL.mdは分割必須
50
64
 
51
- 1. 既存スキルをGlob: `.claude/skills/*/SKILL.md`
65
+ ### Step 4: スキル間整合性チェック
66
+
67
+ 1. 既存スキルをGlob: `.claude/skills/*/SKILL.md`, `~/.claude/skills/*/SKILL.md`
52
68
  2. 既存スキルとのコンテンツ重複を確認
53
69
  3. スコープ境界が明示されているか検証
54
70
  4. 責務が隣接するスキルとの相互参照を確認
55
71
 
56
- ### Step 4: バランス評価
72
+ ### Step 5: バランス評価
57
73
 
58
74
  全体のバランスを評価:
59
75
 
@@ -81,6 +97,19 @@ skill-optimizationの9つの編集原則に対して評価:
81
97
  "suggestedFix": "置換テキスト"
82
98
  }
83
99
  ],
100
+ "patternExceptions": [
101
+ {
102
+ "pattern": "BP-XXX",
103
+ "location": "セクション見出し",
104
+ "original": "引用テキスト",
105
+ "conditions": {
106
+ "singleStepDestruction": "true|false + エビデンス",
107
+ "callerCannotRecover": "true|false + エビデンス",
108
+ "operationalNotPolicy": "true|false + エビデンス",
109
+ "positiveFormBlursScope": "true|false + エビデンス"
110
+ }
111
+ }
112
+ ],
84
113
  "principlesEvaluation": [
85
114
  {
86
115
  "principle": "1: コンテキスト効率",
@@ -88,6 +117,12 @@ skill-optimizationの9つの編集原則に対して評価:
88
117
  "detail": "合格以外の場合の説明"
89
118
  }
90
119
  ],
120
+ "progressiveDisclosure": {
121
+ "tier1": "pass|fail(description品質)",
122
+ "tier2": "pass|fail(本文構造)",
123
+ "tier3": "pass|fail(参照構成)",
124
+ "details": "問題がある場合の具体的な指摘"
125
+ },
91
126
  "crossSkillIssues": [
92
127
  {
93
128
  "overlappingSkill": "スキル名",
@@ -111,13 +146,25 @@ skill-optimizationの9つの編集原則に対して評価:
111
146
 
112
147
  | グレード | 基準 | 判定 |
113
148
  |----------|------|------|
114
- | A | P1問題0件、P2問題0件、原則8つ以上合格 | 即使用可 |
115
- | B | P1問題0件、P2問題2件以下、原則6つ以上合格 | 改善点を認識した上で使用可 |
116
- | C | P1問題あり、またはP2問題3件以上、または原則合格6未満 | 修正が必要 |
149
+ | A | P1問題0件、P2問題0件、原則8つ以上合格、Progressive Disclosure Tier 1合格 | 即使用可 |
150
+ | B | P1問題0件、P2問題2件以下、原則6つ以上合格、Progressive Disclosure Tier 1合格 | 改善点を認識した上で使用可 |
151
+ | C | P1問題あり、またはP2問題3件以上、または原則合格6未満、またはProgressive Disclosure Tier 1不合格 | 修正が必要 |
152
+
153
+ **Progressive Disclosureのグレードへの影響**: Tier 1(description品質)の不合格はグレードゲートとなる — descriptionが不適切だとスキルがトリガーされないため、A/Bを阻止する。Tier 2/3の不合格はactionItemsに報告するが、グレードは阻止しない。
154
+
155
+ ## レビューモード別の差異
156
+
157
+ | 観点 | creation | modification |
158
+ |------|----------|-------------|
159
+ | 対象範囲 | 全コンテンツを網羅的に | 変更箇所 + 退行チェック |
160
+ | BPスキャン | 全8パターン | 変更に関連するパターンに注力 |
161
+ | スキル間確認 | 全体の重複スキャン | 変更で重複が発生していないか |
162
+ | Progressive Disclosure | 全階層を評価 | 変更で開示構造が劣化していないか |
163
+ | 追加確認 | — | 変更スコープ外の問題は別途報告 |
117
164
 
118
- ## 出力セルフチェック
165
+ ## 操作上の制約
119
166
 
120
- - [ ] 出力はレポートのみでスキルコンテンツを直接変更していない
121
- - [ ] 全ての報告問題がBPパターンまたは9原則に基づいている
122
- - [ ] レビューモードに関わらず全P1問題が含まれている
123
- - [ ] P1問題が存在する場合にグレードAを付与していない
167
+ - レポートのみを返却する(コンテンツ編集は呼び出し元が担当)
168
+ - 全ての指摘を特定のBPパターン(BP-001〜BP-008)または9つの編集原則のいずれかに基づいて行う
169
+ - 全レビューモードで全P1問題を評価する
170
+ - P1問題が0件の場合のみグレードAを判定する
@@ -12,26 +12,49 @@ Register the following steps with TaskCreate and proceed systematically.
12
12
 
13
13
  ### Step 1: Pre-flight Check
14
14
 
15
- 1. Glob existing skills: `.claude/skills/*/SKILL.md`
15
+ 1. Glob existing skills: `.claude/skills/*/SKILL.md`, `~/.claude/skills/*/SKILL.md`
16
16
  2. If `$ARGUMENTS` matches an existing skill name: suggest `/refine-skill` instead and stop
17
17
  3. List existing skill names for user awareness
18
18
 
19
19
  ### Step 2: Collect Skill Knowledge
20
20
 
21
- Use AskUserQuestion to collect information in 3 rounds.
21
+ Use AskUserQuestion to collect information in 4 rounds.
22
22
 
23
23
  **Round 1: Skill Essence**
24
24
  - What domain knowledge does this skill encode? (1-2 sentences)
25
25
  - What is the primary goal when this skill is applied? (e.g., "ensure type safety", "standardize test patterns")
26
26
 
27
- **Round 2: Scope and Triggers**
27
+ **Round 2: Project-Specific Value**
28
+
29
+ Verify whether the proposed skill adds value beyond the LLM's baseline knowledge.
30
+
31
+ - What project-specific rules, patterns, class names, or workflows does this skill encode that the LLM would not know from general training?
32
+ - Provide concrete examples (e.g., specific error classes, team conventions, file patterns in this codebase)
33
+
34
+ | User response | Action |
35
+ |---------------|--------|
36
+ | Provides project-specific details | Incorporate into skill content. Proceed to Round 3. |
37
+ | Describes only general knowledge | Warn: "A skill containing only general knowledge is unlikely to trigger at runtime." Offer: (A) identify project-specific aspects to add, (B) proceed with the understanding that the skill may not trigger reliably |
38
+
39
+ **Round 3: Scope, Triggers, and User Phrases**
28
40
  - When should this skill be activated? List 3-5 concrete scenarios (e.g., "when writing unit tests", "when reviewing PR for security")
29
41
  - What does this skill explicitly NOT cover? (scope boundary)
42
+ - What phrases does your team actually use when requesting this kind of work? (e.g., "add error handling to X", "review the catch blocks", "fix the retry logic")
43
+
44
+ Classify collected phrases into two categories:
45
+
46
+ | Category | Definition | Example |
47
+ |----------|-----------|---------|
48
+ | **skill-dependent** | Cannot be completed correctly without the skill's knowledge | "implement retry logic", "review error handling" |
49
+ | **pattern-copyable** | Can be completed by reading and copying existing code patterns | "add a fetchXxx function" |
50
+
51
+ If all phrases are pattern-copyable: "These tasks can be completed by copying existing code. Can you provide a scenario that requires the hidden rules this skill encodes?" Ensure at least 1 skill-dependent phrase exists before proceeding.
30
52
 
31
- **Round 3: Decision Criteria and Content**
53
+ **Round 4: Decision Criteria and Evidence**
32
54
  - What are the concrete rules or criteria? (the core knowledge to encode)
33
55
  - Any examples of good/bad patterns?
34
56
  - Any external references or standards this skill is based on?
57
+ - Practical artifacts: "Do you have any existing files, past failures, PRs, or conversation logs that demonstrate these patterns?" (these ground the skill in real-world usage)
35
58
 
36
59
  ### Step 3: Determine Name and Structure
37
60
 
@@ -43,11 +66,15 @@ Use AskUserQuestion to collect information in 3 rounds.
43
66
  ### Step 4: Generate Skill Content
44
67
 
45
68
  Invoke skill-creator agent via Agent tool with collected information:
46
- - Raw knowledge from Round 3
47
- - Skill name from Step 3
48
- - Trigger scenarios from Round 2
49
- - Scope from Round 2
50
- - Decision criteria from Round 3
69
+ - Mode: creation
70
+ - Skill name: from Step 3
71
+ - Raw knowledge: from Round 4
72
+ - Trigger scenarios: from Round 3
73
+ - User phrases: from Round 3 (both skill-dependent and pattern-copyable)
74
+ - Scope: from Round 3
75
+ - Decision criteria: from Round 4
76
+ - Project-specific value: from Round 2
77
+ - Practical artifacts: from Round 4 (if provided)
51
78
 
52
79
  ### Step 5: Review Generated Content
53
80
 
@@ -63,13 +90,14 @@ If grade A or B: proceed to Step 6.
63
90
  1. Present generated SKILL.md content to user for final approval
64
91
  2. Confirm user intent alignment: "Does this skill capture the knowledge and criteria you described?"
65
92
  3. If revision requested: apply changes and re-run skill-reviewer
66
- 3. Upon approval, write to `.claude/skills/{name}/SKILL.md`
67
- 4. Suggest running `/sync-skills` to update metadata and language variants
93
+ 4. Upon approval, write to `.claude/skills/{name}/SKILL.md`
94
+ 5. Suggest running `/sync-skills` to update metadata and language variants
68
95
 
69
96
  ## Completion Criteria
70
97
 
71
98
  - [ ] No naming conflict with existing skills
72
- - [ ] Skill knowledge collected through 3 rounds of dialog
99
+ - [ ] Project-specific value validated in Round 2
100
+ - [ ] User phrases collected and classified (at least 1 skill-dependent)
73
101
  - [ ] Skill name confirmed by user
74
102
  - [ ] skill-creator agent returned valid JSON output
75
103
  - [ ] skill-reviewer agent returned grade A or B
@@ -82,7 +110,7 @@ If grade A or B: proceed to Step 6.
82
110
  | Error | Action |
83
111
  |-------|--------|
84
112
  | Skill name already exists | Suggest `/refine-skill {name}` instead |
85
- | Insufficient knowledge after 3 rounds | Ask targeted follow-up (max 2 additional questions) |
113
+ | Insufficient knowledge after 4 rounds | Ask targeted follow-up (max 2 additional questions) |
86
114
  | skill-creator returns invalid JSON | Retry once with simplified input |
87
115
  | Grade C after 2 review iterations | Present current content with issues list, let user decide |
88
116
  | User rejects generated content | Collect specific feedback, re-run skill-creator with adjustments |
@@ -2,7 +2,7 @@
2
2
  description: Implement user skill change requests with optimization pattern evaluation
3
3
  ---
4
4
 
5
- **Command Context**: Workflow for understanding skill file change requests and implementing with quality-assured optimization.
5
+ **Command Context**: Workflow for understanding skill file change requests and implementing via skill-creator (modification mode) with quality-assured optimization.
6
6
 
7
7
  Change request: $ARGUMENTS
8
8
 
@@ -18,11 +18,17 @@ If unspecified, use AskUserQuestion to clarify:
18
18
  - Specific changes
19
19
 
20
20
  Target file identification:
21
- - Skill name provided → Read: `.claude/skills/{skill-name}/SKILL.md`
22
- - Partial name known → Glob: `.claude/skills/*{keyword}*/SKILL.md`
23
- - Unknown → Glob: `.claude/skills/*/SKILL.md` for full scan → Confirm selection with user
21
+ - Skill name provided → Read: `.claude/skills/{skill-name}/SKILL.md` (also check `~/.claude/skills/`)
22
+ - Partial name known → Glob: `.claude/skills/*{keyword}*/SKILL.md`, `~/.claude/skills/*{keyword}*/SKILL.md`
23
+ - Unknown → Glob: `.claude/skills/*/SKILL.md`, `~/.claude/skills/*/SKILL.md` for full scan → Confirm selection with user
24
24
 
25
- ### Step 2: Create Design Proposal
25
+ ### Step 2: Collect User Phrases (optional)
26
+
27
+ Collect phrases the team actually uses when requesting this kind of work:
28
+ - Required if the change affects description or scope
29
+ - Can be skipped for minor criteria modifications
30
+
31
+ ### Step 3: Create Design Proposal
26
32
 
27
33
  Present before/after comparison of current state and proposed change:
28
34
 
@@ -44,31 +50,48 @@ Proceed with this design? (y/n)
44
50
  - Deduplication: verify no overlap with other skill files
45
51
  - Scope boundaries: confirm changes stay within this skill's responsibility
46
52
 
47
- ### Step 3: Quality Review
53
+ ### Step 4: Execute Changes via skill-creator
54
+
55
+ Invoke skill-creator agent via Agent tool in modification mode:
56
+
57
+ ```
58
+ subagent_type: skill-creator
59
+ prompt: |
60
+ Mode: modification
61
+ Skill name: {target skill name}
62
+ Existing content: {current full SKILL.md content}
63
+ Modification request: {approved change content from Step 3}
64
+ ```
65
+
66
+ Review the changesSummary returned by skill-creator to verify changes match intent.
67
+
68
+ ### Step 5: Quality Review
48
69
 
49
70
  Invoke skill-reviewer agent via Agent tool:
50
- - Pass the modified SKILL.md content
71
+ - Pass the modified SKILL.md content assembled from skill-creator output
51
72
  - Review mode: `modification`
52
73
 
53
74
  **Review outcome handling:**
54
- - Grade A or B: proceed to Step 4
55
- - Grade C: revise changes based on reviewer's action items and re-review (max 2 iterations)
75
+ - Grade A or B: proceed to Step 6
76
+ - Grade C: re-invoke skill-creator with reviewer's `actionItems` and `patternIssues` to fix (max 2 iterations)
56
77
  - Reviewer identifies issues outside the change scope: report to user as separate improvement opportunities
57
78
 
58
- ### Step 4: Approval and Implementation
79
+ ### Step 6: Approval and Implementation
59
80
 
60
81
  1. Present before/after comparison to user and obtain approval
61
82
  2. Include skill-reviewer's grade and any remaining action items
62
- 3. Confirm user intent alignment: "Do the changes achieve what you originally requested?"
63
- 4. Apply changes with appropriate tool
64
- 4. Verify with git diff
65
- 5. If reviewer flagged issues outside change scope, list them as optional follow-ups
66
- 6. Suggest `/sync-skills` execution
83
+ 3. Present skill-creator's changesSummary
84
+ 4. Confirm user intent alignment: "Do the changes achieve what you originally requested?"
85
+ 5. Apply changes with appropriate tool
86
+ 6. Verify with git diff
87
+ 7. If reviewer flagged issues outside change scope, list them as optional follow-ups
88
+ 8. Suggest `/sync-skills` execution
67
89
 
68
90
  ## Completion Criteria
69
91
 
70
92
  - [ ] Identified target skill and understood current state
71
93
  - [ ] Reviewed design proposal against skill-optimization editing principles
94
+ - [ ] Executed changes via skill-creator (modification mode)
72
95
  - [ ] skill-reviewer returned grade A or B
73
96
  - [ ] Obtained user approval
74
97
  - [ ] Applied changes and verified with git diff
@@ -82,6 +105,6 @@ Invoke skill-reviewer agent via Agent tool:
82
105
  | Large change detected (50%+ of file) | Suggest phased implementation |
83
106
  | Responsibility overlap with other skills | Confirm boundaries and defer to user judgment |
84
107
  | Grade C after 2 review iterations | Present changes with issues list, let user decide |
85
- | Reviewer identifies regression | Revert specific change causing regression, re-review |
108
+ | Reviewer identifies regression | Revert specific change causing regression, re-invoke skill-creator |
86
109
 
87
- **Scope**: Understanding user change requests and implementing with quality-assured optimization. Quality evaluation delegated to skill-reviewer agent. Metadata sync through /sync-skills.
110
+ **Scope**: Understanding user change requests and implementing with quality-assured optimization. Change execution delegated to skill-creator (modification mode). Quality evaluation delegated to skill-reviewer agent. Metadata sync through /sync-skills.
@@ -12,26 +12,49 @@ description: 対話的にユーザーの知識を収集し、最適化された
12
12
 
13
13
  ### Step 1: 事前確認
14
14
 
15
- 1. 既存スキルをGlob: `.claude/skills/*/SKILL.md`
15
+ 1. 既存スキルをGlob: `.claude/skills/*/SKILL.md`, `~/.claude/skills/*/SKILL.md`
16
16
  2. `$ARGUMENTS`が既存スキル名と一致する場合: `/refine-skill`を提案して終了
17
17
  3. 既存スキル名の一覧をユーザーに提示
18
18
 
19
19
  ### Step 2: スキル知識の収集
20
20
 
21
- AskUserQuestionで3ラウンドに分けて情報を収集する。
21
+ AskUserQuestionで4ラウンドに分けて情報を収集する。
22
22
 
23
23
  **ラウンド1: スキルの本質**
24
24
  - このスキルはどのドメイン知識を体系化するか?(1-2文)
25
25
  - スキル適用時の主な目的は?(例: 「型安全性の確保」「テストパターンの標準化」)
26
26
 
27
- **ラウンド2: スコープと使用場面**
27
+ **ラウンド2: プロジェクト固有の価値**
28
+
29
+ LLMのベースライン知識を超える価値があるかを検証する。
30
+
31
+ - このスキルが体系化するプロジェクト固有のルール・パターン・クラス名・ワークフローは何か?
32
+ - 具体例を提示する(例: 特定のエラークラス、チーム規約、このコードベース固有のファイルパターン)
33
+
34
+ | ユーザー回答 | アクション |
35
+ |-------------|-----------|
36
+ | プロジェクト固有の詳細を提供 | スキルコンテンツに組み込む。ラウンド3へ。 |
37
+ | 一般知識のみ記述 | 「一般知識のみのスキルは実行時にトリガーされにくい」旨を警告。選択肢を提示: (A) プロジェクト固有の要素を特定する (B) トリガーされにくい可能性を理解した上で進める |
38
+
39
+ **ラウンド3: スコープ、使用場面、ユーザーフレーズ**
28
40
  - どのような場面でこのスキルを有効化すべきか? 具体的なシナリオを3-5個(例: 「ユニットテスト作成時」「セキュリティ観点でのPRレビュー時」)
29
41
  - このスキルが明示的に扱わない範囲は?(スコープ境界)
42
+ - チームがこの作業を依頼する際に実際に使うフレーズは?(例: 「エラーハンドリング追加して」「リトライロジック見て」「キャッチブロックレビューして」)
43
+
44
+ 収集したフレーズを2カテゴリに分類:
45
+
46
+ | カテゴリ | 定義 | 例 |
47
+ |----------|------|-----|
48
+ | **skill-dependent** | スキルの知識なしでは正しく完了できない | 「リトライロジック実装して」「エラーハンドリングレビューして」 |
49
+ | **pattern-copyable** | 既存コードのコピーで完了可能 | 「fetchXxx関数を追加して」 |
50
+
51
+ 全てpattern-copyableの場合: 「これらの作業は既存コードのコピーで完了できます。このスキルが体系化する隠れたルールが必要なシナリオを提供できますか?」と確認し、少なくとも1つのskill-dependentフレーズを確保する。
30
52
 
31
- **ラウンド3: 判断基準とコンテンツ**
53
+ **ラウンド4: 判断基準とエビデンス**
32
54
  - 具体的なルールや基準は?(体系化すべき中核知識)
33
55
  - 良い/悪いパターンの具体例は?
34
56
  - このスキルが準拠する外部参照や標準は?
57
+ - 実践的成果物: 「これらのパターンを実証する既存ファイル、過去の障害例、PR、会話ログはありますか?」(実際の使用に基づいてスキルを根拠付ける)
35
58
 
36
59
  ### Step 3: スキル名と構造の決定
37
60
 
@@ -42,16 +65,20 @@ AskUserQuestionで3ラウンドに分けて情報を収集する。
42
65
 
43
66
  ### Step 4: スキルコンテンツの生成
44
67
 
45
- 収集した情報を渡してskill-creatorエージェントをAgentツールで起動:
46
- - ラウンド3の生の知識
47
- - Step 3のスキル名
48
- - ラウンド2の使用場面
49
- - ラウンド2のスコープ
50
- - ラウンド3の判断基準
68
+ 収集した情報を渡してskill-creatorエージェントをAgent toolで起動:
69
+ - Mode: creation
70
+ - Skill name: Step 3のスキル名
71
+ - Raw knowledge: ラウンド4の生の知識
72
+ - Trigger scenarios: ラウンド3の使用場面
73
+ - User phrases: ラウンド3のユーザーフレーズ(skill-dependentとpattern-copyable両方)
74
+ - Scope: ラウンド3のスコープ
75
+ - Decision criteria: ラウンド4の判断基準
76
+ - Project-specific value: ラウンド2のプロジェクト固有の価値
77
+ - Practical artifacts: ラウンド4の実践的成果物(提供された場合)
51
78
 
52
79
  ### Step 5: 生成コンテンツのレビュー
53
80
 
54
- skill-reviewerエージェントをAgentツールで起動:
81
+ skill-reviewerエージェントをAgent toolで起動:
55
82
  - skill-creatorの生成コンテンツを渡す
56
83
  - レビューモード: `creation`
57
84
 
@@ -69,7 +96,8 @@ skill-reviewerエージェントをAgentツールで起動:
69
96
  ## 完了条件
70
97
 
71
98
  - [ ] 既存スキルとの名前衝突がない
72
- - [ ] 3ラウンドの対話でスキル知識を収集済み
99
+ - [ ] プロジェクト固有の価値をラウンド2で検証済み
100
+ - [ ] ユーザーフレーズを収集・分類済み(少なくとも1つのskill-dependent)
73
101
  - [ ] スキル名をユーザーが確認済み
74
102
  - [ ] skill-creatorが有効なJSON出力を返却
75
103
  - [ ] skill-reviewerがグレードAまたはBを返却
@@ -82,7 +110,7 @@ skill-reviewerエージェントをAgentツールで起動:
82
110
  | エラー | アクション |
83
111
  |--------|-----------|
84
112
  | スキル名が既存と重複 | `/refine-skill {スキル名}`を提案 |
85
- | 3ラウンドで知識が不足 | 対象を絞った追加質問(最大2問) |
113
+ | 4ラウンドで知識が不足 | 対象を絞った追加質問(最大2問) |
86
114
  | skill-creatorが無効なJSONを返却 | 入力を簡素化して1回再試行 |
87
115
  | 2回のレビューでもグレードC | 現在の内容と問題リストを提示し、ユーザーに判断を委ねる |
88
116
  | ユーザーが生成内容を却下 | 具体的なフィードバックを収集し、調整してskill-creatorを再実行 |
@@ -2,7 +2,7 @@
2
2
  description: ユーザーのスキル変更要求を最適化パターン評価付きで実装
3
3
  ---
4
4
 
5
- **コマンドコンテキスト**: スキルファイルの変更要求を理解し、品質評価を伴う最適化で実装するワークフロー。
5
+ **コマンドコンテキスト**: スキルファイルの変更要求を理解し、skill-creator(modificationモード)による品質評価付き実装ワークフロー。
6
6
 
7
7
  変更要求: $ARGUMENTS
8
8
 
@@ -18,11 +18,17 @@ description: ユーザーのスキル変更要求を最適化パターン評価
18
18
  - 具体的な変更内容
19
19
 
20
20
  対象ファイル特定:
21
- - スキル名が明示 → Read: `.claude/skills/{スキル名}/SKILL.md`
22
- - 部分的に判明 → Glob: `.claude/skills/*{キーワード}*/SKILL.md`
23
- - 不明 → Glob: `.claude/skills/*/SKILL.md` で全件確認 → ユーザーに選択
21
+ - スキル名が明示 → Read: `.claude/skills/{スキル名}/SKILL.md`(`~/.claude/skills/`も確認)
22
+ - 部分的に判明 → Glob: `.claude/skills/*{キーワード}*/SKILL.md`, `~/.claude/skills/*{キーワード}*/SKILL.md`
23
+ - 不明 → Glob: `.claude/skills/*/SKILL.md`, `~/.claude/skills/*/SKILL.md` で全件確認 → ユーザーに選択
24
24
 
25
- ### Step 2: 変更設計案の作成
25
+ ### Step 2: ユーザーフレーズの収集(任意)
26
+
27
+ チームがこの作業を依頼する際に実際に使うフレーズを確認:
28
+ - 変更がdescriptionやスコープに影響する場合は必須
29
+ - 軽微な基準修正の場合は省略可
30
+
31
+ ### Step 3: 変更設計案の作成
26
32
 
27
33
  現状と変更案のbefore/afterを提示:
28
34
 
@@ -44,31 +50,48 @@ description: ユーザーのスキル変更要求を最適化パターン評価
44
50
  - 重複排除: 他スキルファイルとの重複がないか
45
51
  - スコープ境界: 変更内容がこのスキルの責務範囲内か
46
52
 
47
- ### Step 3: 品質レビュー
53
+ ### Step 4: skill-creatorによる変更実行
54
+
55
+ skill-creatorエージェントをAgent toolでmodificationモードとして起動:
56
+
57
+ ```
58
+ subagent_type: skill-creator
59
+ prompt: |
60
+ Mode: modification
61
+ Skill name: {対象スキル名}
62
+ Existing content: {現在のSKILL.md全文}
63
+ Modification request: {Step 3で承認された変更内容}
64
+ ```
65
+
66
+ skill-creatorが返すchangesSummaryを確認し、変更内容が意図通りか検証。
67
+
68
+ ### Step 5: 品質レビュー
48
69
 
49
- skill-reviewerエージェントをAgentツールで起動:
50
- - 変更後のSKILL.md全文を渡す
70
+ skill-reviewerエージェントをAgent toolで起動:
71
+ - skill-creatorの出力を組み立てたSKILL.md全文を渡す
51
72
  - レビューモード: `modification`
52
73
 
53
74
  **レビュー結果の処理:**
54
- - グレードAまたはB: Step 4へ進行
55
- - グレードC: reviewerの修正提案に基づき修正し再レビュー(最大2回)
75
+ - グレードAまたはB: Step 6へ進行
76
+ - グレードC: skill-creatorをreviewerのactionItemsとpatternIssues付きで再起動し修正(最大2回)
56
77
  - 変更スコープ外の問題を検出: 別の改善機会としてユーザーに報告
57
78
 
58
- ### Step 4: 承認取得と実装
79
+ ### Step 6: 承認取得と実装
59
80
 
60
81
  1. 変更前後の比較をユーザーに提示し承認を取得
61
82
  2. skill-reviewerのグレードと残存する修正提案を提示
62
- 3. 意図の整合性を確認: 「この変更は当初の要求を正しく反映していますか?」
63
- 4. 適切なツールで変更適用
64
- 5. git diffで変更内容を最終確認
65
- 6. 変更スコープ外の問題があれば、任意の改善事項として提示
66
- 7. `/sync-skills`実行を提案
83
+ 3. skill-creatorのchangesSummaryを提示
84
+ 4. 意図の整合性を確認: 「この変更は当初の要求を正しく反映していますか?」
85
+ 5. 適切なツールで変更適用
86
+ 6. git diffで変更内容を最終確認
87
+ 7. 変更スコープ外の問題があれば、任意の改善事項として提示
88
+ 8. `/sync-skills`実行を提案
67
89
 
68
90
  ## 完了条件
69
91
 
70
92
  - [ ] 対象スキルを特定し現状を把握した
71
93
  - [ ] skill-optimizationの編集原則に照らして設計案をレビューした
94
+ - [ ] skill-creator(modificationモード)で変更を実行した
72
95
  - [ ] skill-reviewerがグレードAまたはBを返却した
73
96
  - [ ] ユーザー承認を取得した
74
97
  - [ ] 変更を適用しgit diffで確認した
@@ -82,6 +105,6 @@ skill-reviewerエージェントをAgentツールで起動:
82
105
  | 大規模変更検出(ファイルの50%以上) | 段階的実施を提案 |
83
106
  | 他スキルとの責務重複 | 責務境界を確認しユーザーに判断を委ねる |
84
107
  | 2回のレビューでもグレードC | 変更内容と問題リストを提示し、ユーザーに判断を委ねる |
85
- | reviewerが退行を検出 | 退行原因の変更を取り消し、再レビュー |
108
+ | reviewerが退行を検出 | 退行原因の変更を取り消し、skill-creatorを再起動 |
86
109
 
87
- **スコープ**: ユーザーの変更要求理解と品質評価付き最適化実装。品質評価はskill-reviewerエージェントに委譲。メタデータ同期は/sync-skills連携。
110
+ **スコープ**: ユーザーの変更要求理解と品質評価付き最適化実装。変更実行はskill-creator(modificationモード)に委譲。品質評価はskill-reviewerエージェントに委譲。メタデータ同期は/sync-skills連携。
@@ -1,6 +1,6 @@
1
1
  ---
2
2
  name: skill-optimization
3
- description: Evaluates and optimizes skill file quality. Use when creating skills, refining skill content, or auditing skill quality.
3
+ description: Evaluates and optimizes skill file quality using 8 content patterns and 9 editing principles. Use when creating skills, refining skill content, or auditing skill quality.
4
4
  ---
5
5
 
6
6
  # Skill Content Optimization
@@ -21,7 +21,13 @@ Issues that directly reduce LLM execution accuracy when consuming the skill.
21
21
 
22
22
  | Detection | Transform |
23
23
  |-----------|-----------|
24
- | "don't", "do not", "never", "avoid" in skill instructions | Reframe as positive directive with equivalent constraint |
24
+ | "don't", "do not", "never", "avoid" in skill instructions | Reframe as positive directive with equivalent constraint. **Exception**: Negative form is permitted only when ALL 4 conditions are met: (1) violation destroys state in a single step, (2) caller or subsequent steps cannot normally recover, (3) the constraint is operational/procedural, not a quality policy or role boundary, (4) positive rewording would expand or blur the target scope. If any condition is not met, rewrite in positive form. |
25
+
26
+ **Exception boundary examples**:
27
+ - Permitted: "Do not modify the command", "Do not add flags", "Do not execute destructive operations"
28
+ - Rewrite in positive form: "Do not invent issues" → "Base every issue on BP patterns or 9 principles", "Do not skip P1 issues" → "Evaluate all P1 issues in every review mode", "Do not give grade A when P1 exists" → "Assign grade A only when P1 count is zero"
29
+
30
+ Quality policies, role boundaries, scoring criteria, and general work rules always use positive form. Outputs that the caller validates, overwrites, or discards are never irreversible.
25
31
 
26
32
  **Skill example:**
27
33
  - Before: "Don't use generic variable names"
@@ -48,7 +48,15 @@ For skill frontmatter `description` field:
48
48
  | Specific over generic | "Applies 8 content patterns" not "Improves quality" |
49
49
  | No implementation details | Describe what it does, not how |
50
50
 
51
- **Template**: `{Verb}s {what} against {criteria}. Use when {trigger scenarios}.`
51
+ **Core principle**: The description is the agent's **trigger mechanism**, not a summary for humans. Agents only consult skills for tasks requiring knowledge beyond their baseline capabilities. The description must convey why this skill adds value the agent lacks.
52
+
53
+ **Template**: `{Verb}s {what} using {project-specific criteria/patterns}. Use when {user phrases that trigger this skill}.`
54
+
55
+ **Description quality checklist**:
56
+ - [ ] Contains project-specific terms, class names, or patterns (differentiates from general LLM knowledge)
57
+ - [ ] Uses phrases users actually say (e.g., "add tests", "review error handling")
58
+ - [ ] Focuses on user intent (not skill internal mechanics)
59
+ - [ ] Skills consisting only of general knowledge may be unnecessary — verify project-specific content is present
52
60
 
53
61
  ## Split Decision
54
62
 
@@ -16,7 +16,17 @@ Criteria for evaluating existing or generated skill content quality.
16
16
 
17
17
  **Output**: Issue list with severity, location, and original text per finding.
18
18
 
19
- ### Step 2: Evaluate and Grade
19
+ ### Step 2: Progressive Disclosure Evaluation
20
+
21
+ Verify the 3-tier disclosure architecture:
22
+
23
+ | Tier | Target | Verification |
24
+ |------|--------|-------------|
25
+ | Tier 1 | description | Passes the description quality checklist (see creation-guide.md) |
26
+ | Tier 2 | SKILL.md body | Under 500 lines (ideal: 250), first 30 lines convey overview, standard section order, conditional sections use IF/WHEN guards |
27
+ | Tier 3 | References/scripts | One level deep from SKILL.md only, SKILL.md over 400 lines must be split |
28
+
29
+ ### Step 3: Evaluate and Grade
20
30
 
21
31
  **Input**: Issue list + skill content
22
32
 
@@ -37,9 +47,9 @@ Criteria for evaluating existing or generated skill content quality.
37
47
 
38
48
  | Grade | Criteria | Recommendation |
39
49
  |-------|----------|----------------|
40
- | A | 0 P1, 0 P2 issues, 8+ principles pass | Ready for use |
41
- | B | 0 P1, ≤2 P2 issues, 6+ principles pass | Acceptable with noted improvements |
42
- | C | Any P1 OR >2 P2 OR <6 principles pass | Revision required |
50
+ | A | 0 P1, 0 P2 issues, 8+ principles pass, Tier 1 pass | Ready for use |
51
+ | B | 0 P1, ≤2 P2 issues, 6+ principles pass, Tier 1 pass | Acceptable with noted improvements |
52
+ | C | Any P1 OR >2 P2 OR <6 principles pass OR Tier 1 fail | Revision required |
43
53
 
44
54
  ## Review Mode Differences
45
55
 
@@ -1,6 +1,6 @@
1
1
  ---
2
2
  name: skill-optimization
3
- description: スキルファイルの品質を評価・最適化。スキル作成、内容改善、品質評価時に使用。
3
+ description: スキルファイルの品質を8つのコンテンツパターンと9つの編集原則で評価・最適化。スキル作成、内容改善、品質監査時に使用。
4
4
  ---
5
5
 
6
6
  # スキルコンテンツ最適化
@@ -21,7 +21,13 @@ description: スキルファイルの品質を評価・最適化。スキル作
21
21
 
22
22
  | 検出条件 | 変換方法 |
23
23
  |----------|----------|
24
- | 「〜しない」「〜を避ける」「禁止」等の否定形指示 | 同等の制約を持つ肯定形の指示に変換 |
24
+ | 「〜しない」「〜を避ける」「禁止」等の否定形指示 | 同等の制約を持つ肯定形の指示に変換。**例外**: 以下の4条件を**全て**満たす場合のみ否定形を保持: (1) 違反が1ステップで状態を破壊する、(2) 呼び出し元や後続ステップで通常回復できない、(3) 品質ポリシーやロール境界ではなく操作/手続き上の制約である、(4) 肯定形に書き換えると対象範囲が拡大・曖昧化する。いずれか1つでも満たさない場合は肯定形に書き換える。 |
25
+
26
+ **例外の境界例**:
27
+ - 許容: 「コマンドを変更しない」「フラグを追加しない」「破壊的操作を実行しない」
28
+ - 肯定形に書き換え: 「問題を捏造しない」→「全ての指摘をBPパターンまたは9原則に基づいて行う」、「P1問題を省略しない」→「全レビューモードで全P1問題を評価する」、「P1がある時にグレードAを付与しない」→「P1問題が0件の場合のみグレードAを判定する」
29
+
30
+ 品質ポリシー、ロール境界、採点基準、一般的な作業ルールは常に肯定形を使用する。呼び出し元が検証・上書き・破棄する出力は不可逆ではない。
25
31
 
26
32
  **スキルでの例:**
27
33
  - 変更前: 「汎用的な変数名を使わないこと」
@@ -40,6 +40,8 @@
40
40
 
41
41
  スキルのfrontmatter `description`フィールド向け:
42
42
 
43
+ **基本原則**: descriptionはエージェントの**トリガーメカニズム**であり、人間向けの要約ではない。エージェントはベースライン能力を超える知識が必要なタスクにのみスキルを参照する。descriptionは、このスキルがエージェントにない価値を提供する理由を伝える必要がある。
44
+
43
45
  | ルール | 例 |
44
46
  |--------|-----|
45
47
  | 三人称・動詞始まり | 「コード品質を検査。」(「このスキルは〜」としない) |
@@ -48,7 +50,13 @@
48
50
  | 具体的に記述 | 「8つのコンテンツパターンを適用」(「品質を改善」としない) |
49
51
  | 実装詳細を含めない | 何をするかを記述し、どうやるかは記述しない |
50
52
 
51
- **テンプレート**: `{対象}を{基準}で{動詞}。{使用場面}時に使用。`
53
+ **テンプレート**: `{対象}を{プロジェクト固有の基準/パターン}で{動詞}。{ユーザーがこの作業を依頼する際のフレーズ}時に使用。`
54
+
55
+ **description品質チェックリスト**:
56
+ - [ ] プロジェクト固有の用語・クラス名・パターンを含む(一般LLM知識と差別化)
57
+ - [ ] ユーザーが実際に使うフレーズを含む(「テスト追加して」「エラーハンドリング見て」等)
58
+ - [ ] ユーザーの意図にフォーカスしている(スキル内部構造の説明ではなく)
59
+ - [ ] 一般知識のみで構成されたスキルは不要の可能性がある — プロジェクト固有の内容が含まれているか確認
52
60
 
53
61
  ## 分割判定
54
62
 
@@ -16,7 +16,17 @@
16
16
 
17
17
  **出力**: 重大度・該当箇所・原文を含む検出リスト。
18
18
 
19
- ### Step 2: 評価とグレード判定
19
+ ### Step 2: Progressive Disclosure評価
20
+
21
+ 3階層の開示アーキテクチャを検証:
22
+
23
+ | 階層 | 対象 | 検証項目 |
24
+ |------|------|----------|
25
+ | Tier 1 | description | description品質チェックリスト(creation-guide.md参照)に合格するか |
26
+ | Tier 2 | SKILL.md本文 | 500行以下(理想250行)、最初の30行で概要把握可能、標準セクション順序、条件付きセクションにIF/WHENガード |
27
+ | Tier 3 | 参照・スクリプト | SKILL.mdから1階層のみ、400行超のSKILL.mdは分割必須 |
28
+
29
+ ### Step 3: 評価とグレード判定
20
30
 
21
31
  **入力**: 検出リスト + スキルコンテンツ
22
32
 
@@ -37,9 +47,9 @@
37
47
 
38
48
  | グレード | 基準 | 判定 |
39
49
  |----------|------|------|
40
- | A | P1問題0件、P2問題0件、原則8つ以上合格 | 即使用可 |
41
- | B | P1問題0件、P2問題2件以下、原則6つ以上合格 | 改善点を認識した上で使用可 |
42
- | C | P1問題あり、またはP2問題3件以上、または原則合格6未満 | 修正が必要 |
50
+ | A | P1問題0件、P2問題0件、原則8つ以上合格、Tier 1合格 | 即使用可 |
51
+ | B | P1問題0件、P2問題2件以下、原則6つ以上合格、Tier 1合格 | 改善点を認識した上で使用可 |
52
+ | C | P1問題あり、またはP2問題3件以上、または原則合格6未満、またはTier 1不合格 | 修正が必要 |
43
53
 
44
54
  ## レビューモード別の差異
45
55
 
package/CHANGELOG.md CHANGED
@@ -5,6 +5,47 @@ All notable changes to this project will be documented in this file.
5
5
  The format is based on [Keep a Changelog](https://keepachangelog.com/en/1.1.0/),
6
6
  and this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0.html).
7
7
 
8
+ ## [1.18.6] - 2026-03-29
9
+
10
+ ### Fixed
11
+
12
+ #### Skill Optimization Workflow Precision
13
+
14
+ The skill creation and review workflow had several precision gaps: descriptions lacked project-specific trigger alignment, quality gates were observational rather than enforcing, BP-001 exceptions were vague enough to allow misuse, and the creator agent had no modification mode for targeted edits.
15
+
16
+ **Description as trigger mechanism**
17
+ - `skill-creator`: Description generation now requires **user phrases** and **project-specific value** as mandatory inputs, wired into the template `{Verb}s {what} using {project-specific criteria}. Use when {user phrases}.`
18
+ - `creation-guide`: Add core principle — description is an agent's trigger mechanism, not a human summary
19
+ - `creation-guide`: Add 4-item description quality checklist (project-specific terms, user phrases, user intent focus, general-knowledge-only warning)
20
+
21
+ **Progressive Disclosure as quality gate**
22
+ - `skill-reviewer`: Tier 1 (description quality) failure now blocks grade A/B — previously reported but did not affect grading
23
+ - `review-criteria`: Grading table updated with Tier 1 pass as explicit condition for A/B
24
+
25
+ **BP-001 exception tightening**
26
+ - `skill-optimization SKILL.md`: Replace vague "safety-critical/destructive" exception with strict 4-condition AND test: (1) single-step state destruction, (2) caller cannot normally recover, (3) operational constraint not quality policy, (4) positive form would blur scope
27
+ - Add concrete boundary examples (permitted vs must-rewrite negative instructions)
28
+ - `skill-reviewer`: Add `patternExceptions` output with per-condition evidence fields for auditable exception judgments
29
+
30
+ **Operational Constraints (BP-001 self-application)**
31
+ - `skill-creator`, `skill-reviewer`: Convert "Prohibited Actions" sections to positive-form "Operational Constraints" — the agents' own prohibition lists violated BP-001
32
+
33
+ **Modification mode**
34
+ - `skill-creator`: Add dual-mode operation (creation/modification) — modification mode applies targeted section-level changes while preserving unaffected content verbatim, with `changesSummary` output
35
+ - `refine-skill`: Route changes through skill-creator modification mode instead of direct editing
36
+
37
+ **Knowledge cutoff protection**
38
+ - `skill-creator`, `skill-reviewer`: Add WebSearch for verifying time-sensitive domain knowledge (API changes, deprecations, SDK versions) to prevent outdated suggestions caused by the LLM's knowledge cutoff date
39
+ - `skill-creator`: Add `researchFindings` output recording adopted/rejected findings with rationale
40
+
41
+ **Knowledge collection improvements**
42
+ - `create-skill`: Add Round 2 (project-specific value validation) — warns when skill contains only general knowledge unlikely to trigger at runtime
43
+ - `create-skill`: Add trigger phrase classification (skill-dependent vs pattern-copyable) in Round 3 with minimum 1 skill-dependent phrase requirement
44
+ - `create-skill`: Add practical artifacts collection in Round 4 (existing files, past failures, PRs)
45
+
46
+ **Cross-skill discovery**
47
+ - `skill-creator`, `skill-reviewer`, `create-skill`, `refine-skill`: Extend Glob paths to include `~/.claude/skills/*/SKILL.md` for detecting overlap with user-level skills
48
+
8
49
  ## [1.18.5] - 2026-03-29
9
50
 
10
51
  ### Fixed
package/package.json CHANGED
@@ -1,6 +1,6 @@
1
1
  {
2
2
  "name": "create-ai-project",
3
- "version": "1.18.5",
3
+ "version": "1.18.6",
4
4
  "packageManager": "npm@10.8.2",
5
5
  "description": "TypeScript boilerplate with skills and sub-agents for Claude Code. Prevents context exhaustion through role-based task splitting.",
6
6
  "keywords": [