buildcrew 1.5.2 → 1.8.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
package/README.ko.md CHANGED
@@ -2,7 +2,7 @@
2
2
 
3
3
  > [English](README.md) | **한국어** | [문서](https://buildcrew-landing.vercel.app)
4
4
 
5
- Claude Code를 위한 11개 AI 에이전트 9개 운영 모드로 자동 오케스트레이션되는 개발 팀.
5
+ Claude Code를 위한 15개 AI 에이전트 팀. 생각부터 배포까지 전체 개발 라이프사이클을 자동으로 진행합니다.
6
6
 
7
7
  ```bash
8
8
  npx buildcrew
@@ -12,19 +12,19 @@ npx buildcrew
12
12
 
13
13
  ## 왜 buildcrew인가?
14
14
 
15
- AI 코딩 에이전트는 강력하지만 구조 없이는 일관성 없는 결과를 냅니다. buildcrew는 Claude Code에 다음을 제공합니다:
15
+ AI 코딩 에이전트가 아무리 똑똑해도, 구조 없이 쓰면 결과가 들쑥날쑥합니다. buildcrew는 Claude Code에 **팀**, **프로세스**, **컨텍스트**를 제공합니다.
16
16
 
17
- - **팀** — 11개 전문 에이전트 (5 opus + 6 sonnet)
18
- - **프로세스** — 품질 게이트와 반복을 갖춘 순차 파이프라인
19
- - **하네스** — 코드베이스에서 자동 감지한 프로젝트 컨텍스트
20
- - **오케스트레이터** — `@buildcrew`에게 말하면 자동으로 적절한 에이전트 배치
17
+ - **팀** — 역할이 명확한 15개 전문 에이전트 (7 opus + 8 sonnet)
18
+ - **프로세스** — 품질 게이트가 있는 순차 파이프라인. 통과 못하면 자동으로 재시도
19
+ - **하네스** — 코드베이스를 분석해서 프로젝트 맥락을 자동으로 파악
20
+ - **오케스트레이터** — `@buildcrew`에게 말하면 알아서 적절한 에이전트를 투입
21
21
 
22
22
  ```
23
23
  나: @buildcrew 유저 인증 추가해줘
24
24
  크루: 기획자 → 디자이너 → 개발자 → QA → 브라우저 QA → 리뷰어 → 배포
25
25
  ```
26
26
 
27
- 외부 의존성 없음. 런타임 없음. 바이너리 없음. 그냥 마크다운.
27
+ 외부 의존성 없음. 런타임 없음. 바이너리 없음. 마크다운 파일만으로 동작합니다.
28
28
 
29
29
  ---
30
30
 
@@ -34,13 +34,13 @@ AI 코딩 에이전트는 강력하지만 구조 없이는 일관성 없는 결
34
34
  # 1. 에이전트 설치
35
35
  npx buildcrew
36
36
 
37
- # 2. 프로젝트 하네스 자동 생성 (질문 없음)
37
+ # 2. 프로젝트 하네스 자동 생성 (질문 없이 코드베이스 분석)
38
38
  npx buildcrew init
39
39
 
40
- # 3. 커스터마이징 (생성된 파일에서 <!-- 주석 --> 부분만 수정)
40
+ # 3. 필요한 부분만 커스터마이징
41
41
  code .claude/harness/
42
42
 
43
- # 4. 사용
43
+ # 4. 바로 사용
44
44
  @buildcrew 유저 대시보드 추가해줘
45
45
  ```
46
46
 
@@ -48,7 +48,7 @@ code .claude/harness/
48
48
 
49
49
  ## 하네스 엔지니어링
50
50
 
51
- `npx buildcrew init`은 코드베이스를 스캔해서 프로젝트 하네스를 생성합니다 **질문 0개**.
51
+ `npx buildcrew init` 하나로 코드베이스를 스캔해서 프로젝트 하네스를 자동 생성합니다. 질문하지 않습니다.
52
52
 
53
53
  ### 자동 감지 항목
54
54
 
@@ -61,28 +61,28 @@ code .claude/harness/
61
61
  | 결제 | Stripe, Paddle, Toss Payments |
62
62
  | AI | OpenAI, Anthropic, Google AI |
63
63
  | 배포 | Vercel, Netlify, Fly.io, Docker |
64
- | 컴포넌트 | `src/components/` 스캔 |
65
- | API 라우트 | `src/app/api/` 스캔 |
64
+ | 컴포넌트 | `src/components/` 자동 스캔 |
65
+ | API 라우트 | `src/app/api/` 자동 스캔 |
66
66
  | 다국어 | i18n 디렉토리 스캔 |
67
67
 
68
68
  ### 생성되는 파일
69
69
 
70
- 감지 결과에 따라 관련 하네스 파일이 자동 생성:
70
+ 감지 결과에 따라 필요한 하네스 파일이 자동으로 생성됩니다:
71
71
 
72
72
  ```
73
73
  .claude/harness/
74
- ├── project.md ← 항상 (프로젝트 컨텍스트, 스택, 컴포넌트, API 라우트)
75
- ├── rules.md ← 항상 (프레임워크에 맞는 스마트 기본값)
74
+ ├── project.md ← 항상 (프로젝트 컨텍스트, 스택, 컴포넌트, API)
75
+ ├── rules.md ← 항상 (프레임워크에 맞는 코딩 규칙)
76
76
  ├── erd.md ← DB 감지 시
77
77
  ├── api-spec.md ← API 라우트 발견 시
78
78
  ├── design-system.md ← TailwindCSS 감지 시
79
79
  ├── architecture.md ← 항상
80
- └── user-flow.md ← i18n 또는 5개+ 컴포넌트 시
80
+ └── user-flow.md ← i18n 또는 5 이상 컴포넌트 시
81
81
  ```
82
82
 
83
83
  ### 커스터마이징
84
84
 
85
- 생성된 파일은 `<!-- HTML 주석 -->`으로 채워야 부분을 표시합니다. 나머지는 코드베이스에서 자동으로 채워져 있습니다.
85
+ 생성된 파일에서 `<!-- HTML 주석 -->`으로 부분만 채우면 됩니다. 나머지는 코드베이스에서 이미 채워져 있습니다.
86
86
 
87
87
  ```bash
88
88
  npx buildcrew harness # 어떤 파일을 편집해야 하는지 확인
@@ -90,16 +90,18 @@ npx buildcrew harness # 어떤 파일을 편집해야 하는지 확인
90
90
 
91
91
  ### 열린 구조
92
92
 
93
- `.claude/harness/`에 아무 `.md` 파일이나 추가 가능 — 에이전트가 전부 읽음:
93
+ `.claude/harness/`에 아무 `.md` 파일이나 추가하면 에이전트가 읽습니다:
94
94
 
95
95
  ```bash
96
- npx buildcrew add glossary # 템플릿에서 추가
97
- npx buildcrew add env-vars # 템플릿에서 추가
98
- echo "# 메모" > .claude/harness/내메모.md # 직접 생성도 가능
96
+ npx buildcrew add glossary # 용어 사전 추가
97
+ npx buildcrew add env-vars # 환경 변수 가이드 추가
98
+ echo "# 메모" > .claude/harness/notes.md # 직접 파일 생성도 가능
99
99
  ```
100
100
 
101
101
  ### 에이전트 라우팅
102
102
 
103
+ 각 에이전트는 자기 역할에 맞는 하네스 파일만 읽습니다:
104
+
103
105
  | 파일 | 읽는 에이전트 |
104
106
  |------|-------------|
105
107
  | `project.md`, `rules.md` | 모든 에이전트 |
@@ -107,7 +109,7 @@ echo "# 메모" > .claude/harness/내메모.md # 직접 생성도 가능
107
109
  | `design-system.md` | designer |
108
110
  | `glossary.md`, `user-flow.md` | planner, designer, browser-qa |
109
111
  | `env-vars.md` | developer, security-auditor |
110
- | 커스텀 `.md` | reviewer, security-auditor (전부 읽음) |
112
+ | 커스텀 `.md` 파일 | reviewer, security-auditor (전부 읽음) |
111
113
 
112
114
  ---
113
115
 
@@ -117,38 +119,38 @@ echo "# 메모" > .claude/harness/내메모.md # 직접 생성도 가능
117
119
 
118
120
  | 에이전트 | 모델 | 역할 |
119
121
  |---------|------|------|
120
- | **planner** | opus | 6가지 강제 질문 + 4관점 자체 리뷰 (CEO, 엔지니어링, 디자인, QA). 관점별 1-10점. |
121
- | **designer** | opus | UI/UX 레퍼런스 수집 + 모션 엔지니어링 Playwright 스크린샷 Figma MCP 애니메이션, 스크롤 이펙트, 제스처가 포함된 프로덕션 컴포넌트. AI 슬롭 블랙리스트. |
122
- | **developer** | sonnet | 기획서 + 디자인 + 하네스 규칙에 따라 구현. |
122
+ | **planner** | opus | 6가지 강제 질문으로 요구사항 분석 → 4관점 자체 리뷰 (CEO, 엔지니어링, 디자인, QA). 관점별 1-10 채점 후 기준 미달 시 자동 보강. |
123
+ | **designer** | opus | UI/UX 레퍼런스 리서치 + 모션 엔지니어링. Playwright 실제 사이트 스크린샷 수집, Figma MCP 연동, 애니메이션과 인터랙션이 포함된 프로덕션 컴포넌트 생성. AI 슬롭 블랙리스트 적용. |
124
+ | **developer** | sonnet | 6가지 구현 질문으로 코드베이스를 먼저 파악한 구현. 3관점 자체 리뷰 (아키텍처, 코드 품질, 안전성)로 자기 코드 검증. 에러 핸들링 프로토콜 내장. 기능 구현, 버그 수정, 반복 수정 3가지 모드 지원. |
123
125
 
124
126
  ### 품질 팀
125
127
 
126
128
  | 에이전트 | 모델 | 역할 |
127
129
  |---------|------|------|
128
- | **qa-tester** | sonnet | 코드 레벨 검증 타입, 린트, 빌드, 수용 기준. |
129
- | **browser-qa** | sonnet | Playwright MCP 실제 브라우저 테스트 유저 플로우, 반응형, 콘솔, 건강 점수 (0-100). |
130
- | **reviewer** | opus | 4관점 병렬 리뷰 (보안, 성능, 테스트, 유지보수) + 적대적 리뷰 + 자동 수정. |
131
- | **health-checker** | sonnet | 코드 품질 대시보드 7개 카테고리 가중 점수 (0-10) + 트렌드. |
130
+ | **qa-tester** | sonnet | 5가지 테스트 전략 질문으로 체계적 검증. 테스트 맵을 먼저 만들고 수용 기준별 검증 수행. 엣지 케이스 자동 생성, 신뢰도 점수 기반 버그 분류. |
131
+ | **browser-qa** | sonnet | Playwright MCP 실제 브라우저 테스트. 유저 플로우, 반응형, 콘솔 에러 확인. 건강 점수 (0-100) 산출. |
132
+ | **reviewer** | opus | 4명의 전문가 관점으로 심층 리뷰 (보안, 성능, 테스트, 유지보수). 신뢰도 점수 + 스코프 드리프트 감지 + 적대적 리뷰. 기계적 이슈는 즉시 자동 수정. |
133
+ | **health-checker** | sonnet | 코드 품질 대시보드. 7개 카테고리별 가중 점수 (0-10) 트렌드 추적. |
132
134
 
133
135
  ### 보안 & 운영 팀
134
136
 
135
137
  | 에이전트 | 모델 | 역할 |
136
138
  |---------|------|------|
137
- | **security-auditor** | opus | OWASP Top 10 + STRIDE 위협 모델. 10단계 감사 + 신뢰도 게이트. |
138
- | **canary-monitor** | sonnet | 배포 후 프로덕션 헬스 페이지, API, 콘솔, 성능 비교. |
139
- | **shipper** | sonnet | 릴리즈 파이프라인 테스트 버전 체인지로그 PR. |
139
+ | **security-auditor** | opus | OWASP Top 10 + STRIDE 위협 모델 기반 10단계 보안 감사. 신뢰도 게이트 적용. |
140
+ | **canary-monitor** | sonnet | 배포 후 프로덕션 상태 모니터링. 페이지 로드, API 응답, 콘솔 에러, 성능 비교. |
141
+ | **shipper** | sonnet | 8가지 사전 점검 배포. Semver 결정 프레임워크로 버전 자동 판단. 체인지로그 자동 생성, PR 템플릿, 배포 후 검증까지. |
140
142
 
141
143
  ### 전문가
142
144
 
143
145
  | 에이전트 | 모델 | 역할 |
144
146
  |---------|------|------|
145
- | **investigator** | sonnet | 근본 원인 디버깅. 4단계 조사. 무관한 코드 수정 동결. |
147
+ | **investigator** | sonnet | 5가지 증거 수집 가설 수립 (확률 기반) → 가설 검증 → 수정. 12가지 대표 버그 패턴 내장. 무관한 코드 수정 자동 차단. |
146
148
 
147
149
  ---
148
150
 
149
- ## 9가지 운영 모드
151
+ ## 13가지 운영 모드
150
152
 
151
- `@buildcrew`에게 자연스럽게 말하세요. 모드를 자동 감지합니다.
153
+ `@buildcrew`에게 자연스럽게 말하면 됩니다. 모드는 자동으로 감지됩니다.
152
154
 
153
155
  | 모드 | 예시 | 파이프라인 |
154
156
  |------|------|----------|
@@ -159,12 +161,12 @@ echo "# 메모" > .claude/harness/내메모.md # 직접 생성도 가능
159
161
  | **Debug** | "왜 로그인이 안 돼?" | 4단계 근본 원인 조사 |
160
162
  | **Health** | "헬스체크 돌려줘" | 품질 대시보드 |
161
163
  | **Canary** | "배포 확인해줘" | 프로덕션 모니터링 |
162
- | **Review** | "코드 리뷰해줘" | 멀티 전문가 + 적대적 + 자동 수정 |
163
- | **Ship** | "배포해줘" | 테스트 → 버전 → 체인지로그 → PR |
164
+ | **Review** | "코드 리뷰해줘" | 4전문가 병렬 리뷰 + 자동 수정 |
165
+ | **Ship** | "배포해줘" | 사전 점검 → 테스트 → 버전 → 체인지로그 → PR |
164
166
 
165
- ### 반복 (Iterations)
167
+ ### 반복 실행
166
168
 
167
- 매 반복마다 **전체 파이프라인**을 처음부터 다시 실행 기획자가 이전 결과를 리뷰하고 계획을 수정합니다:
169
+ 매 반복마다 전체 파이프라인을 처음부터 다시 돌립니다. 기획자가 이전 결과를 읽고 계획을 수정하고, 개발자가 다시 구현하고, QA가 다시 검증합니다:
168
170
 
169
171
  ```
170
172
  @buildcrew 유저 대시보드 추가해줘, 5 iterations
@@ -172,60 +174,98 @@ echo "# 메모" > .claude/harness/내메모.md # 직접 생성도 가능
172
174
 
173
175
  ### 모드 체이닝
174
176
 
175
- Feature 완료 → Ship → Canary. Canary CRITICAL → Debug.
177
+ Feature 완료 → Ship 제안 → Canary 제안. Canary에서 문제 발견 → Debug 자동 전환.
176
178
 
177
179
  ---
178
180
 
179
181
  ## 기능 파이프라인
180
182
 
183
+ 기능마다 전체 문서 체인이 자동 생성됩니다:
184
+
181
185
  ```
182
186
  .claude/pipeline/{기능명}/
183
187
  ├── 01-plan.md 요구사항 + 4관점 리뷰 점수
184
188
  ├── 02-references.md UI/UX 레퍼런스
185
- ├── 02-design.md 디자인 결정 + 스펙
186
- ├── 03-dev-notes.md 구현 노트 + 변경 파일
187
- ├── 04-qa-report.md 수용 기준 검증
188
- ├── 05-browser-qa.md 건강 점수 + 스크린샷
189
- ├── 06-review.md 리뷰 발견사항 + 자동 수정
189
+ ├── 02-design.md 디자인 결정 + 컴포넌트 스펙
190
+ ├── 03-dev-notes.md 구현 노트 + 6질문 분석 + 자체 리뷰 점수
191
+ ├── 04-qa-report.md 테스트 맵 + 수용 기준 검증 + 버그 리포트
192
+ ├── 05-browser-qa.md 건강 점수 + 스크린샷 + 유저 플로우
193
+ ├── 06-review.md 4전문가 발견사항 + 자동 수정 내역
190
194
  └── 07-ship.md PR URL + 릴리즈 노트
191
195
  ```
192
196
 
193
197
  ---
194
198
 
195
- ## CLI 레퍼런스
199
+ ## CLI
196
200
 
197
201
  | 명령어 | 설명 |
198
202
  |--------|------|
199
- | `npx buildcrew` | 에이전트 설치 (11 + 오케스트레이터) |
200
- | `npx buildcrew init` | 하네스 자동 생성 (질문 없음) |
203
+ | `npx buildcrew` | 에이전트 설치 (11 + 오케스트레이터) |
204
+ | `npx buildcrew init` | 하네스 자동 생성 (질문 없이 코드베이스 분석) |
201
205
  | `npx buildcrew init --force` | 하네스 재생성 |
202
- | `npx buildcrew add` | 템플릿 목록 |
203
- | `npx buildcrew add <name>` | 템플릿 추가 |
204
- | `npx buildcrew harness` | 하네스 파일 상태 |
206
+ | `npx buildcrew add` | 사용 가능한 템플릿 목록 |
207
+ | `npx buildcrew add <name>` | 템플릿 추가 (erd, architecture 등) |
208
+ | `npx buildcrew harness` | 하네스 파일 상태 확인 |
205
209
  | `npx buildcrew --force` | 에이전트 덮어쓰기 |
206
- | `npx buildcrew --list` | 에이전트 목록 |
210
+ | `npx buildcrew --list` | 에이전트 목록 + 모델 정보 |
207
211
  | `npx buildcrew --uninstall` | 에이전트 제거 |
212
+ | `npx buildcrew --version` | 버전 확인 |
208
213
 
209
214
  ## 요구사항
210
215
 
211
216
  - **필수**: [Claude Code](https://claude.ai/code) CLI
212
- - **선택**: [Playwright MCP](https://github.com/anthropics/anthropic-quickstarts/tree/main/mcp-servers/playwright) — browser-qa, canary-monitor, designer
213
- - **선택**: [Figma MCP](https://github.com/anthropics/anthropic-quickstarts/tree/main/mcp-servers/figma) — designer
217
+ - **선택**: [Playwright MCP](https://github.com/anthropics/anthropic-quickstarts/tree/main/mcp-servers/playwright) — browser-qa, canary-monitor, designer가 사용
218
+ - **선택**: [Figma MCP](https://github.com/anthropics/anthropic-quickstarts/tree/main/mcp-servers/figma) — designer가 사용
219
+
220
+ ```bash
221
+ # 실제 브라우저 테스트 활성화
222
+ claude mcp add playwright -- npx @anthropic-ai/mcp-server-playwright
223
+ ```
224
+
225
+ ## 커스터마이징
214
226
 
215
- ## 실시간 상태 로그
227
+ ```
228
+ .claude/agents/ 에이전트 정의 — 역할, 도구, 모델 수정 가능
229
+ .claude/harness/ 프로젝트 컨텍스트 — 언제든 수정, .md 파일 자유 추가
230
+ .claude/pipeline/ 결과물 — 기능별 자동 생성
231
+ ```
232
+
233
+ ## 실시간 진행 상태
216
234
 
217
235
  모든 에이전트가 이모지 태그된 진행 로그를 출력합니다:
218
236
 
219
237
  ```
220
238
  📋 PLANNER — "유저 대시보드" 요구사항 분석 시작
239
+ 🧠 6가지 강제 질문 분석...
221
240
  🔎 4관점 자체 리뷰...
222
- 🏢 CEO: 8/10 ⚙️ 엔지니어링: 9/10
223
- ✅ PLANNER — 완료
241
+ 🏢 CEO: 8/10 ⚙️ 엔지니어링: 9/10 🎨 디자인: 9/10 🧪 QA: 8/10
242
+ ✅ PLANNER — 완료 (평균: 8.5/10)
243
+
244
+ 💻 DEVELOPER — 구현 시작
245
+ 🔍 6가지 구현 질문 분석...
246
+ 🏗️ 구현 중...
247
+ 🔎 3관점 자체 리뷰 — 아키텍처: 8/10, 품질: 9/10, 안전성: 7/10
248
+ ✅ DEVELOPER — 완료 (12개 파일 변경, 평균: 8.0/10)
249
+
250
+ 🧪 QA TESTER — 테스트 맵 구축 → 검증 중
251
+ ✅ AC-1: 통과 ❌ AC-2: 실패 (신뢰도: 9/10)
252
+ 🔬 REVIEWER — 4전문가 + 적대적 리뷰 — 승인 (2건 자동 수정)
253
+ ```
254
+
255
+ ## 아키텍처
224
256
 
225
- 🎨 DESIGNER — UI/UX 디자인 시작...
226
- 💻 DEVELOPER — 구현 시작...
227
- 🧪 QA TESTER — 11/12 통과, 1건 발견
228
- 🔬 REVIEWER — 승인
257
+ ```
258
+ @buildcrew (오케스트레이터, opus)
259
+
260
+ ├─ .claude/harness/*.md 읽기
261
+ ├─ 유저 메시지에서 모드 자동 감지
262
+ ├─ 하네스 컨텍스트와 함께 에이전트 디스패치
263
+ └─ 품질 게이트 적용 + 전체 파이프라인 반복 관리
264
+
265
+ ├── 빌드: planner → designer → developer
266
+ ├── 품질: qa-tester → browser-qa → reviewer
267
+ ├── 보안/운영: security-auditor, canary-monitor, shipper
268
+ └── 디버그: investigator
229
269
  ```
230
270
 
231
271
  ## 라이선스
package/README.md CHANGED
@@ -2,7 +2,7 @@
2
2
 
3
3
  > **English** | [한국어](README.ko.md) | [Docs](https://buildcrew-landing.vercel.app)
4
4
 
5
- 11 AI agents for Claude Code — auto-orchestrated dev team with 9 operating modes.
5
+ 15 AI agents for Claude Code — full development lifecycle from product thinking to production monitoring.
6
6
 
7
7
  ```bash
8
8
  npx buildcrew
@@ -14,7 +14,7 @@ npx buildcrew
14
14
 
15
15
  AI coding agents are powerful, but without structure they produce inconsistent results. buildcrew gives Claude Code:
16
16
 
17
- - **A team** — 11 specialized agents (5 opus + 6 sonnet), each with a clear role
17
+ - **A team** — 15 specialized agents (7 opus + 8 sonnet), each with a clear role
18
18
  - **A process** — sequential pipeline with quality gates and iteration
19
19
  - **A harness** — your project context auto-detected from your codebase
20
20
  - **An orchestrator** — just talk to `@buildcrew`, it routes automatically
@@ -119,15 +119,15 @@ echo "# Notes" > .claude/harness/my-notes.md # Or create your own
119
119
  |-------|-------|------|
120
120
  | **planner** | opus | 6 Forcing Questions + 4-Lens Self-Review (CEO, Engineering, Design, QA). Plans scored 1-10 per lens. |
121
121
  | **designer** | opus | UI/UX research + motion engineering → Playwright screenshots → Figma MCP → production components with animations, scroll effects, gestures. AI slop blacklist. |
122
- | **developer** | sonnet | Implements features following plan + design + harness conventions. |
122
+ | **developer** | sonnet | 6 Implementation Questions + 3-Lens Self-Review (Architecture, Code Quality, Safety). Error Handling Protocol. 3 modes: feature, bugfix, iteration. |
123
123
 
124
124
  ### Quality Team
125
125
 
126
126
  | Agent | Model | Role |
127
127
  |-------|-------|------|
128
- | **qa-tester** | sonnet | Code-level verification types, lint, build, acceptance criteria. |
128
+ | **qa-tester** | sonnet | 5 Test Strategy Questions + Test Map methodology. Systematic edge case generation. Confidence-scored findings with severity classification. |
129
129
  | **browser-qa** | sonnet | Real browser testing via Playwright MCP — flows, responsive, console, health score (0-100). |
130
- | **reviewer** | opus | 4-specialist parallel review (security, perf, testing, maintainability) + adversarial pass + auto-fix. |
130
+ | **reviewer** | opus | 4-specialist deep analysis (security, perf, testing, maintainability) with confidence scoring + scope drift detection + adversarial pass + fix-first approach. |
131
131
  | **health-checker** | sonnet | Code quality dashboard — 7-category weighted 0-10 score + trends. |
132
132
 
133
133
  ### Security & Ops
@@ -136,13 +136,13 @@ echo "# Notes" > .claude/harness/my-notes.md # Or create your own
136
136
  |-------|-------|------|
137
137
  | **security-auditor** | opus | OWASP Top 10 + STRIDE threat model. 10-phase audit with confidence gate. |
138
138
  | **canary-monitor** | sonnet | Post-deploy health — pages, APIs, console, performance vs baseline. |
139
- | **shipper** | sonnet | Release pipeline test version bump changelog PR. |
139
+ | **shipper** | sonnet | 8-point pre-flight + semver decision framework + changelog methodology + PR template + post-ship verification. |
140
140
 
141
141
  ### Specialist
142
142
 
143
143
  | Agent | Model | Role |
144
144
  |-------|-------|------|
145
- | **investigator** | sonnet | Root cause debugging. 4-phase investigation. Edit freeze on unrelated code. |
145
+ | **investigator** | sonnet | 5 Evidence Sources + hypothesis scoring + 12 common bug patterns + regression prevention. Edit freeze on unrelated code. |
146
146
 
147
147
  ---
148
148
 
@@ -236,17 +236,20 @@ Every agent outputs emoji-tagged progress logs so you can track what's happening
236
236
 
237
237
  ```
238
238
  📋 PLANNER — Starting requirements analysis for "user dashboard"
239
- 🔍 Reading project harness...
240
239
  🧠 Phase 1: Asking 6 Forcing Questions...
241
240
  🔎 Phase 3: 4-Lens Self-Review...
242
- 🏢 CEO Review: 8/10
243
- ⚙️ Engineering Review: 9/10
241
+ 🏢 CEO: 8/10 ⚙️ Engineering: 9/10 🎨 Design: 9/10 🧪 QA: 8/10
244
242
  ✅ PLANNER — Complete (avg score: 8.5/10)
245
243
 
246
244
  🎨 DESIGNER — Starting UI/UX design...
247
- 💻 DEVELOPER — Starting implementation...
248
- 🧪 QA TESTER — 11/12 passed, 1 issue found
249
- 🔬 REVIEWERAPPROVE
245
+ 💻 DEVELOPER — Phase 1: 6 Implementation Questions...
246
+ 🔍 Phase 2: Implementation...
247
+ 🔎 Phase 3: 3-Lens Self-Review Architecture: 8/10, Quality: 9/10, Safety: 7/10
248
+ ✅ DEVELOPER — Complete (12 files changed, avg: 8.0/10)
249
+
250
+ 🧪 QA TESTER — 5 Test Strategy Questions → Test Map built
251
+ ✅ AC-1: PASS ❌ AC-2: FAIL (confidence: 9/10)
252
+ 🔬 REVIEWER — 4 specialists + adversarial — APPROVE (2 auto-fixed)
250
253
  ```
251
254
 
252
255
  ## Architecture