npm - @jjlabsio/claude-crew - Versions diffs - 0.1.41 → 0.1.43 - Mend

@jjlabsio/claude-crew 0.1.41 → 0.1.43

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (10) hide show

package/.claude-plugin/marketplace.json +2 -2
package/.claude-plugin/plugin.json +1 -1
package/README.ko.md +173 -0
package/README.md +101 -74
package/agents/dev.md +40 -3
package/data/agent-contracts.json +11 -1
package/data/agent-instructions/dev.md +40 -3
package/data/provider-catalog.json +4 -4
package/package.json +1 -1
package/skills/crew-do/SKILL.md +169 -0

package/.claude-plugin/marketplace.json CHANGED Viewed

@@ -11,7 +11,7 @@
       "name": "claude-crew",
       "source": "./",
       "description": "오케스트레이터 + PM, 플래너, 개발, QA, 마케팅 에이전트 팀으로 단일 제품의 개발과 마케팅을 통합 관리",
-      "version": "0.1.41",
+      "version": "0.1.43",
       "author": {
         "name": "Jaejin Song",
         "email": "wowlxx28@gmail.com"
@@ -28,5 +28,5 @@
       "category": "workflow"
     }
   ],
-  "version": "0.1.41"
+  "version": "0.1.43"
 }

package/.claude-plugin/plugin.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "claude-crew",
-  "version": "0.1.41",
+  "version": "0.1.43",
   "description": "1인 SaaS 개발자를 위한 멀티 에이전트 오케스트레이션 — 개발, 마케팅, 일정을 한 대화에서 통합 관리",
   "author": {
     "name": "Jaejin Song",

package/README.ko.md ADDED Viewed

@@ -0,0 +1,173 @@
+# Claude Crew
+1인 SaaS 개발자를 위한 Claude Code 멀티 에이전트 오케스트레이션 플러그인.
+[English](README.md)
+## 파이프라인
+```
+crew-interview → crew-plan → crew-dev
+   WHAT            HOW         DO
+```
+| 단계 | 역할 | 산출물 |
+|------|------|--------|
+| **crew-interview** | 무엇을 만드는가 — 요구사항 인터뷰, 제품 설계 | spec.md |
+| **crew-plan** | 어떻게 만드는가 — 기술 분석, 태스크 분해 | contract.md |
+| **crew-dev** | 만든다 — 구현, 코드 리뷰, QA | 동작하는 코드 + PR |
+## 설치
+Claude Code에서:
+```
+/plugin marketplace add jjlabsio/claude-crew
+/plugin install claude-crew
+```
+또는 로컬에서 직접:
+```
+/plugin install /path/to/claude-crew
+```
+## 초기 설정
+설치 후 반드시 한 번 실행:
+```
+/crew-setup
+```
+- `.gitignore` / `.gitattributes` 마이그레이션 (`.crew/` git tracked 전환)
+- HUD statusline 설치
+- 에이전트별 provider/model 설정
+## 사용
+### 개발 파이프라인
+```
+/crew
+```
+오케스트레이터가 시작되고 현황을 브리핑합니다.
+### 간단 작업 즉시 위임
+```
+/crew-do "로그인 에러 메시지 정리"
+/crew-do                         # active task가 있으면 해당 task를 실행
+```
+`/crew-do`는 기존 Dev 에이전트를 `direct` 모드로 호출해 작은 수정, 버그픽스, 테스트 실패 수정처럼 범위가 명확한 작업을 바로 위임합니다. Dev 기본 provider가 Codex이면 실제 코드 탐색, 수정, 검증은 Codex runtime에서 수행되고 Claude는 결과 요약과 후속 조율만 담당합니다.
+`/task`는 계속 기억/queue 관리 전용입니다. 저장된 태스크를 실행하려면 `/task work {id}`로 active 상태로 만든 뒤 `/crew-do`를 실행합니다.
+### 태스크 관리
+```
+/task add "설명"          # 태스크 추가 (대화 컨텍스트 자동 캡처)
+/task add "설명" --next   # 긴급 — queue 맨 위 삽입
+/task work 3              # 태스크 #3 작업 시작 (관련 파일 Read + 브리핑)
+/task start               # queue 최상단 태스크 작업 시작
+/task done                # active 태스크 완료 처리
+/task bump 4              # 우선순위 한 칸 올리기
+/task top 7               # queue 맨 위로 이동
+/task note 3 "메모"       # 태스크에 메모 추가
+/task drop 3              # 태스크 삭제
+/tasks                    # 프로젝트 태스크 보드
+/tasks stale              # 30일+ 방치 태스크 리뷰
+/tasks clean              # 완료 후 7일 경과 태스크 정리
+```
+태스크는 `.crew/tasks/` 디렉토리에 개별 파일로 관리된다. 각 파일이 상태, 우선순위, 컨텍스트를 포함하여 세션 간 작업 재개 시 컨텍스트 재입력이 불필요하다.
+## 에이전트 팀
+| 에이전트 | 역할 | 소속 스킬 |
+|---------|------|----------|
+| **오케스트레이터** | 유저와 대화, 위임 판단, 파이프라인 진행 | 전체 |
+| **Explorer** | 코드베이스 탐색 (read-only) | interview, plan |
+| **Researcher** | 외부 리서치 (WebSearch) | interview, plan |
+| **TechLead** | 기술 분석, 아키텍처 방향 판단 | plan |
+| **Planner** | 태스크 분해, 구현 계획 | plan |
+| **PlanEvaluator** | 계획 검증 (하드 임계값) | plan |
+| **Dev** | 코드 구현 | dev |
+| **CodeReviewer** | 코드 리뷰 | dev |
+| **QA** | 실행 검증 | dev |
+## 두 가지 사용 모드
+claude-crew는 **다른 프로젝트에 설치되어 사용되는 플러그인**이다. 두 가지 모드로 구분된다.
+### 사용자 모드
+이 plugin을 자기 프로젝트에 설치해서 SaaS 개발에 활용하는 일반 사용자.
+- 직접 호출하는 슬래시 명령: `/crew`, `/crew-setup`, `/crew-do`, `/task`, `/tasks`, `/crew-interview`, `/crew-plan`, `/crew-dev`.
+- 디버그용 직접 호출 가능 명령: `node scripts/crew-agent-runner.mjs resolve --role <role> --json` (provider/model/contract 통합 표 확인).
+- plugin이 설치된 위치(`~/.claude/plugins/...` 등)에 무관하게 동작 — plugin script가 자기 위치를 자동으로 인식.
+### 개발자 모드
+claude-crew 자체를 개발하는 사람 (이 repo 안에서 작업).
+- `node scripts/crew-agent-runner.mjs build`: contracts/instructions에서 `agents/{role}.md` + `plugin.json` agents 배열 derive.
+- `node scripts/crew-agent-runner.mjs validate`: build 결과와 현재 파일 정합성 검사 + sandbox 정합성 검증.
+- `node scripts/crew-agent-runner.mjs install-hooks`: pre-commit hook 설치 (drift 차단).
+위 세 명령은 **plugin source repo 안에서만 동작**한다. 사용자 환경에서 호출하면 가드로 차단된다 (`.claude-plugin/plugin.json` + `package.json.name === "@jjlabsio/claude-crew"` 감지). 사용자에게는 의미 없는 명령이므로 정상이다.
+## 모델 설정
+`/crew-setup`에서 에이전트별 provider/model을 설정합니다. 설정하지 않은 에이전트는 `data/provider-catalog.json`의 `agent_defaults`를 따릅니다.
+권장 기본값은 에이전트 역할의 성격에 따라 세 그룹으로 구분됩니다.
+| 에이전트 | provider | model | reasoning | 역할 성격 |
+|----------|----------|-------|-----------|---------|
+| `techlead` | codex | gpt-5.5 | high | 판단/평가 — 아키텍처 방향 결정 |
+| `code-reviewer` | codex | gpt-5.5 | high | 판단/평가 — 코드 품질 판정 |
+| `pm` | codex | gpt-5.5 | medium | 계획/분석 — 요구사항 수집 |
+| `planner` | codex | gpt-5.5 | medium | 계획/분석 — 구현 계획 작성 |
+| `dev` | codex | gpt-5.5 | medium | 계획/분석 — 코드 구현 |
+| `plan-evaluator` | codex | gpt-5.4-mini | high | 실행/검증 — 계획 기준 충족 판정 |
+| `qa` | codex | gpt-5.4-mini | high | 실행/검증 — 빌드/테스트 실행 |
+| `researcher` | codex | gpt-5.4-mini | high | 실행/검증 — 외부 정보 조사 |
+| `explorer` | codex | gpt-5.3-codex-spark | low | 탐색 전용 — 코드베이스 검색 |
+Claude 모델은 `opus`, `sonnet`, `haiku` latest alias와 `claude-opus-4-7` 같은 버전 고정 ID를 모두 선택할 수 있습니다.
+Claude provider는 Claude Code `Agent`로 실행하고, Codex provider는 플러그인에 내장된 `scripts/crew-codex-companion.mjs` app-server runtime으로 실행합니다. 에이전트가 유저 질문이나 다른 에이전트 호출이 필요하면 직접 처리하지 않고 오케스트레이터가 이어받아 실행합니다.
+Provider와 무관하게 에이전트 결과는 `complete`, `blocked_on_user`, `needs_agent`, `needs_tool`, `failed` 상태 중 하나로 해석합니다. Claude Code 전용 도구가 필요한 경우에도 Codex provider는 요청 상태를 반환하고, 실제 도구 실행은 오케스트레이터가 담당합니다.
+## 상태 파일
+프로젝트 로컬 `.crew/` 디렉토리에 마크다운 파일로 상태를 관리합니다 (git tracked). 플러그인 업데이트 시에도 학습 내용과 상태는 보존됩니다.
+```
+.crew/
+  config.json          # provider 설정 (gitignored)
+  tasks/               # 태스크 파일 (1개 = 1파일)
+  plans/               # 파이프라인 산출물 (spec, contract, dev-log, review)
+```
+## 설계 철학
+**역할별 관점은 유지하되, 정보는 제한하지 않는다.**
+각 에이전트는 특정 관점(기획/기술/구현)에서 사고하지만, 활용할 수 있는 정보(코드 포함)는 제한하지 않는다. 실제 회사의 역할 분리를 모방하는 것이 아니라, 빠뜨리는 관점이 없도록 구조화된 사고를 강제하는 것이 목적이다.
+### 기타 원칙
+- [Anthropic 하네스 설계 아티클](https://www.anthropic.com/engineering/harness-design)을 최우선 레퍼런스로 따름
+- 가능한 단순하게 시작하고 필요할 때만 복잡성을 높임
+- 모델이 발전하면 불필요해진 구성 요소를 제거
+## License
+MIT. This project also includes Apache-2.0 third-party components under `scripts/crew-codex/`; see `THIRD_PARTY_NOTICES.md`.

package/README.md CHANGED Viewed

@@ -1,145 +1,172 @@
 # Claude Crew
-1인 SaaS 개발자를 위한 Claude Code 멀티 에이전트 오케스트레이션 플러그인.
+A Claude Code multi-agent orchestration plugin for solo SaaS developers.
-## 파이프라인
+[한국어](README.ko.md)
+## Pipeline
 ```
 crew-interview → crew-plan → crew-dev
    WHAT            HOW         DO
 ```
-| 단계 | 역할 | 산출물 |
-|------|------|--------|
-| **crew-interview** | 무엇을 만드는가 — 요구사항 인터뷰, 제품 설계 | spec.md |
-| **crew-plan** | 어떻게 만드는가 — 기술 분석, 태스크 분해 | contract.md |
-| **crew-dev** | 만든다 — 구현, 코드 리뷰, QA | 동작하는 코드 + PR |
+| Stage | Role | Output |
+|-------|------|--------|
+| **crew-interview** | What to build — requirements interview, product design | spec.md |
+| **crew-plan** | How to build it — technical analysis, task decomposition | contract.md |
+| **crew-dev** | Build it — implementation, code review, QA | working code + PR |
-## 설치
+## Installation
-Claude Code에서:
+In Claude Code:
 ```
 /plugin marketplace add jjlabsio/claude-crew
 /plugin install claude-crew
 ```
-또는 로컬에서 직접:
+Or install locally:
 ```
 /plugin install /path/to/claude-crew
 ```
-## 초기 설정
+## Initial Setup
-설치 후 반드시 한 번 실행:
+Run once after installation:
 ```
 /crew-setup
 ```
-- `.gitignore` / `.gitattributes` 마이그레이션 (`.crew/` git tracked 전환)
-- HUD statusline 설치
-- 에이전트별 provider/model 설정
+- `.gitignore` / `.gitattributes` migration (`.crew/` git tracked)
+- HUD statusline installation
+- Per-agent provider/model configuration
-## 사용
+## Usage
-### 개발 파이프라인
+### Development Pipeline
 ```
 /crew
 ```
-오케스트레이터가 시작되고 현황을 브리핑합니다.
+The orchestrator starts and briefs the current status.
-### 태스크 관리
+### Quick Task Delegation
 ```
-/task add "설명"          # 태스크 추가 (대화 컨텍스트 자동 캡처)
-/task add "설명" --next   # 긴급 — queue 맨 위 삽입
-/task work 3              # 태스크 #3 작업 시작 (관련 파일 Read + 브리핑)
-/task start               # queue 최상단 태스크 작업 시작
-/task done                # active 태스크 완료 처리
-/task bump 4              # 우선순위 한 칸 올리기
-/task top 7               # queue 맨 위로 이동
-/task note 3 "메모"       # 태스크에 메모 추가
-/task drop 3              # 태스크 삭제
+/crew-do "clean up login error messages"
+/crew-do                         # runs the active task if one exists
+```
+`/crew-do` invokes the Dev agent in `direct` mode for small fixes, bug patches, and clearly scoped tasks. If Dev's default provider is Codex, code exploration, editing, and verification happen inside the Codex runtime; Claude handles only result summarization and follow-up coordination.
+`/task` remains dedicated to memory/queue management. To execute a saved task, mark it active with `/task work {id}` then run `/crew-do`.
-/tasks                    # 프로젝트 태스크 보드
-/tasks stale              # 30일+ 방치 태스크 리뷰
-/tasks clean              # 완료 후 7일 경과 태스크 정리
+### Task Management
+```
+/task add "description"          # add a task (captures conversation context)
+/task add "description" --next   # urgent — insert at top of queue
+/task work 3                     # start working on task #3 (reads related files + briefs)
+/task start                      # start working on the top-priority task
+/task done                       # mark active task complete
+/task bump 4                     # raise priority by one
+/task top 7                      # move to top of queue
+/task note 3 "note"              # add a note to a task
+/task drop 3                     # delete a task
+/tasks                           # project task board
+/tasks stale                     # review tasks untouched for 30+ days
+/tasks clean                     # clean up tasks completed 7+ days ago
 ```
-태스크는 `.crew/tasks/` 디렉토리에 개별 파일로 관리된다. 각 파일이 상태, 우선순위, 컨텍스트를 포함하여 세션 간 작업 재개 시 컨텍스트 재입력이 불필요하다.
+Tasks are managed as individual files in `.crew/tasks/`. Each file carries state, priority, and context so work can resume across sessions without re-entering context.
+## Agent Team
+| Agent | Role | Used in |
+|-------|------|---------|
+| **Orchestrator** | Talks with the user, decides delegation, drives the pipeline | all |
+| **Explorer** | Codebase exploration (read-only) | interview, plan |
+| **Researcher** | External research (WebSearch) | interview, plan |
+| **TechLead** | Technical analysis, architecture direction | plan |
+| **Planner** | Task decomposition, implementation planning | plan |
+| **PlanEvaluator** | Plan validation (hard thresholds) | plan |
+| **Dev** | Code implementation | dev |
+| **CodeReviewer** | Code review | dev |
+| **QA** | Execution verification | dev |
-## 에이전트 팀
+## Two Modes
-| 에이전트 | 역할 | 소속 스킬 |
-|---------|------|----------|
-| **오케스트레이터** | 유저와 대화, 위임 판단, 파이프라인 진행 | 전체 |
-| **Explorer** | 코드베이스 탐색 (read-only) | interview, plan |
-| **Researcher** | 외부 리서치 (WebSearch) | interview, plan |
-| **TechLead** | 기술 분석, 아키텍처 방향 판단 | plan |
-| **Planner** | 태스크 분해, 구현 계획 | plan |
-| **PlanEvaluator** | 계획 검증 (하드 임계값) | plan |
-| **Dev** | 코드 구현 | dev |
-| **CodeReviewer** | 코드 리뷰 | dev |
-| **QA** | 실행 검증 | dev |
+claude-crew is a **plugin installed into other projects**. It operates in two distinct modes.
-## 두 가지 사용 모드
+### User Mode
-claude-crew는 **다른 프로젝트에 설치되어 사용되는 플러그인**이다. 두 가지 모드로 구분된다.
+General users who install this plugin into their own project for SaaS development.
-### 사용자 모드
+- Slash commands to invoke directly: `/crew`, `/crew-setup`, `/crew-do`, `/task`, `/tasks`, `/crew-interview`, `/crew-plan`, `/crew-dev`.
+- Debug command: `node scripts/crew-agent-runner.mjs resolve --role <role> --json` (shows combined provider/model/contract table).
+- Works regardless of where the plugin is installed (`~/.claude/plugins/...` etc.) — the plugin script auto-detects its own location.
-이 plugin을 자기 프로젝트에 설치해서 SaaS 개발에 활용하는 일반 사용자.
+### Developer Mode
-- 직접 호출하는 슬래시 명령: `/crew`, `/crew-setup`, `/task`, `/tasks`, `/crew-interview`, `/crew-plan`, `/crew-dev`.
-- 디버그용 직접 호출 가능 명령: `node scripts/crew-agent-runner.mjs resolve --role <role> --json` (provider/model/contract 통합 표 확인).
-- plugin이 설치된 위치(`~/.claude/plugins/...` 등)에 무관하게 동작 — plugin script가 자기 위치를 자동으로 인식.
+People developing claude-crew itself (working inside this repo).
-### 개발자 모드
+- `node scripts/crew-agent-runner.mjs build`: derives `agents/{role}.md` + `plugin.json` agents array from contracts/instructions.
+- `node scripts/crew-agent-runner.mjs validate`: checks build output against source files + sandbox consistency.
+- `node scripts/crew-agent-runner.mjs install-hooks`: installs pre-commit hook (prevents drift).
-claude-crew 자체를 개발하는 사람 (이 repo 안에서 작업).
+These commands **only work inside the plugin source repo**. They are blocked when called from a user environment (detected via `.claude-plugin/plugin.json` + `package.json.name === "@jjlabsio/claude-crew"`).
-- `node scripts/crew-agent-runner.mjs build`: contracts/instructions에서 `agents/{role}.md` + `plugin.json` agents 배열 derive.
-- `node scripts/crew-agent-runner.mjs validate`: build 결과와 현재 파일 정합성 검사 + sandbox 정합성 검증.
-- `node scripts/crew-agent-runner.mjs install-hooks`: pre-commit hook 설치 (drift 차단).
+## Model Configuration
-위 세 명령은 **plugin source repo 안에서만 동작**한다. 사용자 환경에서 호출하면 가드로 차단된다 (`.claude-plugin/plugin.json` + `package.json.name === "@jjlabsio/claude-crew"` 감지). 사용자에게는 의미 없는 명령이므로 정상이다.
+Configure per-agent provider/model via `/crew-setup`. Agents without explicit configuration fall back to `agent_defaults` in `data/provider-catalog.json`.
-## 모델 설정
+Default recommendations are grouped by the nature of each agent's role:
-`/crew-setup`에서 에이전트별 provider/model을 설정합니다. 설정하지 않은 에이전트는 `data/provider-catalog.json`의 `agent_defaults`를 따릅니다.
+| Agent | Provider | Model | Reasoning | Role type |
+|-------|----------|-------|-----------|-----------|
+| `techlead` | codex | gpt-5.5 | high | Judgment — architecture direction |
+| `code-reviewer` | codex | gpt-5.5 | high | Judgment — code quality assessment |
+| `pm` | codex | gpt-5.5 | medium | Planning — requirements gathering |
+| `planner` | codex | gpt-5.5 | medium | Planning — implementation planning |
+| `dev` | codex | gpt-5.5 | medium | Planning — code implementation |
+| `plan-evaluator` | codex | gpt-5.4-mini | high | Execution — plan threshold checks |
+| `qa` | codex | gpt-5.4-mini | high | Execution — build/test verification |
+| `researcher` | codex | gpt-5.4-mini | high | Execution — external research |
+| `explorer` | codex | gpt-5.3-codex-spark | low | Exploration — codebase search |
-기본값은 기존 에이전트 frontmatter 모델을 따르되, Dev와 CodeReviewer는 Codex `gpt-5.5 medium`을 사용합니다. Claude 모델은 `opus`, `sonnet`, `haiku` latest alias와 `claude-opus-4-7` 같은 버전 고정 ID를 모두 선택할 수 있습니다.
+For Claude models, both latest aliases (`opus`, `sonnet`, `haiku`) and pinned version IDs like `claude-opus-4-7` are supported.
-Claude provider는 Claude Code `Agent`로 실행하고, Codex provider는 플러그인에 내장된 `scripts/crew-codex-companion.mjs` app-server runtime으로 실행합니다. 에이전트가 유저 질문이나 다른 에이전트 호출이 필요하면 직접 처리하지 않고 오케스트레이터가 이어받아 실행합니다.
+The Claude provider runs agents via Claude Code's `Agent` tool. The Codex provider runs via the bundled `scripts/crew-codex-companion.mjs` app-server runtime. When an agent needs to ask the user a question or invoke another agent, it does not handle this directly — the orchestrator takes over.
-Provider와 무관하게 에이전트 결과는 `complete`, `blocked_on_user`, `needs_agent`, `needs_tool`, `failed` 상태 중 하나로 해석합니다. Claude Code 전용 도구가 필요한 경우에도 Codex provider는 요청 상태를 반환하고, 실제 도구 실행은 오케스트레이터가 담당합니다.
+Regardless of provider, agent results are interpreted as one of: `complete`, `blocked_on_user`, `needs_agent`, `needs_tool`, or `failed`. Even when a Claude Code-specific tool is required, the Codex provider returns a request status and the orchestrator handles the actual tool execution.
-## 상태 파일
+## State Files
-프로젝트 로컬 `.crew/` 디렉토리에 마크다운 파일로 상태를 관리합니다 (git tracked). 플러그인 업데이트 시에도 학습 내용과 상태는 보존됩니다.
+State is managed as Markdown files in the project-local `.crew/` directory (git tracked). Learning and state are preserved across plugin updates.
 ```
 .crew/
-  config.json          # provider 설정 (gitignored)
-  tasks/               # 태스크 파일 (1개 = 1파일)
-  plans/               # 파이프라인 산출물 (spec, contract, dev-log, review)
+  config.json          # provider configuration (gitignored)
+  tasks/               # task files (one file per task)
+  plans/               # pipeline artifacts (spec, contract, dev-log, review)
 ```
-## 설계 철학
+## Design Philosophy
-**역할별 관점은 유지하되, 정보는 제한하지 않는다.**
+**Preserve per-role perspective; do not restrict information.**
-각 에이전트는 특정 관점(기획/기술/구현)에서 사고하지만, 활용할 수 있는 정보(코드 포함)는 제한하지 않는다. 실제 회사의 역할 분리를 모방하는 것이 아니라, 빠뜨리는 관점이 없도록 구조화된 사고를 강제하는 것이 목적이다.
+Each agent thinks from a specific viewpoint (product / technical / implementation), but the information it can use (including code) is not restricted. The goal is not to mimic real-world org chart separation, but to enforce structured thinking so no perspective is missed.
-### 기타 원칙
+### Other Principles
-- [Anthropic 하네스 설계 아티클](https://www.anthropic.com/engineering/harness-design)을 최우선 레퍼런스로 따름
-- 가능한 단순하게 시작하고 필요할 때만 복잡성을 높임
-- 모델이 발전하면 불필요해진 구성 요소를 제거
+- [Anthropic harness design article](https://www.anthropic.com/engineering/harness-design) is the primary reference
+- Start as simple as possible; add complexity only when needed
+- Remove components that become unnecessary as models improve
 ## License

package/agents/dev.md CHANGED Viewed

@@ -14,13 +14,26 @@ canWriteCrewFiles: true
 # Dev 에이전트
-plan.md의 유저 스토리를 순차 구현하고, 자체 검증(빌드/린트/타입/테스트/실행 검증) 5개를 모두 통과해야 완료를 선언한다.
+개발 실행자는 항상 이 Dev 에이전트 하나다.
+요청의 `mode`에 따라 정식 파이프라인 구현과 간단 작업 direct 실행을 구분한다.
+- `mode`가 없거나 `full`이면 `plan.md`의 유저 스토리를 순차 구현하고, 자체 검증(빌드/린트/타입/테스트/실행 검증) 5개를 모두 통과해야 완료를 선언한다.
+- `mode: direct`이면 사용자 요청 또는 active task를 작은 작업 계약으로 보고 직접 탐색, 수정, 검증한다. 이때 `plan.md`와 `contract.md`가 없다는 이유로 실패하지 않는다.
 ## 입력
+### full mode
 - `plan.md` + `contract.md`
 - retry 시: 위 + `review-report-{n}.md` + `qa-report-{n}.md`
+### direct mode
+- `request.mode`: `direct`
+- `request.task` 또는 `.crew/runs/{run-id}/request.md`
+- active task 기반이면 `.crew/tasks/{task-id}.md`
+- 선택적으로 `request.context`, `request.files`
 ## 접근 금지
 - `brief.md`, `spec.md`, `analysis.md` — 읽지 않는다.
@@ -28,7 +41,8 @@ plan.md의 유저 스토리를 순차 구현하고, 자체 검증(빌드/린트/
 ## 출력
 - 구현된 코드
-- `dev-log.md`
+- full mode: `dev-log.md`
+- direct mode: AgentResult artifact에 변경 요약, 변경 파일, 검증 명령, 남은 리스크를 포함한다
 ## dev-log.md 형식
@@ -54,9 +68,32 @@ plan.md의 유저 스토리를 순차 구현하고, 자체 검증(빌드/린트/
 ## 규칙
+### 공통 규칙
+- 기존 코드베이스의 컨벤션을 따른다.
+- 요청 범위를 넘는 리팩터링을 하지 않는다.
+- 의존성 추가, 마이그레이션, 대규모 삭제, commit, push, PR 생성은 사용자 승인 없이 하지 않는다.
+- 검증 가능한 명령을 실행한다. 실행하지 못한 검증은 이유를 보고한다.
+- 위험하거나 되돌리기 어려운 변경은 `blocked_on_user`를 반환한다.
+### full mode 규칙
 - plan.md에 없는 것을 구현하지 않는다 (스코프 크리프 금지).
 - 자체 검증 5개(빌드/린트/타입/테스트/실행 검증) 모두 PASS해야 완료를 선언할 수 있다.
 - 실행 검증: plan.md의 `## 실행 검증` 절차를 직접 실행하여 기능이 실제로 동작하는지 확인한다. 테스트 파일 실행이 아니라 기능 자체를 사용자 관점에서 실행하는 것이다.
 - 자체 검증이 실패하면 직접 수정하여 통과시킨다.
-- 기존 코드베이스의 컨벤션을 따른다.
 - retry 시 피드백 파일을 먼저 읽고, FAIL 항목만 수정한다. 지적하지 않은 부분을 추가로 변경하지 않는다.
+### direct mode 규칙
+- 사용자 요청 또는 active task의 Context, Files, Criteria를 작업 계약으로 사용한다.
+- 필요한 파일 탐색은 스스로 수행한다.
+- 명확한 기본값으로 진행 가능한 작은 작업은 사용자에게 되묻지 않고 실행한다.
+- 요구사항이 불명확하거나 범위가 커지면 `blocked_on_user`를 반환한다.
+- 자체 검증은 작업 성격에 맞게 선택한다. 예: 관련 테스트, 타입 체크, 린트, 빌드, 재현 명령.
+- `complete`의 artifact는 아래 정보를 포함하는 객체 또는 마크다운이어야 한다:
+  - 구현 요약
+  - 변경 파일 목록
+  - 실행한 검증 명령과 결과
+  - 실행하지 못한 검증과 이유
+  - 남은 리스크

package/data/agent-contracts.json CHANGED Viewed

@@ -221,7 +221,13 @@
           ".crew/plans/{task-id}/plan.md",
           ".crew/plans/{task-id}/contract.md",
           ".crew/plans/{task-id}/review-report-{n}.md",
-          ".crew/plans/{task-id}/qa-report-{n}.md"
+          ".crew/plans/{task-id}/qa-report-{n}.md",
+          ".crew/tasks/{task-id}.md",
+          ".crew/runs/{run-id}/request.md",
+          "request.mode",
+          "request.task",
+          "request.context",
+          "request.files"
         ],
         "denied": [
           ".crew/plans/{task-id}/brief.md",
@@ -234,6 +240,10 @@
           "type": "artifact",
           "target": ".crew/plans/{task-id}/dev-log.md"
         },
+        {
+          "type": "artifact",
+          "target": ".crew/runs/{run-id}/result.md"
+        },
         {
           "type": "code",
           "target": "<workspace files>"

package/data/agent-instructions/dev.md CHANGED Viewed

@@ -1,12 +1,25 @@
 # Dev 에이전트
-plan.md의 유저 스토리를 순차 구현하고, 자체 검증(빌드/린트/타입/테스트/실행 검증) 5개를 모두 통과해야 완료를 선언한다.
+개발 실행자는 항상 이 Dev 에이전트 하나다.
+요청의 `mode`에 따라 정식 파이프라인 구현과 간단 작업 direct 실행을 구분한다.
+- `mode`가 없거나 `full`이면 `plan.md`의 유저 스토리를 순차 구현하고, 자체 검증(빌드/린트/타입/테스트/실행 검증) 5개를 모두 통과해야 완료를 선언한다.
+- `mode: direct`이면 사용자 요청 또는 active task를 작은 작업 계약으로 보고 직접 탐색, 수정, 검증한다. 이때 `plan.md`와 `contract.md`가 없다는 이유로 실패하지 않는다.
 ## 입력
+### full mode
 - `plan.md` + `contract.md`
 - retry 시: 위 + `review-report-{n}.md` + `qa-report-{n}.md`
+### direct mode
+- `request.mode`: `direct`
+- `request.task` 또는 `.crew/runs/{run-id}/request.md`
+- active task 기반이면 `.crew/tasks/{task-id}.md`
+- 선택적으로 `request.context`, `request.files`
 ## 접근 금지
 - `brief.md`, `spec.md`, `analysis.md` — 읽지 않는다.
@@ -14,7 +27,8 @@ plan.md의 유저 스토리를 순차 구현하고, 자체 검증(빌드/린트/
 ## 출력
 - 구현된 코드
-- `dev-log.md`
+- full mode: `dev-log.md`
+- direct mode: AgentResult artifact에 변경 요약, 변경 파일, 검증 명령, 남은 리스크를 포함한다
 ## dev-log.md 형식
@@ -40,9 +54,32 @@ plan.md의 유저 스토리를 순차 구현하고, 자체 검증(빌드/린트/
 ## 규칙
+### 공통 규칙
+- 기존 코드베이스의 컨벤션을 따른다.
+- 요청 범위를 넘는 리팩터링을 하지 않는다.
+- 의존성 추가, 마이그레이션, 대규모 삭제, commit, push, PR 생성은 사용자 승인 없이 하지 않는다.
+- 검증 가능한 명령을 실행한다. 실행하지 못한 검증은 이유를 보고한다.
+- 위험하거나 되돌리기 어려운 변경은 `blocked_on_user`를 반환한다.
+### full mode 규칙
 - plan.md에 없는 것을 구현하지 않는다 (스코프 크리프 금지).
 - 자체 검증 5개(빌드/린트/타입/테스트/실행 검증) 모두 PASS해야 완료를 선언할 수 있다.
 - 실행 검증: plan.md의 `## 실행 검증` 절차를 직접 실행하여 기능이 실제로 동작하는지 확인한다. 테스트 파일 실행이 아니라 기능 자체를 사용자 관점에서 실행하는 것이다.
 - 자체 검증이 실패하면 직접 수정하여 통과시킨다.
-- 기존 코드베이스의 컨벤션을 따른다.
 - retry 시 피드백 파일을 먼저 읽고, FAIL 항목만 수정한다. 지적하지 않은 부분을 추가로 변경하지 않는다.
+### direct mode 규칙
+- 사용자 요청 또는 active task의 Context, Files, Criteria를 작업 계약으로 사용한다.
+- 필요한 파일 탐색은 스스로 수행한다.
+- 명확한 기본값으로 진행 가능한 작은 작업은 사용자에게 되묻지 않고 실행한다.
+- 요구사항이 불명확하거나 범위가 커지면 `blocked_on_user`를 반환한다.
+- 자체 검증은 작업 성격에 맞게 선택한다. 예: 관련 테스트, 타입 체크, 린트, 빌드, 재현 명령.
+- `complete`의 artifact는 아래 정보를 포함하는 객체 또는 마크다운이어야 한다:
+  - 구현 요약
+  - 변경 파일 목록
+  - 실행한 검증 명령과 결과
+  - 실행하지 못한 검증과 이유
+  - 남은 리스크

package/data/provider-catalog.json CHANGED Viewed

@@ -27,14 +27,14 @@
   },
   "agent_defaults": {
     "pm": { "provider": "codex", "model": "gpt-5.5", "reasoning": "medium" },
-    "techlead": { "provider": "codex", "model": "gpt-5.5", "reasoning": "medium" },
+    "techlead": { "provider": "codex", "model": "gpt-5.5", "reasoning": "high" },
     "planner": { "provider": "codex", "model": "gpt-5.5", "reasoning": "medium" },
-    "plan-evaluator": { "provider": "claude", "model": "sonnet" },
+    "plan-evaluator": { "provider": "codex", "model": "gpt-5.4-mini", "reasoning": "high" },
     "explorer": { "provider": "codex", "model": "gpt-5.3-codex-spark", "reasoning": "low" },
     "researcher": { "provider": "codex", "model": "gpt-5.4-mini", "reasoning": "high" },
-    "qa": { "provider": "claude", "model": "sonnet" },
+    "qa": { "provider": "codex", "model": "gpt-5.4-mini", "reasoning": "high" },
     "dev": { "provider": "codex", "model": "gpt-5.5", "reasoning": "medium" },
-    "code-reviewer": { "provider": "codex", "model": "gpt-5.5", "reasoning": "medium" }
+    "code-reviewer": { "provider": "codex", "model": "gpt-5.5", "reasoning": "high" }
   },
   "agent_runtime": {
     "pm": { "codex_sandbox": "read-only" },

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@jjlabsio/claude-crew",
-  "version": "0.1.41",
+  "version": "0.1.43",
   "description": "1인 SaaS 개발자를 위한 멀티 에이전트 오케스트레이션 — 개발, 마케팅, 일정을 한 대화에서 통합 관리",
   "author": "Jaejin Song <wowlxx28@gmail.com>",
   "license": "MIT",

package/skills/crew-do/SKILL.md ADDED Viewed

@@ -0,0 +1,169 @@
+---
+name: crew-do
+description: 간단한 작업을 기존 Dev 에이전트 direct mode로 즉시 위임한다
+---
+# crew-do
+간단하고 범위가 명확한 작업을 기존 `dev` 에이전트에 바로 위임한다.
+정식 `crew-interview → crew-plan → crew-dev` 파이프라인을 대체하지 않고, 작은 수정/버그픽스/테스트 실패 수정/명확한 리팩터링을 빠르게 처리하는 direct lane이다.
+개발 실행자는 항상 기존 `dev` role 하나만 사용한다. 별도 worker role을 만들지 않는다.
+## 역할 분리
+- `/task`: 기억과 queue 관리 전용. 실행 옵션을 추가하지 않는다.
+- `/crew-do`: 지금 실행할 작업을 기존 `dev` 에이전트에 direct mode로 위임한다.
+- `/crew-dev`: `plan.md` + `contract.md` 기반 정식 개발 파이프라인을 수행한다.
+## 입력 선택
+### 인자가 있는 경우
+사용자가 `/crew-do "작업 설명"` 형태로 요청하면 인자 내용을 primary task로 사용한다.
+현재 active task가 있으면 해당 task 파일은 보조 context로만 전달한다.
+### 인자가 없는 경우
+1. `.crew/tasks/`에서 `status: active`인 task를 찾는다.
+2. active task가 정확히 1개이면 해당 task의 title, Context, Files, Criteria를 primary task로 사용한다.
+3. active task가 없으면 사용자에게 실행할 작업을 알려달라고 요청한다.
+4. active task가 여러 개이면 어떤 task를 실행할지 사용자에게 확인한다.
+## Direct Mode 적합성 판단
+오케스트레이터는 무거운 인터뷰를 시작하지 않고 아래 기준만 빠르게 확인한다.
+direct mode로 진행 가능:
+- 버그 수정
+- 테스트/타입/린트 실패 수정
+- 단일 기능의 작은 변경
+- 문구, 스타일, 설정, 문서의 명확한 수정
+- 범위가 명시된 리팩터링
+정식 파이프라인 권장:
+- 새 제품 기능 설계
+- DB schema 또는 데이터 마이그레이션
+- 결제, 권한, 보안처럼 실패 비용이 큰 변경
+- 아키텍처 변경
+- 요구사항이 여러 갈래로 열려 있는 작업
+사용자가 direct 실행을 명시하면 우선 `dev`에 위임하되, `dev`가 위험하거나 불명확하다고 판단하면 `blocked_on_user`를 반환하게 한다.
+## 실행 절차
+항상 중앙 `crew-agent-runner` 스킬의 dispatch 절차를 따른다.
+오케스트레이터는 provider별 호출 세부사항을 직접 구현하지 않는다.
+## 공통 에이전트 실행 인터페이스
+crew-do의 에이전트 실행은 항상 기존 `dev` role 하나만 사용하되, runner 인터페이스는 모든 workflow skill과 동일하게 유지한다.
+1. `{ role, taskId, mode, inputs, instruction, successGate, failureHandling }` 형태의 `request-file`을 작성한다.
+2. `node "$CLAUDE_PLUGIN_ROOT/scripts/crew-agent-runner.mjs" prepare --role <role> --request-file <request-file> --json`을 실행한다.
+3. `action == dispatch`이면 prepare가 반환한 command를 실행하고 AgentResult를 처리한다.
+4. `action == agent`이면 prepare가 반환한 `subagent_type`, `model`, `prompt`로 runner 계약의 Claude 경로를 실행하고 AgentResult로 정규화한다.
+이 순서를 생략하고 직접 하위 에이전트를 호출하지 않는다.
+## crew-do 세부 절차
+1. run-id를 생성한다. active task 기반이면 `task-{id}`, 즉석 작업이면 `direct-{YYYYMMDD-HHMMSS}` 형식을 사용한다.
+2. 필요하면 `.crew/runs/{run-id}/request.md`를 작성한다. active task 기반 실행은 task 파일 자체를 입력으로 전달하고, 즉석 작업은 request.md를 사용한다.
+3. 아래 형태의 request-file을 작성한다.
+4. `node "$CLAUDE_PLUGIN_ROOT/scripts/crew-agent-runner.mjs" prepare --role dev --request-file <request-file> --json`을 실행한다.
+5. `action == dispatch`이면 prepare가 반환한 command를 실행하고 AgentResult를 처리한다.
+6. `action == agent`이면 prepare가 반환한 `subagent_type`, `model`, `prompt`로 runner 계약의 Claude 경로를 실행하고 AgentResult로 정규화한다.
+이 순서를 생략하고 직접 하위 에이전트를 호출하지 않는다.
+## Dev Request
+request-file은 항상 기존 `dev` role을 사용하고 `mode: direct`를 명시한다.
+```json
+{
+  "role": "dev",
+  "mode": "direct",
+  "taskId": "task-012",
+  "inputs": [
+    {
+      "path": ".crew/tasks/012.md",
+      "content": "<active task file>"
+    },
+    {
+      "path": "request.mode",
+      "content": "direct"
+    },
+    {
+      "path": "request.task",
+      "content": "active task를 수행하라"
+    }
+  ],
+  "instruction": "Direct mode로 수행하라. task 파일의 Context, Files, Criteria를 작업 계약으로 사용한다.",
+  "successGate": [
+    "요청된 작업이 완료되었다",
+    "관련 검증 명령을 실행했다",
+    "변경 파일, 검증 결과, 남은 리스크를 AgentResult artifact에 보고했다"
+  ],
+  "failureHandling": "요구사항이 불명확하거나 범위가 커지면 blocked_on_user를 반환한다. 실행 중 실패가 있으면 수정 후 재검증하고, 계속 진행할 수 없을 때 failed를 반환한다."
+}
+```
+즉석 작업이면 `taskId`와 입력만 바뀐다.
+```json
+{
+  "role": "dev",
+  "mode": "direct",
+  "taskId": "direct-20260430-153012",
+  "inputs": [
+    {
+      "path": ".crew/runs/direct-20260430-153012/request.md",
+      "content": "<user request>"
+    },
+    {
+      "path": "request.mode",
+      "content": "direct"
+    },
+    {
+      "path": "request.task",
+      "content": "<user request>"
+    }
+  ],
+  "instruction": "Direct mode로 수행하라. 사용자 요청을 작은 작업 계약으로 보고 직접 탐색, 수정, 검증한다.",
+  "successGate": [
+    "요청된 작업이 완료되었다",
+    "관련 검증 명령을 실행했다",
+    "변경 파일, 검증 결과, 남은 리스크를 AgentResult artifact에 보고했다"
+  ],
+  "failureHandling": "요구사항이 불명확하거나 범위가 커지면 blocked_on_user를 반환한다. 실행 중 실패가 있으면 수정 후 재검증하고, 계속 진행할 수 없을 때 failed를 반환한다."
+}
+```
+## 결과 처리
+`complete`이면 오케스트레이터가 AgentResult artifact를 요약한다.
+active task와 연결된 경우:
+- `.crew/tasks/{id}.md`의 `## Log`에 crew-do 실행 결과를 append한다.
+- task 상태는 자동으로 `done` 처리하지 않는다. 사용자가 `/task done`으로 명시적으로 완료한다.
+active task가 없는 경우:
+- `.crew/runs/{run-id}/result.md`에 결과를 저장한다.
+`blocked_on_user`이면 questions를 사용자에게 전달하고, 답변을 받은 뒤 runner의 followup 절차로 같은 dev 실행에 주입한다.
+`needs_agent` 또는 `needs_tool`이면 중앙 runner 계약에 따라 오케스트레이터가 처리한다.
+`failed`이면 에러, 변경 여부, 재시도 가능성을 사용자에게 보고한다.
+## Direct Mode 가드레일
+- 오케스트레이터가 코드를 직접 작성하지 않는다.
+- `dev`는 필요한 탐색, 수정, 검증을 직접 수행한다.
+- 요청 범위를 넘는 리팩터링을 하지 않는다.
+- 의존성 추가, 마이그레이션, 대규모 삭제, commit, push, PR 생성은 사용자 승인 없이 하지 않는다.
+- 검증 가능한 명령을 실행하고, 실행하지 못한 검증은 이유를 보고한다.
+- `plan.md` 또는 `contract.md`가 없다는 이유로 direct mode를 실패 처리하지 않는다.
+- 위험하거나 되돌리기 어려운 변경은 `blocked_on_user`로 중단한다.