workflow-ai 1.0.65 → 1.0.66

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (36) hide show
  1. package/README.md +377 -371
  2. package/configs/agent-health-rules.yaml +12 -1
  3. package/configs/pipeline.yaml +6 -6
  4. package/package.json +1 -1
  5. package/src/lib/agent-spawner.mjs +47 -6
  6. package/src/lib/error-classifier.mjs +311 -274
  7. package/src/runner.mjs +215 -58
  8. package/src/skills/coach/tests/cases/TC-COACH-001/current/meta.json +93 -93
  9. package/src/skills/coach/tests/cases/TC-COACH-002/current/meta.json +93 -93
  10. package/src/skills/create-plan/SKILL.md +1 -0
  11. package/src/skills/create-plan/knowledge/test-hygiene.md +47 -0
  12. package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/meta.json +113 -113
  13. package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/meta.json +87 -87
  14. package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005/current/meta.json +87 -87
  15. package/src/skills/review-result/SKILL.md +1 -0
  16. package/src/skills/review-result/knowledge/test-hygiene.md +44 -0
  17. package/src/skills/review-result/scripts/verify-artifacts.js +115 -2
  18. package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/claude-sonnet/trial-1.md +7 -0
  19. package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/claude-sonnet/trial-2.md +7 -0
  20. package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/claude-sonnet/trial-3.md +7 -0
  21. package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/judge.json +163 -0
  22. package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-deepseek/trial-1.md +5 -0
  23. package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-deepseek/trial-2.md +5 -0
  24. package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-deepseek/trial-3.md +11 -0
  25. package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-glm/trial-1.md +16 -0
  26. package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-glm/trial-2.md +18 -0
  27. package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-glm/trial-3.md +17 -0
  28. package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-minimax/trial-1.md +17 -0
  29. package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-minimax/trial-2.md +31 -0
  30. package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-minimax/trial-3.md +5 -0
  31. package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/meta.json +115 -0
  32. package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003-test-isolation.yaml +50 -0
  33. package/src/skills/review-result/tests/fixtures/QA-904-test-isolation-violation/QA-904.md +51 -0
  34. package/src/skills/review-result/tests/fixtures/QA-904-test-isolation-violation/example-test.mjs +36 -0
  35. package/src/skills/review-result/tests/index.yaml +5 -0
  36. package/src/skills/review-result/tests/rubrics/test-isolation.md +20 -0
package/README.md CHANGED
@@ -1,371 +1,377 @@
1
- # workflow-ai
2
-
3
- Координатор воркфлоу для AI-агентов — конвейер на основе канбан-доски для AI-агентов, пишущих код.
4
-
5
- Система координации AI-агентов через файловую канбан-доску. Автоматически оркестрирует выполнение задач: берёт тикеты из очереди, запускает нужного агента, проверяет результат и генерирует отчёты.
6
-
7
- ## Установка
8
-
9
- ```bash
10
- npm install -g workflow-ai
11
- ```
12
-
13
- ## Быстрый старт
14
-
15
- ```bash
16
- # 1. Инициализировать воркфлоу в вашем проекте
17
- workflow init
18
- ```
19
-
20
- ```text
21
- # 2. Открыть проект в AI-агенте (Claude Code, Kilo, и т.д.) и попросить создать план через скил:
22
- Создай план <описание задачи> используя скил .workflow/src/skills/create-plan/SKILL.md
23
- ```
24
-
25
- ```bash
26
- # 3. Запустить конвейер — он декомпозирует план на тикеты и начнёт исполнение
27
- workflow run
28
- ```
29
-
30
- ## Команды
31
-
32
- | Команда | Описание |
33
- |---------|----------|
34
- | `workflow init [path] [--force]` | Инициализировать директорию `.workflow/` со структурой канбан-доски |
35
- | `workflow run [options]` | Запустить AI-конвейер |
36
- | `workflow update [path]` | Обновить глобальную директорию и пересоздать junctions |
37
- | `workflow eject <skill> [path]` | Извлечь скил (скопировать из глобальной директории в проект) |
38
- | `workflow eject-scripts [path]` | Извлечь скрипты (скопировать из глобальной директории в проект) |
39
- | `workflow eject-configs [path]` | Извлечь конфиги (скопировать из глобальной директории в проект) |
40
- | `workflow list [path]` | Вывести список скилов со статусом (shared/ejected/project-only) |
41
- | `workflow help` | Показать справку |
42
- | `workflow version` | Показать версию |
43
-
44
- ### Опции команды `run`
45
-
46
- | Опция | Описание |
47
- |-------|----------|
48
- | `--plan <plan>` | ID плана для выполнения |
49
- | `--config <path>` | Путь к конфиг-файлу |
50
- | `--project <path>` | Корень проекта (по умолчанию: автоопределение) |
51
-
52
- ## Инициализация
53
-
54
- Команда `workflow init` создаёт структуру директории `.workflow/`:
55
-
56
- ```
57
- .workflow/
58
- ├── config/ # → junction на ~/.workflow/configs/ (eject для кастомизации)
59
- ├── plans/
60
- │ ├── current/ # Текущие планы разработки
61
- │ ├── templates/ # Шаблоны планов с триггерами (повторяющиеся планы)
62
- │ └── archive/ # Архивные планы
63
- ├── tickets/
64
- │ ├── backlog/ # Ожидают условий
65
- │ ├── ready/ # Готовы к выполнению
66
- │ ├── in-progress/ # В работе
67
- │ ├── blocked/ # Заблокированы зависимостями
68
- │ ├── review/ # Ожидают ревью
69
- │ └── done/ # Завершены
70
- ├── reports/ # Сгенерированные отчёты
71
- ├── logs/ # Логи выполнения конвейера
72
- ├── metrics/ # Метрики производительности
73
- ├── templates/ # Шаблоны тикетов/планов/отчётов
74
- └── src/
75
- ├── skills/ # Инструкции скилов (junctions на глобальные, по каждому скилу)
76
- └── scripts/ # Скрипты автоматизации (junction на глобальные)
77
- ```
78
-
79
- ## Конвейер
80
-
81
- Команда `workflow run` исполняет многоэтапный конвейер:
82
-
83
- 1. **pick-first-task** — выбрать тикет из очереди ready
84
- 2. **check-plan-templates** — проверить триггеры шаблонов планов, создать планы при срабатывании
85
- 3. **check-plan-decomposition** — проверить, что план декомпозирован на тикеты
86
- 4. **decompose-plan** — разбить план на тикеты (при необходимости)
87
- 5. **check-conditions** — проверить условия готовности тикета
88
- 6. **move-to-ready** — переместить тикеты из backlog в ready
89
- 7. **pick-next-task** — выбрать следующий тикет для выполнения
90
- 8. **move-to-in-progress** — начать выполнение
91
- 9. **check-relevance** — проверить, что тикет всё ещё актуален (на скриптах, без LLM)
92
- 10. **execute-task** — выполнить работу через AI-агента
93
- 11. **move-to-review** — отправить на ревью
94
- 12. **review-result** — проверить результаты по Definition of Done
95
- 13. **increment-task-attempts** — учесть попытки повторов
96
- 14. **move-ticket** — переместить в done/blocked по результатам ревью
97
- 15. **create-report** — сгенерировать отчёт о выполнении
98
- 16. **analyze-report / decompose-gaps** — проанализировать результаты и итерировать
99
-
100
- ### Поддерживаемые агенты
101
-
102
- | Агент | Описание |
103
- |-------|----------|
104
- | `claude-code` | Claude Opus — мощная модель для сложных задач |
105
- | `qwen-code` | Qwen Code — альтернативный агент |
106
- | `kilo-code` | Kilo Code — мультирежимный агент |
107
- ...
108
-
109
- Агенты настраиваются в `configs/pipeline.yaml`.
110
-
111
- ## Скилы
112
-
113
- Встроенные скилы для разных типов задач:
114
-
115
- | Скил | Описание |
116
- |------|----------|
117
- | `analyze-report` | Анализ отчёта |
118
- | `coach` | Управление и улучшение скилов |
119
- | `create-plan` | Создание плана |
120
- | `create-report` | Генерация отчёта |
121
- | `decompose-gaps` | Декомпозиция пробелов |
122
- | `decompose-plan` | Декомпозиция плана на тикеты |
123
- | `deep-research` | Глубокий ресерч |
124
- | `execute-task` | Выполнение задачи |
125
- | `review-result` | Ревью результата по DoD |
126
-
127
- Скилы хранятся глобально в `~/.workflow/skills/` и подключаются в проекты через junctions.
128
-
129
- Используйте `workflow eject <skill>` для копирования скила в проект для кастомизации.
130
-
131
- ### Как работать с коучем
132
-
133
- Коуч мета-скил для создания и улучшения остальных скилов. Правки в `.workflow/src/skills/` делаются **только** через него.
134
-
135
- ```text
136
- # Запрос к AI-агенту:
137
- Загрузи коуча из .workflow/src/skills/coach/SKILL.md и <действие>
138
- ```
139
-
140
- Варианты `<действия>`:
141
-
142
- | Тип задачи | Пример запроса |
143
- |------------|----------------|
144
- | Создать новый скил | `создай скил <имя> для <назначение>` |
145
- | Аудит существующего | `сделай аудит скила <имя>` |
146
- | Анализ эффективности | `проанализируй результаты скила <имя> по завершённым тикетам` |
147
- | Точечное улучшение | `улучши скил <имя>: <что именно>` |
148
- | Ресерч практик | `найди лучшие практики для <тема> и обогати скил <имя>` |
149
- | Ревью скила | `сделай ревью скила <имя>` |
150
-
151
- Коуч сам определит тип задачи, загрузит нужный воркфлоу, внесёт правку, прогонит тест скила и запишет результат в `.workflow/coach-backlog.yaml`. Коммит делает пользователь.
152
-
153
- ## Регрессионные тесты скилов
154
-
155
- Трёхуровневая система тестирования скилов для проверки качества AI-агентов.
156
-
157
- ### Три слоя тестирования
158
-
159
- | Уровень | Название | Описание |
160
- |---------|----------|----------|
161
- | L0 | Static | Базовая проверка синтаксиса и структуры: YAML-валидация, проверка обязательных полей, линтер |
162
- | L1 | Deterministic | Детерминированные тесты: эталонные входные данные → ожидаемый результат (strict match) |
163
- | L2 | Rubric | Гибкая оценка по критериям: scorer выставляет баллы на основе качества результата |
164
-
165
- ### Структура директорий
166
-
167
- ```
168
- src/skills/<name>/tests/
169
- ├── index.yaml # Метаданные тестов, список test cases
170
- ├── cases/ # Входные данные для тестов
171
- │ └── <case-id>/
172
- │ └── input.yaml
173
- ├── fixtures/ # Ожидаемые выходные данные (для L1)
174
- │ └── <case-id>/
175
- │ └── expected.yaml
176
- └── rubrics/ # Критерии оценки (для L2)
177
- └── <case-id>/
178
- └── rubric.yaml
179
- ```
180
-
181
- ### Запуск тестов
182
-
183
- ```bash
184
- npm run test:skills
185
- ```
186
-
187
- ### CLI-флаги
188
-
189
- | Флаг | Описание |
190
- |------|----------|
191
- | `--skill <name>` | Запустить тесты только для указанного скила |
192
- | `--relevant` | Запустить только тесты, соответствующие изменённым файлам |
193
- | `--establish-baseline` | Запустить тесты и сохранить результаты как baseline |
194
- | `--baseline-ref <ref>` | Использовать конкретный baseline (коммит, тег) |
195
- | `--yes` | Автоматически подтверждать все действия |
196
-
197
- ### Режимы вердикта
198
-
199
- | Режим | Описание |
200
- |-------|----------|
201
- | `no-baseline` | Первый запуск результаты сохраняются как baseline без сравнения |
202
- | `no-regression` | Сравнение с baseline — тест считается пройденным, если результат не хуже baseline |
203
-
204
- ### Принцип git write
205
-
206
- Runner и коуч **не выполняют git write-операций**. Все изменения в кодовой базе делает исключительно пользователь. Runner только анализирует и рекомендует, но не коммитит.
207
-
208
- ### Первый запуск на новом проекте
209
-
210
- 1. Запустить тесты с флагом `--establish-baseline`
211
- 2. Проверить результаты: красные тесты — ожидаемы для нового проекта
212
- 3. Зафиксировать baseline: `git commit current/` как baseline-коммит
213
-
214
- ## Скрипты
215
-
216
- Скрипты хранятся глобально в `~/.workflow/scripts/` и подключаются одним junction в `.workflow/src/scripts/`.
217
-
218
- Используйте `workflow eject-scripts` для копирования скриптов в проект для кастомизации.
219
-
220
- ## Конфиги
221
-
222
- Конфиги хранятся глобально в `~/.workflow/configs/` и подключаются одним junction в `.workflow/config/`.
223
-
224
- Используйте `workflow eject-configs` для копирования конфигов в проект для кастомизации.
225
-
226
- ## Шаблоны планов
227
-
228
- Шаблоны планов позволяют автоматически создавать повторяющиеся планы. Шаблоны лежат в `.workflow/plans/templates/` и содержат условия триггеров во frontmatter.
229
-
230
- ### Формат шаблона
231
-
232
- ```yaml
233
- id: "TMPL-001"
234
- title: "Daily manual testing"
235
- type: template
236
- trigger:
237
- type: daily # daily | weekly | date_after | interval_days
238
- params: {} # параметры, зависящие от типа
239
- last_triggered: "" # обновляется автоматически при срабатывании
240
- enabled: true
241
- ```
242
-
243
- ### Типы триггеров
244
-
245
- | Тип | Параметры | Описание |
246
- |-----|-----------|----------|
247
- | `daily` | — | Раз в день |
248
- | `weekly` | `days_of_week: [1,3,5]` (0=вс) | В указанные дни недели |
249
- | `date_after` | `date: "2026-04-01"` | Один раз после указанной даты |
250
- | `interval_days` | `days: 3` | Каждые N дней |
251
-
252
- При срабатывании триггера конвейер создаёт план в `plans/current/` со статусом `approved`, далее идёт обычный поток декомпозиции.
253
-
254
- ## Типы задач
255
-
256
- | Тип | Префикс | Описание |
257
- |-----|---------|----------|
258
- | `arch` | ARCH | Архитектура и планирование |
259
- | `impl` | IMPL | Реализация кода |
260
- | `fix` | FIX | Исправления ошибок |
261
- | `review` | REVIEW | Ревью кода/документации |
262
- | `docs` | DOCS | Документация |
263
- | `admin` | ADMIN | Административные задачи |
264
-
265
- ## Fallback агентов и правила здоровья
266
-
267
- Система включает механизм in-stage fallback и health-мониторинг агентов.
268
-
269
- ### Механика fallback
270
-
271
- Когда агент падает во время выполнения задачи, система использует **artifact-snapshot** для принятия решения:
272
- - Если snapshot пустой (нет записанных файлов) → выполняется fallback на следующего агента
273
- - Если snapshot непустой (есть изменения) задача переходит в состояние `goto.error`
274
-
275
- **Пример сценария:** Qwen превысил quota и упал без записи файлов → Kilo вызван в той же попытке, task_attempts не инкрементирован.
276
-
277
- Конфигурация snapshot:
278
- ```yaml
279
- execution:
280
- artifact_snapshot_enabled: false # по умолчанию выключено
281
- snapshot_paths: ["src/", "configs/"] # что мониторить
282
- snapshot_max_file_size: 524288 # файлы >512KB — только mtime+size
283
- ```
284
-
285
- **Baseline производительности:** `p50=169ms p95=299ms files=598` (из QA-20 benchmark).
286
-
287
- ### Классификатор ошибок и health-реестр
288
-
289
- Ошибки классифицируются по классам:
290
- - `unavailable` — агент временно недоступен (quota, rate limit)
291
- - `transient` временная ошибка сети (timeout, 5xx)
292
- - `misconfigured` — ошибка конфигурации (401, 403, отсутствует API key)
293
- - `unmatched` ошибка не распознана
294
-
295
- **Семантика TTL:**
296
- - `5m` — 5 минут
297
- - `1h` — 1 час
298
- - `until_utc_midnight` — до полуночи UTC (минимум 30 минут)
299
- - `infinite` — навсегда
300
-
301
- Файл конфигурации: `configs/agent-health-rules.yaml`. Файл состояния: `.workflow/state/agent-health.json`.
302
-
303
- ### Команда сброса
304
-
305
- ```bash
306
- # показать текущее состояние
307
- node .workflow/src/scripts/reset-agent-health.js
308
-
309
- # сбросить конкретного агента
310
- node .workflow/src/scripts/reset-agent-health.js --agent qwen-code
311
-
312
- # сбросить всех агентов
313
- node .workflow/src/scripts/reset-agent-health.js --all
314
- ```
315
-
316
- ### Пример добавления правила
317
-
318
- ```yaml
319
- # В configs/agent-health-rules.yaml:
320
- agents:
321
- my-new-agent:
322
- rules:
323
- - id: "my-agent-quota"
324
- class: "unavailable"
325
- ttl: "until_utc_midnight"
326
- pattern: "quota exceeded|daily limit reached"
327
- exit_codes: "any"
328
- ```
329
-
330
- ## Конфигурация
331
-
332
- ### `configs/config.yaml`
333
-
334
- Основная конфигурация воркфлоу: информация о проекте, типы задач, приоритеты, статусы, типы условий, пути, настройки отчётности.
335
-
336
- ### `configs/pipeline.yaml`
337
-
338
- Определение конвейера: агенты, стадии, управление потоком, goto-логика, стратегии повторов.
339
-
340
- ### `configs/ticket-movement-rules.yaml`
341
-
342
- Правила автоматического перемещения тикетов на основе статуса ревью.
343
-
344
- ## Структура проекта
345
-
346
- ```
347
- workflow-ai/
348
- ├── bin/ # Точка входа CLI
349
- ├── src/
350
- │ ├── cli.mjs # Парсинг команд
351
- │ ├── runner.mjs # Оркестратор конвейера
352
- │ ├── init.mjs # Инициализация проекта
353
- │ ├── global-dir.mjs # Управление глобальной ~/.workflow/
354
- ├── junction-manager.mjs # Управление junction/symlink
355
- ├── wf-loader.mjs # Загрузчик конфигов
356
- │ ├── lib/ # Библиотеки утилит
357
- └── tests/ # Набор тестов
358
- ├── configs/ # Файлы конфигурации (источник)
359
- ├── templates/ # Шаблоны воркфлоу (источник)
360
- ├── agent-templates/ # Шаблоны инструкций для AI-агентов
361
- └── package.json
362
- ```
363
-
364
- ## Требования
365
-
366
- - Node.js >= 18.0.0
367
- - npm
368
-
369
- ## Лицензия
370
-
371
- MIT
1
+ # workflow-ai
2
+
3
+ Координатор воркфлоу для AI-агентов — конвейер на основе канбан-доски для AI-агентов, пишущих код.
4
+
5
+ Система координации AI-агентов через файловую канбан-доску. Автоматически оркестрирует выполнение задач: берёт тикеты из очереди, запускает нужного агента, проверяет результат и генерирует отчёты.
6
+
7
+ ## Установка
8
+
9
+ ```bash
10
+ npm install -g workflow-ai
11
+ ```
12
+
13
+ ## Быстрый старт
14
+
15
+ ```bash
16
+ # 1. Инициализировать воркфлоу в вашем проекте
17
+ workflow init
18
+ ```
19
+
20
+ ```text
21
+ # 2. Открыть проект в AI-агенте (Claude Code, Kilo, и т.д.) и попросить создать план через скил:
22
+ Создай план <описание задачи> используя скил .workflow/src/skills/create-plan/SKILL.md
23
+ ```
24
+
25
+ ```bash
26
+ # 3. Запустить конвейер — он декомпозирует план на тикеты и начнёт исполнение
27
+ workflow run
28
+ ```
29
+
30
+ ## Команды
31
+
32
+ | Команда | Описание |
33
+ |---------|----------|
34
+ | `workflow init [path] [--force]` | Инициализировать директорию `.workflow/` со структурой канбан-доски |
35
+ | `workflow run [options]` | Запустить AI-конвейер |
36
+ | `workflow update [path]` | Обновить глобальную директорию и пересоздать junctions |
37
+ | `workflow eject <skill> [path]` | Извлечь скил (скопировать из глобальной директории в проект) |
38
+ | `workflow eject-scripts [path]` | Извлечь скрипты (скопировать из глобальной директории в проект) |
39
+ | `workflow eject-configs [path]` | Извлечь конфиги (скопировать из глобальной директории в проект) |
40
+ | `workflow list [path]` | Вывести список скилов со статусом (shared/ejected/project-only) |
41
+ | `workflow help` | Показать справку |
42
+ | `workflow version` | Показать версию |
43
+
44
+ ### Опции команды `run`
45
+
46
+ | Опция | Описание |
47
+ |-------|----------|
48
+ | `--plan <plan>` | ID плана для выполнения |
49
+ | `--config <path>` | Путь к конфиг-файлу |
50
+ | `--project <path>` | Корень проекта (по умолчанию: автоопределение) |
51
+
52
+ ## Инициализация
53
+
54
+ Команда `workflow init` создаёт структуру директории `.workflow/`:
55
+
56
+ ```
57
+ .workflow/
58
+ ├── config/ # → junction на ~/.workflow/configs/ (eject для кастомизации)
59
+ ├── plans/
60
+ │ ├── current/ # Текущие планы разработки
61
+ │ ├── templates/ # Шаблоны планов с триггерами (повторяющиеся планы)
62
+ │ └── archive/ # Архивные планы
63
+ ├── tickets/
64
+ │ ├── backlog/ # Ожидают условий
65
+ │ ├── ready/ # Готовы к выполнению
66
+ │ ├── in-progress/ # В работе
67
+ │ ├── blocked/ # Заблокированы зависимостями
68
+ │ ├── review/ # Ожидают ревью
69
+ │ └── done/ # Завершены
70
+ ├── reports/ # Сгенерированные отчёты
71
+ ├── logs/ # Логи выполнения конвейера
72
+ ├── metrics/ # Метрики производительности
73
+ ├── templates/ # Шаблоны тикетов/планов/отчётов
74
+ └── src/
75
+ ├── skills/ # Инструкции скилов (junctions на глобальные, по каждому скилу)
76
+ └── scripts/ # Скрипты автоматизации (junction на глобальные)
77
+ ```
78
+
79
+ ## Конвейер
80
+
81
+ Команда `workflow run` исполняет многоэтапный конвейер:
82
+
83
+ 1. **pick-first-task** — выбрать тикет из очереди ready
84
+ 2. **check-plan-templates** — проверить триггеры шаблонов планов, создать планы при срабатывании
85
+ 3. **check-plan-decomposition** — проверить состояние декомпозиции/активации планов
86
+ 4. **allocate-ticket-ids** — выделить стартовые ID для префиксов до декомпозиции
87
+ 5. **decompose-plan** — разбить план на тикеты (при необходимости)
88
+ 6. **check-atomicity-limit / verify-atomicity / increment-atomicity-counter** — проверить атомарность тикетов плана
89
+ 7. **check-conditions** — проверить условия готовности тикета
90
+ 8. **move-to-ready** — переместить тикеты из backlog в ready
91
+ 9. **pick-next-task** — выбрать следующий тикет для выполнения
92
+ 10. **move-to-in-progress** — начать выполнение
93
+ 11. **check-relevance** — проверить, что тикет всё ещё актуален (на скриптах, без LLM)
94
+ 12. **check-mcp** — проверить доступность MCP-зависимостей тикета
95
+ 13. **execute-task** — выполнить работу через AI-агента
96
+ 14. **move-to-review** — отправить на ревью
97
+ 15. **verify-artifacts** — детерминированная проверка артефактов тикета
98
+ 16. **review-result** — проверить результаты по Definition of Done
99
+ 17. **increment-task-attempts** — учесть попытки повторов
100
+ 18. **move-ticket** — переместить в done/blocked по результатам ревью
101
+ 19. **create-report** — сгенерировать отчёт о выполнении
102
+ 20. **analyze-report / decompose-gaps** — проанализировать результаты и итерировать
103
+ 21. **complete-plan / increment-plan-iterations** — закрыть план или запустить следующую итерацию
104
+
105
+ ### Поддерживаемые агенты
106
+
107
+ | Агент | Описание |
108
+ |-------|----------|
109
+ | `claude-code` | Claude Opus — мощная модель для сложных задач |
110
+ | `qwen-code` | Qwen Code — альтернативный агент |
111
+ | `kilo-code` | Kilo Code — мультирежимный агент |
112
+ ...
113
+
114
+ Агенты настраиваются в `configs/pipeline.yaml`.
115
+
116
+ ## Скилы
117
+
118
+ Встроенные скилы для разных типов задач:
119
+
120
+ | Скил | Описание |
121
+ |------|----------|
122
+ | `analyze-report` | Анализ отчёта |
123
+ | `coach` | Управление и улучшение скилов |
124
+ | `create-plan` | Создание плана |
125
+ | `create-report` | Генерация отчёта |
126
+ | `decompose-gaps` | Декомпозиция пробелов |
127
+ | `decompose-plan` | Декомпозиция плана на тикеты |
128
+ | `deep-research` | Глубокий ресерч |
129
+ | `execute-task` | Выполнение задачи |
130
+ | `manual-testing` | UI-observability: ручное тестирование сценариев |
131
+ | `review-result` | Ревью результата по DoD |
132
+
133
+ Скилы хранятся глобально в `~/.workflow/skills/` и подключаются в проекты через junctions.
134
+
135
+ Используйте `workflow eject <skill>` для копирования скила в проект для кастомизации.
136
+
137
+ ### Как работать с коучем
138
+
139
+ Коуч — мета-скил для создания и улучшения остальных скилов. Правки в `.workflow/src/skills/` делаются **только** через него.
140
+
141
+ ```text
142
+ # Запрос к AI-агенту:
143
+ Загрузи коуча из .workflow/src/skills/coach/SKILL.md и <действие>
144
+ ```
145
+
146
+ Варианты `<действия>`:
147
+
148
+ | Тип задачи | Пример запроса |
149
+ |------------|----------------|
150
+ | Создать новый скил | `создай скил <имя> для <назначение>` |
151
+ | Аудит существующего | `сделай аудит скила <имя>` |
152
+ | Анализ эффективности | `проанализируй результаты скила <имя> по завершённым тикетам` |
153
+ | Точечное улучшение | `улучши скил <имя>: <что именно>` |
154
+ | Ресерч практик | `найди лучшие практики для <тема> и обогати скил <имя>` |
155
+ | Ревью скила | `сделай ревью скила <имя>` |
156
+
157
+ Коуч сам определит тип задачи, загрузит нужный воркфлоу, внесёт правку, прогонит тест скила и запишет результат в `.workflow/coach-backlog.yaml`. Коммит делает пользователь.
158
+
159
+ ## Регрессионные тесты скилов
160
+
161
+ Трёхуровневая система тестирования скилов для проверки качества AI-агентов.
162
+
163
+ ### Три слоя тестирования
164
+
165
+ | Уровень | Название | Описание |
166
+ |---------|----------|----------|
167
+ | L0 | Static | Базовая проверка синтаксиса и структуры: YAML-валидация, проверка обязательных полей, линтер |
168
+ | L1 | Deterministic | Детерминированные тесты: эталонные входные данные → ожидаемый результат (strict match) |
169
+ | L2 | Rubric | Гибкая оценка по критериям: scorer выставляет баллы на основе качества результата |
170
+
171
+ ### Структура директорий
172
+
173
+ ```
174
+ src/skills/<name>/tests/
175
+ ├── index.yaml # Метаданные тестов, список test cases
176
+ ├── cases/ # Входные данные для тестов
177
+ └── <case-id>/
178
+ └── input.yaml
179
+ ├── fixtures/ # Ожидаемые выходные данные (для L1)
180
+ │ └── <case-id>/
181
+ │ └── expected.yaml
182
+ └── rubrics/ # Критерии оценки (для L2)
183
+ └── <case-id>/
184
+ └── rubric.yaml
185
+ ```
186
+
187
+ ### Запуск тестов
188
+
189
+ ```bash
190
+ npm run test:skills
191
+ ```
192
+
193
+ ### CLI-флаги
194
+
195
+ | Флаг | Описание |
196
+ |------|----------|
197
+ | `--skill <name>` | Запустить тесты только для указанного скила |
198
+ | `--relevant` | Запустить только тесты, соответствующие изменённым файлам |
199
+ | `--establish-baseline` | Запустить тесты и сохранить результаты как baseline |
200
+ | `--baseline-ref <ref>` | Использовать конкретный baseline (коммит, тег) |
201
+ | `--yes` | Автоматически подтверждать все действия |
202
+
203
+ ### Режимы вердикта
204
+
205
+ | Режим | Описание |
206
+ |-------|----------|
207
+ | `no-baseline` | Первый запуск — результаты сохраняются как baseline без сравнения |
208
+ | `no-regression` | Сравнение с baseline — тест считается пройденным, если результат не хуже baseline |
209
+
210
+ ### Принцип git write
211
+
212
+ Runner и коуч **не выполняют git write-операций**. Все изменения в кодовой базе делает исключительно пользователь. Runner только анализирует и рекомендует, но не коммитит.
213
+
214
+ ### Первый запуск на новом проекте
215
+
216
+ 1. Запустить тесты с флагом `--establish-baseline`
217
+ 2. Проверить результаты: красные тесты — ожидаемы для нового проекта
218
+ 3. Зафиксировать baseline: `git commit current/` как baseline-коммит
219
+
220
+ ## Скрипты
221
+
222
+ Скрипты хранятся глобально в `~/.workflow/scripts/` и подключаются одним junction в `.workflow/src/scripts/`.
223
+
224
+ Используйте `workflow eject-scripts` для копирования скриптов в проект для кастомизации.
225
+
226
+ ## Конфиги
227
+
228
+ Конфиги хранятся глобально в `~/.workflow/configs/` и подключаются одним junction в `.workflow/config/`.
229
+
230
+ Используйте `workflow eject-configs` для копирования конфигов в проект для кастомизации.
231
+
232
+ ## Шаблоны планов
233
+
234
+ Шаблоны планов позволяют автоматически создавать повторяющиеся планы. Шаблоны лежат в `.workflow/plans/templates/` и содержат условия триггеров во frontmatter.
235
+
236
+ ### Формат шаблона
237
+
238
+ ```yaml
239
+ id: "TMPL-001"
240
+ title: "Daily manual testing"
241
+ type: template
242
+ trigger:
243
+ type: daily # daily | weekly | date_after | interval_days
244
+ params: {} # параметры, зависящие от типа
245
+ last_triggered: "" # обновляется автоматически при срабатывании
246
+ enabled: true
247
+ ```
248
+
249
+ ### Типы триггеров
250
+
251
+ | Тип | Параметры | Описание |
252
+ |-----|-----------|----------|
253
+ | `daily` | — | Раз в день |
254
+ | `weekly` | `days_of_week: [1,3,5]` (0=вс) | В указанные дни недели |
255
+ | `date_after` | `date: "2026-04-01"` | Один раз после указанной даты |
256
+ | `interval_days` | `days: 3` | Каждые N дней |
257
+
258
+ При срабатывании триггера конвейер создаёт план в `plans/current/` со статусом `approved`, далее идёт обычный поток декомпозиции.
259
+
260
+ ## Типы задач
261
+
262
+ | Тип | Префикс | Описание |
263
+ |-----|---------|----------|
264
+ | `arch` | ARCH | Архитектура и планирование |
265
+ | `impl` | IMPL | Реализация кода |
266
+ | `fix` | FIX | Исправления ошибок |
267
+ | `review` | REVIEW | Ревью кода/документации |
268
+ | `docs` | DOCS | Документация |
269
+ | `admin` | ADMIN | Административные задачи |
270
+
271
+ ## Fallback агентов и правила здоровья
272
+
273
+ Система включает механизм in-stage fallback и health-мониторинг агентов.
274
+
275
+ ### Механика fallback
276
+
277
+ Когда агент падает во время выполнения задачи, система использует **artifact-snapshot** для принятия решения:
278
+ - Если snapshot пустой (нет записанных файлов) → выполняется fallback на следующего агента
279
+ - Если snapshot непустой (есть изменения) → задача переходит в состояние `goto.error`
280
+
281
+ **Пример сценария:** Qwen превысил quota и упал без записи файлов → Kilo вызван в той же попытке, task_attempts не инкрементирован.
282
+
283
+ Конфигурация snapshot:
284
+ ```yaml
285
+ execution:
286
+ artifact_snapshot_enabled: false # по умолчанию выключено
287
+ snapshot_paths: ["src/", "configs/"] # что мониторить
288
+ snapshot_max_file_size: 524288 # файлы >512KB — только mtime+size
289
+ ```
290
+
291
+ **Baseline производительности:** `p50=169ms p95=299ms files=598` (из QA-20 benchmark).
292
+
293
+ ### Классификатор ошибок и health-реестр
294
+
295
+ Ошибки классифицируются по классам:
296
+ - `unavailable` — агент временно недоступен (quota, rate limit)
297
+ - `transient` — временная ошибка сети (timeout, 5xx)
298
+ - `misconfigured` — ошибка конфигурации (401, 403, отсутствует API key)
299
+ - `unmatched` — ошибка не распознана
300
+
301
+ **Семантика TTL:**
302
+ - `5m` — 5 минут
303
+ - `1h` — 1 час
304
+ - `until_utc_midnight` — до полуночи UTC (минимум 30 минут)
305
+ - `infinite` — навсегда
306
+
307
+ Файл конфигурации: `configs/agent-health-rules.yaml`. Файл состояния: `.workflow/state/agent-health.json`.
308
+
309
+ ### Команда сброса
310
+
311
+ ```bash
312
+ # показать текущее состояние
313
+ node .workflow/src/scripts/reset-agent-health.js
314
+
315
+ # сбросить конкретного агента
316
+ node .workflow/src/scripts/reset-agent-health.js --agent qwen-code
317
+
318
+ # сбросить всех агентов
319
+ node .workflow/src/scripts/reset-agent-health.js --all
320
+ ```
321
+
322
+ ### Пример добавления правила
323
+
324
+ ```yaml
325
+ # В configs/agent-health-rules.yaml:
326
+ agents:
327
+ my-new-agent:
328
+ rules:
329
+ - id: "my-agent-quota"
330
+ class: "unavailable"
331
+ ttl: "until_utc_midnight"
332
+ pattern: "quota exceeded|daily limit reached"
333
+ exit_codes: "any"
334
+ ```
335
+
336
+ ## Конфигурация
337
+
338
+ ### `configs/config.yaml`
339
+
340
+ Основная конфигурация воркфлоу: информация о проекте, типы задач, приоритеты, статусы, типы условий, пути, настройки отчётности.
341
+
342
+ ### `configs/pipeline.yaml`
343
+
344
+ Определение конвейера: агенты, стадии, управление потоком, goto-логика, стратегии повторов.
345
+
346
+ ### `configs/ticket-movement-rules.yaml`
347
+
348
+ Правила автоматического перемещения тикетов на основе статуса ревью.
349
+
350
+ ## Структура проекта
351
+
352
+ ```
353
+ workflow-ai/
354
+ ├── bin/ # Точка входа CLI
355
+ ├── src/
356
+ │ ├── cli.mjs # Парсинг команд
357
+ ├── runner.mjs # Оркестратор конвейера
358
+ ├── init.mjs # Инициализация проекта
359
+ ├── global-dir.mjs # Управление глобальной ~/.workflow/
360
+ ├── junction-manager.mjs # Управление junction/symlink
361
+ │ ├── wf-loader.mjs # Загрузчик конфигов
362
+ │ ├── lib/ # Библиотеки утилит
363
+ │ └── tests/ # Набор тестов
364
+ ├── configs/ # Файлы конфигурации (источник)
365
+ ├── templates/ # Шаблоны воркфлоу (источник)
366
+ ├── agent-templates/ # Шаблоны инструкций для AI-агентов
367
+ └── package.json
368
+ ```
369
+
370
+ ## Требования
371
+
372
+ - Node.js >= 18.0.0
373
+ - npm
374
+
375
+ ## Лицензия
376
+
377
+ MIT