npm - workflow-ai - Versions diffs - 1.0.63 → 1.0.64 - Mend

workflow-ai 1.0.63 → 1.0.64

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (494) hide show

package/src/skills/coach/knowledge/test-authorship.md ADDED Viewed

@@ -0,0 +1,141 @@
+# Авторство тест-кейсов регрессионных тестов скилов
+Руководство для коуча по написанию тест-кейсов при работе с регрессионными тестами скилов.
+---
+## 1. Дерево выбора слоя (L0 / L1 / L2)
+Выбери слой по первому подходящему условию:
+| Слой | Название | Когда использовать |
+|------|----------|-------------------|
+| **L0** | static | **Всегда** — если нужно проверить, что агент записал конкретный инвариант в файл (наличие раздела, запрета, поля). Не зависит от модели. |
+| **L1** | deterministic | Когда у output есть наблюдаемая сигнатура: структура YAML/JSON, наличие обязательных ключей, формат ID. Подходит, если ответ детерминирован при заданном входе. |
+| **L2** | rubric | Когда нужно проверить **принцип рассуждения** агента: правильно ли выбрана root cause, корректно ли применён принцип. Оценивается поведение, а не текст. |
+Правило: если сомневаешься между L0 и L1 — выбирай L0. L2 только тогда, когда L0/L1 физически не применимы.
+---
+## 2. Правила написания static-anchor
+**Семантический инвариант, не дословный текст:**
+- Anchor должен выражать *правило*, нарушение которого тест должен поймать.
+- Anchor **отвергает** любое поведение, нарушающее правило, а не просто проверяет «строка существует в файле».
+- Один anchor — одно правило. Несколько правил → несколько anchor'ов.
+**Пример плохого anchor:** `"git commit"` — существует в любом упоминании темы.
+**Пример хорошего anchor:** `"коуч не выполняет git commit ни при каких условиях"` — семантически проверяет запрет, а не присутствие слова.
+---
+## 3. Минимизация фикстуры
+- Фикстура — реальный артефакт ±20 строк вокруг инцидента.
+- **Не включай** в фикстуру весь лог или полный тикет.
+- Критерий минимума: убери строку → тест перестаёт проверять нужное поведение? Если нет — строка лишняя.
+- Для log-фикстур: вырезай только те шаги, где произошёл инцидент + 5 строк контекста до и после.
+---
+## 4. Формулировка rubric-критерия
+Rubric проверяет **процесс рассуждения**, а не конкретный текст ответа:
+- Формулируй как: «Агент должен [определить / выбрать / проверить] [что именно] [по какому признаку]».
+- Не указывай конкретные слова, которые агент должен произнести — указывай логический шаг.
+- Rubric должен оставаться валидным при переформулировке инструкций скила.
+**Пример плохого rubric:** «Ответ содержит слово "root cause"».
+**Пример хорошего rubric:** «Агент идентифицировал физический скил-источник артефакта, а не предметный владелец».
+---
+## 5. Выбор `target_agents[]` на уровне скила
+Заполняется автором-коучем вручную при первой настройке, сверяясь с `pipeline.yaml` проекта.
+Перечислить как минимум все модели, на которых скил реально гоняется в пайплайне:
+- основная модель скила,
+- fallback-модель (если задана),
+- модели из секций `agent_by_type` и `agent_by_attempt`.
+**Дополнительные модели для сравнения разрешены.** `target_agents[]` может включать модели сверх pipeline-набора — они выступают как «контрольная группа» для выявления регрессий формулировок скила на более широкой выборке. Такие модели помечаются комментарием (см. пример в `coach/tests/index.yaml`). Наличие «лишних» моделей — не ошибка и не повод сокращать список.
+Заполняется один раз в `tests/index.yaml` и наследуется всеми тест-кейсами скила. Не дублировать в каждом кейсе отдельно.
+**⛔ Сокращать `target_agents[]` (на уровне `index.yaml` или через per-case override) коуч не имеет права без явного согласия стейкхолдера.** Это относится к любому удалению модели из списка, включая случай «модель не используется в pipeline.yaml». Обоснование: `target_agents[]` — это заявленная сфера регрессии скила, а не техническая конфигурация; сокращение сужает покрытие тестов. См. подробный запрет ниже в секции «Override на уровне кейса».
+**Сверка с pipeline.yaml:**
+Runner автоматически проверяет каждый agent-id из `target_agents[]` против списка `agents` в `pipeline.yaml`. Если агент не найден — fail-fast с сообщением:
+```
+Agent 'invalid-agent-id' from target_agents[] not found in pipeline.yaml → agents[]
+```
+Порядок резолва `pipeline.yaml`:
+1. Приоритет: `<project_root>/.workflow/config/pipeline.yaml` (через `find-root.mjs`)
+2. Fallback: `<package_root>/configs/pipeline.yaml`
+Путь к используемому файлу логируется при старте runner'а.
+**Override на уровне кейса:**
+Точечный override допустим — если конкретный тест-кейс требует другую модель, укажи `execution.target_agents[]` в файле кейса. Это переопределит значение из `index.yaml` для данного кейса.
+**⛔ Override target_agents — это решение стейкхолдера, не коуча.** Убирать модель из списка или сужать его — **изменение сферы тестирования**, не техническая правка. Коуч **не имеет права** проактивно применять per-case override target_agents при провале модели на тесте, даже если:
+- модель выдаёт нестабильные/обрезанные ответы;
+- есть прецедент в бэклоге, где похожий override уже применялся;
+- формально «модель физически не может пройти тест».
+Все эти случаи — повод **явно согласовать** с стейкхолдером в отдельном сообщении, показав: (а) диагностику, что именно модель не может сделать, (б) три варианта действий (оставить как есть с honest baseline / исследовать глубже / исключить), (в) дождаться выбора. Применение override без явного согласия — перекладывание решения стейкхолдера на коуча и нарушение **границ компетенции** (см. SKILL.md, раздел «Границы компетенции»).
+**Антипаттерн:** «в прецеденте X модель была исключена, применяю тот же паттерн молча». Прецедент — это не карт-бланш. Проверь: стейкхолдер явно запросил исключение в прецеденте или коуч предложил и получил согласие? Если второе — всегда повторяй согласование для нового случая, даже если кажется аналогичным.
+**CLI-флаги для запуска:**
+- `--agent <id>` — прогон только на конкретной модели из `target_agents[]`
+- `--primary-only` — только первая модель из `target_agents[]` (без fallback)
+---
+## 6. Сравнение прогонов через git
+Для отслеживания регрессий между прогонами используй стандартные git-инструменты:
+| Задача | Команда |
+|--------|---------|
+| Посмотреть изменения в мета-файле | `git diff current/meta.json` |
+| История прогонов | `git log current/meta.json` |
+| Кто изменил конкретную строку | `git blame current/meta.json` |
+Никакой специальной инфраструктуры не требуется — `current/meta.json` версионируется как обычный файл.
+---
+## 7. Кто делает commit
+**⛔ Коуч не выполняет `git add`, `git commit`, `git push`, `git checkout`, `git reset` ни при каких условиях.**
+Коммит `current/` делает **исключительно пользователь**.
+Роль коуча после прогона тестов:
+1. Сообщить verdict runner'а (pass / fail / error).
+2. Перечислить затронутые файлы.
+3. Остановиться — дальнейшие git-операции выполняет пользователь.
+---
+## 8. Антипаттерны авторства
+| Антипаттерн | Почему плохо | Как правильно |
+|-------------|-------------|---------------|
+| Тестировать дословную формулировку инструкции | Хрупко: переформулировка инструкции ломает тест, не меняя поведение | Тестировать семантический инвариант правила |
+| Over-specifying expected output | Привязка к конкретным словам делает тест зависимым от стиля модели | Проверять принцип, а не точный текст |
+| Фикстура = полный лог/тикет | Тест медленный, нечитаемый, хрупкий к несвязанным изменениям | Минимальная фикстура ±20 строк вокруг инцидента |
+| L2 вместо L0 для проверки файла | L2 дороже и недетерминирован; если можно проверить файл — используй L0 | Выбирай наименьший подходящий слой |

package/src/skills/coach/templates/audit-report.md ADDED Viewed

@@ -0,0 +1,39 @@
+# Шаблон: Отчёт аудита скила
+```markdown
+# Аудит скила: {skill-name}
+**Дата:** {YYYY-MM-DD}
+**Тикет:** {COACH-NNN}
+## Общая оценка
+| Категория | Балл | Макс |
+|-----------|------|------|
+| Структура | {N} | 20 |
+| Полнота SKILL.md | {N} | 20 |
+| Качество воркфлоу | {N} | 20 |
+| Качество знаний и алгоритмов | {N} | 20 |
+| Связность и консистентность | {N} | 20 |
+| **Итого** | **{N}** | **100** |
+**Оценка:** {EXCELLENT / GOOD / NEEDS_WORK / POOR}
+## Найденные проблемы
+| # | Приоритет | Файл | Проблема | Рекомендация |
+|---|-----------|------|----------|-------------|
+| 1 | {CRITICAL/HIGH/MEDIUM/LOW} | {path} | {описание} | {что сделать} |
+## Антипаттерны / Gap-анализ
+| # | Тип | Описание | Где / Приоритет |
+|---|-----|----------|----------------|
+| 1 | {Антипаттерн/Gap} | {описание} | {файл:секция / приоритет} |
+## Сильные стороны (топ-3) / План улучшений
+| # | Сильная сторона | Улучшение | Приоритет | Трудозатраты |
+|---|----------------|-----------|-----------|-------------|
+| 1 | {что хорошо} | {что сделать} | {приоритет} | {быстро/средне/долго} |
+```

package/src/skills/coach/templates/coach-backlog-init.yaml ADDED Viewed

@@ -0,0 +1,14 @@
+version: 2
+last_updated: ""
+# Защита от повторного анализа тикетов/логов, не приведших к правке скила.
+# (Те, что привели к правке, имеют тест-кейс в src/skills/*/tests/cases/ — туда и смотрим.)
+analyzed_tickets: []
+# Snapshot scores скилов на момент аудита (trajectory во времени).
+audited_skills: []
+# История правок скилов — в git, не в этом файле:
+# git log -- src/skills/<name>/                    # все правки скила
+# git log -- src/skills/<name>/tests/cases/        # тест-кейсы
+# git log --follow -- src/skills/<name>/SKILL.md   # история файла

package/src/skills/coach/templates/coach-backlog-init.yaml.legacy ADDED Viewed

@@ -0,0 +1,10 @@
+# Шаблон инициализации бэклога коуча
+# Скопировать в .workflow/coach-backlog.yaml при первом запуске
+version: 1
+last_updated: ""
+analyzed_tickets: []
+applied_changes: []
+audited_skills: []

package/src/skills/coach/templates/improvement-plan.md ADDED Viewed

@@ -0,0 +1,42 @@
+# Шаблон: План улучшений скила
+```markdown
+# План улучшений: {skill-name}
+**Дата:** {YYYY-MM-DD}
+**Тикет:** {COACH-NNN}
+**Основание:** {ссылка на аудит / анализ / запрос}
+## Цель
+{Что хотим улучшить и почему — 1-2 предложения.}
+## Изменения
+| # | Название | Приоритет | Файлы | Проблема → Решение | Ожидаемый эффект |
+|---|----------|-----------|-------|--------------------|-----------------|
+| 1 | {название} | {CRITICAL/HIGH/MEDIUM/LOW} | {файлы} | {проблема → решение} | {эффект} |
+## Порядок выполнения
+{Последовательность: что делать первым, какие зависимости.}
+1. {Шаг 1} — зависит от: нет
+2. {Шаг 2} — зависит от: шаг 1
+...
+## Критерии успеха
+- [ ] {Критерий 1 — как проверить что улучшение работает}
+- [ ] {Критерий 2}
+- [ ] Все ссылки в SKILL.md валидны
+- [ ] Scoring скила вырос на {N} баллов
+## Источники
+{Если использовались внешние знания — ссылки с описанием.}
+| Источник | Что взято | Дата |
+|----------|----------|------|
+| {URL/название} | {что именно} | {YYYY-MM-DD} |
+```

package/src/skills/coach/templates/new-skill.md ADDED Viewed

@@ -0,0 +1,95 @@
+# Шаблон: Структура нового скила
+## SKILL.md
+```markdown
+---
+name: {skill-name}
+description: >
+  {2-3 предложения: кто агент, что делает, в каком контексте}
+ticket_prefix: {PREFIX}
+---
+# {Skill Name} — Agent Skill
+## Роль
+{Роль, контекст, ограничения}
+**Ты делаешь:** {перечисление}
+**Ты НЕ делаешь:** {перечисление → куда направить}
+## Маршрутизация тикетов {PREFIX}-*
+| Тип | Триггеры | Воркфлоу |
+|-----|----------|----------|
+| **TYPE1** | «ключевые слова» | → `workflows/type1.md` |
+## Загрузка знаний
+| Модуль | Когда загружать |
+|--------|----------------|
+| `knowledge/module.md` | Условие |
+## Загрузка алгоритмов
+| Алгоритм | Когда загружать |
+|----------|----------------|
+| `algorithms/algo.md` | Условие |
+## Шаблоны вывода
+| Шаблон | Когда использовать |
+|--------|-------------------|
+| `templates/template.md` | Условие |
+## Принципы
+1. **Принцип** — описание.
+{3-7 принципов}
+## Формат вывода
+- Язык, стиль, конкретность
+## Границы компетенции
+- **Зона X** → куда направить
+```
+## Workflow файл
+```markdown
+# Воркфлоу: {TYPE}
+## Алгоритм
+### 1. {Действие}
+{Пояснение, ссылки на knowledge/algorithms}
+### N. Валидация
+- [ ] Критерий 1
+```
+## Knowledge файл
+```markdown
+# {Модуль знаний}
+## {Категория}
+| Параметр | Значение | Описание |
+|----------|----------|----------|
+<!-- РАСШИРЕНИЕ: добавляй {что} ниже -->
+```
+## Algorithm файл
+```markdown
+# Алгоритм: {Название}
+## Вход
+{Входные данные}
+## Алгоритм
+### 1. {Шаг}
+## Выход
+{Результат}
+## Пример
+{Конкретный пример}
+```

package/src/skills/coach/tests/cases/TC-COACH-001/current/claude-sonnet/trial-1.md ADDED Viewed

@@ -0,0 +1,58 @@
+Тест пройден. Relevant case TC-DECOMPOSE-PLAN-004: **passed**.
+**Verdict: `no_baseline_failures`** (режим no-baseline — история отсутствует, это первый прогон). Все 4 статических assertion прошли.
+---
+## Итог анализа пайплайна PLAN-003
+### Findings
+| # | Приоритет | Проблема | Статус |
+|---|-----------|---------|--------|
+| 1 | CRITICAL | ID-коллизия IMPL-002/IMPL-003: заархивированы из PLAN-002, пересозданы для PLAN-003 | ✅ Fix в пайплайне (`allocate-ticket-ids`) |
+| 2 | CRITICAL | STOP-GATE 9.B нарушен: декомпозитор назначил ID «из головы» при отсутствии `id_ranges_json` | ✅ STOP-GATE уже добавлен в `decompose.md` |
+| 3 | HIGH | `ids_allocated_from` отсутствует в RESULT | ✅ Требование зафиксировано в `decompose.md` |
+| 4 | MEDIUM | STOP-GATE не определял явный формат вывода ошибки — пайплайн не мог отличить infra-ошибку от нормального завершения | **CHG-2026-04-19-001: добавлен `status: infra_error`** |
+### Ключевой паттерн коллизии
+```
+16:36:02  auto-correction: IMPL-002 (PLAN-002) → archive/
+16:36:02  auto-correction: IMPL-003 (PLAN-002) → archive/
+          [check-plan-decomposition → decompose-plan БЕЗ allocate-ticket-ids]
+16:40:31  decompose-plan создаёт IMPL-002 для PLAN-003 → backlog/
+16:40:31  decompose-plan создаёт IMPL-003 для PLAN-003 → backlog/
+          ↑ tasks_completed в pick-next-task.js находит старый IMPL-002 в archive/
+            и ошибочно считает зависимость QA-001 выполненной
+```
+### Правка скила (CHG-2026-04-19-001)
+**Файл:** `skills/decompose-plan/workflows/decompose.md`, шаг 9.B пункт 3
+**Добавлен явный формат вывода при срабатывании STOP-GATE:**
+```
+---RESULT---
+status: infra_error
+error: <описание: что отсутствует или некорректно в id_ranges_json>
+---RESULT---
+```
+**Тест:** `TC-DECOMPOSE-PLAN-004` — verdict `no_baseline_failures`, relevant case passed.
+### Рекомендуемый тикет (вне scope коуча)
+Добавить в `pipeline.yaml` обработчик `infra_error` для стадии `decompose-plan`:
+```yaml
+decompose-plan:
+  goto:
+    default: check-atomicity-limit
+    infra_error: check-conditions  # ← добавить
+```
+**Затронутые файлы:**
+- `D:/Dev/workflowAi/src/skills/decompose-plan/workflows/decompose.md`
+- `D:/Dev/workflowAi/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004-stopgate-infra-error-format.yaml` (новый)
+- `D:/Dev/workflowAi/src/skills/decompose-plan/tests/index.yaml`
+- `.workflow/coach-backlog.yaml`

package/src/skills/coach/tests/cases/TC-COACH-001/current/claude-sonnet/trial-2.md ADDED Viewed

@@ -0,0 +1,65 @@
+---
+## Итоговый отчёт findings
+### Временны́е диаграммы повторяющихся ID
+**IMPL-002** (коллизия):
+```
+16:36:02  ARCHIVE  tickets/done/IMPL-002.md → tickets/archive/IMPL-002.md
+                   (pick-next-task auto-correction: PLAN-002 archived)
+16:40:31  CREATE   tickets/backlog/IMPL-002.md
+                   (decompose-plan: "Конфиг tickets/**: protected_files + trusted_stages")
+          ⚠️ КОЛЛИЗИЯ: tickets/archive/IMPL-002.md и tickets/backlog/IMPL-002.md
+```
+**IMPL-003** (коллизия):
+```
+16:36:02  ARCHIVE  tickets/done/IMPL-003.md → tickets/archive/IMPL-003.md
+                   (pick-next-task auto-correction: PLAN-002 archived)
+16:40:31  CREATE   tickets/backlog/IMPL-003.md
+                   (decompose-plan: "Дедупликация в pick-next-task")
+          ⚠️ КОЛЛИЗИЯ: tickets/archive/IMPL-003.md и tickets/backlog/IMPL-003.md
+```
+---
+### Findings (приоритизированы)
+| # | Приоритет | Finding |
+|---|-----------|---------|
+| F1 | CRITICAL | **ID коллизия.** IMPL-002 и IMPL-003 существуют одновременно в `archive/` и `backlog/`. Нарушена ссылочная целостность: `check-conditions` считает тикет "завершённым" (archive), пока новый тикет с тем же ID активен в backlog. |
+| F2 | CRITICAL | **Отсутствие `allocate-ticket-ids` в пайплайне PLAN-003.** GOTO: `check-plan-decomposition → decompose-plan` напрямую, без выделения `id_ranges_json`. Агент-декомпозитор запущен без источника нумерации. |
+| F3 | CRITICAL | **Нарушение stop-gate.** Старая версия `decompose-plan` не остановилась при отсутствии `id_ranges_json`; применила fallback (нумерация с 001). Признак: `ids_allocated_from` отсутствует в `---RESULT---`. |
+| F4 | HIGH | **`decompose-gaps` использует агент-driven ID-генерацию без hard stop-gate** — тот же класс риска. Инструкция «найди все файлы... прибавь 1» без ⛔-нотации могла быть проигнорирована fallback-агентом так же, как в PLAN-003. |
+**Root cause chain:**
+```
+Нет allocate-ticket-ids в пайплайне  →  id_ranges_json = absent
+→  Агент применил fallback (нумерация с 001)
+→  Пост-валидация уникальности не выполнена
+→  ID IMPL-002, IMPL-003 коллизируют с archive/
+```
+---
+### Статус исправлений
+| Компонент | Статус |
+|-----------|--------|
+| `pipeline.yaml`: стадия `allocate-ticket-ids` | ✅ Уже существует (добавлена по итогам инцидента) |
+| `decompose-plan/workflows/decompose.md`: stop-gate 9.B | ✅ Уже существует + CHG-2026-04-19-001/002 применены ранее |
+| `decompose-gaps/workflows/decompose.md`: СТОП-ГЕЙТ | ✅ **CHG-2026-04-19-003 применён в этой сессии** |
+### Применённое изменение (CHG-2026-04-19-003)
+**Файл:** `D:\Dev\workflowAi\src\skills\decompose-gaps\workflows\decompose.md`
+**Изменения:**
+1. Шаг 9 — определение следующего ID: заменена формулировка «найди все файлы... во всех папках» на явный Glob-вызов с подчёркиванием `archive/` и `done/`; добавлено `⛔ Не угадывай номер`
+2. Шаг 9 — добавлен блок `⛔ СТОП-ГЕЙТ: проверка уникальности ID` с антипаттерном
+3. Чеклист завершения — добавлен пункт: `Для каждого созданного тикета выполнен СТОП-ГЕЙТ проверки уникальности ID`
+### Тест
+Воркфлоу `workflows/test.md` имеет статус **DRAFT (не активирован)**. Существующий тест `TC-DECOMPOSE-GAPS-002` уже покрывает glob-before-write поведение (проверяет обнаружение файла в `ready/`). Изменение усиливает инструкцию, не меняя требуемое поведение — регрессии не ожидается.

package/src/skills/coach/tests/cases/TC-COACH-001/current/claude-sonnet/trial-3.md ADDED Viewed

@@ -0,0 +1,58 @@
+Тест прошёл. Финальный вывод:
+---
+## Результат анализа
+### Временны́е диаграммы — ID с коллизиями
+**IMPL-002:**
+| 16:36:02 | done → archive (PLAN-002 archived) | pick-next-task auto-correction |
+| 16:40:31 | **CREATED NEW** для PLAN-003 | decompose-plan |
+→ **Коллизия**: два разных тикета с одним ID в разных планах.
+**IMPL-003:**
+| 16:36:02 | done → archive (PLAN-002 archived) | pick-next-task auto-correction |
+| 16:40:31 | **CREATED NEW** для PLAN-003 | decompose-plan |
+→ **Коллизия**.
+**Ключевое доказательство из лога:** контекст, переданный в `decompose-plan` на шаге 4, содержал только `plan_id` и `plan_file`. `id_ranges_json` — отсутствует. Стадии `allocate-ticket-ids` в пайплайне на тот момент не было.
+---
+### Findings
+| # | Severity | Описание | Статус |
+|---|----------|---------|--------|
+| F1 | CRITICAL | Стадия `allocate-ticket-ids` отсутствовала → `decompose-plan` не получил `id_ranges_json` → нумерация с 001 → коллизия с архивными IMPL-002, IMPL-003 | **Уже исправлено** (pipeline.yaml + шаг 9.B decompose.md) |
+| F2 | CRITICAL | Агент не остановился при отсутствии `id_ranges_json` (нарушение шаг 9.B) + output без `ids_allocated_from` | **Уже исправлено** (стоп-гейт 9.B, инцидент 2026-04-08/PLAN-008) |
+| F3 | HIGH | **TC-DECOMPOSE-PLAN-002 инвертирован:** assertion `output_contains_all:["get-next-id"]` проваливал правильно работающего агента | **ИСПРАВЛЕНО CHG-079** |
+| F4 | MEDIUM | `verify-atomicity.js` не проверяет наличие `ids_allocated_from` в выводе декомпозитора — нет машинного гейта | Зафиксировано, инфраструктура |
+---
+### CHG-079: правка TC-DECOMPOSE-PLAN-002
+**Проблема:** тест тестировал старый контракт (агент *должен* вызывать `get-next-id.js`), тогда как с момента введения `allocate-ticket-ids` стадии контракт противоположен (агент *не должен* вызывать скрипт — получает готовые диапазоны через `id_ranges_json`).
+**Изменения:**
+- Заменён `output_contains_all: ["get-next-id"]` → `output_contains_all: ["ids_allocated_from"]`
+- Заменены static assertions: проверяют `id_ranges_json`, `не вызывает.*get-next-id`, `ids_allocated_from`
+- Добавлен `output_does_not_contain` на прямой вызов скрипта
+- Обновлён сценарий: теперь предоставляет `id_ranges_json` на входе + минимальный план
+---
+### Verdict теста
+```
+status: passed
+skill: decompose-plan
+total: 1
+current_run.passed: 1
+verdict: no_baseline_failures
+```
+**Затронутые файлы:**
+- `src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002-get-next-id-mandatory.yaml`
+- `src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/meta.json`