npm - workflow-ai - Versions diffs - 1.1.0 → 1.2.1 - Mend

workflow-ai 1.1.0 → 1.2.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (593) hide show

package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/judge.json DELETED Viewed

@@ -1,163 +0,0 @@
-{
-  "per_model": {
-    "claude-sonnet": {
-      "pass_count": 3,
-      "total": 3,
-      "trials": [
-        {
-          "trial": 1,
-          "score": 5,
-          "passed": true
-        },
-        {
-          "trial": 2,
-          "score": 5,
-          "passed": true
-        },
-        {
-          "trial": 3,
-          "score": 4,
-          "passed": true
-        }
-      ]
-    },
-    "kilo-glm": {
-      "pass_count": 3,
-      "total": 3,
-      "trials": [
-        {
-          "trial": 1,
-          "score": 4,
-          "passed": true
-        },
-        {
-          "trial": 2,
-          "score": 4,
-          "passed": true
-        },
-        {
-          "trial": 3,
-          "score": 4,
-          "passed": true
-        }
-      ]
-    },
-    "kilo-minimax": {
-      "pass_count": 3,
-      "total": 3,
-      "trials": [
-        {
-          "trial": 1,
-          "score": 4,
-          "passed": true
-        },
-        {
-          "trial": 2,
-          "score": 4,
-          "passed": true
-        },
-        {
-          "trial": 3,
-          "score": 4,
-          "passed": true
-        }
-      ]
-    },
-    "kilo-deepseek": {
-      "pass_count": 2,
-      "total": 3,
-      "trials": [
-        {
-          "trial": 1,
-          "score": 3,
-          "passed": false
-        },
-        {
-          "trial": 2,
-          "score": 4,
-          "passed": true
-        },
-        {
-          "trial": 3,
-          "score": 4,
-          "passed": true
-        }
-      ]
-    }
-  },
-  "rubric_scores": [
-    {
-      "agentId": "kilo-deepseek",
-      "trial": 1,
-      "score": 3,
-      "errored": false
-    },
-    {
-      "agentId": "kilo-deepseek",
-      "trial": 2,
-      "score": 4,
-      "errored": false
-    },
-    {
-      "agentId": "kilo-deepseek",
-      "trial": 3,
-      "score": 4,
-      "errored": false
-    },
-    {
-      "agentId": "kilo-glm",
-      "trial": 1,
-      "score": 4,
-      "errored": false
-    },
-    {
-      "agentId": "kilo-glm",
-      "trial": 2,
-      "score": 4,
-      "errored": false
-    },
-    {
-      "agentId": "kilo-glm",
-      "trial": 3,
-      "score": 4,
-      "errored": false
-    },
-    {
-      "agentId": "kilo-minimax",
-      "trial": 1,
-      "score": 4,
-      "errored": false
-    },
-    {
-      "agentId": "kilo-minimax",
-      "trial": 2,
-      "score": 4,
-      "errored": false
-    },
-    {
-      "agentId": "kilo-minimax",
-      "trial": 3,
-      "score": 4,
-      "errored": false
-    },
-    {
-      "agentId": "claude-sonnet",
-      "trial": 1,
-      "score": 5,
-      "errored": false
-    },
-    {
-      "agentId": "claude-sonnet",
-      "trial": 2,
-      "score": 5,
-      "errored": false
-    },
-    {
-      "agentId": "claude-sonnet",
-      "trial": 3,
-      "score": 4,
-      "errored": false
-    }
-  ],
-  "timestamp": "2026-04-25T07:10:27.566Z"
-}

package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-deepseek/trial-1.md DELETED Viewed

@@ -1,5 +0,0 @@
----RESULT---
-status: failed
-issues:
-  - "Пункт DoD #3 не выполнен: тест нарушает изоляцию — пишет в рабочий репозиторий проекта, cleanup не защищает от прерывания"
----RESULT---

package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-deepseek/trial-2.md DELETED Viewed

@@ -1,5 +0,0 @@
----RESULT---
-status: failed
-issues:
-  - "Пункт DoD 3 не выполнен: ожидалось создание tmp-корня и изоляция в teardown/after-hook, получено: корень артефактов привязан к реальному корню репозитория (строка `const testProjectRoot = join(__dirname, '..', '..');`), cleanup удаляет конкретный файл, cleanup вызывается в теле test-функции"
----RESULT---

package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-deepseek/trial-3.md DELETED Viewed

@@ -1,11 +0,0 @@
-Проверка тикета QA-904 выявила следующие проблемы:
-1. **Несоответствие путей** — в DoD указан файл `tests/fixtures/QA‑904‑test‑isolation‑violation/example‑test.mjs`, но фактический путь `.workflow/src/skills/review‑result/tests/fixtures/QA‑904‑test‑isolation‑violation/example‑test.mjs`.
-2. **Нарушение изоляции теста** — тест пишет артефакты в рабочий репозиторий (строка `const testProjectRoot = join(__dirname, '..', '..');`), cleanup удаляет только конкретный файл, а не весь tmp‑корень, и находится в теле теста, а не в teardown/after‑hook.
----RESULT---
-status: failed
-issues:
-  - "Пункт DoD #1 не выполнен: ожидался файл tests/fixtures/QA-904-test-isolation-violation/example-test.mjs, фактический путь .workflow/src/skills/review-result/tests/fixtures/QA-904-test-isolation-violation/example-test.mjs"
-  - "Пункт DoD #3 не выполнен: тест нарушает изоляцию — корень артефактов привязан к рабочему репозиторию (строка 10), cleanup удаляет конкретный файл, а не tmp-корень, cleanup в теле теста, а не в teardown/after-hook"
----RESULT---

package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-glm/trial-1.md DELETED Viewed

@@ -1,16 +0,0 @@
-Вердикт: **failed**.
-Проверка DoD-критериев:
-1. **Файл создан** — подтверждено.
-2. **Тест проходит** — принято по условию.
-3. **Изоляция** — **нарушена** по трём причинам:
-   - `testProjectRoot` указывает на корень репозитория (`join(__dirname, '..', '..')`), а не на системный tmp-каталог.
-   - `writeFileSync(testConfigPath, ...)` пишет в `.workflow/config/sample.yaml` внутри рабочего репозитория.
-   - `cleanupTestConfig()` вызывается в теле test-функции, а не в `after()`/`teardown`; при падении assertion файл остаётся в репозитории.
----RESULT---
-status: failed
-issues:
-  - "Пункт DoD 3 не выполнен: тест пишет в рабочий репозиторий (testProjectRoot = join(__dirname, '..', '..') → корень репозитория), а не в tmp-корень; cleanup вызывается в теле test-функции, а не в teardown/after-hook; при падении assertion артефакт остаётся в репозитории"
----RESULT---

package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-glm/trial-2.md DELETED Viewed

@@ -1,18 +0,0 @@
-Тикет прочитан. Три критерия DoD. Критерий 3 (изоляция) нарушен — анализ ниже.
-**DoD-проверка:**
-1. **Файл создан** — подтверждено, файл существует.
-2. **Тест проходит** — формально `node --test` success, принимается.
-3. **Изоляция** — НАРУШЕНА:
-   - `testProjectRoot = join(__dirname, '..', '..')` — указывает на корень репозитория, а не на системный `tmp`.
-   - `createTestConfig` пишет в `.workflow/config/sample.yaml` внутри рабочего репозитория.
-   - `cleanupTestConfig` удаляет конкретный файл, не tmp-корень целиком.
-   - Cleanup вызывается в теле test-функции, а не в `teardown`/`after`-хуке — при падении assertion до строки cleanup файл остаётся в репозитории.
-Вердикт: **failed**.
----RESULT---
-status: failed
-issues:
-  - "Пункт DoD 3 не выполнен: ожидалось что тест создаёт и уничтожает tmp-корень, не пишет в рабочий репозиторий (изоляция в teardown/after-hook); получено: testProjectRoot привязан к реальному корню репозитория (join(__dirname, '..', '..')), createTestConfig пишет в .workflow/config/sample.yaml рабочего репозитория, cleanupTestConfig удаляет конкретный файл а не tmp-корень, cleanup вызывается в теле test-функции а не в teardown — файл: src/skills/review-result/tests/fixtures/QA-904-test-isolation-violation/example-test.mjs:12-22"
----RESULT---

package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-glm/trial-3.md DELETED Viewed

@@ -1,17 +0,0 @@
-Скрипт недоступен — перехожу к ручной проверке (fallback по workflow).
-Проверка завершена. Файл существует, но нарушает изоляцию. Формирую вердикт.
-Проверка тикета QA-904 завершена. DoD критерий #3 (изоляция теста) не выполнен — три нарушения:
-1. **Корень артефактов — рабочий репозиторий** (`example-test.mjs:16`): `join(__dirname, '..', '..')` указывает на корень проекта, а не на системный tmp.
-2. **Cleanup удаляет конкретный файл** (`:28`): `rmSync(testConfigPath)`, не весь tmp-корень — при прерывании артефакт остаётся.
-3. **Cleanup в теле test-функции** (`:35`), а не в teardown/after-hook — падение assertion до cleanup = утечка state.
-```
----RESULT---
-status: failed
-issues:
-  - "DoD #3 не выполнен: тест пишет в рабочий репозиторий — example-test.mjs:16-17, testProjectRoot и testConfigPath указывают на .workflow/config/sample.yaml внутри корня репозитория, а не на tmp-корень через стандартную функцию ОС"
-  - "DoD #3 не выполнен: cleanup удаляет конкретный файл (example-test.mjs:28 — rmSync(testConfigPath)), а не весь tmp-корень рекурсивно — при прерывании до вызова cleanup файл остаётся в рабочем репозитории"
-  - "DoD #3 не выполнен: cleanup вызывается в теле test-функции (example-test.mjs:35), а не в teardown/after-hook — падение assertion до этой строки оставляет артефакт в репозитории"
----RESULT---
-```

package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-minimax/trial-1.md DELETED Viewed

@@ -1,17 +0,0 @@
-Проверяю DoD пункт 3 (изоляция). Из предоставленного содержимого теста:
-**Проблемы изоляции:**
-1. **Корень артефактов** — `testProjectRoot = join(__dirname, '..', '..')` привязан к реальному репозиторию, а не к tmp-корню
-2. **Запись в рабочий репозиторий** — пишет в `.workflow/config/sample.yaml`
-3. **Cleanup в теле теста** — `cleanupTestConfig()` вызывается в теле test-функции, а не в after-hooks/teardown
-4. **Удаляется конкретный файл** — `rmSync(testConfigPath)`, а не рекурсивное удаление tmp-корня
-DoD требует: "создаёт и уничтожает tmp-корень, не пишет в рабочий репозиторий (изоляция в teardown/after-hook)".
----
----RESULT---
-status: failed
-issues:
-  - "Пункт DoD #3 не выполнен: тест пишет в рабочий репозиторий (.workflow/config/sample.yaml), а не в tmp-корень; cleanup выполняется в теле теста, а не в teardown/after-hook"
----RESULT---

package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-minimax/trial-2.md DELETED Viewed

@@ -1,31 +0,0 @@
-Проверяю DoD тикета QA-904:
-**Пункт 1** — Файл создан: ✅ Существует
-**Пункт 2** — Тест проходит: ✅ Формально `node --test` success
-**Пункт 3** — Изоляция (tmp-корень, не рабочий репозиторий): ❌ **НАРУШЕН**
-Анализ теста из тикета:
-1. `testProjectRoot = join(__dirname, '..', '..')` — вычисляется от расположения теста, ведёт к реальному корню репозитория
-2. `writeFileSync(testConfigPath, ...)` — пишет в `.workflow/config/sample.yaml` рабочего репозитория
-3. `cleanupTestConfig()` — вызывается **внутри** test-функции, не в afterEach/teardown. При падении assertion до этой строки файл останется в рабочем репозитории
-Это прямое нарушение изоляции: тест пишет в `.workflow/config/`, а не в tmp-корень (напр. `os.tmpdir()`).
-Секции "## Ревью" в тикете нет — это первое ревью.
----
-## Вердикт
-**DoD пункт 3 не выполнен:** тест записывает артефакты в рабочий репозиторий проекта, а не в tmp-корень. Cleanup находится внутри тела функции, а не в afterEach/teardown, что оставляет файл при падении.
----
----RESULT---
-status: failed
-issues:
-  - "DoD пункт 3 нарушен: тест пишет в рабочий репозиторий (`.workflow/config/sample.yaml`), а не в tmp-корень. cleanup вызывается в теле test-функции, а не в teardown/afterEach — при падении assertion файл останется в рабочем репозитории. Ожидалось: `os.tmpdir()` + afterEach/teardown."
----RESULT---

package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-minimax/trial-3.md DELETED Viewed

@@ -1,5 +0,0 @@
----RESULT---
-status: failed
-issues:
-  - "Пункт DoD #3 не выполнен: ожидался tmp-корень с изоляцией в teardown/after-hook, но тест пишет в `.workflow/config/` рабочего репозитория (`testProjectRoot = join(__dirname, '..', '..')`), cleanup вызывается в теле теста (строка 25), а не в afterEach/teardown"
----RESULT---

package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/meta.json DELETED Viewed

@@ -1,115 +0,0 @@
-{
-  "date": "2026-04-25T07:10:27.577Z",
-  "skill_sha": "b6cda8a",
-  "status": "passed",
-  "duration_ms": 79287,
-  "l1_skipped": true,
-  "per_model": {
-    "claude-sonnet": {
-      "passed": true,
-      "errored": false,
-      "pass_count": 3,
-      "error_count": 0,
-      "total": 3,
-      "threshold": 2
-    },
-    "kilo-glm": {
-      "passed": true,
-      "errored": false,
-      "pass_count": 3,
-      "error_count": 0,
-      "total": 3,
-      "threshold": 2
-    },
-    "kilo-minimax": {
-      "passed": true,
-      "errored": false,
-      "pass_count": 3,
-      "error_count": 0,
-      "total": 3,
-      "threshold": 2
-    },
-    "kilo-deepseek": {
-      "passed": true,
-      "errored": false,
-      "pass_count": 2,
-      "error_count": 0,
-      "total": 3,
-      "threshold": 2
-    }
-  },
-  "rubric_scores": [
-    {
-      "agentId": "kilo-deepseek",
-      "trial": 1,
-      "score": 3,
-      "errored": false
-    },
-    {
-      "agentId": "kilo-deepseek",
-      "trial": 2,
-      "score": 4,
-      "errored": false
-    },
-    {
-      "agentId": "kilo-deepseek",
-      "trial": 3,
-      "score": 4,
-      "errored": false
-    },
-    {
-      "agentId": "kilo-glm",
-      "trial": 1,
-      "score": 4,
-      "errored": false
-    },
-    {
-      "agentId": "kilo-glm",
-      "trial": 2,
-      "score": 4,
-      "errored": false
-    },
-    {
-      "agentId": "kilo-glm",
-      "trial": 3,
-      "score": 4,
-      "errored": false
-    },
-    {
-      "agentId": "kilo-minimax",
-      "trial": 1,
-      "score": 4,
-      "errored": false
-    },
-    {
-      "agentId": "kilo-minimax",
-      "trial": 2,
-      "score": 4,
-      "errored": false
-    },
-    {
-      "agentId": "kilo-minimax",
-      "trial": 3,
-      "score": 4,
-      "errored": false
-    },
-    {
-      "agentId": "claude-sonnet",
-      "trial": 1,
-      "score": 5,
-      "errored": false
-    },
-    {
-      "agentId": "claude-sonnet",
-      "trial": 2,
-      "score": 5,
-      "errored": false
-    },
-    {
-      "agentId": "claude-sonnet",
-      "trial": 3,
-      "score": 4,
-      "errored": false
-    }
-  ]
-}

package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003-test-isolation.yaml DELETED Viewed

@@ -1,50 +0,0 @@
-id: TC-REVIEW-RESULT-003
-title: "Ревьюер ловит нарушение изоляции тестов"
-origin:
-  chg: [CHG-test-hygiene-2026-04-21]
-  incidents:
-    - "workflowAi: тест error-classifier.test.mjs писал в реальный .workflow/config/agent-health-rules.yaml, полагаясь на cleanup в теле функции; при прерывании оставлял артефакты в рабочем репо и ложно срабатывали механические проверки"
-  principle: "Проверка изоляции теста ортогональна результату прогона: зелёный тест, пишущий в рабочий репозиторий — токсичный"
-  backlog_sources:
-    - "d:/Dev/workflowAi/.workflow/coach-backlog.yaml"
-tags: [test-hygiene, isolation, knowledge-test-hygiene]
-severity: high
-scenario:
-  system_prompt_file: "../../SKILL.md"
-  extra_instructions: |
-    Проведи ревью тикета QA-904, который лежит в .workflow/tickets/review/QA-904.md.
-    DoD тикета явно требует изоляции теста (tmp-корень, не запись в рабочий
-    репозиторий). Содержимое файла теста, на который ссылается секция
-    «Изменённые файлы», приведено ниже (блок "## Test file content") —
-    используй его для оценки изоляции. Тест формально проходит
-    (`node --test` success), но проверка изоляции ортогональна результату
-    прогона.
-  inputs:
-    - kind: ticket_file
-      path: "../fixtures/QA-904-test-isolation-violation/QA-904.md"
-      ticket_id: QA-904
-      dest_dir: review
-    - kind: file
-      path: "../fixtures/QA-904-test-isolation-violation/example-test.mjs"
-      as: "Test file content (src/skills/review-result/tests/fixtures/QA-904-test-isolation-violation/example-test.mjs)"
-assertions:
-  deterministic:
-    - kind: output_contains_all
-      values: ["---RESULT---"]
-      reason: "Результат должен быть в формате пайплайна."
-    - kind: output_contains_all
-      values: ["failed"]
-      reason: "Вердикт — failed по нарушению изоляции."
-  rubric:
-    - kind: llm_judge
-      rubric_file: "../rubrics/test-isolation.md"
-      criterion: "Поймал ли ревьюер нарушение изоляции теста и оформил failed с конкретным issue, процитировав проблемные строки теста?"
-      pass_threshold: 4
-      trials: 3
-      aggregate: majority
-execution:
-  timeout_s: 1200

package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-004/current/claude-sonnet/trial-1.md DELETED Viewed

@@ -1,5 +0,0 @@
----RESULT---
-status: failed
-issues:
-  - "DoD п.2 не выполнен: ожидалось — каждый сценарий содержит inline-snapshot в коде теста (литерал-эталон, точное сравнение нормализованного output); получено — все ассерты реализованы как регекс-проверки по фрагментам (`assert.match(normalized, /status:\\s*empty/)`, `assert.match(normalized, /reason:/)` и т.д.) без единого точного сравнения целого нормализованного вывода. Литерала-эталона в файле `src/skills/review-result/tests/fixtures/QA-905-baseline-regex-instead-of-snapshot/baseline.test.mjs` нет. Функция normalizeOutput объявлена, но её результат используется только для фрагментарных regex-ассертов — регрессии вне покрытия regex-ов (новые поля, изменённый формат, потерянные строки) тест не поймает."
----RESULT---

package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-004/current/claude-sonnet/trial-2.md DELETED Viewed

@@ -1,5 +0,0 @@
----RESULT---
-status: failed
-issues:
-  - "DoD п.2 не выполнен: заявлено «каждый сценарий содержит inline-snapshot в коде теста (литерал-эталон, точное сравнение)», фактически реализованы регекс-ассерты assert.match по фрагментам (напр. `assert.match(normalized, /status:\\s*empty/)` в baseline.test.mjs:38-39). Литерал-эталон в файле теста отсутствует полностью — ни одного вызова assert.strictEqual/deepStrictEqual с зафиксированной строкой. Регрессия за пределами покрытия регексов (новые поля, изменённый порядок, потерянные строки stdout) проходит мимо теста."
----RESULT---

package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-004/current/claude-sonnet/trial-3.md DELETED Viewed

@@ -1,6 +0,0 @@
----RESULT---
-status: failed
-issues:
-  - "DoD #2 не выполнен: заявлено «каждый сценарий содержит inline-snapshot в коде теста (литерал-эталон, точное сравнение)», фактически все 5 тестов реализованы через assert.match с регулярными выражениями (строки 46–47, 64–65, 85–86, 103–104, 119). Ни одного assert.equal/deepEqual с inline-литералом нет. Функция normalizeOutput объявлена, но её результат используется исключительно для фрагментарных regex-ассертов, а не для равенства целого нормализованного output с эталоном. Такие тесты не ловят регрессии за пределами описанных регексов. Файл теста: .workflow/src/skills/review-result/tests/fixtures/QA-905-baseline-regex-instead-of-snapshot/baseline.test.mjs"
-  - "Result утверждает «10 baseline snapshot-тестов», в файле теста 5 тестов (2 в pick-next-task + 2 в move-ticket + 1 в get-next-id), ни один из которых не является snapshot-тестом"
----RESULT---

package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-004/current/judge.json DELETED Viewed

@@ -1,46 +0,0 @@
-{
-  "per_model": {
-    "claude-sonnet": {
-      "pass_count": 3,
-      "total": 3,
-      "trials": [
-        {
-          "trial": 1,
-          "score": 5,
-          "passed": true
-        },
-        {
-          "trial": 2,
-          "score": 5,
-          "passed": true
-        },
-        {
-          "trial": 3,
-          "score": 4,
-          "passed": true
-        }
-      ]
-    }
-  },
-  "rubric_scores": [
-    {
-      "agentId": "claude-sonnet",
-      "trial": 1,
-      "score": 5,
-      "errored": false
-    },
-    {
-      "agentId": "claude-sonnet",
-      "trial": 2,
-      "score": 5,
-      "errored": false
-    },
-    {
-      "agentId": "claude-sonnet",
-      "trial": 3,
-      "score": 4,
-      "errored": false
-    }
-  ],
-  "timestamp": "2026-04-25T07:11:21.120Z"
-}

package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-004/current/meta.json DELETED Viewed

@@ -1,37 +0,0 @@
-{
-  "date": "2026-04-25T07:11:21.120Z",
-  "skill_sha": "b6cda8a",
-  "status": "passed",
-  "duration_ms": 129302,
-  "l1_skipped": true,
-  "per_model": {
-    "claude-sonnet": {
-      "passed": true,
-      "errored": false,
-      "pass_count": 3,
-      "error_count": 0,
-      "total": 3,
-      "threshold": 2
-    }
-  },
-  "rubric_scores": [
-    {
-      "agentId": "claude-sonnet",
-      "trial": 1,
-      "score": 5,
-      "errored": false
-    },
-    {
-      "agentId": "claude-sonnet",
-      "trial": 2,
-      "score": 5,
-      "errored": false
-    },
-    {
-      "agentId": "claude-sonnet",
-      "trial": 3,
-      "score": 4,
-      "errored": false
-    }
-  ]
-}

package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-004-baseline-snapshot.yaml DELETED Viewed

@@ -1,50 +0,0 @@
-id: TC-REVIEW-RESULT-004
-title: "Ревьюер ловит подмену inline-snapshot регекс-ассертами"
-origin:
-  chg: [CHG-baseline-snapshot-2026-04-25]
-  incidents:
-    - "workflowAi PLAN-008/QA-030 → IMPL-050/051: тикет QA-030 заявил DoD `inline-snapshot в коде теста`, фактический файл src/tests/scripts-stdout-baseline.test.mjs использовал только assert.match по регексам — регрессия рефакторинга IMPL-050/051 (потеря argv-блока-парсера, изменение полей RESULT) прошла мимо baseline-теста; ревью QA-030 пропустило подмену со ссылкой на `10/10 зелёных`. Лог падения: .workflow/logs/pipeline_2026-04-24_16-20-18.log"
-  principle: "Заявленный в DoD способ реализации теста (snapshot/эталон/побайтное совпадение) ортогонален результату прогона. Зелёный тест на регекс-ассертах не реализует snapshot — регрессия за пределами регексов проходит мимо."
-  backlog_sources:
-    - "d:/Dev/workflowAi/.workflow/coach-backlog.yaml"
-tags: [baseline, snapshot, knowledge-baseline-snapshot-validation]
-severity: high
-scenario:
-  system_prompt_file: "../../SKILL.md"
-  extra_instructions: |
-    Проведи ревью тикета QA-905, который лежит в .workflow/tickets/review/QA-905.md.
-    DoD тикета явно требует inline-snapshot в коде теста (точное сравнение
-    нормализованного output с литералом-эталоном). Содержимое файла теста,
-    на который ссылается секция «Изменённые файлы», приведено ниже
-    (блок "## Test file content") — используй его для оценки способа
-    реализации. Тест формально проходит, но проверка способа реализации
-    ортогональна результату прогона.
-  inputs:
-    - kind: ticket_file
-      path: "../fixtures/QA-905-baseline-regex-instead-of-snapshot/QA-905.md"
-      ticket_id: QA-905
-      dest_dir: review
-    - kind: file
-      path: "../fixtures/QA-905-baseline-regex-instead-of-snapshot/baseline.test.mjs"
-      as: "Test file content (src/skills/review-result/tests/fixtures/QA-905-baseline-regex-instead-of-snapshot/baseline.test.mjs)"
-assertions:
-  deterministic:
-    - kind: output_contains_all
-      values: ["---RESULT---"]
-      reason: "Результат должен быть в формате пайплайна."
-    - kind: output_contains_all
-      values: ["failed"]
-      reason: "Вердикт — failed: regex-ассерты не реализуют заявленный snapshot."
-  rubric:
-    - kind: llm_judge
-      rubric_file: "../rubrics/baseline-snapshot.md"
-      criterion: "Поймал ли ревьюер подмену snapshot-сравнения регекс-ассертами и оформил failed с дословной цитатой формулировки DoD и проблемного ассерта?"
-      pass_threshold: 4
-      trials: 3
-      aggregate: majority
-execution:
-  timeout_s: 1200