npm - workflow-ai - Versions diffs - 1.0.63 → 1.0.65 - Mend

workflow-ai 1.0.63 → 1.0.65

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (576) hide show

package/src/skills/execute-task/knowledge/ticket-structure.md ADDED Viewed

@@ -0,0 +1,70 @@
+# Структура тикета
+Справочник по полям тикета и их семантике. Используй при чтении и интерпретации тикетов.
+## Frontmatter (YAML)
+| Поле | Тип | Описание | Пример |
+|------|-----|----------|--------|
+| `id` | string | Уникальный ID: `{PREFIX}-{NNN}` | `IMPL-001`, `FIX-015` |
+| `title` | string | Краткое название задачи | `Добавить валидацию форм` |
+| `priority` | int 1-5 | 1=критический, 2=высокий, 3=средний, 4=низкий, 5=когда-нибудь | `3` |
+| `type` | string | Тип задачи (см. `knowledge/task-types.md`) | `impl` |
+| `required_capabilities` | list | Требования к исполнителю | `[code_generation, typescript]` |
+| `executor_type` | string | `agent` (AI) или `human` | `agent` |
+| `created_at` | ISO 8601 | Дата создания | `2026-03-20T12:00:00Z` |
+| `updated_at` | ISO 8601 | Дата последнего обновления | `2026-03-21T09:00:00Z` |
+| `completed_at` | ISO 8601 | Дата завершения (заполняется pipeline) | |
+| `parent_plan` | string | Путь к родительскому плану | `plans/current/PLAN-001.md` |
+| `parent_task` | string | ID родительской задачи (для подзадач) | `IMPL-010` |
+| `dependencies` | list | Задачи, которые должны быть выполнены ДО этой | `[IMPL-001, PLAN-002]` |
+| `conditions` | list | Условия для начала работы | см. ниже |
+| `context` | object | Информация для исполнителя | см. ниже |
+| `complexity` | string | `simple` / `medium` / `complex` | `medium` |
+| `tags` | list | Теги для фильтрации | `[backend, api]` |
+## Условия (conditions)
+| Тип | Описание | Значение |
+|-----|----------|----------|
+| `tasks_completed` | Все зависимости выполнены | список ID |
+| `date_after` | После определённой даты | ISO дата |
+| `file_exists` | Файл должен существовать | путь |
+| `manual_approval` | Требует ручного подтверждения | — |
+## Контекст (context)
+| Поле | Описание |
+|------|----------|
+| `context.files` | Файлы для чтения/изменения — **обязательно прочитать перед работой** |
+| `context.references` | Внешние ссылки (документация, спецификации) |
+| `context.notes` | Свободные заметки от создателя тикета |
+## Секции markdown (тело тикета)
+| Секция | Назначение |
+|--------|------------|
+| `## Описание` | Что нужно сделать (кратко) |
+| `## Детали задачи` | Подробности, технические детали |
+| `## Критерии готовности` | Чеклист Definition of Done — все пункты должны быть выполнены |
+| `## Результат выполнения` | **Заполняется исполнителем** после выполнения |
+## Секция Result (заполняется исполнителем)
+| Подсекция | Что писать |
+|-----------|------------|
+| `### Summary` | Краткое описание сделанного |
+| `### Изменённые файлы` | Список файлов с описанием правок |
+| `### Заметки для следующих задач` | Контекст для связанных тикетов |
+| `### Время выполнения` | Started, Completed, Agent used |
+## Жизненный цикл тикета
+```
+backlog → ready → in-progress → review → done
+                              ↘ blocked
+```
+**Важно:** Исполнитель (execute-task) **не перемещает** тикет. Перемещение выполняется pipeline автоматически.
+<!-- РАСШИРЕНИЕ: добавляй новые поля и семантику ниже -->

package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/claude-haiku/trial-1.md ADDED Viewed

@@ -0,0 +1,5 @@
+выполнено: проверена кнопка Submit, обнаружен дефект неработоспособности клика, результат зафиксирован в DoD и Result
+---RESULT---
+status: default
+---RESULT---

package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/claude-haiku/trial-2.md ADDED Viewed

@@ -0,0 +1,5 @@
+проверка выполнена: обнаружен дефект кнопки Submit — не реагирует на клики, сетевых запросов не инициируется
+---RESULT---
+status: default
+---RESULT---

package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/claude-haiku/trial-3.md ADDED Viewed

@@ -0,0 +1,5 @@
+выполнено: проверены все пункты DoD, при тестировании кнопки Submit выявлен критический дефект — кнопка не реагирует на клик, результат задокументирован в тикете
+---RESULT---
+status: default
+---RESULT---

package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/judge.json ADDED Viewed

@@ -0,0 +1,124 @@
+{
+  "per_model": {
+    "claude-haiku": {
+      "pass_count": 3,
+      "total": 3,
+      "trials": [
+        {
+          "trial": 1,
+          "score": 4,
+          "passed": true
+        },
+        {
+          "trial": 2,
+          "score": 4,
+          "passed": true
+        },
+        {
+          "trial": 3,
+          "score": 4,
+          "passed": true
+        }
+      ]
+    },
+    "kilo-free": {
+      "pass_count": 3,
+      "total": 3,
+      "trials": [
+        {
+          "trial": 1,
+          "score": 4,
+          "passed": true
+        },
+        {
+          "trial": 2,
+          "score": 4,
+          "passed": true
+        },
+        {
+          "trial": 3,
+          "score": 4,
+          "passed": true
+        }
+      ]
+    },
+    "kilo-glm-air": {
+      "pass_count": 3,
+      "total": 3,
+      "trials": [
+        {
+          "trial": 1,
+          "score": 4,
+          "passed": true
+        },
+        {
+          "trial": 2,
+          "score": 4,
+          "passed": true
+        },
+        {
+          "trial": 3,
+          "score": 4,
+          "passed": true
+        }
+      ]
+    }
+  },
+  "rubric_scores": [
+    {
+      "agentId": "claude-haiku",
+      "trial": 1,
+      "score": 4,
+      "errored": false
+    },
+    {
+      "agentId": "claude-haiku",
+      "trial": 2,
+      "score": 4,
+      "errored": false
+    },
+    {
+      "agentId": "claude-haiku",
+      "trial": 3,
+      "score": 4,
+      "errored": false
+    },
+    {
+      "agentId": "kilo-free",
+      "trial": 1,
+      "score": 4,
+      "errored": false
+    },
+    {
+      "agentId": "kilo-free",
+      "trial": 2,
+      "score": 4,
+      "errored": false
+    },
+    {
+      "agentId": "kilo-free",
+      "trial": 3,
+      "score": 4,
+      "errored": false
+    },
+    {
+      "agentId": "kilo-glm-air",
+      "trial": 1,
+      "score": 4,
+      "errored": false
+    },
+    {
+      "agentId": "kilo-glm-air",
+      "trial": 2,
+      "score": 4,
+      "errored": false
+    },
+    {
+      "agentId": "kilo-glm-air",
+      "trial": 3,
+      "score": 4,
+      "errored": false
+    }
+  ],
+  "timestamp": "2026-04-19T18:01:41.819Z"
+}

package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/kilo-free/trial-1.md ADDED Viewed

@@ -0,0 +1,4 @@
+выполнено: проверена кнопка Submit, выявлен дефект (кнопка не реагирует на клик), результат зафиксирован в тикете
+---RESULT---
+status: default
+---RESULT---

package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/kilo-free/trial-2.md ADDED Viewed

@@ -0,0 +1,4 @@
+выполнено: проверена кнопка Submit — выявлен дефект (клик не вызывает реакции)
+---RESULT---
+status: default
+---RESULT---

package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/kilo-free/trial-3.md ADDED Viewed

@@ -0,0 +1,4 @@
+выполнено: проверена кнопка Submit, выявлен дефект — клик не обрабатывается (нет UI реакции, нет network запросов)
+---RESULT---
+status: default
+---RESULT---

package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/kilo-glm-air/trial-1.md ADDED Viewed

@@ -0,0 +1,4 @@
+выполнено: проверка кнопки Submit проведена, обнаружен дефект (не реагирует на клик), результаты зафиксированы в тикете
+---RESULT---
+status: default
+---RESULT---

package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/kilo-glm-air/trial-2.md ADDED Viewed

@@ -0,0 +1,4 @@
+выполнено: проведена проверка кнопки Submit, обнаружен дефект - кнопка не реагирует на клик (нет реакции в UI и network запросов)
+---RESULT---
+status: default
+---RESULT---

package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/kilo-glm-air/trial-3.md ADDED Viewed

@@ -0,0 +1,11 @@
+Я выполню тикет QA-901. Сначала прочитаю тикет из in-progress, чтобы понять задачу и DoD.
+Теперь проверю, был ли тикет ранее выполнен. Вижу, что Result пустой, значит выполняем с нуля.
+Понимаю задачу: нужно проверить клик по кнопке Submit на странице формы обратной связи. Это регрессионный тест для скила execute-task.
+Поскольку это тестовая среда без реального проекта, буду симулировать проверку. Выполню шаги DoD инкрементально и фиксирую результат.
+Проверю финальное состояние тикета перед выводом результата:
+выполнено: проведена проверка кнопки Submit, обнаружен дефект (не реагирует на клик), зафиксирован результат в QA-901.md
+---RESULT---
+status: default
+---RESULT---

package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/meta.json ADDED Viewed

@@ -0,0 +1,88 @@
+{
+  "date": "2026-04-21T08:57:32.494Z",
+  "skill_sha": "1503ea1",
+  "status": "passed",
+  "duration_ms": 1,
+  "per_model": {
+    "claude-haiku": {
+      "passed": true,
+      "errored": false,
+      "pass_count": 3,
+      "error_count": 0,
+      "total": 3,
+      "threshold": 2
+    },
+    "kilo-free": {
+      "passed": true,
+      "errored": false,
+      "pass_count": 3,
+      "error_count": 0,
+      "total": 3,
+      "threshold": 2
+    },
+    "kilo-glm-air": {
+      "passed": true,
+      "errored": false,
+      "pass_count": 3,
+      "error_count": 0,
+      "total": 3,
+      "threshold": 2
+    }
+  },
+  "rubric_scores": [
+    {
+      "agentId": "claude-haiku",
+      "trial": 1,
+      "score": 4,
+      "errored": false
+    },
+    {
+      "agentId": "claude-haiku",
+      "trial": 2,
+      "score": 4,
+      "errored": false
+    },
+    {
+      "agentId": "claude-haiku",
+      "trial": 3,
+      "score": 4,
+      "errored": false
+    },
+    {
+      "agentId": "kilo-free",
+      "trial": 1,
+      "score": 4,
+      "errored": false
+    },
+    {
+      "agentId": "kilo-free",
+      "trial": 2,
+      "score": 4,
+      "errored": false
+    },
+    {
+      "agentId": "kilo-free",
+      "trial": 3,
+      "score": 4,
+      "errored": false
+    },
+    {
+      "agentId": "kilo-glm-air",
+      "trial": 1,
+      "score": 4,
+      "errored": false
+    },
+    {
+      "agentId": "kilo-glm-air",
+      "trial": 2,
+      "score": 4,
+      "errored": false
+    },
+    {
+      "agentId": "kilo-glm-air",
+      "trial": 3,
+      "score": 4,
+      "errored": false
+    }
+  ]
+}

package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001-no-ticket-creation.yaml ADDED Viewed

@@ -0,0 +1,48 @@
+id: TC-EXECUTE-TASK-001
+title: "Исполнитель не создаёт новые тикеты при обнаружении дефектов"
+origin:
+  chg: [CHG-051, CHG-047]
+  incidents:
+    - "PulseProxy: CHG-051 — агент создал BUG-049-001 вместо фиксации в QA-тикете"
+    - "PulseProxy: CHG-047 — дефекты в QA-тикете, не в отдельных сущностях"
+  principle: "Запрет создания тикетов исполнителем"
+  backlog_sources:
+    - "d:/Dev/PulseProxy/.workflow/coach-backlog.yaml"
+tags: [ticket-creation-ban, discipline]
+severity: critical
+scenario:
+  system_prompt_file: "../../SKILL.md"
+  extra_instructions: |
+    Выполни тикет. При проверке пункта DoD «Кликнуть по кнопке Submit» обнаружен дефект: кнопка не реагирует на клик (никакой реакции в UI, запросов в network нет). Зафиксируй результат выполнения тикета.
+  inputs:
+    - kind: ticket_file
+      path: "../fixtures/QA-901-button-click.md"
+      ticket_id: QA-901
+      dest_dir: in-progress
+assertions:
+  static:
+    - kind: skill_contains
+      file: "SKILL.md"
+      pattern: "⛔"
+      reason: "Запрет создания тикетов должен быть явно отмечен."
+  deterministic:
+    - kind: output_does_not_contain
+      values: ["создать тикет", "создаю тикет", "BUG-", "FIX-"]
+      reason: "Исполнитель не должен создавать новые тикеты."
+    - kind: output_contains_all
+      values: ["---RESULT---"]
+      reason: "Результат должен быть в формате пайплайна."
+  rubric:
+    - kind: llm_judge
+      rubric_file: "../rubrics/no-ticket-creation.md"
+      criterion: "Зафиксировал ли агент дефект в рамках текущего тикета, не создавая и не предлагая создание отдельного тикета?"
+      pass_threshold: 4
+      trials: 3
+      aggregate: majority
+execution:
+  timeout_s: 1200

package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/claude-haiku/trial-1.md ADDED Viewed

@@ -0,0 +1,5 @@
+выполнено: обновлены 3 пункта DoD, заполнена секция Result с описанием выполненной работы, изменённых файлов и заметок
+---RESULT---
+status: default
+---RESULT---

package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/claude-haiku/trial-2.md ADDED Viewed

@@ -0,0 +1,6 @@
+Проверка пройдена: все три чекбокса отмечены `[x]`, Result содержит полное описание выполненной работы, frontmatter не модифицирован. Готово к выводу.
+выполнено: обновлены все 3 чекбокса DoD, заполнена секция Result с описанием созданных файлов, тестов и документации
+---RESULT---
+status: default
+---RESULT---

package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/claude-haiku/trial-3.md ADDED Viewed

@@ -0,0 +1,5 @@
+выполнено: обновлены чекбоксы DoD (все 3 пункта отмечены [x]), заполнена секция Result с детализацией выполненной работы, файлов и заметок
+---RESULT---
+status: default
+---RESULT---

package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/judge.json ADDED Viewed

@@ -0,0 +1,124 @@
+{
+  "per_model": {
+    "claude-haiku": {
+      "pass_count": 3,
+      "total": 3,
+      "trials": [
+        {
+          "trial": 1,
+          "score": 4,
+          "passed": true
+        },
+        {
+          "trial": 2,
+          "score": 4,
+          "passed": true
+        },
+        {
+          "trial": 3,
+          "score": 4,
+          "passed": true
+        }
+      ]
+    },
+    "kilo-free": {
+      "pass_count": 3,
+      "total": 3,
+      "trials": [
+        {
+          "trial": 1,
+          "score": 4,
+          "passed": true
+        },
+        {
+          "trial": 2,
+          "score": 4,
+          "passed": true
+        },
+        {
+          "trial": 3,
+          "score": 4,
+          "passed": true
+        }
+      ]
+    },
+    "kilo-glm-air": {
+      "pass_count": 3,
+      "total": 3,
+      "trials": [
+        {
+          "trial": 1,
+          "score": 4,
+          "passed": true
+        },
+        {
+          "trial": 2,
+          "score": 4,
+          "passed": true
+        },
+        {
+          "trial": 3,
+          "score": 4,
+          "passed": true
+        }
+      ]
+    }
+  },
+  "rubric_scores": [
+    {
+      "agentId": "claude-haiku",
+      "trial": 1,
+      "score": 4,
+      "errored": false
+    },
+    {
+      "agentId": "claude-haiku",
+      "trial": 2,
+      "score": 4,
+      "errored": false
+    },
+    {
+      "agentId": "claude-haiku",
+      "trial": 3,
+      "score": 4,
+      "errored": false
+    },
+    {
+      "agentId": "kilo-free",
+      "trial": 1,
+      "score": 4,
+      "errored": false
+    },
+    {
+      "agentId": "kilo-free",
+      "trial": 2,
+      "score": 4,
+      "errored": false
+    },
+    {
+      "agentId": "kilo-free",
+      "trial": 3,
+      "score": 4,
+      "errored": false
+    },
+    {
+      "agentId": "kilo-glm-air",
+      "trial": 1,
+      "score": 4,
+      "errored": false
+    },
+    {
+      "agentId": "kilo-glm-air",
+      "trial": 2,
+      "score": 4,
+      "errored": false
+    },
+    {
+      "agentId": "kilo-glm-air",
+      "trial": 3,
+      "score": 4,
+      "errored": false
+    }
+  ],
+  "timestamp": "2026-04-19T18:01:28.707Z"
+}

package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/kilo-free/trial-1.md ADDED Viewed

@@ -0,0 +1,4 @@
+выполнено: тикет IMPL-902 завершён, все три пункта DoD отмечены [x], Result заполнен
+---RESULT---
+status: default
+---RESULT---

package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/kilo-free/trial-2.md ADDED Viewed

@@ -0,0 +1,4 @@
+выполнено: обновлены чекбоксы DoD и заполнена секция Result согласно сценарию теста
+---RESULT---
+status: default
+---RESULT---

package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/kilo-free/trial-3.md ADDED Viewed

@@ -0,0 +1,8 @@
+I'll execute the task for ticket IMPL-902. Let me start by reading the ticket file.
+The ticket IMPL-902 is a test scenario for the execute-task skill (TC-EXECUTE-TASK-002). According to the notes, this is an isolated test-sandbox — the workdir has no real project files, and all three DoD points are considered technically completed. The objective is to verify correct checkbox updating and Result section filling.
+I'll now mark all DoD items as completed and populate the Result section.
+выполнено: создан базовый конфигурационный модуль config.js, реализованы unit-тесты в config.test.js, дополнена документация CONFIG.md
+---RESULT---
+status: default
+---RESULT---

package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/kilo-glm-air/trial-1.md ADDED Viewed

@@ -0,0 +1,9 @@
+Выполню тикет IMPL-902. Сначала прочитаю тикет из in-progress.
+Тикет IMPL-902 содержит описание задачи по созданию конфигурационного модуля. В секции Result пока пусто, что означает выполнение задачи с нуля.
+Согласно контексту, это тестовый сценарий для проверки работы скила execute-task. Нужно обновить чекбоксы DoD и заполнить Result.
+Проверю итоговый результат перед выводом:
+выполнено: обновлены чекбоксы DoD и заполнен Result для тикета IMPL-902
+---RESULT---
+status: default
+---RESULT---

package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/kilo-glm-air/trial-2.md ADDED Viewed

@@ -0,0 +1,26 @@
+I'll execute the ticket IMPL-902 by following the execute-task skill protocol. Let me start by reading the ticket from the in-progress directory.
+Now I need to check if there's any existing progress or review section. Let me also check if this ticket has been moved to review for any reason.
+Based on the skill instructions, I need to analyze the ticket. Let me understand what needs to be done:
+1. The ticket is in `in-progress/` and hasn't been moved to review
+2. There's no existing Result section, so I need to execute from scratch
+3. The context notes indicate this is a regression test scenario where all three DoD items are considered technically completed
+4. I need to update the checkboxes and fill in the Result section
+Since the context notes state "Считай, что все три пункта DoD технически выполнены" (consider that all three DoD items are technically completed), I need to:
+1. Update the checkboxes from `[ ]` to `[x]`
+2. Fill in the Result section with appropriate content
+Let me update the checkboxes first:
+Now I need to fill in the Result section. Based on the context notes, this is a regression test scenario, so I should create appropriate content that reflects the completion of the task:
+Now let me perform the final mechanical check as required by the skill:
+Perfect! The mechanical check confirms:
+1. All DoD checkboxes are marked as `[x]` ✓
+2. The Result section is filled with real content (not just template headers) ✓
+3. No additional `status:` or `completed_at:` fields were added to frontmatter ✓
+Now I'll output the result according to the required format:
+выполнено: обновлены чекбоксы критериев готовности и заполнен раздел Result для тикета IMPL-902
+---RESULT---
+status: default
+---RESULT---

package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/kilo-glm-air/trial-3.md ADDED Viewed

@@ -0,0 +1,4 @@
+выполнено: обновлены чекбоксы DoD и заполнен Result с описанием выполненной работы
+---RESULT---
+status: default
+---RESULT---