workflow-ai 1.1.0 → 1.3.0
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/CHANGELOG.md +61 -0
- package/README.md +37 -377
- package/configs/pipeline.yaml +113 -4
- package/package.json +54 -44
- package/src/lib/operations/tickets.mjs +305 -207
- package/src/lib/utils.mjs +286 -286
- package/src/runner.mjs +316 -35
- package/src/scripts/check-conditions.js +2 -2
- package/src/scripts/check-relevance.js +3 -1
- package/src/scripts/get-next-id.js +144 -41
- package/src/scripts/mark-blocked.js +160 -0
- package/src/scripts/move-ticket.js +305 -83
- package/src/scripts/pick-next-task.js +782 -93
- package/src/skills/__test-cal-001-1777553217513/SKILL.md +2 -0
- package/src/skills/__test-runner-1777553217483/SKILL.md +5 -0
- package/src/skills/coach/SKILL.md +2 -2
- package/src/skills/execute-task/SKILL.md +1 -1
- package/src/skills/manual-testing/SKILL.md +2 -0
- package/src/skills/review-result/SKILL.md +23 -1
- package/src/scripts/tests/timeout-cascade.test.js +0 -28
- package/src/skills/analyze-report/README.md +0 -44
- package/src/skills/analyze-report/algorithms/progress-assessment.md +0 -108
- package/src/skills/analyze-report/knowledge/analysis-frameworks.md +0 -66
- package/src/skills/analyze-report/knowledge/report-structure.md +0 -61
- package/src/skills/analyze-report/scripts/calc-plan-metrics.js +0 -234
- package/src/skills/analyze-report/templates/analysis-report.md +0 -80
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/claude-sonnet/trial-1.md +0 -5
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/claude-sonnet/trial-2.md +0 -98
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/claude-sonnet/trial-3.md +0 -99
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/judge.json +0 -163
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/kilo-deepseek/trial-1.md +0 -89
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/kilo-deepseek/trial-2.md +0 -88
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/kilo-deepseek/trial-3.md +0 -100
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/kilo-glm/trial-1.md +0 -77
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/kilo-glm/trial-2.md +0 -64
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/kilo-glm/trial-3.md +0 -110
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/kilo-minimax/trial-1.md +0 -74
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/kilo-minimax/trial-2.md +0 -38
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/kilo-minimax/trial-3.md +0 -61
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/meta.json +0 -115
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001-evidence-from-log.yaml +0 -60
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/claude-sonnet/trial-1.md +0 -90
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/claude-sonnet/trial-2.md +0 -89
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/claude-sonnet/trial-3.md +0 -5
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/judge.json +0 -163
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/kilo-deepseek/trial-1.md +0 -84
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/kilo-deepseek/trial-2.md +0 -77
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/kilo-deepseek/trial-3.md +0 -89
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/kilo-glm/trial-1.md +0 -103
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/kilo-glm/trial-2.md +0 -103
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/kilo-glm/trial-3.md +0 -103
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/kilo-minimax/trial-1.md +0 -93
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/kilo-minimax/trial-2.md +0 -93
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/kilo-minimax/trial-3.md +0 -86
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/meta.json +0 -115
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002-result-block-format.yaml +0 -44
- package/src/skills/analyze-report/tests/fixtures/REPORT-002-incorrect-attribution.md +0 -27
- package/src/skills/analyze-report/tests/fixtures/pipeline-2026-04-06_qa-001-skip.log +0 -32
- package/src/skills/analyze-report/tests/index.yaml +0 -25
- package/src/skills/analyze-report/tests/rubrics/evidence-from-log.md +0 -22
- package/src/skills/analyze-report/tests/rubrics/result-block-format.md +0 -22
- package/src/skills/analyze-report/workflows/progress.md +0 -158
- package/src/skills/analyze-report/workflows/retrospective.md +0 -143
- package/src/skills/coach/README.md +0 -43
- package/src/skills/coach/SKILL.md.legacy +0 -157
- package/src/skills/coach/algorithms/gap-analysis.md +0 -69
- package/src/skills/coach/algorithms/improvement-prioritization.md +0 -62
- package/src/skills/coach/algorithms/skill-scoring.md +0 -80
- package/src/skills/coach/knowledge/audit-applied-changes-clean.txt +0 -11
- package/src/skills/coach/knowledge/backlog-management.md +0 -67
- package/src/skills/coach/knowledge/backlog-management.md.legacy +0 -90
- package/src/skills/coach/knowledge/common-antipatterns.md +0 -76
- package/src/skills/coach/knowledge/prompt-engineering.md +0 -45
- package/src/skills/coach/knowledge/shared-knowledge-guide.md +0 -44
- package/src/skills/coach/knowledge/skill-anatomy.md +0 -49
- package/src/skills/coach/knowledge/test-authorship.md +0 -141
- package/src/skills/coach/templates/audit-report.md +0 -39
- package/src/skills/coach/templates/coach-backlog-init.yaml +0 -14
- package/src/skills/coach/templates/coach-backlog-init.yaml.legacy +0 -10
- package/src/skills/coach/templates/improvement-plan.md +0 -42
- package/src/skills/coach/templates/new-skill.md +0 -95
- package/src/skills/coach/tests/cases/TC-COACH-001/current/claude-sonnet/trial-1.md +0 -58
- package/src/skills/coach/tests/cases/TC-COACH-001/current/claude-sonnet/trial-2.md +0 -65
- package/src/skills/coach/tests/cases/TC-COACH-001/current/claude-sonnet/trial-3.md +0 -58
- package/src/skills/coach/tests/cases/TC-COACH-001/current/judge.json +0 -151
- package/src/skills/coach/tests/cases/TC-COACH-001/current/kilo-deepseek/trial-1.md +0 -46
- package/src/skills/coach/tests/cases/TC-COACH-001/current/kilo-deepseek/trial-2.md +0 -0
- package/src/skills/coach/tests/cases/TC-COACH-001/current/kilo-deepseek/trial-3.md +0 -75
- package/src/skills/coach/tests/cases/TC-COACH-001/current/kilo-glm/trial-1.md +0 -81
- package/src/skills/coach/tests/cases/TC-COACH-001/current/kilo-glm/trial-2.md +0 -101
- package/src/skills/coach/tests/cases/TC-COACH-001/current/kilo-glm/trial-3.md +0 -91
- package/src/skills/coach/tests/cases/TC-COACH-001/current/kilo-minimax/trial-1.md +0 -48
- package/src/skills/coach/tests/cases/TC-COACH-001/current/kilo-minimax/trial-2.md +0 -30
- package/src/skills/coach/tests/cases/TC-COACH-001/current/kilo-minimax/trial-3.md +0 -55
- package/src/skills/coach/tests/cases/TC-COACH-001/current/meta.json +0 -94
- package/src/skills/coach/tests/cases/TC-COACH-001-evidence-based-temporal-diagram.yaml +0 -53
- package/src/skills/coach/tests/cases/TC-COACH-002/current/claude-sonnet/trial-1.md +0 -46
- package/src/skills/coach/tests/cases/TC-COACH-002/current/claude-sonnet/trial-2.md +0 -50
- package/src/skills/coach/tests/cases/TC-COACH-002/current/claude-sonnet/trial-3.md +0 -48
- package/src/skills/coach/tests/cases/TC-COACH-002/current/judge.json +0 -151
- package/src/skills/coach/tests/cases/TC-COACH-002/current/kilo-deepseek/trial-1.md +0 -0
- package/src/skills/coach/tests/cases/TC-COACH-002/current/kilo-deepseek/trial-2.md +0 -37
- package/src/skills/coach/tests/cases/TC-COACH-002/current/kilo-deepseek/trial-3.md +0 -30
- package/src/skills/coach/tests/cases/TC-COACH-002/current/kilo-glm/trial-1.md +0 -23
- package/src/skills/coach/tests/cases/TC-COACH-002/current/kilo-glm/trial-2.md +0 -29
- package/src/skills/coach/tests/cases/TC-COACH-002/current/kilo-glm/trial-3.md +0 -35
- package/src/skills/coach/tests/cases/TC-COACH-002/current/kilo-minimax/trial-1.md +0 -13
- package/src/skills/coach/tests/cases/TC-COACH-002/current/kilo-minimax/trial-2.md +0 -19
- package/src/skills/coach/tests/cases/TC-COACH-002/current/kilo-minimax/trial-3.md +0 -33
- package/src/skills/coach/tests/cases/TC-COACH-002/current/meta.json +0 -94
- package/src/skills/coach/tests/cases/TC-COACH-002-root-cause-first.yaml +0 -57
- package/src/skills/coach/tests/fixtures/pipeline-2026-04-06_id-collision.log +0 -77
- package/src/skills/coach/tests/index.yaml +0 -29
- package/src/skills/coach/tests/rubrics/calibration/evidence-based-bad.md +0 -13
- package/src/skills/coach/tests/rubrics/calibration/evidence-based-good.md +0 -29
- package/src/skills/coach/tests/rubrics/evidence-based.md +0 -26
- package/src/skills/coach/tests/rubrics/root-cause-first.md +0 -21
- package/src/skills/coach/workflows/analyze.md +0 -79
- package/src/skills/coach/workflows/analyze.md.legacy +0 -64
- package/src/skills/coach/workflows/audit.md +0 -74
- package/src/skills/coach/workflows/audit.md.legacy +0 -59
- package/src/skills/coach/workflows/create.md +0 -80
- package/src/skills/coach/workflows/create.md.legacy +0 -67
- package/src/skills/coach/workflows/improve.md +0 -71
- package/src/skills/coach/workflows/improve.md.legacy +0 -60
- package/src/skills/coach/workflows/research.md +0 -55
- package/src/skills/coach/workflows/review.md +0 -52
- package/src/skills/coach/workflows/review.md.legacy +0 -48
- package/src/skills/coach/workflows/test.md +0 -97
- package/src/skills/create-plan/README.md +0 -39
- package/src/skills/create-plan/algorithms/risk-assessment.md +0 -73
- package/src/skills/create-plan/knowledge/plan-completeness.md +0 -67
- package/src/skills/create-plan/knowledge/plan-lifecycle.md +0 -33
- package/src/skills/create-plan/knowledge/task-verification-pairs.md +0 -151
- package/src/skills/create-plan/knowledge/test-hygiene.md +0 -47
- package/src/skills/create-plan/scripts/validate-completeness.js +0 -182
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/claude-sonnet/trial-1.md +0 -5
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/claude-sonnet/trial-2.md +0 -39
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/claude-sonnet/trial-3.md +0 -35
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/judge.json +0 -167
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/kilo-deepseek/trial-1.md +0 -5
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/kilo-deepseek/trial-2.md +0 -10
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/kilo-deepseek/trial-3.md +0 -5
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/kilo-glm/trial-1.md +0 -26
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/kilo-glm/trial-2.md +0 -86
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/kilo-glm/trial-3.md +0 -5
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/kilo-minimax/trial-1.md +0 -11
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/kilo-minimax/trial-2.md +0 -15
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/kilo-minimax/trial-3.md +0 -14
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/meta.json +0 -119
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001-validate-completeness.yaml +0 -41
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/claude-sonnet/trial-1.md +0 -25
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/claude-sonnet/trial-2.md +0 -30
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/claude-sonnet/trial-3.md +0 -37
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/judge.json +0 -164
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/kilo-deepseek/trial-1.md +0 -3
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/kilo-deepseek/trial-2.md +0 -11
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/kilo-deepseek/trial-3.md +0 -13
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/kilo-glm/trial-1.md +0 -44
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/kilo-glm/trial-2.md +0 -5
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/kilo-glm/trial-3.md +0 -49
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/kilo-minimax/trial-1.md +0 -6
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/kilo-minimax/trial-2.md +0 -11
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/kilo-minimax/trial-3.md +0 -16
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/meta.json +0 -116
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002-task-granularity.yaml +0 -39
- package/src/skills/create-plan/tests/index.yaml +0 -25
- package/src/skills/create-plan/tests/rubrics/task-granularity.md +0 -21
- package/src/skills/create-plan/tests/rubrics/validate-completeness.md +0 -21
- package/src/skills/create-plan/workflows/create.md +0 -136
- package/src/skills/create-report/README.md +0 -40
- package/src/skills/create-report/algorithms/metric-calculation.md +0 -93
- package/src/skills/create-report/knowledge/report-metrics.md +0 -82
- package/src/skills/create-report/scripts/calc-metrics.js +0 -383
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/claude-sonnet/trial-1.md +0 -25
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/claude-sonnet/trial-2.md +0 -26
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/claude-sonnet/trial-3.md +0 -28
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/judge.json +0 -163
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/kilo-deepseek/trial-1.md +0 -4
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/kilo-deepseek/trial-2.md +0 -3
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/kilo-deepseek/trial-3.md +0 -6
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/kilo-glm/trial-1.md +0 -8
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/kilo-glm/trial-2.md +0 -12
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/kilo-glm/trial-3.md +0 -7
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/kilo-minimax/trial-1.md +0 -12
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/kilo-minimax/trial-2.md +0 -22
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/kilo-minimax/trial-3.md +0 -13
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/meta.json +0 -115
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001-root-cause-attribution.yaml +0 -57
- package/src/skills/create-report/tests/index.yaml +0 -20
- package/src/skills/create-report/tests/rubrics/root-cause-attribution.md +0 -21
- package/src/skills/create-report/workflows/standard.md +0 -175
- package/src/skills/decompose-gaps/README.md +0 -39
- package/src/skills/decompose-gaps/algorithms/scope-check.md +0 -110
- package/src/skills/decompose-gaps/knowledge/scope-validation.md +0 -65
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/claude-sonnet/trial-1.md +0 -41
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/claude-sonnet/trial-2.md +0 -41
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/claude-sonnet/trial-3.md +0 -56
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/judge.json +0 -164
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/kilo-deepseek/trial-1.md +0 -25
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/kilo-deepseek/trial-2.md +0 -17
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/kilo-deepseek/trial-3.md +0 -22
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/kilo-glm/trial-1.md +0 -25
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/kilo-glm/trial-2.md +0 -5
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/kilo-glm/trial-3.md +0 -29
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/kilo-minimax/trial-1.md +0 -27
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/kilo-minimax/trial-2.md +0 -35
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/kilo-minimax/trial-3.md +0 -18
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/meta.json +0 -116
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001-scope-exclusion.yaml +0 -46
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/claude-sonnet/trial-1.md +0 -27
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/claude-sonnet/trial-2.md +0 -30
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/claude-sonnet/trial-3.md +0 -27
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/judge.json +0 -163
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/kilo-deepseek/trial-1.md +0 -0
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/kilo-deepseek/trial-2.md +0 -15
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/kilo-deepseek/trial-3.md +0 -7
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/kilo-glm/trial-1.md +0 -21
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/kilo-glm/trial-2.md +0 -38
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/kilo-glm/trial-3.md +0 -16
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/kilo-minimax/trial-1.md +0 -5
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/kilo-minimax/trial-2.md +0 -10
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/kilo-minimax/trial-3.md +0 -9
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/meta.json +0 -115
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002-glob-before-write.yaml +0 -36
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/claude-sonnet/trial-1.md +0 -30
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/claude-sonnet/trial-2.md +0 -30
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/claude-sonnet/trial-3.md +0 -30
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/judge.json +0 -165
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/kilo-deepseek/trial-1.md +0 -5
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/kilo-deepseek/trial-2.md +0 -26
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/kilo-deepseek/trial-3.md +0 -5
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/kilo-glm/trial-1.md +0 -39
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/kilo-glm/trial-2.md +0 -37
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/kilo-glm/trial-3.md +0 -45
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/kilo-minimax/trial-1.md +0 -26
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/kilo-minimax/trial-2.md +0 -27
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/kilo-minimax/trial-3.md +0 -7
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/meta.json +0 -117
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003-parent-plan-mandatory.yaml +0 -41
- package/src/skills/decompose-gaps/tests/index.yaml +0 -30
- package/src/skills/decompose-gaps/tests/rubrics/glob-before-write.md +0 -21
- package/src/skills/decompose-gaps/tests/rubrics/parent-plan-mandatory.md +0 -22
- package/src/skills/decompose-gaps/tests/rubrics/scope-exclusion.md +0 -21
- package/src/skills/decompose-gaps/workflows/decompose.md +0 -123
- package/src/skills/decompose-plan/README.md +0 -43
- package/src/skills/decompose-plan/algorithms/deduplication.md +0 -101
- package/src/skills/decompose-plan/knowledge/atomicity-checklist.md +0 -139
- package/src/skills/decompose-plan/knowledge/capabilities.md +0 -68
- package/src/skills/decompose-plan/knowledge/human-task-rules.md +0 -82
- package/src/skills/decompose-plan/knowledge/scope-guard-checklist.md +0 -73
- package/src/skills/decompose-plan/scripts/check-atomicity-limit.js +0 -47
- package/src/skills/decompose-plan/scripts/check-duplicates.js +0 -323
- package/src/skills/decompose-plan/scripts/verify-atomicity.js +0 -408
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/claude-sonnet/trial-1.md +0 -30
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/claude-sonnet/trial-2.md +0 -36
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/claude-sonnet/trial-3.md +0 -37
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/judge.json +0 -163
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/kilo-deepseek/trial-1.md +0 -20
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/kilo-deepseek/trial-2.md +0 -17
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/kilo-deepseek/trial-3.md +0 -28
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/kilo-glm/trial-1.md +0 -114
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/kilo-glm/trial-2.md +0 -137
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/kilo-glm/trial-3.md +0 -188
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/kilo-minimax/trial-1.md +0 -0
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/kilo-minimax/trial-2.md +0 -32
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/kilo-minimax/trial-3.md +0 -110
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/meta.json +0 -115
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001-atomicity-no-1to1.yaml +0 -56
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/claude-sonnet/trial-1.md +0 -47
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/claude-sonnet/trial-2.md +0 -54
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/claude-sonnet/trial-3.md +0 -43
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/judge.json +0 -163
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/kilo-deepseek/trial-1.md +0 -15
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/kilo-deepseek/trial-2.md +0 -5
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/kilo-deepseek/trial-3.md +0 -12
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/kilo-glm/trial-1.md +0 -34
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/kilo-glm/trial-2.md +0 -30
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/kilo-glm/trial-3.md +0 -35
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/kilo-minimax/trial-1.md +0 -0
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/kilo-minimax/trial-2.md +0 -31
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/kilo-minimax/trial-3.md +0 -0
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/meta.json +0 -115
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002-get-next-id-mandatory.yaml +0 -44
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/claude-sonnet/trial-1.md +0 -21
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/claude-sonnet/trial-2.md +0 -38
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/claude-sonnet/trial-3.md +0 -30
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/judge.json +0 -163
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/kilo-deepseek/trial-1.md +0 -31
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/kilo-deepseek/trial-2.md +0 -35
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/kilo-deepseek/trial-3.md +0 -48
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/kilo-glm/trial-1.md +0 -167
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/kilo-glm/trial-2.md +0 -62
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/kilo-glm/trial-3.md +0 -174
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/kilo-minimax/trial-1.md +0 -0
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/kilo-minimax/trial-2.md +0 -0
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/kilo-minimax/trial-3.md +0 -0
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/meta.json +0 -115
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003-verbatim-dod-transfer.yaml +0 -42
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/claude-sonnet/trial-1.md +0 -55
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/claude-sonnet/trial-2.md +0 -49
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/claude-sonnet/trial-3.md +0 -49
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/judge.json +0 -163
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/kilo-deepseek/trial-1.md +0 -104
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/kilo-deepseek/trial-2.md +0 -45
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/kilo-deepseek/trial-3.md +0 -58
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/kilo-glm/trial-1.md +0 -193
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/kilo-glm/trial-2.md +0 -202
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/kilo-glm/trial-3.md +0 -155
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/kilo-minimax/trial-1.md +0 -52
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/kilo-minimax/trial-2.md +0 -17
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/kilo-minimax/trial-3.md +0 -0
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/meta.json +0 -115
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004-executor-atomicity.yaml +0 -64
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/claude-sonnet/trial-1.md +0 -59
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/claude-sonnet/trial-2.md +0 -204
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/claude-sonnet/trial-3.md +0 -213
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/judge.json +0 -163
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/kilo-deepseek/trial-1.md +0 -0
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/kilo-deepseek/trial-2.md +0 -57
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/kilo-deepseek/trial-3.md +0 -54
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/kilo-glm/trial-1.md +0 -147
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/kilo-glm/trial-2.md +0 -165
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/kilo-glm/trial-3.md +0 -133
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/kilo-minimax/trial-1.md +0 -81
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/kilo-minimax/trial-2.md +0 -108
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/kilo-minimax/trial-3.md +0 -3
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/meta.json +0 -114
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005-capabilities-registry.yaml +0 -78
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/claude-sonnet/trial-1.md +0 -225
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/claude-sonnet/trial-2.md +0 -66
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/claude-sonnet/trial-3.md +0 -36
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/judge.json +0 -163
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/kilo-deepseek/trial-1.md +0 -42
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/kilo-deepseek/trial-2.md +0 -67
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/kilo-deepseek/trial-3.md +0 -40
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/kilo-glm/trial-1.md +0 -122
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/kilo-glm/trial-2.md +0 -131
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/kilo-glm/trial-3.md +0 -138
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/kilo-minimax/trial-1.md +0 -41
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/kilo-minimax/trial-2.md +0 -88
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/kilo-minimax/trial-3.md +0 -0
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/meta.json +0 -115
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006-dod-threshold.yaml +0 -72
- package/src/skills/decompose-plan/tests/index.yaml +0 -45
- package/src/skills/decompose-plan/tests/rubrics/atomicity-no-1to1.md +0 -21
- package/src/skills/decompose-plan/tests/rubrics/capabilities-registry.md +0 -21
- package/src/skills/decompose-plan/tests/rubrics/dod-threshold.md +0 -21
- package/src/skills/decompose-plan/tests/rubrics/executor-atomicity.md +0 -21
- package/src/skills/decompose-plan/tests/rubrics/get-next-id-mandatory.md +0 -21
- package/src/skills/decompose-plan/tests/rubrics/verbatim-dod-transfer.md +0 -21
- package/src/skills/decompose-plan/workflows/decompose.md +0 -305
- package/src/skills/deep-research/README.md +0 -36
- package/src/skills/deep-research/algorithms/source-scoring.md +0 -63
- package/src/skills/deep-research/algorithms/synthesis.md +0 -67
- package/src/skills/deep-research/knowledge/data-validation.md +0 -44
- package/src/skills/deep-research/knowledge/perplexity-config.md +0 -30
- package/src/skills/deep-research/knowledge/research-methodology.md +0 -54
- package/src/skills/deep-research/knowledge/source-evaluation.md +0 -33
- package/src/skills/deep-research/scripts/perplexity-research.js +0 -315
- package/src/skills/deep-research/templates/brief-summary.md +0 -25
- package/src/skills/deep-research/templates/research-report.md +0 -76
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/claude-haiku/trial-1.md +0 -48
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/claude-haiku/trial-2.md +0 -88
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/claude-haiku/trial-3.md +0 -56
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/judge.json +0 -163
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/kilo-free/trial-1.md +0 -58
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/kilo-free/trial-2.md +0 -249
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/kilo-free/trial-3.md +0 -44
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/kilo-glm/trial-1.md +0 -96
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/kilo-glm/trial-2.md +0 -56
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/kilo-glm/trial-3.md +0 -94
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/kilo-glm-air/trial-1.md +0 -11
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/kilo-glm-air/trial-2.md +0 -1
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/kilo-glm-air/trial-3.md +0 -1
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/meta.json +0 -115
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001-self-check-url.yaml +0 -58
- package/src/skills/deep-research/tests/index.yaml +0 -20
- package/src/skills/deep-research/tests/rubrics/self-check-url.md +0 -34
- package/src/skills/deep-research/workflows/base-checklist.md +0 -19
- package/src/skills/deep-research/workflows/benchmark.md +0 -38
- package/src/skills/deep-research/workflows/competitor.md +0 -44
- package/src/skills/deep-research/workflows/custom.md +0 -32
- package/src/skills/deep-research/workflows/market.md +0 -44
- package/src/skills/deep-research/workflows/technology.md +0 -40
- package/src/skills/deep-research/workflows/trend.md +0 -40
- package/src/skills/execute-task/README.md +0 -44
- package/src/skills/execute-task/algorithms/execution-strategy.md +0 -136
- package/src/skills/execute-task/knowledge/context-checkpoints.md +0 -75
- package/src/skills/execute-task/knowledge/ticket-structure.md +0 -70
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/claude-haiku/trial-1.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/claude-haiku/trial-2.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/claude-haiku/trial-3.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/judge.json +0 -124
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/kilo-free/trial-1.md +0 -4
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/kilo-free/trial-2.md +0 -4
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/kilo-free/trial-3.md +0 -4
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/kilo-glm-air/trial-1.md +0 -4
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/kilo-glm-air/trial-2.md +0 -4
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/kilo-glm-air/trial-3.md +0 -11
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/meta.json +0 -88
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001-no-ticket-creation.yaml +0 -48
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/claude-haiku/trial-1.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/claude-haiku/trial-2.md +0 -6
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/claude-haiku/trial-3.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/judge.json +0 -124
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/kilo-free/trial-1.md +0 -4
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/kilo-free/trial-2.md +0 -4
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/kilo-free/trial-3.md +0 -8
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/kilo-glm-air/trial-1.md +0 -9
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/kilo-glm-air/trial-2.md +0 -26
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/kilo-glm-air/trial-3.md +0 -4
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/meta.json +0 -89
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002-no-duplicate-dod.yaml +0 -44
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-003/current/claude-haiku/trial-1.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-003/current/claude-haiku/trial-2.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-003/current/claude-haiku/trial-3.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-003/current/judge.json +0 -46
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-003/current/meta.json +0 -37
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-003-verification-proportionality.yaml +0 -46
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-004/current/claude-haiku/trial-1.md +0 -18
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-004/current/claude-haiku/trial-2.md +0 -16
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-004/current/claude-haiku/trial-3.md +0 -14
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-004/current/judge.json +0 -124
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-004/current/kilo-free/trial-1.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-004/current/kilo-free/trial-2.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-004/current/kilo-free/trial-3.md +0 -1
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-004/current/kilo-glm-air/trial-1.md +0 -8
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-004/current/kilo-glm-air/trial-2.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-004/current/kilo-glm-air/trial-3.md +0 -4
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-004/current/meta.json +0 -89
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-004-no-foreign-ticket-edit.yaml +0 -50
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005/current/claude-haiku/trial-1.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005/current/claude-haiku/trial-2.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005/current/claude-haiku/trial-3.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005/current/judge.json +0 -124
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005/current/kilo-free/trial-1.md +0 -15
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005/current/kilo-free/trial-2.md +0 -4
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005/current/kilo-free/trial-3.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005/current/kilo-glm-air/trial-1.md +0 -11
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005/current/kilo-glm-air/trial-2.md +0 -11
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005/current/kilo-glm-air/trial-3.md +0 -4
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005/current/meta.json +0 -88
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005-ticket-fields-updated.yaml +0 -39
- package/src/skills/execute-task/tests/fixtures/IMPL-902-create-file.md +0 -41
- package/src/skills/execute-task/tests/fixtures/IMPL-904-current-task.md +0 -40
- package/src/skills/execute-task/tests/fixtures/IMPL-906-fill-ticket.md +0 -42
- package/src/skills/execute-task/tests/fixtures/QA-901-button-click.md +0 -41
- package/src/skills/execute-task/tests/fixtures/QA-903-visual-figma.md +0 -40
- package/src/skills/execute-task/tests/fixtures/TASK-905-done-with-typo.md +0 -36
- package/src/skills/execute-task/tests/index.yaml +0 -39
- package/src/skills/execute-task/tests/rubrics/no-duplicate-dod.md +0 -22
- package/src/skills/execute-task/tests/rubrics/no-foreign-ticket-edit.md +0 -20
- package/src/skills/execute-task/tests/rubrics/no-ticket-creation.md +0 -21
- package/src/skills/execute-task/tests/rubrics/ticket-fields-updated.md +0 -23
- package/src/skills/execute-task/tests/rubrics/verification-proportionality.md +0 -22
- package/src/skills/execute-task/workflows/execute.md +0 -104
- package/src/skills/manual-testing/README.md +0 -63
- package/src/skills/manual-testing/algorithms/blocked-tool-strategy.md +0 -74
- package/src/skills/manual-testing/algorithms/bug-severity.md +0 -73
- package/src/skills/manual-testing/algorithms/mcp-budget.md +0 -97
- package/src/skills/manual-testing/algorithms/test-prioritization.md +0 -69
- package/src/skills/manual-testing/knowledge/browser-extension-testing.md +0 -102
- package/src/skills/manual-testing/knowledge/browser-tools.md +0 -114
- package/src/skills/manual-testing/knowledge/desktop-tools-advanced.md +0 -92
- package/src/skills/manual-testing/knowledge/desktop-tools-core.md +0 -76
- package/src/skills/manual-testing/knowledge/sandbox-advanced.md +0 -83
- package/src/skills/manual-testing/knowledge/sandbox-core.md +0 -67
- package/src/skills/manual-testing/knowledge/stateful-edge-cases.md +0 -69
- package/src/skills/manual-testing/knowledge/test-case-design.md +0 -107
- package/src/skills/manual-testing/knowledge/testing-types.md +0 -45
- package/src/skills/manual-testing/templates/bug-report.md +0 -52
- package/src/skills/manual-testing/templates/test-case.md +0 -34
- package/src/skills/manual-testing/templates/test-plan.md +0 -97
- package/src/skills/manual-testing/templates/test-session-report.md +0 -56
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/claude-sonnet/trial-1.md +0 -34
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/claude-sonnet/trial-2.md +0 -32
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/claude-sonnet/trial-3.md +0 -30
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/judge.json +0 -163
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/kilo-deepseek/trial-1.md +0 -0
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/kilo-deepseek/trial-2.md +0 -7
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/kilo-deepseek/trial-3.md +0 -0
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/kilo-glm/trial-1.md +0 -4
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/kilo-glm/trial-2.md +0 -15
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/kilo-glm/trial-3.md +0 -8
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/kilo-minimax/trial-1.md +0 -5
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/kilo-minimax/trial-2.md +0 -7
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/kilo-minimax/trial-3.md +0 -7
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/meta.json +0 -114
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001-sandbox-mandatory.yaml +0 -38
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/claude-sonnet/trial-1.md +0 -44
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/claude-sonnet/trial-2.md +0 -32
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/claude-sonnet/trial-3.md +0 -47
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/judge.json +0 -163
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/kilo-deepseek/trial-1.md +0 -19
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/kilo-deepseek/trial-2.md +0 -15
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/kilo-deepseek/trial-3.md +0 -24
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/kilo-glm/trial-1.md +0 -19
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/kilo-glm/trial-2.md +0 -13
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/kilo-glm/trial-3.md +0 -18
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/kilo-minimax/trial-1.md +0 -21
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/kilo-minimax/trial-2.md +0 -15
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/kilo-minimax/trial-3.md +0 -14
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/meta.json +0 -114
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002-visual-tc-screenshot.yaml +0 -37
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-003/current/claude-sonnet/trial-1.md +0 -76
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-003/current/claude-sonnet/trial-2.md +0 -71
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-003/current/claude-sonnet/trial-3.md +0 -85
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-003/current/judge.json +0 -46
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-003/current/meta.json +0 -36
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-003-qa-non-ui-assertion.yaml +0 -65
- package/src/skills/manual-testing/tests/index.yaml +0 -30
- package/src/skills/manual-testing/tests/last-run-tc001-sonnet.log +0 -140
- package/src/skills/manual-testing/tests/last-run-tc002.log +0 -1
- package/src/skills/manual-testing/tests/last-run.log +0 -1469
- package/src/skills/manual-testing/tests/rubrics/qa-non-ui-assertion.md +0 -31
- package/src/skills/manual-testing/tests/rubrics/sandbox-mandatory.md +0 -20
- package/src/skills/manual-testing/tests/rubrics/visual-tc-screenshot.md +0 -21
- package/src/skills/manual-testing/workflows/acceptance.md +0 -80
- package/src/skills/manual-testing/workflows/exploratory.md +0 -84
- package/src/skills/manual-testing/workflows/regression.md +0 -76
- package/src/skills/manual-testing/workflows/smoke.md +0 -109
- package/src/skills/manual-testing/workflows/test-plan.md +0 -75
- package/src/skills/review-result/README.md +0 -59
- package/src/skills/review-result/algorithms/verification.md +0 -112
- package/src/skills/review-result/knowledge/baseline-snapshot-validation.md +0 -67
- package/src/skills/review-result/knowledge/dod-patterns.md +0 -116
- package/src/skills/review-result/knowledge/test-hygiene.md +0 -44
- package/src/skills/review-result/scripts/verify-artifacts.js +0 -497
- package/src/skills/review-result/templates/verdict.md +0 -153
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/claude-haiku/trial-1.md +0 -22
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/claude-haiku/trial-2.md +0 -7
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/claude-haiku/trial-3.md +0 -21
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/claude-sonnet/trial-1.md +0 -6
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/claude-sonnet/trial-2.md +0 -6
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/claude-sonnet/trial-3.md +0 -6
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/judge.json +0 -164
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/kilo-deepseek/trial-1.md +0 -5
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/kilo-deepseek/trial-2.md +0 -7
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/kilo-deepseek/trial-3.md +0 -6
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/kilo-glm/trial-1.md +0 -49
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/kilo-glm/trial-2.md +0 -28
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/kilo-glm/trial-3.md +0 -37
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/kilo-minimax/trial-1.md +0 -22
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/kilo-minimax/trial-2.md +0 -13
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/kilo-minimax/trial-3.md +0 -21
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/meta.json +0 -116
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001-visual-tc-trigger.yaml +0 -51
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/claude-haiku/trial-1.md +0 -23
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/claude-haiku/trial-2.md +0 -22
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/claude-haiku/trial-3.md +0 -28
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/claude-sonnet/trial-1.md +0 -4
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/claude-sonnet/trial-2.md +0 -4
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/claude-sonnet/trial-3.md +0 -4
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/judge.json +0 -163
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/kilo-deepseek/trial-1.md +0 -4
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/kilo-deepseek/trial-2.md +0 -0
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/kilo-deepseek/trial-3.md +0 -4
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/kilo-glm/trial-1.md +0 -39
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/kilo-glm/trial-2.md +0 -25
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/kilo-glm/trial-3.md +0 -32
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/kilo-minimax/trial-1.md +0 -34
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/kilo-minimax/trial-2.md +0 -8
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/kilo-minimax/trial-3.md +0 -23
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/meta.json +0 -115
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002-path-line-suffix.yaml +0 -39
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/claude-sonnet/trial-1.md +0 -40
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/claude-sonnet/trial-2.md +0 -15
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/claude-sonnet/trial-3.md +0 -7
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/judge.json +0 -163
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-deepseek/trial-1.md +0 -5
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-deepseek/trial-2.md +0 -5
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-deepseek/trial-3.md +0 -11
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-glm/trial-1.md +0 -16
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-glm/trial-2.md +0 -18
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-glm/trial-3.md +0 -17
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-minimax/trial-1.md +0 -17
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-minimax/trial-2.md +0 -31
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-minimax/trial-3.md +0 -5
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/meta.json +0 -115
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003-test-isolation.yaml +0 -50
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-004/current/claude-sonnet/trial-1.md +0 -5
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-004/current/claude-sonnet/trial-2.md +0 -5
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-004/current/claude-sonnet/trial-3.md +0 -6
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-004/current/judge.json +0 -46
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-004/current/meta.json +0 -37
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-004-baseline-snapshot.yaml +0 -50
- package/src/skills/review-result/tests/fixtures/IMPL-902-path-with-line.md +0 -43
- package/src/skills/review-result/tests/fixtures/QA-901-visual-button.md +0 -46
- package/src/skills/review-result/tests/fixtures/QA-904-test-isolation-violation/QA-904.md +0 -51
- package/src/skills/review-result/tests/fixtures/QA-904-test-isolation-violation/example-test.mjs +0 -36
- package/src/skills/review-result/tests/fixtures/QA-905-baseline-regex-instead-of-snapshot/QA-905.md +0 -62
- package/src/skills/review-result/tests/fixtures/QA-905-baseline-regex-instead-of-snapshot/baseline.test.mjs +0 -124
- package/src/skills/review-result/tests/index.yaml +0 -35
- package/src/skills/review-result/tests/rubrics/baseline-snapshot.md +0 -20
- package/src/skills/review-result/tests/rubrics/path-line-suffix.md +0 -19
- package/src/skills/review-result/tests/rubrics/test-isolation.md +0 -20
- package/src/skills/review-result/tests/rubrics/visual-tc-trigger.md +0 -19
- package/src/skills/review-result/workflows/review.md +0 -209
|
@@ -1,143 +0,0 @@
|
|
|
1
|
-
# Воркфлоу: RETROSPECTIVE — Ретроспективный анализ завершённого плана
|
|
2
|
-
|
|
3
|
-
Полный анализ завершённого плана: что получилось, что нет, какие уроки извлечь, что улучшить в следующем цикле.
|
|
4
|
-
|
|
5
|
-
## Алгоритм выполнения
|
|
6
|
-
|
|
7
|
-
### 1. Собери входные данные
|
|
8
|
-
|
|
9
|
-
> **Pre-condition: Проверка статуса плана**
|
|
10
|
-
>
|
|
11
|
-
> До начала сбора данных — прочитай frontmatter плана.
|
|
12
|
-
>
|
|
13
|
-
> Если `status` **не** `completed` и не `archived`:
|
|
14
|
-
> 1. Зафиксировать как находку в разделе Lessons Learned отчёта:
|
|
15
|
-
> «Аномалия процесса: план не имел статуса `completed` к моменту запуска ретроспективы — пропущено обновление статуса в progress-анализе (шаг 6.5)»
|
|
16
|
-
> 2. Обновить frontmatter плана: установить `status: completed`, `completed_at` на текущую дату (ISO 8601), `updated_at` на текущую дату.
|
|
17
|
-
>
|
|
18
|
-
> Если `status` уже `completed` или `archived` — пропустить (идемпотентность), продолжить шаг 1 в штатном режиме.
|
|
19
|
-
>
|
|
20
|
-
> ⚠️ Это страховочный механизм. Основной путь обновления `status: completed` — через шаг 6.5 в `progress.md`. Ретроспектива лишь страхует от пропущенного обновления и фиксирует это как проблему процесса.
|
|
21
|
-
|
|
22
|
-
Из тикета извлеки:
|
|
23
|
-
- Какой план анализировать
|
|
24
|
-
- Все связанные отчёты
|
|
25
|
-
- Контекст: для чего проводится ретроспектива
|
|
26
|
-
|
|
27
|
-
Прочитай:
|
|
28
|
-
- Файл плана из `.workflow/plans/`
|
|
29
|
-
- Все отчёты, связанные с планом, из `.workflow/reports/`
|
|
30
|
-
- Все тикеты плана из `.workflow/tickets/done/`
|
|
31
|
-
- Заблокированные тикеты (если остались) из `.workflow/tickets/blocked/`
|
|
32
|
-
|
|
33
|
-
### 2. Оцени результат vs цели
|
|
34
|
-
|
|
35
|
-
> Загрузи `knowledge/analysis-frameworks.md`
|
|
36
|
-
|
|
37
|
-
Для каждой цели плана:
|
|
38
|
-
|
|
39
|
-
| Цель | Статус | Результат | Отклонение |
|
|
40
|
-
|------|--------|-----------|------------|
|
|
41
|
-
| ... | ✅/⚠️/❌ | Что получилось | Чем отличается от ожиданий |
|
|
42
|
-
|
|
43
|
-
### 3. Проанализируй эффективность процесса
|
|
44
|
-
|
|
45
|
-
> Загрузи `algorithms/progress-assessment.md`
|
|
46
|
-
|
|
47
|
-
#### 3a. Автоматический расчёт (основной путь)
|
|
48
|
-
|
|
49
|
-
Запусти скрипт расчёта метрик:
|
|
50
|
-
|
|
51
|
-
```bash
|
|
52
|
-
node .workflow/src/skills/analyze-report/scripts/calc-plan-metrics.js <PLAN-NNN>
|
|
53
|
-
```
|
|
54
|
-
|
|
55
|
-
Где `<PLAN-NNN>` — ID анализируемого плана.
|
|
56
|
-
|
|
57
|
-
Прочитай JSON из блока `---RESULT---`. Скрипт возвращает: `completion_pct`, `blocked_rate`, `rework_count`, `avg_time_to_done`, `distribution`.
|
|
58
|
-
|
|
59
|
-
Используй готовые метрики для:
|
|
60
|
-
- **Throughput**: `completion_pct` + `distribution` (завершено / всего)
|
|
61
|
-
- **Blockers**: `blocked_rate` + `distribution.blocked`
|
|
62
|
-
- **Rework**: `rework_count`
|
|
63
|
-
|
|
64
|
-
#### 3b. Дополнительные метрики (вручную)
|
|
65
|
-
|
|
66
|
-
Скрипт не рассчитывает — собери самостоятельно:
|
|
67
|
-
- **Quality**: % тикетов, прошедших ревью с первого раза (проверь историю ревью в тикетах)
|
|
68
|
-
|
|
69
|
-
#### 3c. Fallback (если скрипт недоступен)
|
|
70
|
-
|
|
71
|
-
Собери все метрики вручную:
|
|
72
|
-
- **Throughput**: сколько тикетов завершено / сколько было в плане
|
|
73
|
-
- **Quality**: % тикетов, прошедших ревью с первого раза
|
|
74
|
-
- **Blockers**: количество и длительность блокировок
|
|
75
|
-
- **Rework**: количество тикетов, потребовавших повторного выполнения
|
|
76
|
-
|
|
77
|
-
### 4. Выяви паттерны
|
|
78
|
-
|
|
79
|
-
**Что работало хорошо (Keep):**
|
|
80
|
-
- Практики, которые привели к успешным результатам
|
|
81
|
-
- Процессы, которые работали гладко
|
|
82
|
-
|
|
83
|
-
**Что не работало (Stop):**
|
|
84
|
-
- Практики, которые приводили к проблемам
|
|
85
|
-
- Повторяющиеся ошибки
|
|
86
|
-
|
|
87
|
-
**Что попробовать (Try):**
|
|
88
|
-
- Идеи для улучшения на основе выявленных проблем
|
|
89
|
-
|
|
90
|
-
### 4.1. Верифицируй паттерны проблем по логам пайплайна (ОБЯЗАТЕЛЬНО)
|
|
91
|
-
|
|
92
|
-
> **⛔ Без этого шага ретроспектива воспроизводит ошибки атрибуции из отчётов-источников.** Принцип evidence-based нарушается.
|
|
93
|
-
|
|
94
|
-
**Зачем:** ретроспектива опирается на REPORT-NNN, которые могут содержать **угаданную** атрибуцию root cause (если их сгенерировал старый воркфлоу `create-report` без проверки лога). Чтобы Lessons Learned были полезными, их **причинно-следственная часть** должна опираться на лог, а не на пересказ отчёта.
|
|
95
|
-
|
|
96
|
-
**Алгоритм:**
|
|
97
|
-
|
|
98
|
-
1. **Найди логи сессий** в `.workflow/logs/`, относящиеся к периоду плана. Может быть несколько `pipeline_*.log` за разные дни.
|
|
99
|
-
|
|
100
|
-
2. **Для каждой проблемы в категории "Stop":**
|
|
101
|
-
1. Найди в логах строки с упоминанием тикета или паттерна (Grep по `ticket_id` или ключевому слову).
|
|
102
|
-
2. Извлеки **точное имя стейджа**, который принял проблемное решение, и его обоснование (поле `reason`).
|
|
103
|
-
3. Сравни с тем, что написано в отчёте-источнике.
|
|
104
|
-
|
|
105
|
-
3. **Если атрибуция в отчёте-источнике расходится с логом**, выдели это как **отдельный урок (Lesson Learned)** с уровнем CRITICAL: «Отчёт неверно атрибутировал X — фактически решение принял Y. Это указывает на дефект в скиле, генерирующем отчёты». Рекомендуй создание тикета на правку.
|
|
106
|
-
|
|
107
|
-
4. **Каждый паттерн "Stop" должен иметь evidence:** цитата строки лога или явная пометка `evidence not found, confidence LOW`.
|
|
108
|
-
|
|
109
|
-
> **⛔ Запрет угадывания.** Если evidence нет — пиши уровень уверенности LOW. Не интерпретируй знакомые имена компонентов как «вероятную причину».
|
|
110
|
-
|
|
111
|
-
### 5. Извлеки уроки (Lessons Learned)
|
|
112
|
-
|
|
113
|
-
Для каждого урока:
|
|
114
|
-
- **Наблюдение:** что произошло (факт)
|
|
115
|
-
- **Причина:** почему это произошло (анализ) — **для уровня HIGH обязательна цитата строки лога**
|
|
116
|
-
- **Урок:** что из этого следует (вывод)
|
|
117
|
-
- **Действие:** что изменить в следующем цикле (рекомендация)
|
|
118
|
-
- **Уверенность:** HIGH (есть evidence из лога) / MEDIUM (только данные из тикетов) / LOW (косвенные признаки)
|
|
119
|
-
|
|
120
|
-
### 6. Сформулируй рекомендации для следующего плана
|
|
121
|
-
|
|
122
|
-
- Что учесть при планировании
|
|
123
|
-
- Какие риски закладывать
|
|
124
|
-
- Какие процессы изменить
|
|
125
|
-
- Приоритеты: CRITICAL / HIGH / MEDIUM / LOW
|
|
126
|
-
|
|
127
|
-
### 7. Сформируй отчёт
|
|
128
|
-
|
|
129
|
-
> Используй `templates/analysis-report.md`
|
|
130
|
-
|
|
131
|
-
> Загрузи `knowledge/report-structure.md`
|
|
132
|
-
|
|
133
|
-
### 8. Валидация
|
|
134
|
-
|
|
135
|
-
- [ ] Каждая цель плана покрыта анализом (результат vs ожидания)
|
|
136
|
-
- [ ] Метрики процесса рассчитаны на реальных данных
|
|
137
|
-
- [ ] Паттерны подкреплены конкретными примерами из тикетов
|
|
138
|
-
- [ ] **Каждый паттерн "Stop" имеет evidence из лога** (`pipeline_*.log:NNNN`) или явную пометку LOW
|
|
139
|
-
- [ ] **Расхождения с атрибуцией в отчёте-источнике вынесены в отдельный урок CRITICAL**
|
|
140
|
-
- [ ] Уроки содержат и наблюдение, и причину, и действие
|
|
141
|
-
- [ ] Уроки помечены уровнем уверенности (HIGH/MEDIUM/LOW)
|
|
142
|
-
- [ ] Рекомендации actionable и приоритизированы
|
|
143
|
-
- [ ] Executive summary отражает ключевые выводы
|
|
@@ -1,43 +0,0 @@
|
|
|
1
|
-
# Coach — Модульный скилл
|
|
2
|
-
|
|
3
|
-
Мета-скил для создания, аудита и совершенствования других скилов. Обрабатывает тикеты `COACH-*`.
|
|
4
|
-
|
|
5
|
-
## Структура
|
|
6
|
-
|
|
7
|
-
```
|
|
8
|
-
coach/
|
|
9
|
-
├── SKILL.md # Ядро: роль, маршрутизация, принципы
|
|
10
|
-
├── workflows/ # CREATE, AUDIT, ANALYZE, IMPROVE, RESEARCH, REVIEW
|
|
11
|
-
├── knowledge/ # skill-anatomy, common-antipatterns, prompt-engineering,
|
|
12
|
-
│ # backlog-management, shared-knowledge-guide
|
|
13
|
-
├── algorithms/ # skill-scoring, gap-analysis, improvement-prioritization
|
|
14
|
-
├── templates/ # new-skill, audit-report, improvement-plan
|
|
15
|
-
└── README.md
|
|
16
|
-
```
|
|
17
|
-
|
|
18
|
-
## Как это работает
|
|
19
|
-
|
|
20
|
-
1. Агент получает `COACH-*` тикет → **SKILL.md** определяет тип → подгружает **workflow**
|
|
21
|
-
2. Воркфлоу ссылается на **knowledge** и **algorithms** по необходимости
|
|
22
|
-
3. Результат оформляется по **template**
|
|
23
|
-
|
|
24
|
-
## Типичные сценарии
|
|
25
|
-
|
|
26
|
-
| Задача | Воркфлоу |
|
|
27
|
-
|--------|----------|
|
|
28
|
-
| Создать скил для новой роли | `workflows/create.md` |
|
|
29
|
-
| Полный аудит скила | `workflows/audit.md` |
|
|
30
|
-
| Анализ эффективности по тикетам | `workflows/analyze.md` |
|
|
31
|
-
| Точечное улучшение | `workflows/improve.md` |
|
|
32
|
-
| Поиск лучших практик | `workflows/research.md` |
|
|
33
|
-
| Ревью структуры и качества | `workflows/review.md` |
|
|
34
|
-
|
|
35
|
-
## Как расширять
|
|
36
|
-
|
|
37
|
-
| Что добавить | Действия |
|
|
38
|
-
|-------------|----------|
|
|
39
|
-
| Новый тип тикета | Создать `workflows/type.md` + строка в маршрутизации SKILL.md |
|
|
40
|
-
| Новые знания | Создать `knowledge/name.md` + строка в таблице загрузки SKILL.md |
|
|
41
|
-
| Новый алгоритм | Создать `algorithms/name.md` + строка в таблице загрузки SKILL.md |
|
|
42
|
-
| Новый шаблон | Создать `templates/name.md` + ссылка в воркфлоу |
|
|
43
|
-
| Расширение модуля | Дописать после маркера `<!-- РАСШИРЕНИЕ -->` |
|
|
@@ -1,157 +0,0 @@
|
|
|
1
|
-
---
|
|
2
|
-
name: coach
|
|
3
|
-
description: >
|
|
4
|
-
Скилл агента-коуча для workflow-ai. Активируется при обработке тикетов
|
|
5
|
-
с префиксом COACH-*. Агент — мета-специалист по совершенствованию скилов.
|
|
6
|
-
Он создаёт новые скилы, анализирует работу существующих на основе завершённых
|
|
7
|
-
планов и тикетов, находит недостатки, ищет лучшие практики в интернете,
|
|
8
|
-
обогащает knowledge-базу и итеративно улучшает скилы.
|
|
9
|
-
ticket_prefix: COACH
|
|
10
|
-
---
|
|
11
|
-
|
|
12
|
-
# Coach — Agent Skill
|
|
13
|
-
|
|
14
|
-
## ⛔ ГЛАВНОЕ ПРАВИЛО
|
|
15
|
-
|
|
16
|
-
**Точки запуска вопроса** (любая из трёх):
|
|
17
|
-
- После каждой записи в бэклог — перед ответом пользователю.
|
|
18
|
-
- После каждого сообщения стейкхолдера, в котором есть указание на ошибку, противоречие или вопрос о соответствии принципам — перед формированием ответа. Это включает обсуждение **черновика** правки до её записи в файл (обсуждение черновика — такая же зона ответственности коуча, как и обсуждение записанного).
|
|
19
|
-
- Перед показом стейкхолдеру любого черновика правки скила (даже до Edit'а) — задай вопрос превентивно.
|
|
20
|
-
|
|
21
|
-
**Вопрос:** «Поправлял ли стейкхолдер в этой сессии?»
|
|
22
|
-
|
|
23
|
-
Если **да** — это значит, что твой self-check (принцип 10) и/или чеклист принципа 9 не сработали. Обязательные действия **до** ответа пользователю:
|
|
24
|
-
1. Определи, что именно ты упустил и почему — конкретно: на каком этапе должна была сработать проверка (формирование черновика / показ стейкхолдеру / Edit / финальный self-check), и почему она не сработала.
|
|
25
|
-
2. Усиль инструкции коуча (`SKILL.md` или knowledge), чтобы ошибка не повторилась. Усиление должно бить в **этап**, на котором проверка пропущена, а не дублировать существующее правило для другого этапа.
|
|
26
|
-
3. Запиши CHG в бэклог на правку коуча.
|
|
27
|
-
4. Только потом отвечай.
|
|
28
|
-
|
|
29
|
-
**Пропуск этого правила = незавершённая работа.** Коррекция стейкхолдера — всегда сигнал провала проактивной проверки. Не имеет значения, на каком этапе произошла коррекция (обсуждение черновика, ревью записанного, ad-hoc указание) — все три случая равноценны как сигнал провала.
|
|
30
|
-
|
|
31
|
-
**Антипаттерн 1:** «покажу черновик стейкхолдеру в чате до записи — он поправит, и я учту правки в финальной версии». Это перекладывание собственного self-check на стейкхолдера. Стейкхолдер — последний рубеж, не первый. Черновик, который ты выкладываешь в чат, должен быть уже очищен от нарушений принципов 1-12 в той же мере, как если бы ты собирался сразу его записать.
|
|
32
|
-
|
|
33
|
-
**Антипаттерн 2:** воспринимать коррекцию стейкхолдера как «уточнение направления» и просто скорректировать курс, не выполняя ГЛАВНОЕ ПРАВИЛО. Любой отказ стейкхолдера от предложенной правки (`нет`, `не то`, `не туда`) — это коррекция, запускающая ГЛАВНОЕ ПРАВИЛО. Не продолжай работу, пока не выполнишь все 4 шага. Накопление нескольких коррекций без выполнения ГЛАВНОГО ПРАВИЛА после каждой — грубое нарушение.
|
|
34
|
-
|
|
35
|
-
**Антипаттерн 3:** формально выполнить шаг 2 ГЛАВНОГО ПРАВИЛА, но прийти к выводу «усиление не нужно, формулировка достаточна, ошибка применения». Шаг 2 **обязывает** внести правку — если коррекция стейкхолдера произошла, значит инструкции допустили ошибку. Вывод «формулировка достаточна» невалиден: достаточная формулировка не приводит к коррекции стейкхолдера. Если кажется, что правка не нужна — значит ты не нашёл настоящий пробел; ищи глубже, а не закрывай вопрос.
|
|
36
|
-
|
|
37
|
-
## Роль
|
|
38
|
-
|
|
39
|
-
Ты — коуч системы скилов workflow-ai. Твоя задача — создавать, анализировать и совершенствовать скилы агентов. Ты работаешь на мета-уровне: не выполняешь бизнес-задачи, а улучшаешь инструменты, которыми другие агенты их выполняют.
|
|
40
|
-
|
|
41
|
-
**Ты делаешь:** создание новых скилов, аудит существующих, анализ завершённых планов и тикетов, поиск паттернов ошибок и недочётов, поиск лучших практик в интернете, обогащение knowledge/algorithms, рефакторинг воркфлоу, формирование рекомендаций.
|
|
42
|
-
|
|
43
|
-
**⛔ Результат работы коуча — ВСЕГДА правка скила + запись в бэклог.** Если при анализе обнаружена проблема в артефакте (тикете, плане, декомпозиции) — определи скил-источник, улучши его, запиши CHG в бэклог. Выдача стейкхолдеру «голой рекомендации» (таблица с findings, предложение разбить тикеты) без правки скила-источника и без записи в бэклог — **незавершённая работа**, даже если анализ корректен. Ad-hoc запросы стейкхолдера («оцени тикеты», «проверь декомпозицию») — полноценная работа коуча, не исключение.
|
|
44
|
-
|
|
45
|
-
**Ты НЕ делаешь:** выполнение бизнес-тикетов других скилов, принятие решений за скил (только рекомендации), удаление скилов без подтверждения. Если при анализе обнаружена проблема в артефакте — улучши скил, который его создал, и рекомендуй создать тикет на переделку артефакта соответствующим скилом. Коуч правит **только** содержимое `.workflow/src/skills/`.
|
|
46
|
-
|
|
47
|
-
## Объекты работы
|
|
48
|
-
|
|
49
|
-
| Объект | Описание |
|
|
50
|
-
|--------|----------|
|
|
51
|
-
| **Скил** | Директория в `.workflow/src/skills/` с SKILL.md, workflows/, knowledge/, algorithms/, templates/ |
|
|
52
|
-
| **План** | Файл в `.workflow/plans/` — источник контекста для анализа |
|
|
53
|
-
| **Тикет** | Файл в `.workflow/tickets/` — единица работы для анализа результатов |
|
|
54
|
-
| **Отчёт** | Файл в `.workflow/reports/` — источник метрик и выводов |
|
|
55
|
-
| **Бэклог коуча** | Файл `.workflow/coach-backlog.yaml` — реестр проанализированных тикетов и внесённых правок |
|
|
56
|
-
|
|
57
|
-
## Обязательный шаг: Бэклог коуча
|
|
58
|
-
|
|
59
|
-
**⚠️ Любая работа коуча БЕЗ обновления бэклога считается незавершённой.** Правила формата → `knowledge/backlog-management.md`.
|
|
60
|
-
|
|
61
|
-
**ПЕРЕД работой:** Прочитай `.workflow/coach-backlog.yaml` + `knowledge/backlog-management.md`. Пропускай тикеты из `analyzed_tickets`, не предлагай правки из `applied_changes`.
|
|
62
|
-
|
|
63
|
-
**ПОСЛЕ работы** (включая ad-hoc): Добавь тикеты в `analyzed_tickets`, правки в `applied_changes`, аудит в `audited_skills`. Обнови `last_updated`. Компрессия: если > 500 строк → `knowledge/backlog-management.md` → «Компрессия бэклога».
|
|
64
|
-
|
|
65
|
-
**⛔ ПОСЛЕ записи бэклога** — выполни **ГЛАВНОЕ ПРАВИЛО** (см. начало скила).
|
|
66
|
-
|
|
67
|
-
## Маршрутизация тикетов COACH-*
|
|
68
|
-
|
|
69
|
-
При получении тикета определи тип и загрузи соответствующий воркфлоу:
|
|
70
|
-
|
|
71
|
-
| Тип | Триггеры в тикете | Действие | Воркфлоу |
|
|
72
|
-
|-----|-------------------|----------|----------|
|
|
73
|
-
| **CREATE** | «создать скил», «новый скил» | Создание нового скила с нуля | → `workflows/create.md` |
|
|
74
|
-
| **AUDIT** | «аудит скила», «проверить скил» | Полный аудит существующего скила | → `workflows/audit.md` |
|
|
75
|
-
| **ANALYZE** | «анализ результатов», «эффективность» | Анализ работы скила по завершённым тикетам | → `workflows/analyze.md` |
|
|
76
|
-
| **IMPROVE** | «улучшить», «доработать», «обогатить» | Точечное улучшение скила | → `workflows/improve.md` |
|
|
77
|
-
| **RESEARCH** | «исследовать», «найти практики», «бенчмарки» | Поиск знаний и подходов в интернете | → `workflows/research.md` |
|
|
78
|
-
| **REVIEW** | «ревью скила», «код-ревью» | Ревью структуры и качества скила | → `workflows/review.md` |
|
|
79
|
-
|
|
80
|
-
Если тип не определяется — классифицируй по основному действию в описании.
|
|
81
|
-
|
|
82
|
-
## Загрузка знаний
|
|
83
|
-
|
|
84
|
-
Подгружай модули из `knowledge/` когда нужна экспертиза:
|
|
85
|
-
|
|
86
|
-
| Модуль | Когда загружать |
|
|
87
|
-
|--------|----------------|
|
|
88
|
-
| `knowledge/skill-anatomy.md` | При создании или аудите скила — эталонная структура |
|
|
89
|
-
| `knowledge/shared-knowledge-guide.md` | При создании или аудите скила — правила межскиловых знаний (lazy-load) |
|
|
90
|
-
| `knowledge/common-antipatterns.md` | При аудите и ревью — типичные ошибки в скилах |
|
|
91
|
-
| `knowledge/prompt-engineering.md` | При улучшении формулировок в SKILL.md и воркфлоу |
|
|
92
|
-
| `knowledge/backlog-management.md` | **ВСЕГДА** — правила ведения бэклога проанализированных тикетов и правок |
|
|
93
|
-
| `knowledge/test-authorship.md` | При создании или аудите тест-кейсов регрессионных тестов скилов — правила выбора слоя, написания anchor'ов, фикстур и rubric-критериев |
|
|
94
|
-
|
|
95
|
-
## Загрузка алгоритмов
|
|
96
|
-
|
|
97
|
-
Подгружай из `algorithms/` когда нужен формализованный метод:
|
|
98
|
-
|
|
99
|
-
| Алгоритм | Когда загружать |
|
|
100
|
-
|----------|----------------|
|
|
101
|
-
| `algorithms/skill-scoring.md` | Оценка качества скила по критериям |
|
|
102
|
-
| `algorithms/gap-analysis.md` | Поиск пробелов в покрытии скила |
|
|
103
|
-
| `algorithms/improvement-prioritization.md` | Приоритизация улучшений |
|
|
104
|
-
|
|
105
|
-
## Шаблоны вывода
|
|
106
|
-
|
|
107
|
-
Используй шаблоны из `templates/` для формирования результатов:
|
|
108
|
-
|
|
109
|
-
| Шаблон | Когда использовать |
|
|
110
|
-
|--------|-------------------|
|
|
111
|
-
| `templates/new-skill.md` | Структура нового скила |
|
|
112
|
-
| `templates/audit-report.md` | Результат аудита скила |
|
|
113
|
-
| `templates/improvement-plan.md` | План улучшений скила |
|
|
114
|
-
|
|
115
|
-
## Принципы
|
|
116
|
-
|
|
117
|
-
1. **Root Cause First** — при обнаружении проблемы в артефакте (тикете, плане, отчёте) всегда определи скил-источник, который создал этот артефакт, и предложи исправить **скил** первым. Не предлагай ручную правку артефактов (последствий), пока корневая причина (скил) не исправлена. Порядок действий: (1) найти скил-источник → (2) проследить цепочку вверх: если артефакт-источник (план, шаблон) уже содержал дефект — root cause в скиле, создавшем **его**, а не в скиле-обработчике → (3) исправить скил → (4) если нужно, предложить пересоздать артефакт исправленным скилом. **Антипаттерн «остановка на ближайшем скиле»:** тикет неатомарен → правишь декомпозитор. Но если задача **плана** уже неатомарна — root cause в скиле планирования, декомпозитор — вторая линия обороны. **Антипаттерн:** если данные невалидны — root cause в том, кто/что генерирует данные (шаблон, скил, воркфлоу), а НЕ в обработчике данных (скрипт, парсер). Не правь обработчик под невалидный формат — исправь источник формата. **⚠️ Обязательно перед правкой:** прочитай лог или артефакт до конца — определи точный паттерн нарушения (кто, когда, что именно записал). Гипотеза о root cause без evidence из лога — не основание для правки. **Семантика первична:** перед диагностикой сформулируй назначение скила одним предложением (что он должен решать, что НЕ должен). Если поведение противоречит назначению — это ошибка в скиле, не в смежных компонентах. **⚠️ Физический автор ≠ семантический владелец:** при определении скила-источника ищи не «кто владеет предметной областью артефакта», а **кто физически записывает** (Edit/Write) проблемный фрагмент. Если скил A выполняет предметную работу, но скил B записывает результат в тикет — root cause в инструкциях скила B, а не A. Антипаттерн: «тикет предметной области X → правлю скил предметной области», хотя физическую запись в тикет выполняет скил-исполнитель. **⛔ Повторный инцидент по той же корневой проблеме:** перед формулированием правки **обязательно** прогрепай `coach-backlog.yaml` на ключевые термины текущей проблемы (имя скила-жертвы, имя нарушенного правила, имя задействованной нормы). Если обнаружен CHG за последние 30 дней на тот же скил и ту же корневую проблему — это сигнал, что **текстовое усиление инструкции не работает** (предыдущий текст уже содержал норму, но нарушитель её проигнорировал). В этом случае: (а) ещё одна текстовая правка того же скила — недостаточная мера; (б) обязательно создай тикет эскалации стейкхолдеру с рекомендацией ввести **машинную защиту**, не зависящую от дисциплины агента (валидация пайплайном, пост-гейт-стадия, автоматический откат, инфраструктурная проверка); (в) в тикете явно опиши, что попытки дисциплинарного усиления исчерпаны, и почему только машинная защита закрывает класс ошибки. Текстовую правку всё равно применяй — она страхует дисциплинированного агента, — но **не считай её решением проблемы**, пока машинная защита не введена. Антипаттерн: «усилю формулировку ещё жёстче, напишу ⛔ крупнее» — агент, который не прочитал прошлую норму, не прочитает и новую.
|
|
118
|
-
2. **Evidence-Based** — все выводы основаны на данных из завершённых тикетов, планов и логов пайплайна, а не на предположениях. **При анализе лога обязательно строй временную диаграмму ключевых событий по ID артефакта** (тикет, план, отчёт): проследи всю цепочку перемещений/изменений артефакта от первого упоминания до последнего, обращая внимание на события, отстоящие далеко друг от друга по времени, но связанные одним ID. **Антипаттерн:** прочитал начало лога (события archive/cleanup), прочитал середину (события create/decompose), но **не сопоставил** их — упустил коллизию ID или другой паттерн взаимного влияния. Перед формулированием findings задай себе вопрос: «Я проверил всю историю каждого упомянутого ID, или только последнее событие с ним?» **⚠️ Проверка фактической практики перед нормативной правкой:** если правка вводит новое правило про путь, имя, формат, расположение — **обязательно `Grep` по всему проекту** (код, конфиги, скилы, тикеты) на ключевой термин этого правила, чтобы измерить **масштаб уже существующей практики**. Один-два аномальных артефакта — не основание объявлять их новой нормой. Если фактическая практика противоположна гипотезе — гипотеза неверна, или (если стейкхолдер действительно хочет миграцию) нужен явный миграционный план и согласие на масштаб правок. Антипаттерн: получил короткий ответ стейкхолдера на развилку → принял за сильное правило → пошёл править скилы → не проверил, что в проекте 20+ артефактов уже живут по противоположному правилу. Перед каждой нормативной правкой задай себе вопрос: «Сколько уже существующих файлов/строк проекта противоречат тому, что я собираюсь записать?» Если ответ > 5 — остановись и переспроси у стейкхолдера, точно ли это миграция. **⚠️ Обязательный diff формулировок при анализе цепочки артефактов:** когда анализируешь инцидент, прошедший через несколько стадий (план → тикет → исполнение → ревью), **перед назначением виновного** обязан построчно сопоставить формулировки критериев на каждом стыке: (1) дословная строка критерия в плане, (2) дословная строка в тикете, (3) что реально проверяет assertion/тест, (4) что ревьюер проверял. Виновник — стадия, на которой произошла первая потеря семантики. Антипаттерн: прочитал план и увидел расхождение с результатом → обвинил последнюю стадию (ревьюера), не проверив, на какой промежуточной стадии формулировка была ослаблена. Гипотеза «ревьюер должен был поймать» невалидна, если ревьюер работал по формулировке тикета, а тикет уже не содержал потерянного уточнения.
|
|
119
|
-
**⚠️ Антипаттерн «уход в формулировки вместо root cause»:** стейкхолдер задаёт вопрос о наблюдаемом дефекте («почему не поймали?»), а коуч анализирует текст формулировок, семантику переносов, чеклисты — вместо того чтобы ответить на прямой вопрос: какой конкретный шаг в какой конкретной стадии не выполнил конкретное физическое действие (открыть файл, посмотреть на картинку, запустить команду). Формулировки — это причина второго порядка; причина первого порядка — «агент X не сделал действие Y». Всегда начинай с причины первого порядка, потом объясняй, почему инструкции это допустили.
|
|
120
|
-
**⚠️ Антипаттерн «оценка по результату вместо сверки с инструкцией»:** при анализе действия агента — **не оценивай** его «разумность» или «допустимость» по своему суждению. Вместо этого открой скил агента и **дословно сверь** действие с инструкцией. Если инструкция говорит «разбей тикет», а агент объединил шаги — это нарушение, даже если результат выглядит «приемлемо». Коуч не имеет права смягчать finding на основании того, что дефект «небольшой» или «единичный» — скил либо нарушен, либо нет.
|
|
121
|
-
3. **Итеративность** — улучшай скилы инкрементально. Маленькие точечные улучшения > масштабные переписывания.
|
|
122
|
-
4. **Обратная совместимость** — улучшения не должны ломать существующие воркфлоу и интеграции.
|
|
123
|
-
5. **Актуальность знаний** — активно ищи в интернете лучшие практики, фреймворки и подходы для обогащения скилов.
|
|
124
|
-
6. **Измеримость** — каждое улучшение должно иметь критерий успеха, по которому можно оценить результат.
|
|
125
|
-
7. **DRY** — выноси повторяющиеся паттерны в shared knowledge/algorithms, не дублируй между скилами.
|
|
126
|
-
8. **Изоляция скилов** — скилы не должны знать о других скилах по имени. Не допускай хардкод имён ролей (GML, PMA и т.д.) в SKILL.md, воркфлоу, knowledge, примерах. Используй универсальные формулировки: «любой скил проекта», «соответствующий скил», generic ID (XXX-NNN). При создании и аудите — обязательная проверка изоляции.
|
|
127
|
-
9. **Универсальность правок** — при внесении правок в скилы не хардкодить проектно-специфичные значения (конкретные типы тикетов, префиксы, маппинги) и не перечислять закрытые списки категорий предметной области (типы файлов, технологии, виды изменений). Вместо закрытого списка примеров давай **критерий принятия решения** — вопрос или правило, по которому агент сам определит категорию. Скилы должны ссылаться на конфиг как единственный источник правды. Набор типов и префиксов может быть разным в каждом проекте. **Ссылки на shared knowledge** — не хардкодь имена конкретных shared-модулей в SKILL.md. Используй ссылку на директорию shared (glob-паттерн) с указанием проверить индекс и загрузить релевантные модули. Содержимое shared — проектно-специфичное, скилы — универсальные. **Чеклист правки — две точки запуска (обе обязательны):**
|
|
128
|
-
|
|
129
|
-
- **Точка А — перед показом черновика стейкхолдеру.** Если ты собираешься изложить текст планируемой правки в ответе пользователю (даже без записи в файл) — прогоняй чеклист до показа. Черновик, который стейкхолдер увидит и может одобрить «как есть», должен быть уже очищен от нарушений принципа 9. Антипаттерн: «покажу как есть, стейкхолдер всё равно поправит» — это перекладывание собственного self-check на стейкхолдера и срабатывание главного правила (см. начало скила).
|
|
130
|
-
- **Точка Б — перед каждым Edit/Write в файл скила.** Повторный прогон обязателен, даже если черновик уже проходил чеклист на точке А — между точками текст мог быть скорректирован по комментариям стейкхолдера, и новая редакция требует новой проверки.
|
|
131
|
-
|
|
132
|
-
**Четыре вопроса чеклиста** (применяются в обеих точках):
|
|
133
|
-
1. Упоминаю ли я имена UI-элементов, форматов файлов, инструментов, компонентов или **типов тикетов**, специфичных только для этого проекта? Включая **hint'ы** на конкретный тип (например, «обычно X» или «как правило Y») — hint сужает выбор агента так же, как хардкод.
|
|
134
|
-
2. Упоминаю ли я конкретные имена файлов, URL, сервисы, конфигурации, специфичные для этого проекта?
|
|
135
|
-
3. Применима ли эта правка к другому проекту без изменений?
|
|
136
|
-
4. Не перечисляю ли я закрытый список категорий предметной области там, где нужен критерий принятия решения?
|
|
137
|
-
|
|
138
|
-
Если на (1), (2) или (4) ответ «да» — замени на общую формулировку или критерий, либо перенеси в shared knowledge проекта. Правка должна быть применима к любому проекту, использующему этот скил.
|
|
139
|
-
|
|
140
|
-
**Дополнительная проверка на копирование старого текста:** если правка **заменяет** существующий блок, не воспроизводи автоматически терминологию исходника. Pre-existing нарушения в заменяемом тексте — твоя ответственность; молча скопировав их в новый текст, ты унаследуешь нарушения и они станут частью твоей правки. Прогон чеклиста по 4 вопросам обязателен **по новому тексту целиком**, а не только по дельте «новое - старое».
|
|
141
|
-
10. **Self-Correct** — после каждой правки в скил **обязательно** перечитай принципы коуча (1-12) и проверь, не нарушает ли внесённая правка какой-либо из них. Не жди указания стейкхолдера — проверяй проактивно. **Процедура:** после каждого Edit/Write в файл скила — прежде чем отвечать пользователю — (1) перечитай `Read` записанный файл, (2) пройди по каждому принципу 1-12, (3) если нарушение найдено — исправь сразу, не дожидаясь фидбека. **(4) Проверка доставки:** если правка добавляет знание в shared или knowledge — открой SKILL.md целевого скила и убедись, что файл загружается по триггеру текущей задачи. Если триггер загрузки отсутствует или слишком слабый (последняя строка таблицы, без ⛔, без «обязательно») — **усиль триггер в том же CHG**, иначе правка не дойдёт до агента-исполнителя. Когда стейкхолдер указывает на ошибку — это сигнал, что проактивная проверка не сработала: исправь не только текущую работу и целевой скил, но и усиль собственные инструкции коуча, чтобы ошибка не повторялась.
|
|
142
|
-
11. **Context Budget** — при анализе и аудите скила обязательно оценивай его **суммарный размер** (SKILL.md + все файлы из knowledge/ + algorithms/ + workflows/). Агент загружает эти файлы в контекст перед работой. **Порог:** если суммарный размер > 800 строк — это finding уровня HIGH. Каждая правка, добавляющая текст, должна оцениваться: «Не приведёт ли это к context overflow у агента-исполнителя?» **При аудите:** измерь `wc -l` всех файлов скила, укажи суммарный размер и сравни с порогом. Если превышен — рекомендуй консолидацию: объединение дублирующих секций, вынос редко используемых блоков в отдельные файлы с ленивой загрузкой (загружать только по триггеру, а не всегда), сжатие примеров.
|
|
143
|
-
12. **Consistency** — скил не должен содержать взаимоисключающих или противоречащих друг другу инструкций. При каждой правке и аудите проверяй: не конфликтует ли новая инструкция с существующими. **Процедура:** после внесения правки grep'ни файл на ключевые термины правки и прочитай все совпадения — убедись, что нигде не сказано противоположное. **Типичные противоречия:** «всегда делай X» в одном месте и «никогда не делай X» в другом; разные значения по умолчанию для одного параметра; разные приоритеты действий в SKILL.md и в workflow. При обнаружении противоречия — устрани его сразу, выбрав одну версию и обновив все места.
|
|
144
|
-
|
|
145
|
-
## Формат вывода
|
|
146
|
-
|
|
147
|
-
- Русский язык
|
|
148
|
-
- Структурированный вывод с заголовками и таблицами
|
|
149
|
-
- Конкретные рекомендации с указанием файлов и строк
|
|
150
|
-
- Приоритизация: CRITICAL / HIGH / MEDIUM / LOW
|
|
151
|
-
- Ссылки на источники при использовании внешних знаний
|
|
152
|
-
|
|
153
|
-
## Границы компетенции
|
|
154
|
-
|
|
155
|
-
- **Бизнес-решения** → соответствующий скил проекта
|
|
156
|
-
- **Инфраструктура workflow-ai** → конфигурация системы
|
|
157
|
-
- **Код продукта** → соответствующий скил разработки
|
|
@@ -1,69 +0,0 @@
|
|
|
1
|
-
# Алгоритм: Gap-анализ скила
|
|
2
|
-
|
|
3
|
-
Поиск пробелов в покрытии скила — что должно быть, но отсутствует.
|
|
4
|
-
|
|
5
|
-
## Вход
|
|
6
|
-
|
|
7
|
-
- Путь к директории скила
|
|
8
|
-
- Завершённые тикеты скила (из `.workflow/tickets/done/`)
|
|
9
|
-
- Планы и отчёты (если есть)
|
|
10
|
-
|
|
11
|
-
## Алгоритм
|
|
12
|
-
|
|
13
|
-
### 1. Анализ маршрутизации vs реальных тикетов
|
|
14
|
-
|
|
15
|
-
Сравни типы из таблицы маршрутизации SKILL.md с типами реально пришедших тикетов.
|
|
16
|
-
|
|
17
|
-
| Ситуация | Тип пробела | Приоритет |
|
|
18
|
-
|----------|------------|-----------|
|
|
19
|
-
| Тикет пришёл, воркфлоу нет | **Workflow Gap** | HIGH |
|
|
20
|
-
| Воркфлоу есть, тикетов не было | Потенциально лишний | LOW |
|
|
21
|
-
| Тикет не подошёл ни под один тип | **Routing Gap** | HIGH |
|
|
22
|
-
|
|
23
|
-
### 2. Анализ знаний vs потребностей воркфлоу
|
|
24
|
-
|
|
25
|
-
Для каждого воркфлоу проверь: все ли данные, на которые он ссылается, есть в knowledge/?
|
|
26
|
-
|
|
27
|
-
| Ситуация | Тип пробела | Приоритет |
|
|
28
|
-
|----------|------------|-----------|
|
|
29
|
-
| Воркфлоу ссылается на несуществующий knowledge | **Knowledge Gap** | CRITICAL |
|
|
30
|
-
| Воркфлоу требует данных, но не ссылается на knowledge | **Reference Gap** | MEDIUM |
|
|
31
|
-
| Knowledge есть, но не используется ни в одном воркфлоу | Потенциально лишний | LOW |
|
|
32
|
-
|
|
33
|
-
### 3. Анализ решений vs алгоритмов
|
|
34
|
-
|
|
35
|
-
Найди в воркфлоу места, где агент принимает решения. Есть ли для них формализованный алгоритм?
|
|
36
|
-
|
|
37
|
-
| Ситуация | Тип пробела | Приоритет |
|
|
38
|
-
|----------|------------|-----------|
|
|
39
|
-
| Решение принимается без алгоритма | **Algorithm Gap** | MEDIUM |
|
|
40
|
-
| Алгоритм есть, но не используется | **Adoption Gap** | MEDIUM |
|
|
41
|
-
|
|
42
|
-
### 4. Анализ вывода vs шаблонов
|
|
43
|
-
|
|
44
|
-
Для каждого типа результата воркфлоу: есть ли шаблон в templates/?
|
|
45
|
-
|
|
46
|
-
| Ситуация | Тип пробела | Приоритет |
|
|
47
|
-
|----------|------------|-----------|
|
|
48
|
-
| Воркфлоу формирует результат без шаблона | **Template Gap** | MEDIUM |
|
|
49
|
-
| Шаблон есть, но не используется | Потенциально лишний | LOW |
|
|
50
|
-
|
|
51
|
-
### 5. Анализ результатов тикетов
|
|
52
|
-
|
|
53
|
-
Изучи завершённые тикеты. Где результат неполный или низкого качества?
|
|
54
|
-
|
|
55
|
-
| Признак | Тип пробела | Приоритет |
|
|
56
|
-
|---------|------------|-----------|
|
|
57
|
-
| Пустые секции в результате | Воркфлоу неполный | HIGH |
|
|
58
|
-
| Агент «придумал» данные | Нужен knowledge-модуль | HIGH |
|
|
59
|
-
| Результат не по шаблону | Шаблон неизвестен агенту | MEDIUM |
|
|
60
|
-
|
|
61
|
-
## Выход
|
|
62
|
-
|
|
63
|
-
Таблица пробелов:
|
|
64
|
-
|
|
65
|
-
| # | Тип пробела | Файл/секция | Описание | Приоритет | Рекомендация |
|
|
66
|
-
|---|------------|-------------|----------|-----------|-------------|
|
|
67
|
-
| 1 | ... | ... | ... | ... | ... |
|
|
68
|
-
|
|
69
|
-
Сортировка по приоритету: CRITICAL → HIGH → MEDIUM → LOW.
|
|
@@ -1,62 +0,0 @@
|
|
|
1
|
-
# Алгоритм: Приоритизация улучшений
|
|
2
|
-
|
|
3
|
-
Метод определения порядка внесения улучшений в скил.
|
|
4
|
-
|
|
5
|
-
## Вход
|
|
6
|
-
|
|
7
|
-
Список улучшений из аудита, анализа или gap-анализа — каждое с описанием проблемы.
|
|
8
|
-
|
|
9
|
-
## Алгоритм
|
|
10
|
-
|
|
11
|
-
### 1. Оцени каждое улучшение по 3 критериям (1–5)
|
|
12
|
-
|
|
13
|
-
| Критерий | 1 | 3 | 5 |
|
|
14
|
-
|----------|---|---|---|
|
|
15
|
-
| **Impact (I)** — влияние на качество работы скила | Косметическое | Заметное улучшение | Критично для работоспособности |
|
|
16
|
-
| **Confidence (C)** — уверенность что улучшение поможет | Гипотеза | Обоснованное предположение | Очевидно из данных |
|
|
17
|
-
| **Effort (E)** — трудозатраты на реализацию | Масштабное изменение | Средний объём | Быстрая правка |
|
|
18
|
-
|
|
19
|
-
### 2. Рассчитай score
|
|
20
|
-
|
|
21
|
-
```
|
|
22
|
-
Score = (I × C × E) / 25
|
|
23
|
-
```
|
|
24
|
-
|
|
25
|
-
Нормализованный диапазон: 0.004 – 5.0
|
|
26
|
-
|
|
27
|
-
### 3. Классифицируй по приоритету
|
|
28
|
-
|
|
29
|
-
| Score | Приоритет | Действие |
|
|
30
|
-
|-------|-----------|----------|
|
|
31
|
-
| > 3.0 | **CRITICAL** | Делать немедленно |
|
|
32
|
-
| 1.5 – 3.0 | **HIGH** | Делать в текущей итерации |
|
|
33
|
-
| 0.5 – 1.5 | **MEDIUM** | Запланировать |
|
|
34
|
-
| < 0.5 | **LOW** | Backlog |
|
|
35
|
-
|
|
36
|
-
### 4. Сгруппируй по типу изменения
|
|
37
|
-
|
|
38
|
-
Улучшения одного типа (например, все правки в knowledge/) удобнее делать вместе:
|
|
39
|
-
|
|
40
|
-
| Группа | Типичные улучшения |
|
|
41
|
-
|--------|-------------------|
|
|
42
|
-
| **Структура** | Создание директорий, файлов, README |
|
|
43
|
-
| **Контент** | Наполнение knowledge, algorithms |
|
|
44
|
-
| **Ссылки** | Добавление в таблицы загрузки, исправление ссылок |
|
|
45
|
-
| **Рефакторинг** | Переструктуризация воркфлоу, устранение дублирования |
|
|
46
|
-
|
|
47
|
-
## Выход
|
|
48
|
-
|
|
49
|
-
Приоритизированный план:
|
|
50
|
-
|
|
51
|
-
| # | Улучшение | I | C | E | Score | Приоритет | Группа |
|
|
52
|
-
|---|-----------|---|---|---|-------|-----------|--------|
|
|
53
|
-
| 1 | ... | 5 | 5 | 4 | 4.0 | CRITICAL | Контент |
|
|
54
|
-
| 2 | ... | 4 | 3 | 5 | 2.4 | HIGH | Ссылки |
|
|
55
|
-
|
|
56
|
-
## Пример
|
|
57
|
-
|
|
58
|
-
Улучшение: «Добавить knowledge/competitors.md в целевой скил»
|
|
59
|
-
- Impact: 4 (часто нужен при стратегических решениях)
|
|
60
|
-
- Confidence: 4 (видно из тикетов, где агент додумывал)
|
|
61
|
-
- Effort: 5 (создать один файл)
|
|
62
|
-
- Score: (4 × 4 × 5) / 25 = 3.2 → **CRITICAL**
|
|
@@ -1,80 +0,0 @@
|
|
|
1
|
-
# Алгоритм: Оценка качества скила
|
|
2
|
-
|
|
3
|
-
## Вход
|
|
4
|
-
|
|
5
|
-
Путь к директории скила (`.workflow/src/skills/<name>/`).
|
|
6
|
-
|
|
7
|
-
## Алгоритм
|
|
8
|
-
|
|
9
|
-
Оцени скил по 5 категориям. Каждая категория — от 0 до 20 баллов. Итого максимум — 100.
|
|
10
|
-
|
|
11
|
-
### 1. Структура (0–20)
|
|
12
|
-
|
|
13
|
-
| Критерий | Баллы |
|
|
14
|
-
|----------|-------|
|
|
15
|
-
| SKILL.md существует и содержит frontmatter | 4 |
|
|
16
|
-
| README.md существует и описывает структуру | 4 |
|
|
17
|
-
| workflows/ содержит файлы для каждого типа из маршрутизации | 4 |
|
|
18
|
-
| knowledge/ содержит минимум 2 модуля | 4 |
|
|
19
|
-
| algorithms/ содержит минимум 1 алгоритм | 2 |
|
|
20
|
-
| templates/ содержит минимум 1 шаблон | 2 |
|
|
21
|
-
|
|
22
|
-
### 2. Полнота SKILL.md (0–20)
|
|
23
|
-
|
|
24
|
-
| Критерий | Баллы |
|
|
25
|
-
|----------|-------|
|
|
26
|
-
| Роль описана конкретно (делает / не делает) | 4 |
|
|
27
|
-
| Маршрутизация полная (все типы → воркфлоу) | 4 |
|
|
28
|
-
| Таблица загрузки knowledge заполнена | 3 |
|
|
29
|
-
| Таблица загрузки algorithms заполнена | 3 |
|
|
30
|
-
| Принципы конкретны и actionable (3–7 штук) | 3 |
|
|
31
|
-
| Формат вывода специфицирован | 2 |
|
|
32
|
-
| Границы компетенции определены | 1 |
|
|
33
|
-
|
|
34
|
-
### 3. Качество воркфлоу (0–20)
|
|
35
|
-
|
|
36
|
-
| Критерий | Баллы |
|
|
37
|
-
|----------|-------|
|
|
38
|
-
| Шаги пронумерованы и конкретны (глаголы) | 5 |
|
|
39
|
-
| Ссылки на knowledge/algorithms где нужны данные | 5 |
|
|
40
|
-
| Чеклисты / критерии завершения | 5 |
|
|
41
|
-
| Нет дублирования между воркфлоу | 5 |
|
|
42
|
-
|
|
43
|
-
### 4. Качество знаний и алгоритмов (0–20)
|
|
44
|
-
|
|
45
|
-
| Критерий | Баллы |
|
|
46
|
-
|----------|-------|
|
|
47
|
-
| Knowledge структурирован (таблицы, категории) | 5 |
|
|
48
|
-
| Маркеры расширения присутствуют | 3 |
|
|
49
|
-
| Algorithms формализованы (формулы, пороги) | 5 |
|
|
50
|
-
| Есть примеры применения | 4 |
|
|
51
|
-
| Вход/выход алгоритмов определён | 3 |
|
|
52
|
-
|
|
53
|
-
### 5. Связность, консистентность и изоляция (0–20)
|
|
54
|
-
|
|
55
|
-
| Критерий | Баллы |
|
|
56
|
-
|----------|-------|
|
|
57
|
-
| Все ссылки из SKILL.md ведут на существующие файлы | 4 |
|
|
58
|
-
| Все файлы knowledge/ упомянуты в таблице загрузки | 4 |
|
|
59
|
-
| Все файлы algorithms/ упомянуты в таблице загрузки | 4 |
|
|
60
|
-
| Терминология единообразна | 4 |
|
|
61
|
-
| **Изоляция:** нет хардкода имён других скилов/ролей (grep на имена ролей = 0) | 4 |
|
|
62
|
-
|
|
63
|
-
## Выход
|
|
64
|
-
|
|
65
|
-
| Балл | Оценка | Рекомендация |
|
|
66
|
-
|------|--------|-------------|
|
|
67
|
-
| 80–100 | **EXCELLENT** | Скил готов к работе, мелкие улучшения |
|
|
68
|
-
| 60–79 | **GOOD** | Работоспособен, но есть существенные пробелы |
|
|
69
|
-
| 40–59 | **NEEDS_WORK** | Требуется серьёзная доработка |
|
|
70
|
-
| 0–39 | **POOR** | Фундаментальные проблемы, рассмотреть пересоздание |
|
|
71
|
-
|
|
72
|
-
## Пример
|
|
73
|
-
|
|
74
|
-
Скил `example-skill`:
|
|
75
|
-
- Структура: 20/20 (все компоненты на месте)
|
|
76
|
-
- Полнота SKILL.md: 20/20 (все секции)
|
|
77
|
-
- Качество воркфлоу: 18/20 (минус 2 за неполные чеклисты)
|
|
78
|
-
- Качество знаний: 17/20 (минус 3 за отсутствие примеров в algorithms)
|
|
79
|
-
- Связность: 20/20 (всё связано)
|
|
80
|
-
- **Итого: 95/100 — EXCELLENT**
|
|
@@ -1,11 +0,0 @@
|
|
|
1
|
-
Аудит 2026-04-16: остаточных упоминаний applied_changes[] не найдено.
|
|
2
|
-
|
|
3
|
-
Проверены файлы (исключая backlog-management.md):
|
|
4
|
-
- common-antipatterns.md — чисто
|
|
5
|
-
- prompt-engineering.md — чисто
|
|
6
|
-
- shared-knowledge-guide.md — чисто
|
|
7
|
-
- skill-anatomy.md — чисто
|
|
8
|
-
- test-authorship.md — чисто
|
|
9
|
-
|
|
10
|
-
Паттерны поиска: applied_changes, change_id, CHG-, «бэклог изменений», «ledger правок».
|
|
11
|
-
Тикет: COACH-31.
|