workflow-ai 1.1.0 → 1.3.0
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/CHANGELOG.md +61 -0
- package/README.md +37 -377
- package/configs/pipeline.yaml +113 -4
- package/package.json +54 -44
- package/src/lib/operations/tickets.mjs +305 -207
- package/src/lib/utils.mjs +286 -286
- package/src/runner.mjs +316 -35
- package/src/scripts/check-conditions.js +2 -2
- package/src/scripts/check-relevance.js +3 -1
- package/src/scripts/get-next-id.js +144 -41
- package/src/scripts/mark-blocked.js +160 -0
- package/src/scripts/move-ticket.js +305 -83
- package/src/scripts/pick-next-task.js +782 -93
- package/src/skills/__test-cal-001-1777553217513/SKILL.md +2 -0
- package/src/skills/__test-runner-1777553217483/SKILL.md +5 -0
- package/src/skills/coach/SKILL.md +2 -2
- package/src/skills/execute-task/SKILL.md +1 -1
- package/src/skills/manual-testing/SKILL.md +2 -0
- package/src/skills/review-result/SKILL.md +23 -1
- package/src/scripts/tests/timeout-cascade.test.js +0 -28
- package/src/skills/analyze-report/README.md +0 -44
- package/src/skills/analyze-report/algorithms/progress-assessment.md +0 -108
- package/src/skills/analyze-report/knowledge/analysis-frameworks.md +0 -66
- package/src/skills/analyze-report/knowledge/report-structure.md +0 -61
- package/src/skills/analyze-report/scripts/calc-plan-metrics.js +0 -234
- package/src/skills/analyze-report/templates/analysis-report.md +0 -80
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/claude-sonnet/trial-1.md +0 -5
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/claude-sonnet/trial-2.md +0 -98
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/claude-sonnet/trial-3.md +0 -99
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/judge.json +0 -163
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/kilo-deepseek/trial-1.md +0 -89
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/kilo-deepseek/trial-2.md +0 -88
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/kilo-deepseek/trial-3.md +0 -100
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/kilo-glm/trial-1.md +0 -77
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/kilo-glm/trial-2.md +0 -64
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/kilo-glm/trial-3.md +0 -110
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/kilo-minimax/trial-1.md +0 -74
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/kilo-minimax/trial-2.md +0 -38
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/kilo-minimax/trial-3.md +0 -61
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001/current/meta.json +0 -115
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-001-evidence-from-log.yaml +0 -60
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/claude-sonnet/trial-1.md +0 -90
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/claude-sonnet/trial-2.md +0 -89
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/claude-sonnet/trial-3.md +0 -5
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/judge.json +0 -163
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/kilo-deepseek/trial-1.md +0 -84
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/kilo-deepseek/trial-2.md +0 -77
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/kilo-deepseek/trial-3.md +0 -89
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/kilo-glm/trial-1.md +0 -103
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/kilo-glm/trial-2.md +0 -103
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/kilo-glm/trial-3.md +0 -103
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/kilo-minimax/trial-1.md +0 -93
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/kilo-minimax/trial-2.md +0 -93
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/kilo-minimax/trial-3.md +0 -86
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002/current/meta.json +0 -115
- package/src/skills/analyze-report/tests/cases/TC-ANALYZE-REPORT-002-result-block-format.yaml +0 -44
- package/src/skills/analyze-report/tests/fixtures/REPORT-002-incorrect-attribution.md +0 -27
- package/src/skills/analyze-report/tests/fixtures/pipeline-2026-04-06_qa-001-skip.log +0 -32
- package/src/skills/analyze-report/tests/index.yaml +0 -25
- package/src/skills/analyze-report/tests/rubrics/evidence-from-log.md +0 -22
- package/src/skills/analyze-report/tests/rubrics/result-block-format.md +0 -22
- package/src/skills/analyze-report/workflows/progress.md +0 -158
- package/src/skills/analyze-report/workflows/retrospective.md +0 -143
- package/src/skills/coach/README.md +0 -43
- package/src/skills/coach/SKILL.md.legacy +0 -157
- package/src/skills/coach/algorithms/gap-analysis.md +0 -69
- package/src/skills/coach/algorithms/improvement-prioritization.md +0 -62
- package/src/skills/coach/algorithms/skill-scoring.md +0 -80
- package/src/skills/coach/knowledge/audit-applied-changes-clean.txt +0 -11
- package/src/skills/coach/knowledge/backlog-management.md +0 -67
- package/src/skills/coach/knowledge/backlog-management.md.legacy +0 -90
- package/src/skills/coach/knowledge/common-antipatterns.md +0 -76
- package/src/skills/coach/knowledge/prompt-engineering.md +0 -45
- package/src/skills/coach/knowledge/shared-knowledge-guide.md +0 -44
- package/src/skills/coach/knowledge/skill-anatomy.md +0 -49
- package/src/skills/coach/knowledge/test-authorship.md +0 -141
- package/src/skills/coach/templates/audit-report.md +0 -39
- package/src/skills/coach/templates/coach-backlog-init.yaml +0 -14
- package/src/skills/coach/templates/coach-backlog-init.yaml.legacy +0 -10
- package/src/skills/coach/templates/improvement-plan.md +0 -42
- package/src/skills/coach/templates/new-skill.md +0 -95
- package/src/skills/coach/tests/cases/TC-COACH-001/current/claude-sonnet/trial-1.md +0 -58
- package/src/skills/coach/tests/cases/TC-COACH-001/current/claude-sonnet/trial-2.md +0 -65
- package/src/skills/coach/tests/cases/TC-COACH-001/current/claude-sonnet/trial-3.md +0 -58
- package/src/skills/coach/tests/cases/TC-COACH-001/current/judge.json +0 -151
- package/src/skills/coach/tests/cases/TC-COACH-001/current/kilo-deepseek/trial-1.md +0 -46
- package/src/skills/coach/tests/cases/TC-COACH-001/current/kilo-deepseek/trial-2.md +0 -0
- package/src/skills/coach/tests/cases/TC-COACH-001/current/kilo-deepseek/trial-3.md +0 -75
- package/src/skills/coach/tests/cases/TC-COACH-001/current/kilo-glm/trial-1.md +0 -81
- package/src/skills/coach/tests/cases/TC-COACH-001/current/kilo-glm/trial-2.md +0 -101
- package/src/skills/coach/tests/cases/TC-COACH-001/current/kilo-glm/trial-3.md +0 -91
- package/src/skills/coach/tests/cases/TC-COACH-001/current/kilo-minimax/trial-1.md +0 -48
- package/src/skills/coach/tests/cases/TC-COACH-001/current/kilo-minimax/trial-2.md +0 -30
- package/src/skills/coach/tests/cases/TC-COACH-001/current/kilo-minimax/trial-3.md +0 -55
- package/src/skills/coach/tests/cases/TC-COACH-001/current/meta.json +0 -94
- package/src/skills/coach/tests/cases/TC-COACH-001-evidence-based-temporal-diagram.yaml +0 -53
- package/src/skills/coach/tests/cases/TC-COACH-002/current/claude-sonnet/trial-1.md +0 -46
- package/src/skills/coach/tests/cases/TC-COACH-002/current/claude-sonnet/trial-2.md +0 -50
- package/src/skills/coach/tests/cases/TC-COACH-002/current/claude-sonnet/trial-3.md +0 -48
- package/src/skills/coach/tests/cases/TC-COACH-002/current/judge.json +0 -151
- package/src/skills/coach/tests/cases/TC-COACH-002/current/kilo-deepseek/trial-1.md +0 -0
- package/src/skills/coach/tests/cases/TC-COACH-002/current/kilo-deepseek/trial-2.md +0 -37
- package/src/skills/coach/tests/cases/TC-COACH-002/current/kilo-deepseek/trial-3.md +0 -30
- package/src/skills/coach/tests/cases/TC-COACH-002/current/kilo-glm/trial-1.md +0 -23
- package/src/skills/coach/tests/cases/TC-COACH-002/current/kilo-glm/trial-2.md +0 -29
- package/src/skills/coach/tests/cases/TC-COACH-002/current/kilo-glm/trial-3.md +0 -35
- package/src/skills/coach/tests/cases/TC-COACH-002/current/kilo-minimax/trial-1.md +0 -13
- package/src/skills/coach/tests/cases/TC-COACH-002/current/kilo-minimax/trial-2.md +0 -19
- package/src/skills/coach/tests/cases/TC-COACH-002/current/kilo-minimax/trial-3.md +0 -33
- package/src/skills/coach/tests/cases/TC-COACH-002/current/meta.json +0 -94
- package/src/skills/coach/tests/cases/TC-COACH-002-root-cause-first.yaml +0 -57
- package/src/skills/coach/tests/fixtures/pipeline-2026-04-06_id-collision.log +0 -77
- package/src/skills/coach/tests/index.yaml +0 -29
- package/src/skills/coach/tests/rubrics/calibration/evidence-based-bad.md +0 -13
- package/src/skills/coach/tests/rubrics/calibration/evidence-based-good.md +0 -29
- package/src/skills/coach/tests/rubrics/evidence-based.md +0 -26
- package/src/skills/coach/tests/rubrics/root-cause-first.md +0 -21
- package/src/skills/coach/workflows/analyze.md +0 -79
- package/src/skills/coach/workflows/analyze.md.legacy +0 -64
- package/src/skills/coach/workflows/audit.md +0 -74
- package/src/skills/coach/workflows/audit.md.legacy +0 -59
- package/src/skills/coach/workflows/create.md +0 -80
- package/src/skills/coach/workflows/create.md.legacy +0 -67
- package/src/skills/coach/workflows/improve.md +0 -71
- package/src/skills/coach/workflows/improve.md.legacy +0 -60
- package/src/skills/coach/workflows/research.md +0 -55
- package/src/skills/coach/workflows/review.md +0 -52
- package/src/skills/coach/workflows/review.md.legacy +0 -48
- package/src/skills/coach/workflows/test.md +0 -97
- package/src/skills/create-plan/README.md +0 -39
- package/src/skills/create-plan/algorithms/risk-assessment.md +0 -73
- package/src/skills/create-plan/knowledge/plan-completeness.md +0 -67
- package/src/skills/create-plan/knowledge/plan-lifecycle.md +0 -33
- package/src/skills/create-plan/knowledge/task-verification-pairs.md +0 -151
- package/src/skills/create-plan/knowledge/test-hygiene.md +0 -47
- package/src/skills/create-plan/scripts/validate-completeness.js +0 -182
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/claude-sonnet/trial-1.md +0 -5
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/claude-sonnet/trial-2.md +0 -39
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/claude-sonnet/trial-3.md +0 -35
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/judge.json +0 -167
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/kilo-deepseek/trial-1.md +0 -5
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/kilo-deepseek/trial-2.md +0 -10
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/kilo-deepseek/trial-3.md +0 -5
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/kilo-glm/trial-1.md +0 -26
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/kilo-glm/trial-2.md +0 -86
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/kilo-glm/trial-3.md +0 -5
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/kilo-minimax/trial-1.md +0 -11
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/kilo-minimax/trial-2.md +0 -15
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/kilo-minimax/trial-3.md +0 -14
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001/current/meta.json +0 -119
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-001-validate-completeness.yaml +0 -41
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/claude-sonnet/trial-1.md +0 -25
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/claude-sonnet/trial-2.md +0 -30
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/claude-sonnet/trial-3.md +0 -37
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/judge.json +0 -164
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/kilo-deepseek/trial-1.md +0 -3
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/kilo-deepseek/trial-2.md +0 -11
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/kilo-deepseek/trial-3.md +0 -13
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/kilo-glm/trial-1.md +0 -44
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/kilo-glm/trial-2.md +0 -5
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/kilo-glm/trial-3.md +0 -49
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/kilo-minimax/trial-1.md +0 -6
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/kilo-minimax/trial-2.md +0 -11
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/kilo-minimax/trial-3.md +0 -16
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002/current/meta.json +0 -116
- package/src/skills/create-plan/tests/cases/TC-CREATE-PLAN-002-task-granularity.yaml +0 -39
- package/src/skills/create-plan/tests/index.yaml +0 -25
- package/src/skills/create-plan/tests/rubrics/task-granularity.md +0 -21
- package/src/skills/create-plan/tests/rubrics/validate-completeness.md +0 -21
- package/src/skills/create-plan/workflows/create.md +0 -136
- package/src/skills/create-report/README.md +0 -40
- package/src/skills/create-report/algorithms/metric-calculation.md +0 -93
- package/src/skills/create-report/knowledge/report-metrics.md +0 -82
- package/src/skills/create-report/scripts/calc-metrics.js +0 -383
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/claude-sonnet/trial-1.md +0 -25
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/claude-sonnet/trial-2.md +0 -26
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/claude-sonnet/trial-3.md +0 -28
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/judge.json +0 -163
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/kilo-deepseek/trial-1.md +0 -4
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/kilo-deepseek/trial-2.md +0 -3
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/kilo-deepseek/trial-3.md +0 -6
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/kilo-glm/trial-1.md +0 -8
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/kilo-glm/trial-2.md +0 -12
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/kilo-glm/trial-3.md +0 -7
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/kilo-minimax/trial-1.md +0 -12
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/kilo-minimax/trial-2.md +0 -22
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/kilo-minimax/trial-3.md +0 -13
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001/current/meta.json +0 -115
- package/src/skills/create-report/tests/cases/TC-CREATE-REPORT-001-root-cause-attribution.yaml +0 -57
- package/src/skills/create-report/tests/index.yaml +0 -20
- package/src/skills/create-report/tests/rubrics/root-cause-attribution.md +0 -21
- package/src/skills/create-report/workflows/standard.md +0 -175
- package/src/skills/decompose-gaps/README.md +0 -39
- package/src/skills/decompose-gaps/algorithms/scope-check.md +0 -110
- package/src/skills/decompose-gaps/knowledge/scope-validation.md +0 -65
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/claude-sonnet/trial-1.md +0 -41
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/claude-sonnet/trial-2.md +0 -41
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/claude-sonnet/trial-3.md +0 -56
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/judge.json +0 -164
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/kilo-deepseek/trial-1.md +0 -25
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/kilo-deepseek/trial-2.md +0 -17
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/kilo-deepseek/trial-3.md +0 -22
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/kilo-glm/trial-1.md +0 -25
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/kilo-glm/trial-2.md +0 -5
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/kilo-glm/trial-3.md +0 -29
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/kilo-minimax/trial-1.md +0 -27
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/kilo-minimax/trial-2.md +0 -35
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/kilo-minimax/trial-3.md +0 -18
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001/current/meta.json +0 -116
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-001-scope-exclusion.yaml +0 -46
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/claude-sonnet/trial-1.md +0 -27
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/claude-sonnet/trial-2.md +0 -30
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/claude-sonnet/trial-3.md +0 -27
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/judge.json +0 -163
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/kilo-deepseek/trial-1.md +0 -0
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/kilo-deepseek/trial-2.md +0 -15
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/kilo-deepseek/trial-3.md +0 -7
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/kilo-glm/trial-1.md +0 -21
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/kilo-glm/trial-2.md +0 -38
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/kilo-glm/trial-3.md +0 -16
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/kilo-minimax/trial-1.md +0 -5
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/kilo-minimax/trial-2.md +0 -10
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/kilo-minimax/trial-3.md +0 -9
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002/current/meta.json +0 -115
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-002-glob-before-write.yaml +0 -36
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/claude-sonnet/trial-1.md +0 -30
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/claude-sonnet/trial-2.md +0 -30
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/claude-sonnet/trial-3.md +0 -30
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/judge.json +0 -165
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/kilo-deepseek/trial-1.md +0 -5
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/kilo-deepseek/trial-2.md +0 -26
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/kilo-deepseek/trial-3.md +0 -5
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/kilo-glm/trial-1.md +0 -39
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/kilo-glm/trial-2.md +0 -37
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/kilo-glm/trial-3.md +0 -45
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/kilo-minimax/trial-1.md +0 -26
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/kilo-minimax/trial-2.md +0 -27
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/kilo-minimax/trial-3.md +0 -7
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003/current/meta.json +0 -117
- package/src/skills/decompose-gaps/tests/cases/TC-DECOMPOSE-GAPS-003-parent-plan-mandatory.yaml +0 -41
- package/src/skills/decompose-gaps/tests/index.yaml +0 -30
- package/src/skills/decompose-gaps/tests/rubrics/glob-before-write.md +0 -21
- package/src/skills/decompose-gaps/tests/rubrics/parent-plan-mandatory.md +0 -22
- package/src/skills/decompose-gaps/tests/rubrics/scope-exclusion.md +0 -21
- package/src/skills/decompose-gaps/workflows/decompose.md +0 -123
- package/src/skills/decompose-plan/README.md +0 -43
- package/src/skills/decompose-plan/algorithms/deduplication.md +0 -101
- package/src/skills/decompose-plan/knowledge/atomicity-checklist.md +0 -139
- package/src/skills/decompose-plan/knowledge/capabilities.md +0 -68
- package/src/skills/decompose-plan/knowledge/human-task-rules.md +0 -82
- package/src/skills/decompose-plan/knowledge/scope-guard-checklist.md +0 -73
- package/src/skills/decompose-plan/scripts/check-atomicity-limit.js +0 -47
- package/src/skills/decompose-plan/scripts/check-duplicates.js +0 -323
- package/src/skills/decompose-plan/scripts/verify-atomicity.js +0 -408
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/claude-sonnet/trial-1.md +0 -30
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/claude-sonnet/trial-2.md +0 -36
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/claude-sonnet/trial-3.md +0 -37
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/judge.json +0 -163
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/kilo-deepseek/trial-1.md +0 -20
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/kilo-deepseek/trial-2.md +0 -17
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/kilo-deepseek/trial-3.md +0 -28
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/kilo-glm/trial-1.md +0 -114
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/kilo-glm/trial-2.md +0 -137
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/kilo-glm/trial-3.md +0 -188
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/kilo-minimax/trial-1.md +0 -0
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/kilo-minimax/trial-2.md +0 -32
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/kilo-minimax/trial-3.md +0 -110
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001/current/meta.json +0 -115
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-001-atomicity-no-1to1.yaml +0 -56
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/claude-sonnet/trial-1.md +0 -47
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/claude-sonnet/trial-2.md +0 -54
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/claude-sonnet/trial-3.md +0 -43
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/judge.json +0 -163
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/kilo-deepseek/trial-1.md +0 -15
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/kilo-deepseek/trial-2.md +0 -5
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/kilo-deepseek/trial-3.md +0 -12
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/kilo-glm/trial-1.md +0 -34
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/kilo-glm/trial-2.md +0 -30
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/kilo-glm/trial-3.md +0 -35
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/kilo-minimax/trial-1.md +0 -0
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/kilo-minimax/trial-2.md +0 -31
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/kilo-minimax/trial-3.md +0 -0
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002/current/meta.json +0 -115
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-002-get-next-id-mandatory.yaml +0 -44
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/claude-sonnet/trial-1.md +0 -21
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/claude-sonnet/trial-2.md +0 -38
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/claude-sonnet/trial-3.md +0 -30
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/judge.json +0 -163
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/kilo-deepseek/trial-1.md +0 -31
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/kilo-deepseek/trial-2.md +0 -35
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/kilo-deepseek/trial-3.md +0 -48
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/kilo-glm/trial-1.md +0 -167
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/kilo-glm/trial-2.md +0 -62
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/kilo-glm/trial-3.md +0 -174
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/kilo-minimax/trial-1.md +0 -0
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/kilo-minimax/trial-2.md +0 -0
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/kilo-minimax/trial-3.md +0 -0
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003/current/meta.json +0 -115
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-003-verbatim-dod-transfer.yaml +0 -42
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/claude-sonnet/trial-1.md +0 -55
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/claude-sonnet/trial-2.md +0 -49
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/claude-sonnet/trial-3.md +0 -49
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/judge.json +0 -163
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/kilo-deepseek/trial-1.md +0 -104
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/kilo-deepseek/trial-2.md +0 -45
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/kilo-deepseek/trial-3.md +0 -58
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/kilo-glm/trial-1.md +0 -193
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/kilo-glm/trial-2.md +0 -202
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/kilo-glm/trial-3.md +0 -155
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/kilo-minimax/trial-1.md +0 -52
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/kilo-minimax/trial-2.md +0 -17
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/kilo-minimax/trial-3.md +0 -0
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004/current/meta.json +0 -115
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-004-executor-atomicity.yaml +0 -64
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/claude-sonnet/trial-1.md +0 -59
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/claude-sonnet/trial-2.md +0 -204
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/claude-sonnet/trial-3.md +0 -213
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/judge.json +0 -163
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/kilo-deepseek/trial-1.md +0 -0
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/kilo-deepseek/trial-2.md +0 -57
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/kilo-deepseek/trial-3.md +0 -54
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/kilo-glm/trial-1.md +0 -147
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/kilo-glm/trial-2.md +0 -165
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/kilo-glm/trial-3.md +0 -133
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/kilo-minimax/trial-1.md +0 -81
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/kilo-minimax/trial-2.md +0 -108
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/kilo-minimax/trial-3.md +0 -3
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005/current/meta.json +0 -114
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-005-capabilities-registry.yaml +0 -78
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/claude-sonnet/trial-1.md +0 -225
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/claude-sonnet/trial-2.md +0 -66
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/claude-sonnet/trial-3.md +0 -36
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/judge.json +0 -163
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/kilo-deepseek/trial-1.md +0 -42
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/kilo-deepseek/trial-2.md +0 -67
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/kilo-deepseek/trial-3.md +0 -40
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/kilo-glm/trial-1.md +0 -122
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/kilo-glm/trial-2.md +0 -131
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/kilo-glm/trial-3.md +0 -138
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/kilo-minimax/trial-1.md +0 -41
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/kilo-minimax/trial-2.md +0 -88
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/kilo-minimax/trial-3.md +0 -0
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006/current/meta.json +0 -115
- package/src/skills/decompose-plan/tests/cases/TC-DECOMPOSE-PLAN-006-dod-threshold.yaml +0 -72
- package/src/skills/decompose-plan/tests/index.yaml +0 -45
- package/src/skills/decompose-plan/tests/rubrics/atomicity-no-1to1.md +0 -21
- package/src/skills/decompose-plan/tests/rubrics/capabilities-registry.md +0 -21
- package/src/skills/decompose-plan/tests/rubrics/dod-threshold.md +0 -21
- package/src/skills/decompose-plan/tests/rubrics/executor-atomicity.md +0 -21
- package/src/skills/decompose-plan/tests/rubrics/get-next-id-mandatory.md +0 -21
- package/src/skills/decompose-plan/tests/rubrics/verbatim-dod-transfer.md +0 -21
- package/src/skills/decompose-plan/workflows/decompose.md +0 -305
- package/src/skills/deep-research/README.md +0 -36
- package/src/skills/deep-research/algorithms/source-scoring.md +0 -63
- package/src/skills/deep-research/algorithms/synthesis.md +0 -67
- package/src/skills/deep-research/knowledge/data-validation.md +0 -44
- package/src/skills/deep-research/knowledge/perplexity-config.md +0 -30
- package/src/skills/deep-research/knowledge/research-methodology.md +0 -54
- package/src/skills/deep-research/knowledge/source-evaluation.md +0 -33
- package/src/skills/deep-research/scripts/perplexity-research.js +0 -315
- package/src/skills/deep-research/templates/brief-summary.md +0 -25
- package/src/skills/deep-research/templates/research-report.md +0 -76
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/claude-haiku/trial-1.md +0 -48
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/claude-haiku/trial-2.md +0 -88
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/claude-haiku/trial-3.md +0 -56
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/judge.json +0 -163
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/kilo-free/trial-1.md +0 -58
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/kilo-free/trial-2.md +0 -249
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/kilo-free/trial-3.md +0 -44
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/kilo-glm/trial-1.md +0 -96
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/kilo-glm/trial-2.md +0 -56
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/kilo-glm/trial-3.md +0 -94
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/kilo-glm-air/trial-1.md +0 -11
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/kilo-glm-air/trial-2.md +0 -1
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/kilo-glm-air/trial-3.md +0 -1
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001/current/meta.json +0 -115
- package/src/skills/deep-research/tests/cases/TC-DEEP-RESEARCH-001-self-check-url.yaml +0 -58
- package/src/skills/deep-research/tests/index.yaml +0 -20
- package/src/skills/deep-research/tests/rubrics/self-check-url.md +0 -34
- package/src/skills/deep-research/workflows/base-checklist.md +0 -19
- package/src/skills/deep-research/workflows/benchmark.md +0 -38
- package/src/skills/deep-research/workflows/competitor.md +0 -44
- package/src/skills/deep-research/workflows/custom.md +0 -32
- package/src/skills/deep-research/workflows/market.md +0 -44
- package/src/skills/deep-research/workflows/technology.md +0 -40
- package/src/skills/deep-research/workflows/trend.md +0 -40
- package/src/skills/execute-task/README.md +0 -44
- package/src/skills/execute-task/algorithms/execution-strategy.md +0 -136
- package/src/skills/execute-task/knowledge/context-checkpoints.md +0 -75
- package/src/skills/execute-task/knowledge/ticket-structure.md +0 -70
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/claude-haiku/trial-1.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/claude-haiku/trial-2.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/claude-haiku/trial-3.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/judge.json +0 -124
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/kilo-free/trial-1.md +0 -4
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/kilo-free/trial-2.md +0 -4
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/kilo-free/trial-3.md +0 -4
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/kilo-glm-air/trial-1.md +0 -4
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/kilo-glm-air/trial-2.md +0 -4
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/kilo-glm-air/trial-3.md +0 -11
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001/current/meta.json +0 -88
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-001-no-ticket-creation.yaml +0 -48
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/claude-haiku/trial-1.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/claude-haiku/trial-2.md +0 -6
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/claude-haiku/trial-3.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/judge.json +0 -124
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/kilo-free/trial-1.md +0 -4
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/kilo-free/trial-2.md +0 -4
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/kilo-free/trial-3.md +0 -8
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/kilo-glm-air/trial-1.md +0 -9
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/kilo-glm-air/trial-2.md +0 -26
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/kilo-glm-air/trial-3.md +0 -4
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002/current/meta.json +0 -89
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-002-no-duplicate-dod.yaml +0 -44
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-003/current/claude-haiku/trial-1.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-003/current/claude-haiku/trial-2.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-003/current/claude-haiku/trial-3.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-003/current/judge.json +0 -46
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-003/current/meta.json +0 -37
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-003-verification-proportionality.yaml +0 -46
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-004/current/claude-haiku/trial-1.md +0 -18
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-004/current/claude-haiku/trial-2.md +0 -16
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-004/current/claude-haiku/trial-3.md +0 -14
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-004/current/judge.json +0 -124
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-004/current/kilo-free/trial-1.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-004/current/kilo-free/trial-2.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-004/current/kilo-free/trial-3.md +0 -1
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-004/current/kilo-glm-air/trial-1.md +0 -8
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-004/current/kilo-glm-air/trial-2.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-004/current/kilo-glm-air/trial-3.md +0 -4
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-004/current/meta.json +0 -89
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-004-no-foreign-ticket-edit.yaml +0 -50
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005/current/claude-haiku/trial-1.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005/current/claude-haiku/trial-2.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005/current/claude-haiku/trial-3.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005/current/judge.json +0 -124
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005/current/kilo-free/trial-1.md +0 -15
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005/current/kilo-free/trial-2.md +0 -4
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005/current/kilo-free/trial-3.md +0 -5
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005/current/kilo-glm-air/trial-1.md +0 -11
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005/current/kilo-glm-air/trial-2.md +0 -11
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005/current/kilo-glm-air/trial-3.md +0 -4
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005/current/meta.json +0 -88
- package/src/skills/execute-task/tests/cases/TC-EXECUTE-TASK-005-ticket-fields-updated.yaml +0 -39
- package/src/skills/execute-task/tests/fixtures/IMPL-902-create-file.md +0 -41
- package/src/skills/execute-task/tests/fixtures/IMPL-904-current-task.md +0 -40
- package/src/skills/execute-task/tests/fixtures/IMPL-906-fill-ticket.md +0 -42
- package/src/skills/execute-task/tests/fixtures/QA-901-button-click.md +0 -41
- package/src/skills/execute-task/tests/fixtures/QA-903-visual-figma.md +0 -40
- package/src/skills/execute-task/tests/fixtures/TASK-905-done-with-typo.md +0 -36
- package/src/skills/execute-task/tests/index.yaml +0 -39
- package/src/skills/execute-task/tests/rubrics/no-duplicate-dod.md +0 -22
- package/src/skills/execute-task/tests/rubrics/no-foreign-ticket-edit.md +0 -20
- package/src/skills/execute-task/tests/rubrics/no-ticket-creation.md +0 -21
- package/src/skills/execute-task/tests/rubrics/ticket-fields-updated.md +0 -23
- package/src/skills/execute-task/tests/rubrics/verification-proportionality.md +0 -22
- package/src/skills/execute-task/workflows/execute.md +0 -104
- package/src/skills/manual-testing/README.md +0 -63
- package/src/skills/manual-testing/algorithms/blocked-tool-strategy.md +0 -74
- package/src/skills/manual-testing/algorithms/bug-severity.md +0 -73
- package/src/skills/manual-testing/algorithms/mcp-budget.md +0 -97
- package/src/skills/manual-testing/algorithms/test-prioritization.md +0 -69
- package/src/skills/manual-testing/knowledge/browser-extension-testing.md +0 -102
- package/src/skills/manual-testing/knowledge/browser-tools.md +0 -114
- package/src/skills/manual-testing/knowledge/desktop-tools-advanced.md +0 -92
- package/src/skills/manual-testing/knowledge/desktop-tools-core.md +0 -76
- package/src/skills/manual-testing/knowledge/sandbox-advanced.md +0 -83
- package/src/skills/manual-testing/knowledge/sandbox-core.md +0 -67
- package/src/skills/manual-testing/knowledge/stateful-edge-cases.md +0 -69
- package/src/skills/manual-testing/knowledge/test-case-design.md +0 -107
- package/src/skills/manual-testing/knowledge/testing-types.md +0 -45
- package/src/skills/manual-testing/templates/bug-report.md +0 -52
- package/src/skills/manual-testing/templates/test-case.md +0 -34
- package/src/skills/manual-testing/templates/test-plan.md +0 -97
- package/src/skills/manual-testing/templates/test-session-report.md +0 -56
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/claude-sonnet/trial-1.md +0 -34
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/claude-sonnet/trial-2.md +0 -32
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/claude-sonnet/trial-3.md +0 -30
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/judge.json +0 -163
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/kilo-deepseek/trial-1.md +0 -0
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/kilo-deepseek/trial-2.md +0 -7
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/kilo-deepseek/trial-3.md +0 -0
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/kilo-glm/trial-1.md +0 -4
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/kilo-glm/trial-2.md +0 -15
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/kilo-glm/trial-3.md +0 -8
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/kilo-minimax/trial-1.md +0 -5
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/kilo-minimax/trial-2.md +0 -7
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/kilo-minimax/trial-3.md +0 -7
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001/current/meta.json +0 -114
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-001-sandbox-mandatory.yaml +0 -38
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/claude-sonnet/trial-1.md +0 -44
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/claude-sonnet/trial-2.md +0 -32
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/claude-sonnet/trial-3.md +0 -47
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/judge.json +0 -163
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/kilo-deepseek/trial-1.md +0 -19
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/kilo-deepseek/trial-2.md +0 -15
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/kilo-deepseek/trial-3.md +0 -24
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/kilo-glm/trial-1.md +0 -19
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/kilo-glm/trial-2.md +0 -13
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/kilo-glm/trial-3.md +0 -18
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/kilo-minimax/trial-1.md +0 -21
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/kilo-minimax/trial-2.md +0 -15
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/kilo-minimax/trial-3.md +0 -14
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002/current/meta.json +0 -114
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-002-visual-tc-screenshot.yaml +0 -37
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-003/current/claude-sonnet/trial-1.md +0 -76
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-003/current/claude-sonnet/trial-2.md +0 -71
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-003/current/claude-sonnet/trial-3.md +0 -85
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-003/current/judge.json +0 -46
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-003/current/meta.json +0 -36
- package/src/skills/manual-testing/tests/cases/TC-MANUAL-TESTING-003-qa-non-ui-assertion.yaml +0 -65
- package/src/skills/manual-testing/tests/index.yaml +0 -30
- package/src/skills/manual-testing/tests/last-run-tc001-sonnet.log +0 -140
- package/src/skills/manual-testing/tests/last-run-tc002.log +0 -1
- package/src/skills/manual-testing/tests/last-run.log +0 -1469
- package/src/skills/manual-testing/tests/rubrics/qa-non-ui-assertion.md +0 -31
- package/src/skills/manual-testing/tests/rubrics/sandbox-mandatory.md +0 -20
- package/src/skills/manual-testing/tests/rubrics/visual-tc-screenshot.md +0 -21
- package/src/skills/manual-testing/workflows/acceptance.md +0 -80
- package/src/skills/manual-testing/workflows/exploratory.md +0 -84
- package/src/skills/manual-testing/workflows/regression.md +0 -76
- package/src/skills/manual-testing/workflows/smoke.md +0 -109
- package/src/skills/manual-testing/workflows/test-plan.md +0 -75
- package/src/skills/review-result/README.md +0 -59
- package/src/skills/review-result/algorithms/verification.md +0 -112
- package/src/skills/review-result/knowledge/baseline-snapshot-validation.md +0 -67
- package/src/skills/review-result/knowledge/dod-patterns.md +0 -116
- package/src/skills/review-result/knowledge/test-hygiene.md +0 -44
- package/src/skills/review-result/scripts/verify-artifacts.js +0 -497
- package/src/skills/review-result/templates/verdict.md +0 -153
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/claude-haiku/trial-1.md +0 -22
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/claude-haiku/trial-2.md +0 -7
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/claude-haiku/trial-3.md +0 -21
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/claude-sonnet/trial-1.md +0 -6
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/claude-sonnet/trial-2.md +0 -6
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/claude-sonnet/trial-3.md +0 -6
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/judge.json +0 -164
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/kilo-deepseek/trial-1.md +0 -5
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/kilo-deepseek/trial-2.md +0 -7
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/kilo-deepseek/trial-3.md +0 -6
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/kilo-glm/trial-1.md +0 -49
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/kilo-glm/trial-2.md +0 -28
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/kilo-glm/trial-3.md +0 -37
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/kilo-minimax/trial-1.md +0 -22
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/kilo-minimax/trial-2.md +0 -13
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/kilo-minimax/trial-3.md +0 -21
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001/current/meta.json +0 -116
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-001-visual-tc-trigger.yaml +0 -51
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/claude-haiku/trial-1.md +0 -23
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/claude-haiku/trial-2.md +0 -22
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/claude-haiku/trial-3.md +0 -28
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/claude-sonnet/trial-1.md +0 -4
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/claude-sonnet/trial-2.md +0 -4
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/claude-sonnet/trial-3.md +0 -4
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/judge.json +0 -163
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/kilo-deepseek/trial-1.md +0 -4
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/kilo-deepseek/trial-2.md +0 -0
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/kilo-deepseek/trial-3.md +0 -4
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/kilo-glm/trial-1.md +0 -39
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/kilo-glm/trial-2.md +0 -25
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/kilo-glm/trial-3.md +0 -32
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/kilo-minimax/trial-1.md +0 -34
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/kilo-minimax/trial-2.md +0 -8
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/kilo-minimax/trial-3.md +0 -23
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002/current/meta.json +0 -115
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-002-path-line-suffix.yaml +0 -39
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/claude-sonnet/trial-1.md +0 -40
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/claude-sonnet/trial-2.md +0 -15
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/claude-sonnet/trial-3.md +0 -7
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/judge.json +0 -163
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-deepseek/trial-1.md +0 -5
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-deepseek/trial-2.md +0 -5
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-deepseek/trial-3.md +0 -11
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-glm/trial-1.md +0 -16
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-glm/trial-2.md +0 -18
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-glm/trial-3.md +0 -17
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-minimax/trial-1.md +0 -17
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-minimax/trial-2.md +0 -31
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/kilo-minimax/trial-3.md +0 -5
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003/current/meta.json +0 -115
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-003-test-isolation.yaml +0 -50
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-004/current/claude-sonnet/trial-1.md +0 -5
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-004/current/claude-sonnet/trial-2.md +0 -5
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-004/current/claude-sonnet/trial-3.md +0 -6
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-004/current/judge.json +0 -46
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-004/current/meta.json +0 -37
- package/src/skills/review-result/tests/cases/TC-REVIEW-RESULT-004-baseline-snapshot.yaml +0 -50
- package/src/skills/review-result/tests/fixtures/IMPL-902-path-with-line.md +0 -43
- package/src/skills/review-result/tests/fixtures/QA-901-visual-button.md +0 -46
- package/src/skills/review-result/tests/fixtures/QA-904-test-isolation-violation/QA-904.md +0 -51
- package/src/skills/review-result/tests/fixtures/QA-904-test-isolation-violation/example-test.mjs +0 -36
- package/src/skills/review-result/tests/fixtures/QA-905-baseline-regex-instead-of-snapshot/QA-905.md +0 -62
- package/src/skills/review-result/tests/fixtures/QA-905-baseline-regex-instead-of-snapshot/baseline.test.mjs +0 -124
- package/src/skills/review-result/tests/index.yaml +0 -35
- package/src/skills/review-result/tests/rubrics/baseline-snapshot.md +0 -20
- package/src/skills/review-result/tests/rubrics/path-line-suffix.md +0 -19
- package/src/skills/review-result/tests/rubrics/test-isolation.md +0 -20
- package/src/skills/review-result/tests/rubrics/visual-tc-trigger.md +0 -19
- package/src/skills/review-result/workflows/review.md +0 -209
|
@@ -1,13 +0,0 @@
|
|
|
1
|
-
# Calibration: Evidence-Based Bad (ожидаемый score ≤ 2/5)
|
|
2
|
-
|
|
3
|
-
Этот файл содержит слабый ответ агента, который rubric `evidence-based.md` **обязан оценить ≤ 2/5**.
|
|
4
|
-
|
|
5
|
-
---
|
|
6
|
-
|
|
7
|
-
## Ответ агента (образец)
|
|
8
|
-
|
|
9
|
-
**Анализ пайплайна:**
|
|
10
|
-
|
|
11
|
-
В логе видно, что пайплайн выполнил несколько этапов: сначала была выполнена архивация старых тикетов, затем декомпозиция плана. Возможно, возникла проблема с нумерацией тикетов, так как система могла повторно использовать старые ID. Рекомендую проверить скрипт генерации ID.
|
|
12
|
-
|
|
13
|
-
В целом пайплайн завершился успешно, декомпозиция создала 5 тикетов. Скорее всего, нужно улучшить механизм присвоения идентификаторов.
|
|
@@ -1,29 +0,0 @@
|
|
|
1
|
-
# Calibration: Evidence-Based Good (ожидаемый score ≥ 4/5)
|
|
2
|
-
|
|
3
|
-
Этот файл содержит образцовый ответ агента, который rubric `evidence-based.md` **обязан оценить ≥ 4/5**.
|
|
4
|
-
|
|
5
|
-
---
|
|
6
|
-
|
|
7
|
-
## Ответ агента (образец)
|
|
8
|
-
|
|
9
|
-
**Finding: CRITICAL — Коллизия ID IMPL-002 и IMPL-003 между PLAN-002 и PLAN-003**
|
|
10
|
-
|
|
11
|
-
**Временна́я диаграмма по ID IMPL-002:**
|
|
12
|
-
|
|
13
|
-
| Событие | Время | Строка лога |
|
|
14
|
-
|---------|-------|-------------|
|
|
15
|
-
| IMPL-002 создан для PLAN-002 | (ранее) | — (за пределами лога) |
|
|
16
|
-
| IMPL-002: done → archive (PLAN-002 archived) | 16:36:02 | line 28 |
|
|
17
|
-
| decompose-plan создаёт **новый** IMPL-002 для PLAN-003 | 16:40:31 | line 121 |
|
|
18
|
-
|
|
19
|
-
**Временна́я диаграмма по ID IMPL-003:**
|
|
20
|
-
|
|
21
|
-
| Событие | Время | Строка лога |
|
|
22
|
-
|---------|-------|-------------|
|
|
23
|
-
| IMPL-003 создан для PLAN-002 | (ранее) | — |
|
|
24
|
-
| IMPL-003: done → archive (PLAN-002 archived) | 16:36:02 | line 29 |
|
|
25
|
-
| decompose-plan создаёт **новый** IMPL-003 для PLAN-003 | 16:40:31 | line 120 |
|
|
26
|
-
|
|
27
|
-
**Root Cause:** Скил `decompose-plan` использует ручной подбор ID вместо `get-next-id.js`. В 16:36:02 (строки 28-29) IMPL-002 и IMPL-003 были сдвинуты в архив как завершённые тикеты PLAN-002. В 16:40:31 (строки 120-121) `decompose-plan` присвоил те же ID новым тикетам PLAN-003, не сканируя `archive/`. Это коллизия ID — два разных артефакта с одинаковым идентификатором.
|
|
28
|
-
|
|
29
|
-
**Скил-источник:** `decompose-plan` — физически записывает тикеты с ID в `backlog/` (строки 119-123 лога).
|
|
@@ -1,26 +0,0 @@
|
|
|
1
|
-
# Rubric: Evidence-Based Temporal Diagram
|
|
2
|
-
|
|
3
|
-
## Критерий
|
|
4
|
-
|
|
5
|
-
**Демонстрирует ли ответ построение временной диаграммы по ID артефакта?**
|
|
6
|
-
|
|
7
|
-
Агент должен:
|
|
8
|
-
1. Выявить один или несколько ID артефактов (тикет, план, отчёт) из лога.
|
|
9
|
-
2. Проследить **всю историю** каждого ID от первого упоминания до последнего (включая события, разделённые по времени).
|
|
10
|
-
3. Явно сопоставить события, связанные одним ID, — выявить коллизию, противоречие или паттерн.
|
|
11
|
-
4. Обосновать вывод ссылками на **конкретные строки лога** (номера строк или временны́е метки).
|
|
12
|
-
|
|
13
|
-
## Шкала оценки (1–5)
|
|
14
|
-
|
|
15
|
-
| Балл | Описание |
|
|
16
|
-
|------|----------|
|
|
17
|
-
| **5** | Временная диаграмма явно построена: агент перечисляет события по каждому ID хронологически, цитирует конкретные строки/метки лога, явно называет коллизию или паттерн, вывод опирается исключительно на данные из лога. |
|
|
18
|
-
| **4** | Временная диаграмма присутствует в неявном виде: все события по ID прослежены, конкретные строки лога процитированы, коллизия/паттерн выявлена, но хронологическая структура изложена нарративно, а не в виде явной диаграммы. |
|
|
19
|
-
| **3** | Частичное построение: агент идентифицирует коллизию и упоминает часть событий, но не прослеживает полную цепочку по ID — либо пропущен один конец цепочки (только archive или только create), либо строки лога не процитированы. |
|
|
20
|
-
| **2** | Коллизия угадана или названа без опоры на конкретные строки лога. Агент использует общие слова («вероятно», «предположительно») или не связывает события одним ID явно. |
|
|
21
|
-
| **1** | Нет признаков построения временной диаграммы: общий вывод без ссылок на лог, либо ID не сопоставлены между событиями, либо ответ не относится к содержимому лога. |
|
|
22
|
-
|
|
23
|
-
## Calibration
|
|
24
|
-
|
|
25
|
-
- Ответ, оцениваемый **≥ 4/5**: [`calibration/evidence-based-good.md`](calibration/evidence-based-good.md)
|
|
26
|
-
- Ответ, оцениваемый **≤ 2/5**: [`calibration/evidence-based-bad.md`](calibration/evidence-based-bad.md)
|
|
@@ -1,21 +0,0 @@
|
|
|
1
|
-
# Rubric: Root Cause First
|
|
2
|
-
|
|
3
|
-
Оцените ответ коуча по шкале 1-5.
|
|
4
|
-
|
|
5
|
-
## Критерий
|
|
6
|
-
|
|
7
|
-
Коуч при анализе инцидента:
|
|
8
|
-
1. Начинает с **причины первого порядка** (конкретное невыполненное действие агентом)
|
|
9
|
-
2. Затем анализирует **почему инструкции допустили** это (недостаток машинной защиты, нечёткость формулировки)
|
|
10
|
-
3. При повторном инциденте **эскалирует в машинную защиту**, а не предлагает текстовое усиление
|
|
11
|
-
4. НЕ уходит в абстрактные рассуждения о формулировках до установления root cause
|
|
12
|
-
|
|
13
|
-
## Шкала
|
|
14
|
-
|
|
15
|
-
| Балл | Описание |
|
|
16
|
-
|------|----------|
|
|
17
|
-
| 5 | Root cause первого порядка найден, цепочка прослежена, повторный инцидент → эскалация в машинную защиту |
|
|
18
|
-
| 4 | Root cause найден корректно, предложено решение, но эскалация не максимально конкретна |
|
|
19
|
-
| 3 | Root cause найден частично, есть отвлечение на формулировки |
|
|
20
|
-
| 2 | Начал с формулировок, root cause упомянут вторично |
|
|
21
|
-
| 1 | Root cause не найден или предложено только текстовое усиление при повторном инциденте |
|
|
@@ -1,79 +0,0 @@
|
|
|
1
|
-
# Воркфлоу: ANALYZE — Анализ эффективности скила
|
|
2
|
-
|
|
3
|
-
Анализ работы скила на основе завершённых планов, тикетов и отчётов.
|
|
4
|
-
|
|
5
|
-
## Алгоритм выполнения
|
|
6
|
-
|
|
7
|
-
### 0. Бэклог → SKILL.md «Обязательный шаг: Тест». Прочитай `analyzed_tickets[]` — исключи уже проанализированные тикеты из выборки.
|
|
8
|
-
|
|
9
|
-
### 1. Сбор данных
|
|
10
|
-
|
|
11
|
-
Собери все завершённые артефакты, связанные со скилом.
|
|
12
|
-
**Исключи тикеты, уже присутствующие в бэклоге (`analyzed_tickets`).**
|
|
13
|
-
|
|
14
|
-
| Источник | Где искать | Что извлечь |
|
|
15
|
-
|----------|-----------|-------------|
|
|
16
|
-
| Завершённые тикеты | `.workflow/tickets/done/` | Результаты, время, качество |
|
|
17
|
-
| Планы | `.workflow/plans/` | Цели, декомпозиция, отклонения |
|
|
18
|
-
| Отчёты | `.workflow/reports/` | Метрики, выводы, проблемы |
|
|
19
|
-
|
|
20
|
-
Фильтруй по `ticket_prefix` скила.
|
|
21
|
-
|
|
22
|
-
### 2. Анализ паттернов
|
|
23
|
-
|
|
24
|
-
**Паттерны успеха:**
|
|
25
|
-
- Какие типы тикетов выполняются хорошо?
|
|
26
|
-
- Какие воркфлоу дают стабильный качественный результат?
|
|
27
|
-
- Какие knowledge-модули используются чаще всего?
|
|
28
|
-
|
|
29
|
-
**Паттерны проблем:**
|
|
30
|
-
- Какие тикеты завершаются с неполным результатом?
|
|
31
|
-
- Где агент отклоняется от воркфлоу?
|
|
32
|
-
- Какие знания отсутствуют и требуют дополнения?
|
|
33
|
-
- Где агент «додумывает» вместо использования knowledge?
|
|
34
|
-
|
|
35
|
-
**⚠️ Проверка соответствия процесса (ОБЯЗАТЕЛЬНО):** Для каждого тикета сверь предписанные инструменты/шаги (из SKILL.md скила) с фактически использованными (из «Agent used», «Что сделано»). Расхождение = **finding**, даже если DoD формально ✅ passed.
|
|
36
|
-
|
|
37
|
-
### 3. Gap-анализ
|
|
38
|
-
|
|
39
|
-
Применить → `algorithms/gap-analysis.md`
|
|
40
|
-
|
|
41
|
-
Определи:
|
|
42
|
-
- Типы задач, которые приходят, но не имеют воркфлоу
|
|
43
|
-
- Знания, которые нужны, но отсутствуют в knowledge/
|
|
44
|
-
- Решения, которые принимаются ad-hoc вместо формализованного алгоритма
|
|
45
|
-
|
|
46
|
-
### 4. Метрики качества
|
|
47
|
-
|
|
48
|
-
| Метрика | Как считать |
|
|
49
|
-
|---------|------------|
|
|
50
|
-
| Полнота результата | % тикетов с заполненными всеми секциями DoD |
|
|
51
|
-
| Соответствие воркфлоу | % тикетов, где агент следовал шагам воркфлоу |
|
|
52
|
-
| Использование knowledge | Частота обращений к knowledge-модулям |
|
|
53
|
-
| Время выполнения | Среднее время по типам тикетов |
|
|
54
|
-
|
|
55
|
-
### 5. Формирование выводов
|
|
56
|
-
|
|
57
|
-
- Топ-3 сильные стороны скила
|
|
58
|
-
- Топ-3 проблемы / узкие места
|
|
59
|
-
- Топ-3 возможности для улучшения
|
|
60
|
-
- Конкретные рекомендации с указанием файлов для изменения
|
|
61
|
-
|
|
62
|
-
Результат оформи как часть отчёта → `templates/audit-report.md`
|
|
63
|
-
|
|
64
|
-
### 6. Запись в `analyzed_tickets[]` → обнови `analyzed_tickets[]` в `.workflow/coach-backlog.yaml`: добавь проанализированные тикеты/логи. Обнови `last_updated`.
|
|
65
|
-
|
|
66
|
-
### 7. Создание теста → `workflows/test.md`
|
|
67
|
-
|
|
68
|
-
Выполни воркфлоу `workflows/test.md` для скила, который был проанализирован:
|
|
69
|
-
- Создай регрессионный тест-кейс, фиксирующий ключевой finding анализа
|
|
70
|
-
- Прогони runner и получи verdict
|
|
71
|
-
|
|
72
|
-
### 8. Сообщить пользователю verdict и список затронутых файлов
|
|
73
|
-
|
|
74
|
-
Сообщи пользователю:
|
|
75
|
-
|
|
76
|
-
- **Verdict** runner'а из шага 7.
|
|
77
|
-
- **Список затронутых файлов:** `SKILL.md` и/или `workflows/`, `tests/cases/{id}.yaml`, `tests/index.yaml`, `tests/cases/{id}/current/`
|
|
78
|
-
|
|
79
|
-
**Остановиться.** Коуч не делает ничего сверх этого — коммит на стороне пользователя.
|
|
@@ -1,64 +0,0 @@
|
|
|
1
|
-
# Воркфлоу: ANALYZE — Анализ эффективности скила
|
|
2
|
-
|
|
3
|
-
Анализ работы скила на основе завершённых планов, тикетов и отчётов.
|
|
4
|
-
|
|
5
|
-
## Алгоритм выполнения
|
|
6
|
-
|
|
7
|
-
### 0. Бэклог → SKILL.md «Обязательный шаг: Бэклог коуча». Пропусти тикеты из `analyzed_tickets`, не предлагай правки из `applied_changes`.
|
|
8
|
-
|
|
9
|
-
### 1. Сбор данных
|
|
10
|
-
|
|
11
|
-
Собери все завершённые артефакты, связанные со скилом.
|
|
12
|
-
**Исключи тикеты, уже присутствующие в бэклоге (`analyzed_tickets`).**
|
|
13
|
-
|
|
14
|
-
| Источник | Где искать | Что извлечь |
|
|
15
|
-
|----------|-----------|-------------|
|
|
16
|
-
| Завершённые тикеты | `.workflow/tickets/done/` | Результаты, время, качество |
|
|
17
|
-
| Планы | `.workflow/plans/` | Цели, декомпозиция, отклонения |
|
|
18
|
-
| Отчёты | `.workflow/reports/` | Метрики, выводы, проблемы |
|
|
19
|
-
|
|
20
|
-
Фильтруй по `ticket_prefix` скила.
|
|
21
|
-
|
|
22
|
-
### 2. Анализ паттернов
|
|
23
|
-
|
|
24
|
-
**Паттерны успеха:**
|
|
25
|
-
- Какие типы тикетов выполняются хорошо?
|
|
26
|
-
- Какие воркфлоу дают стабильный качественный результат?
|
|
27
|
-
- Какие knowledge-модули используются чаще всего?
|
|
28
|
-
|
|
29
|
-
**Паттерны проблем:**
|
|
30
|
-
- Какие тикеты завершаются с неполным результатом?
|
|
31
|
-
- Где агент отклоняется от воркфлоу?
|
|
32
|
-
- Какие знания отсутствуют и требуют дополнения?
|
|
33
|
-
- Где агент «додумывает» вместо использования knowledge?
|
|
34
|
-
|
|
35
|
-
**⚠️ Проверка соответствия процесса (ОБЯЗАТЕЛЬНО):** Для каждого тикета сверь предписанные инструменты/шаги (из SKILL.md скила) с фактически использованными (из «Agent used», «Что сделано»). Расхождение = **finding**, даже если DoD формально ✅ passed.
|
|
36
|
-
|
|
37
|
-
### 3. Gap-анализ
|
|
38
|
-
|
|
39
|
-
Применить → `algorithms/gap-analysis.md`
|
|
40
|
-
|
|
41
|
-
Определи:
|
|
42
|
-
- Типы задач, которые приходят, но не имеют воркфлоу
|
|
43
|
-
- Знания, которые нужны, но отсутствуют в knowledge/
|
|
44
|
-
- Решения, которые принимаются ad-hoc вместо формализованного алгоритма
|
|
45
|
-
|
|
46
|
-
### 4. Метрики качества
|
|
47
|
-
|
|
48
|
-
| Метрика | Как считать |
|
|
49
|
-
|---------|------------|
|
|
50
|
-
| Полнота результата | % тикетов с заполненными всеми секциями DoD |
|
|
51
|
-
| Соответствие воркфлоу | % тикетов, где агент следовал шагам воркфлоу |
|
|
52
|
-
| Использование knowledge | Частота обращений к knowledge-модулям |
|
|
53
|
-
| Время выполнения | Среднее время по типам тикетов |
|
|
54
|
-
|
|
55
|
-
### 5. Формирование выводов
|
|
56
|
-
|
|
57
|
-
- Топ-3 сильные стороны скила
|
|
58
|
-
- Топ-3 проблемы / узкие места
|
|
59
|
-
- Топ-3 возможности для улучшения
|
|
60
|
-
- Конкретные рекомендации с указанием файлов для изменения
|
|
61
|
-
|
|
62
|
-
Результат оформи как часть отчёта → `templates/audit-report.md`
|
|
63
|
-
|
|
64
|
-
### 6. Обновление бэклога → SKILL.md «Обязательный шаг: Бэклог коуча»
|
|
@@ -1,74 +0,0 @@
|
|
|
1
|
-
# Воркфлоу: AUDIT — Полный аудит скила
|
|
2
|
-
|
|
3
|
-
Комплексная проверка существующего скила на полноту, качество и актуальность.
|
|
4
|
-
|
|
5
|
-
## Алгоритм выполнения
|
|
6
|
-
|
|
7
|
-
### 0. Бэклог → SKILL.md «Обязательный шаг: Тест». Прочитай `audited_skills[]` — учти score и findings предыдущего аудита этого скила.
|
|
8
|
-
|
|
9
|
-
### 1. Инвентаризация
|
|
10
|
-
|
|
11
|
-
Прочитай все файлы скила и составь карту:
|
|
12
|
-
|
|
13
|
-
| Проверка | Что смотреть |
|
|
14
|
-
|----------|-------------|
|
|
15
|
-
| Структура | Все ли директории и обязательные файлы на месте? |
|
|
16
|
-
| SKILL.md | Все ли секции заполнены? Актуальна ли маршрутизация? |
|
|
17
|
-
| Workflows | Покрыты ли все типы тикетов? Есть ли пробелы? |
|
|
18
|
-
| Knowledge | Актуальны ли знания? Нет ли устаревших данных? |
|
|
19
|
-
| Algorithms | Формализованы ли методы? Есть ли конкретные пороги/формулы? |
|
|
20
|
-
| Templates | Покрыты ли все типы вывода? Консистентны ли форматы? |
|
|
21
|
-
| README | Описывает ли структуру и процесс расширения? |
|
|
22
|
-
|
|
23
|
-
### 2. Оценка качества
|
|
24
|
-
|
|
25
|
-
Применить → `algorithms/skill-scoring.md`
|
|
26
|
-
|
|
27
|
-
Оцени по каждому критерию и выведи итоговый балл.
|
|
28
|
-
|
|
29
|
-
### 3. Проверка антипаттернов
|
|
30
|
-
|
|
31
|
-
Загрузи → `knowledge/common-antipatterns.md`
|
|
32
|
-
|
|
33
|
-
Проверь каждый антипаттерн. Зафиксируй найденные.
|
|
34
|
-
|
|
35
|
-
### 4. Анализ связности и изоляции
|
|
36
|
-
|
|
37
|
-
- Все ли ссылки из SKILL.md ведут на существующие файлы?
|
|
38
|
-
- Все ли файлы в knowledge/ и algorithms/ упомянуты в SKILL.md?
|
|
39
|
-
- Есть ли «осиротевшие» файлы без ссылок?
|
|
40
|
-
- Консистентна ли терминология между файлами?
|
|
41
|
-
- **⛔ Изоляция:** нет ли хардкода имён других скилов/ролей? Проверь: `grep -rE "имена конкретных ролей проекта" скил/` — должен быть 0 результатов. Типичные нарушения: таблицы взаимодействия с перечислением ролей, примеры с ID конкретных ролей, границы компетенции с именами скилов. См. `knowledge/common-antipatterns.md` → секция «Антипаттерны изоляции».
|
|
42
|
-
|
|
43
|
-
### 5. Сравнение с эталоном
|
|
44
|
-
|
|
45
|
-
Загрузи → `knowledge/skill-anatomy.md`
|
|
46
|
-
|
|
47
|
-
Сравни скил с эталонной структурой. Какие компоненты отсутствуют или неполны?
|
|
48
|
-
|
|
49
|
-
### 6. Формирование отчёта
|
|
50
|
-
|
|
51
|
-
Используй шаблон → `templates/audit-report.md`
|
|
52
|
-
|
|
53
|
-
Результат должен содержать:
|
|
54
|
-
- Общий балл качества
|
|
55
|
-
- Список найденных проблем с приоритетами
|
|
56
|
-
- Конкретные рекомендации по каждой проблеме
|
|
57
|
-
- План улучшений с приоритизацией
|
|
58
|
-
|
|
59
|
-
### 7. Запись snapshot score → обнови `audited_skills[]` в `.workflow/coach-backlog.yaml`: skill_name, last_audit_date, coach_ticket, score, status, notes. Обнови `last_updated`. Добавь тикет в `analyzed_tickets[]` (как требует SKILL.md «Обязательный шаг: Тест»).
|
|
60
|
-
|
|
61
|
-
### 8. Создание теста → `workflows/test.md`
|
|
62
|
-
|
|
63
|
-
Выполни воркфлоу `workflows/test.md` для скила, который был проверен:
|
|
64
|
-
- Создай регрессионный тест-кейс, фиксирующий ключевой finding аудита
|
|
65
|
-
- Прогони runner и получи verdict
|
|
66
|
-
|
|
67
|
-
### 9. Сообщить пользователю verdict и список затронутых файлов
|
|
68
|
-
|
|
69
|
-
Сообщи пользователю:
|
|
70
|
-
|
|
71
|
-
- **Verdict** runner'а из шага 8.
|
|
72
|
-
- **Список затронутых файлов:** `SKILL.md` и/или `workflows/`, `tests/cases/{id}.yaml`, `tests/index.yaml`, `tests/cases/{id}/current/`
|
|
73
|
-
|
|
74
|
-
**Остановиться.** Коуч не делает ничего сверх этого — коммит на стороне пользователя.
|
|
@@ -1,59 +0,0 @@
|
|
|
1
|
-
# Воркфлоу: AUDIT — Полный аудит скила
|
|
2
|
-
|
|
3
|
-
Комплексная проверка существующего скила на полноту, качество и актуальность.
|
|
4
|
-
|
|
5
|
-
## Алгоритм выполнения
|
|
6
|
-
|
|
7
|
-
### 0. Бэклог → SKILL.md «Обязательный шаг: Бэклог коуча». Учитывай `applied_changes` — не отмечай как проблему то, что уже исправлено.
|
|
8
|
-
|
|
9
|
-
### 1. Инвентаризация
|
|
10
|
-
|
|
11
|
-
Прочитай все файлы скила и составь карту:
|
|
12
|
-
|
|
13
|
-
| Проверка | Что смотреть |
|
|
14
|
-
|----------|-------------|
|
|
15
|
-
| Структура | Все ли директории и обязательные файлы на месте? |
|
|
16
|
-
| SKILL.md | Все ли секции заполнены? Актуальна ли маршрутизация? |
|
|
17
|
-
| Workflows | Покрыты ли все типы тикетов? Есть ли пробелы? |
|
|
18
|
-
| Knowledge | Актуальны ли знания? Нет ли устаревших данных? |
|
|
19
|
-
| Algorithms | Формализованы ли методы? Есть ли конкретные пороги/формулы? |
|
|
20
|
-
| Templates | Покрыты ли все типы вывода? Консистентны ли форматы? |
|
|
21
|
-
| README | Описывает ли структуру и процесс расширения? |
|
|
22
|
-
|
|
23
|
-
### 2. Оценка качества
|
|
24
|
-
|
|
25
|
-
Применить → `algorithms/skill-scoring.md`
|
|
26
|
-
|
|
27
|
-
Оцени по каждому критерию и выведи итоговый балл.
|
|
28
|
-
|
|
29
|
-
### 3. Проверка антипаттернов
|
|
30
|
-
|
|
31
|
-
Загрузи → `knowledge/common-antipatterns.md`
|
|
32
|
-
|
|
33
|
-
Проверь каждый антипаттерн. Зафиксируй найденные.
|
|
34
|
-
|
|
35
|
-
### 4. Анализ связности и изоляции
|
|
36
|
-
|
|
37
|
-
- Все ли ссылки из SKILL.md ведут на существующие файлы?
|
|
38
|
-
- Все ли файлы в knowledge/ и algorithms/ упомянуты в SKILL.md?
|
|
39
|
-
- Есть ли «осиротевшие» файлы без ссылок?
|
|
40
|
-
- Консистентна ли терминология между файлами?
|
|
41
|
-
- **⛔ Изоляция:** нет ли хардкода имён других скилов/ролей? Проверь: `grep -rE "имена конкретных ролей проекта" скил/` — должен быть 0 результатов. Типичные нарушения: таблицы взаимодействия с перечислением ролей, примеры с ID конкретных ролей, границы компетенции с именами скилов. См. `knowledge/common-antipatterns.md` → секция «Антипаттерны изоляции».
|
|
42
|
-
|
|
43
|
-
### 5. Сравнение с эталоном
|
|
44
|
-
|
|
45
|
-
Загрузи → `knowledge/skill-anatomy.md`
|
|
46
|
-
|
|
47
|
-
Сравни скил с эталонной структурой. Какие компоненты отсутствуют или неполны?
|
|
48
|
-
|
|
49
|
-
### 6. Формирование отчёта
|
|
50
|
-
|
|
51
|
-
Используй шаблон → `templates/audit-report.md`
|
|
52
|
-
|
|
53
|
-
Результат должен содержать:
|
|
54
|
-
- Общий балл качества
|
|
55
|
-
- Список найденных проблем с приоритетами
|
|
56
|
-
- Конкретные рекомендации по каждой проблеме
|
|
57
|
-
- План улучшений с приоритизацией
|
|
58
|
-
|
|
59
|
-
### 7. Обновление бэклога → SKILL.md «Обязательный шаг: Бэклог коуча»
|
|
@@ -1,80 +0,0 @@
|
|
|
1
|
-
# Воркфлоу: CREATE — Создание нового скила
|
|
2
|
-
|
|
3
|
-
Создание полноценного модульного скила с нуля по запросу.
|
|
4
|
-
|
|
5
|
-
## Алгоритм выполнения
|
|
6
|
-
|
|
7
|
-
### 1. Сбор требований
|
|
8
|
-
|
|
9
|
-
Из тикета извлеки:
|
|
10
|
-
- **Роль** — кем является агент с этим скилом?
|
|
11
|
-
- **Зона ответственности** — что делает и что НЕ делает?
|
|
12
|
-
- **Типы тикетов** — какие задачи будет обрабатывать?
|
|
13
|
-
- **Команда / RACI** — с кем взаимодействует (если применимо)?
|
|
14
|
-
- **Домен знаний** — какая экспертиза нужна?
|
|
15
|
-
|
|
16
|
-
Если информации недостаточно — сформулируй уточняющие вопросы.
|
|
17
|
-
|
|
18
|
-
### 2. Исследование домена
|
|
19
|
-
|
|
20
|
-
- Поищи в интернете лучшие практики и фреймворки для данной роли/домена
|
|
21
|
-
- Изучи существующие скилы в `.workflow/src/skills/` для переиспользования паттернов
|
|
22
|
-
- Определи, какие knowledge-модули можно переиспользовать из других скилов
|
|
23
|
-
|
|
24
|
-
### 3. Проектирование структуры
|
|
25
|
-
|
|
26
|
-
Используй эталон → `knowledge/skill-anatomy.md`
|
|
27
|
-
|
|
28
|
-
Определи:
|
|
29
|
-
|
|
30
|
-
| Компонент | Что создать |
|
|
31
|
-
|-----------|-------------|
|
|
32
|
-
| **SKILL.md** | Роль, RACI, маршрутизация, принципы, формат вывода |
|
|
33
|
-
| **workflows/** | По одному файлу на каждый тип тикета |
|
|
34
|
-
| **knowledge/** | Экспертные знания домена |
|
|
35
|
-
| **algorithms/** | Формализованные методы принятия решений |
|
|
36
|
-
| **templates/** | Шаблоны вывода для каждого типа результата |
|
|
37
|
-
|
|
38
|
-
### 4. Создание скила
|
|
39
|
-
|
|
40
|
-
Создай все файлы по шаблону → `templates/new-skill.md`
|
|
41
|
-
|
|
42
|
-
**Порядок создания:**
|
|
43
|
-
1. `SKILL.md` — ядро скила
|
|
44
|
-
2. `workflows/` — пошаговые алгоритмы
|
|
45
|
-
3. `knowledge/` — экспертные знания
|
|
46
|
-
4. `algorithms/` — методы принятия решений
|
|
47
|
-
5. `templates/` — шаблоны вывода
|
|
48
|
-
6. `README.md` — документация
|
|
49
|
-
|
|
50
|
-
### 5. Валидация
|
|
51
|
-
|
|
52
|
-
Проверь скил по алгоритму → `algorithms/skill-scoring.md`
|
|
53
|
-
|
|
54
|
-
Критерии:
|
|
55
|
-
- [ ] SKILL.md содержит все обязательные секции
|
|
56
|
-
- [ ] Каждый тип тикета имеет свой воркфлоу
|
|
57
|
-
- [ ] Воркфлоу ссылаются на knowledge и algorithms
|
|
58
|
-
- [ ] Шаблоны вывода покрывают все типы результатов
|
|
59
|
-
- [ ] README.md описывает структуру и расширение
|
|
60
|
-
- [ ] Нет дублирования с существующими скилами
|
|
61
|
-
- [ ] Принципы конкретны и actionable
|
|
62
|
-
- [ ] **Изоляция:** нет хардкода имён других скилов/ролей — в примерах используются generic ID (XXX-NNN, example-skill), в таблицах взаимодействия — универсальные описания. Проверка: `grep -rE "конкретные имена ролей проекта" новый-скил/` = 0
|
|
63
|
-
|
|
64
|
-
### 6. Регистрация
|
|
65
|
-
|
|
66
|
-
- Добавь скил в таблицу в `CLAUDE.md` и `QWEN.md`
|
|
67
|
-
- Убедись что ticket_prefix уникален
|
|
68
|
-
|
|
69
|
-
### 7. Создание теста → `workflows/test.md`
|
|
70
|
-
|
|
71
|
-
Выполни воркфлоу `workflows/test.md` для нового скила.
|
|
72
|
-
|
|
73
|
-
### 8. Сообщить пользователю verdict и список затронутых файлов. Остановиться.
|
|
74
|
-
|
|
75
|
-
Сообщи пользователю:
|
|
76
|
-
|
|
77
|
-
- **Список затронутых файлов:** все файлы созданного скила (`SKILL.md`, `workflows/`, `knowledge/`, `algorithms/`, `templates/`, `README.md`), а также `tests/cases/{id}.yaml`, `tests/index.yaml`
|
|
78
|
-
- **Verdict** из шага 7 (результат запуска тестов).
|
|
79
|
-
|
|
80
|
-
**Остановиться.**
|
|
@@ -1,67 +0,0 @@
|
|
|
1
|
-
# Воркфлоу: CREATE — Создание нового скила
|
|
2
|
-
|
|
3
|
-
Создание полноценного модульного скила с нуля по запросу.
|
|
4
|
-
|
|
5
|
-
## Алгоритм выполнения
|
|
6
|
-
|
|
7
|
-
### 1. Сбор требований
|
|
8
|
-
|
|
9
|
-
Из тикета извлеки:
|
|
10
|
-
- **Роль** — кем является агент с этим скилом?
|
|
11
|
-
- **Зона ответственности** — что делает и что НЕ делает?
|
|
12
|
-
- **Типы тикетов** — какие задачи будет обрабатывать?
|
|
13
|
-
- **Команда / RACI** — с кем взаимодействует (если применимо)?
|
|
14
|
-
- **Домен знаний** — какая экспертиза нужна?
|
|
15
|
-
|
|
16
|
-
Если информации недостаточно — сформулируй уточняющие вопросы.
|
|
17
|
-
|
|
18
|
-
### 2. Исследование домена
|
|
19
|
-
|
|
20
|
-
- Поищи в интернете лучшие практики и фреймворки для данной роли/домена
|
|
21
|
-
- Изучи существующие скилы в `.workflow/src/skills/` для переиспользования паттернов
|
|
22
|
-
- Определи, какие knowledge-модули можно переиспользовать из других скилов
|
|
23
|
-
|
|
24
|
-
### 3. Проектирование структуры
|
|
25
|
-
|
|
26
|
-
Используй эталон → `knowledge/skill-anatomy.md`
|
|
27
|
-
|
|
28
|
-
Определи:
|
|
29
|
-
|
|
30
|
-
| Компонент | Что создать |
|
|
31
|
-
|-----------|-------------|
|
|
32
|
-
| **SKILL.md** | Роль, RACI, маршрутизация, принципы, формат вывода |
|
|
33
|
-
| **workflows/** | По одному файлу на каждый тип тикета |
|
|
34
|
-
| **knowledge/** | Экспертные знания домена |
|
|
35
|
-
| **algorithms/** | Формализованные методы принятия решений |
|
|
36
|
-
| **templates/** | Шаблоны вывода для каждого типа результата |
|
|
37
|
-
|
|
38
|
-
### 4. Создание скила
|
|
39
|
-
|
|
40
|
-
Создай все файлы по шаблону → `templates/new-skill.md`
|
|
41
|
-
|
|
42
|
-
**Порядок создания:**
|
|
43
|
-
1. `SKILL.md` — ядро скила
|
|
44
|
-
2. `workflows/` — пошаговые алгоритмы
|
|
45
|
-
3. `knowledge/` — экспертные знания
|
|
46
|
-
4. `algorithms/` — методы принятия решений
|
|
47
|
-
5. `templates/` — шаблоны вывода
|
|
48
|
-
6. `README.md` — документация
|
|
49
|
-
|
|
50
|
-
### 5. Валидация
|
|
51
|
-
|
|
52
|
-
Проверь скил по алгоритму → `algorithms/skill-scoring.md`
|
|
53
|
-
|
|
54
|
-
Критерии:
|
|
55
|
-
- [ ] SKILL.md содержит все обязательные секции
|
|
56
|
-
- [ ] Каждый тип тикета имеет свой воркфлоу
|
|
57
|
-
- [ ] Воркфлоу ссылаются на knowledge и algorithms
|
|
58
|
-
- [ ] Шаблоны вывода покрывают все типы результатов
|
|
59
|
-
- [ ] README.md описывает структуру и расширение
|
|
60
|
-
- [ ] Нет дублирования с существующими скилами
|
|
61
|
-
- [ ] Принципы конкретны и actionable
|
|
62
|
-
- [ ] **Изоляция:** нет хардкода имён других скилов/ролей — в примерах используются generic ID (XXX-NNN, example-skill), в таблицах взаимодействия — универсальные описания. Проверка: `grep -rE "конкретные имена ролей проекта" новый-скил/` = 0
|
|
63
|
-
|
|
64
|
-
### 6. Регистрация
|
|
65
|
-
|
|
66
|
-
- Добавь скил в таблицу в `CLAUDE.md` и `QWEN.md`
|
|
67
|
-
- Убедись что ticket_prefix уникален
|
|
@@ -1,71 +0,0 @@
|
|
|
1
|
-
# Воркфлоу: IMPROVE — Точечное улучшение скила
|
|
2
|
-
|
|
3
|
-
Внесение конкретных улучшений в существующий скил на основе аудита, анализа или запроса.
|
|
4
|
-
|
|
5
|
-
## Алгоритм выполнения
|
|
6
|
-
|
|
7
|
-
### 1. Определи scope улучшения
|
|
8
|
-
|
|
9
|
-
Из тикета извлеки:
|
|
10
|
-
- Какой скил улучшаем?
|
|
11
|
-
- Какая конкретная проблема или потребность?
|
|
12
|
-
- Есть ли ссылка на аудит/анализ с рекомендациями?
|
|
13
|
-
|
|
14
|
-
### 2. Изучи текущее состояние
|
|
15
|
-
|
|
16
|
-
Прочитай файлы скила, которые затрагивает улучшение. Пойми текущую логику прежде чем менять.
|
|
17
|
-
|
|
18
|
-
### 3. Определи тип улучшения
|
|
19
|
-
|
|
20
|
-
| Тип | Действие |
|
|
21
|
-
|-----|----------|
|
|
22
|
-
| **Новый воркфлоу** | Создай `workflows/new-type.md`, добавь в маршрутизацию SKILL.md |
|
|
23
|
-
| **Новые знания** | Создай/дополни файл в `knowledge/`, добавь в таблицу загрузки |
|
|
24
|
-
| **Новый алгоритм** | Создай `algorithms/new-algo.md`, добавь в таблицу загрузки |
|
|
25
|
-
| **Новый шаблон** | Создай `templates/new-template.md`, укажи в воркфлоу |
|
|
26
|
-
| **Уточнение воркфлоу** | Добавь/исправь шаги в существующем воркфлоу |
|
|
27
|
-
| **Обогащение knowledge** | Дополни существующий файл в knowledge/ после маркера расширения |
|
|
28
|
-
| **Рефакторинг** | Реструктуризация без изменения поведения |
|
|
29
|
-
|
|
30
|
-
### 4. Исследование (если нужно)
|
|
31
|
-
|
|
32
|
-
Если улучшение требует новых знаний:
|
|
33
|
-
- Поищи в интернете лучшие практики, фреймворки, методологии
|
|
34
|
-
- Адаптируй найденное под формат knowledge/ или algorithms/
|
|
35
|
-
- Укажи источник
|
|
36
|
-
|
|
37
|
-
### 5. Внесение изменений
|
|
38
|
-
|
|
39
|
-
- Следуй принципу минимальных изменений
|
|
40
|
-
- Не ломай существующие ссылки и интеграции
|
|
41
|
-
- Добавляй, а не переписывай (если не рефакторинг)
|
|
42
|
-
- Обнови README.md если структура изменилась
|
|
43
|
-
|
|
44
|
-
### 6. Валидация
|
|
45
|
-
|
|
46
|
-
- Проверь все ссылки из SKILL.md
|
|
47
|
-
- Убедись что новые файлы упомянуты в таблицах загрузки
|
|
48
|
-
- Проверь консистентность терминологии
|
|
49
|
-
|
|
50
|
-
### 7. Документирование
|
|
51
|
-
|
|
52
|
-
Сформируй план улучшений → `templates/improvement-plan.md` с:
|
|
53
|
-
- Что изменено и почему
|
|
54
|
-
- Какие файлы затронуты
|
|
55
|
-
- Ожидаемый эффект
|
|
56
|
-
- Как проверить результат
|
|
57
|
-
|
|
58
|
-
### 8. Создание теста → `workflows/test.md`
|
|
59
|
-
|
|
60
|
-
Выполни воркфлоу `workflows/test.md` для скила, который был улучшен:
|
|
61
|
-
- Создай регрессионный тест-кейс, фиксирующий улучшение
|
|
62
|
-
- Прогони runner и получи verdict
|
|
63
|
-
|
|
64
|
-
### 9. Сообщить пользователю verdict и список затронутых файлов
|
|
65
|
-
|
|
66
|
-
Сообщи пользователю:
|
|
67
|
-
|
|
68
|
-
- **Verdict** runner'а из шага 8.
|
|
69
|
-
- **Список затронутых файлов:** `SKILL.md` и/или `workflows/`, `tests/cases/{id}.yaml`, `tests/index.yaml`, `tests/cases/{id}/current/`
|
|
70
|
-
|
|
71
|
-
**Остановиться.** Коуч не делает ничего сверх этого — коммит на стороне пользователя.
|