npm - agentic-qe - Versions diffs - 3.7.9 → 3.7.10 - Mend

agentic-qe 3.7.9 → 3.7.10

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (358) hide show

package/.claude/skills/.validation/README.md +111 -111
package/.claude/skills/.validation/examples/chaos-engineering-output.example.json +530 -530
package/.claude/skills/.validation/examples/performance-testing-output.example.json +252 -252
package/.claude/skills/.validation/examples/security-testing-output.example.json +413 -413
package/.claude/skills/.validation/examples/testability-scoring-output.example.json +350 -350
package/.claude/skills/.validation/schemas/skill-eval.schema.json +462 -462
package/.claude/skills/.validation/schemas/skill-frontmatter.schema.json +341 -341
package/.claude/skills/.validation/schemas/skill-output-meta.schema.json +199 -199
package/.claude/skills/.validation/schemas/skill-output.template.json +610 -610
package/.claude/skills/.validation/skill-validation-mcp-integration.md +250 -250
package/.claude/skills/.validation/templates/eval.template.yaml +366 -366
package/.claude/skills/.validation/templates/schemas/output.json +145 -145
package/.claude/skills/.validation/templates/security-testing-eval.template.yaml +725 -725
package/.claude/skills/.validation/templates/skill-frontmatter.example.yaml +225 -225
package/.claude/skills/.validation/test-data/invalid-output.json +5 -5
package/.claude/skills/.validation/test-data/minimal-output.json +9 -9
package/.claude/skills/.validation/test-data/sample-output.json +73 -73
package/.claude/skills/a11y-ally/evals/a11y-ally.yaml +376 -376
package/.claude/skills/a11y-ally/schemas/output.json +549 -549
package/.claude/skills/accessibility-testing/evals/accessibility-testing.yaml +719 -719
package/.claude/skills/accessibility-testing/schemas/output.json +776 -776
package/.claude/skills/accessibility-testing/test-data/sample-output.json +191 -191
package/.claude/skills/agentic-quality-engineering/schemas/output.json +577 -577
package/.claude/skills/api-testing-patterns/evals/api-testing-patterns.yaml +696 -696
package/.claude/skills/api-testing-patterns/schemas/output.json +845 -845
package/.claude/skills/aqe-v2-v3-migration/schemas/output.json +513 -513
package/.claude/skills/brutal-honesty-review/schemas/output.json +291 -291
package/.claude/skills/bug-reporting-excellence/schemas/output.json +288 -288
package/.claude/skills/chaos-engineering-resilience/evals/chaos-engineering-resilience.yaml +761 -761
package/.claude/skills/chaos-engineering-resilience/schemas/output.json +1205 -1205
package/.claude/skills/cicd-pipeline-qe-orchestrator/evals/cicd-pipeline-qe-orchestrator.yaml +157 -157
package/.claude/skills/cicd-pipeline-qe-orchestrator/schemas/output.json +542 -542
package/.claude/skills/code-review-quality/schemas/output.json +264 -264
package/.claude/skills/compatibility-testing/evals/compatibility-testing.yaml +410 -410
package/.claude/skills/compatibility-testing/schemas/output.json +551 -551
package/.claude/skills/compliance-testing/evals/compliance-testing.yaml +1107 -1107
package/.claude/skills/compliance-testing/schemas/output.json +845 -845
package/.claude/skills/consultancy-practices/schemas/output.json +282 -282
package/.claude/skills/contract-testing/evals/contract-testing.yaml +748 -748
package/.claude/skills/contract-testing/schemas/output.json +638 -638
package/.claude/skills/database-testing/evals/database-testing.yaml +968 -968
package/.claude/skills/database-testing/schemas/output.json +1446 -1446
package/.claude/skills/debug-loop/SKILL.md +61 -61
package/.claude/skills/enterprise-integration-testing/SKILL.md +735 -735
package/.claude/skills/enterprise-integration-testing/evals/enterprise-integration-testing.yaml +158 -158
package/.claude/skills/enterprise-integration-testing/schemas/output.json +74 -74
package/.claude/skills/enterprise-integration-testing/scripts/validate-config.json +25 -25
package/.claude/skills/iterative-loop/SKILL.md +371 -371
package/.claude/skills/localization-testing/evals/localization-testing.yaml +544 -544
package/.claude/skills/localization-testing/schemas/output.json +325 -325
package/.claude/skills/middleware-testing-patterns/SKILL.md +798 -798
package/.claude/skills/middleware-testing-patterns/evals/middleware-testing-patterns.yaml +153 -153
package/.claude/skills/middleware-testing-patterns/schemas/output.json +58 -58
package/.claude/skills/middleware-testing-patterns/scripts/validate-config.json +25 -25
package/.claude/skills/mobile-testing/evals/mobile-testing.yaml +537 -537
package/.claude/skills/mobile-testing/schemas/output.json +318 -318
package/.claude/skills/mutation-testing/evals/mutation-testing.yaml +652 -652
package/.claude/skills/mutation-testing/schemas/output.json +707 -707
package/.claude/skills/mutation-testing/test-data/sample-output.json +295 -295
package/.claude/skills/n8n-expression-testing/evals/n8n-expression-testing.yaml +450 -450
package/.claude/skills/n8n-expression-testing/schemas/output.json +369 -369
package/.claude/skills/n8n-integration-testing-patterns/evals/n8n-integration-testing-patterns.yaml +522 -522
package/.claude/skills/n8n-integration-testing-patterns/schemas/output.json +291 -291
package/.claude/skills/n8n-security-testing/evals/n8n-security-testing.yaml +493 -493
package/.claude/skills/n8n-security-testing/schemas/output.json +293 -293
package/.claude/skills/n8n-trigger-testing-strategies/evals/n8n-trigger-testing-strategies.yaml +500 -500
package/.claude/skills/n8n-trigger-testing-strategies/schemas/output.json +295 -295
package/.claude/skills/n8n-workflow-testing-fundamentals/evals/n8n-workflow-testing-fundamentals.yaml +497 -497
package/.claude/skills/n8n-workflow-testing-fundamentals/schemas/output.json +254 -254
package/.claude/skills/observability-testing-patterns/SKILL.md +930 -930
package/.claude/skills/observability-testing-patterns/evals/observability-testing-patterns.yaml +157 -157
package/.claude/skills/observability-testing-patterns/schemas/output.json +58 -58
package/.claude/skills/observability-testing-patterns/scripts/validate-config.json +25 -25
package/.claude/skills/pentest-validation/SKILL.md +268 -268
package/.claude/skills/pentest-validation/evals/pentest-validation.yaml +708 -708
package/.claude/skills/pentest-validation/schemas/output.json +281 -281
package/.claude/skills/performance-analysis/evals/performance-analysis.yaml +144 -144
package/.claude/skills/performance-analysis/schemas/output.json +588 -588
package/.claude/skills/performance-testing/evals/performance-testing.yaml +772 -772
package/.claude/skills/performance-testing/schemas/output.json +1184 -1184
package/.claude/skills/pr-review/SKILL.md +61 -61
package/.claude/skills/qcsd-cicd-swarm/SKILL.md +2206 -2206
package/.claude/skills/qcsd-cicd-swarm/evals/qcsd-cicd-swarm.yaml +211 -211
package/.claude/skills/qcsd-cicd-swarm/schemas/output.json +86 -86
package/.claude/skills/qcsd-cicd-swarm/scripts/validate-config.json +30 -30
package/.claude/skills/qcsd-development-swarm/SKILL.md +2154 -2154
package/.claude/skills/qcsd-development-swarm/evals/qcsd-development-swarm.yaml +162 -162
package/.claude/skills/qcsd-development-swarm/schemas/output.json +72 -72
package/.claude/skills/qcsd-development-swarm/scripts/validate-config.json +25 -25
package/.claude/skills/qcsd-ideation-swarm/evals/qcsd-ideation-swarm.yaml +138 -138
package/.claude/skills/qcsd-ideation-swarm/schemas/output.json +568 -568
package/.claude/skills/qcsd-production-swarm/SKILL.md +2781 -2781
package/.claude/skills/qcsd-production-swarm/evals/qcsd-production-swarm.yaml +246 -246
package/.claude/skills/qcsd-production-swarm/schemas/output.json +505 -505
package/.claude/skills/qcsd-production-swarm/scripts/validate-config.json +25 -25
package/.claude/skills/qe-chaos-resilience/evals/qe-chaos-resilience.yaml +443 -443
package/.claude/skills/qe-chaos-resilience/schemas/output.json +314 -314
package/.claude/skills/qe-code-intelligence/evals/qe-code-intelligence.yaml +459 -459
package/.claude/skills/qe-code-intelligence/schemas/output.json +315 -315
package/.claude/skills/qe-contract-testing/evals/qe-contract-testing.yaml +513 -513
package/.claude/skills/qe-contract-testing/schemas/output.json +295 -295
package/.claude/skills/qe-coverage-analysis/evals/qe-coverage-analysis.yaml +494 -494
package/.claude/skills/qe-coverage-analysis/schemas/output.json +286 -286
package/.claude/skills/qe-defect-intelligence/evals/qe-defect-intelligence.yaml +511 -511
package/.claude/skills/qe-defect-intelligence/schemas/output.json +283 -283
package/.claude/skills/qe-iterative-loop/schemas/output.json +264 -264
package/.claude/skills/qe-learning-optimization/evals/qe-learning-optimization.yaml +144 -144
package/.claude/skills/qe-learning-optimization/schemas/output.json +288 -288
package/.claude/skills/qe-quality-assessment/evals/qe-quality-assessment.yaml +506 -506
package/.claude/skills/qe-quality-assessment/schemas/output.json +550 -550
package/.claude/skills/qe-requirements-validation/evals/qe-requirements-validation.yaml +598 -598
package/.claude/skills/qe-requirements-validation/schemas/output.json +587 -587
package/.claude/skills/qe-security-compliance/evals/qe-security-compliance.yaml +595 -595
package/.claude/skills/qe-security-compliance/schemas/output.json +498 -498
package/.claude/skills/qe-test-execution/evals/qe-test-execution.yaml +607 -607
package/.claude/skills/qe-test-execution/schemas/output.json +529 -529
package/.claude/skills/qe-test-generation/evals/qe-test-generation.yaml +148 -148
package/.claude/skills/qe-test-generation/schemas/output.json +439 -439
package/.claude/skills/qe-visual-accessibility/evals/qe-visual-accessibility.yaml +142 -142
package/.claude/skills/qe-visual-accessibility/schemas/output.json +491 -491
package/.claude/skills/quality-metrics/evals/quality-metrics.yaml +494 -494
package/.claude/skills/quality-metrics/schemas/output.json +403 -403
package/.claude/skills/refactoring-patterns/schemas/output.json +475 -475
package/.claude/skills/regression-testing/evals/regression-testing.yaml +504 -504
package/.claude/skills/regression-testing/schemas/output.json +311 -311
package/.claude/skills/release/SKILL.md +347 -347
package/.claude/skills/risk-based-testing/evals/risk-based-testing.yaml +141 -141
package/.claude/skills/risk-based-testing/schemas/output.json +480 -480
package/.claude/skills/security-testing/evals/security-testing.yaml +789 -789
package/.claude/skills/security-testing/schemas/output.json +879 -879
package/.claude/skills/security-visual-testing/evals/security-visual-testing.yaml +163 -163
package/.claude/skills/security-visual-testing/schemas/output.json +486 -486
package/.claude/skills/sfdipot-product-factors/SKILL.md +239 -239
package/.claude/skills/sherlock-review/schemas/output.json +297 -297
package/.claude/skills/shift-left-testing/evals/shift-left-testing.yaml +145 -145
package/.claude/skills/shift-left-testing/schemas/output.json +459 -459
package/.claude/skills/shift-right-testing/evals/shift-right-testing.yaml +147 -147
package/.claude/skills/shift-right-testing/schemas/output.json +418 -418
package/.claude/skills/skills-manifest.json +1 -1
package/.claude/skills/tdd-london-chicago/schemas/output.json +444 -444
package/.claude/skills/technical-writing/schemas/output.json +268 -268
package/.claude/skills/test-automation-strategy/evals/test-automation-strategy.yaml +148 -148
package/.claude/skills/test-automation-strategy/schemas/output.json +444 -444
package/.claude/skills/test-data-management/evals/test-data-management.yaml +504 -504
package/.claude/skills/test-data-management/schemas/output.json +284 -284
package/.claude/skills/test-design-techniques/evals/test-design-techniques.yaml +142 -142
package/.claude/skills/test-design-techniques/schemas/output.json +295 -295
package/.claude/skills/test-environment-management/schemas/output.json +310 -310
package/.claude/skills/test-idea-rewriting/SKILL.md +229 -229
package/.claude/skills/test-reporting-analytics/evals/test-reporting-analytics.yaml +155 -155
package/.claude/skills/test-reporting-analytics/schemas/output.json +329 -329
package/.claude/skills/testability-scoring/evals/testability-scoring.yaml +814 -814
package/.claude/skills/testability-scoring/resources/templates/config.template.js +84 -84
package/.claude/skills/testability-scoring/schemas/output.json +606 -606
package/.claude/skills/testability-scoring/scripts/generate-html-report.js +1007 -1007
package/.claude/skills/verification-quality/evals/verification-quality.yaml +150 -150
package/.claude/skills/verification-quality/schemas/output.json +432 -432
package/.claude/skills/visual-testing-advanced/evals/visual-testing-advanced.yaml +154 -154
package/.claude/skills/visual-testing-advanced/schemas/output.json +294 -294
package/.claude/skills/wms-testing-patterns/evals/wms-testing-patterns.yaml +165 -165
package/.claude/skills/wms-testing-patterns/schemas/output.json +150 -150
package/.claude/skills/wms-testing-patterns/scripts/validate-config.json +51 -51
package/CHANGELOG.md +14 -0
package/README.md +169 -900
package/assets/agents/v3/helpers/quality-criteria/evidence-classification.md +116 -116
package/assets/agents/v3/helpers/quality-criteria/htsm-categories.md +139 -139
package/assets/governance/constitution.md +202 -202
package/assets/governance/shards/chaos-resilience.shard.md +221 -221
package/assets/governance/shards/code-intelligence.shard.md +178 -178
package/assets/governance/shards/contract-testing.shard.md +206 -206
package/assets/governance/shards/coverage-analysis.shard.md +146 -146
package/assets/governance/shards/defect-intelligence.shard.md +182 -182
package/assets/governance/shards/learning-optimization.shard.md +248 -248
package/assets/governance/shards/quality-assessment.shard.md +165 -165
package/assets/governance/shards/requirements-validation.shard.md +177 -177
package/assets/governance/shards/security-compliance.shard.md +196 -196
package/assets/governance/shards/test-execution.shard.md +156 -156
package/assets/governance/shards/test-generation.shard.md +128 -128
package/assets/governance/shards/visual-accessibility.shard.md +209 -209
package/assets/hooks/cross-phase-memory.yaml +253 -253
package/assets/patterns/adr-051-booster-patterns.json +78 -78
package/assets/patterns/adr-051-embedding-patterns.json +147 -147
package/assets/patterns/adr-051-integration-summary.json +62 -62
package/assets/patterns/adr-051-reasoning-patterns.json +166 -166
package/assets/patterns/adr-051-router-patterns.json +113 -113
package/assets/patterns/index.json +136 -136
package/assets/skills/.validation/README.md +111 -111
package/assets/skills/.validation/examples/chaos-engineering-output.example.json +530 -530
package/assets/skills/.validation/examples/performance-testing-output.example.json +252 -252
package/assets/skills/.validation/examples/security-testing-output.example.json +413 -413
package/assets/skills/.validation/examples/testability-scoring-output.example.json +350 -350
package/assets/skills/.validation/schemas/skill-eval.schema.json +462 -462
package/assets/skills/.validation/schemas/skill-frontmatter.schema.json +341 -341
package/assets/skills/.validation/schemas/skill-output-meta.schema.json +199 -199
package/assets/skills/.validation/schemas/skill-output.template.json +610 -610
package/assets/skills/.validation/skill-validation-mcp-integration.md +250 -250
package/assets/skills/.validation/templates/eval.template.yaml +366 -366
package/assets/skills/.validation/templates/schemas/output.json +145 -145
package/assets/skills/.validation/templates/security-testing-eval.template.yaml +725 -725
package/assets/skills/.validation/templates/skill-frontmatter.example.yaml +225 -225
package/assets/skills/.validation/test-data/invalid-output.json +5 -5
package/assets/skills/.validation/test-data/minimal-output.json +9 -9
package/assets/skills/.validation/test-data/sample-output.json +73 -73
package/assets/skills/a11y-ally/evals/a11y-ally.yaml +376 -376
package/assets/skills/a11y-ally/schemas/output.json +549 -549
package/assets/skills/accessibility-testing/evals/accessibility-testing.yaml +719 -719
package/assets/skills/accessibility-testing/schemas/output.json +776 -776
package/assets/skills/accessibility-testing/test-data/sample-output.json +191 -191
package/assets/skills/agentic-quality-engineering/schemas/output.json +577 -577
package/assets/skills/api-testing-patterns/evals/api-testing-patterns.yaml +696 -696
package/assets/skills/api-testing-patterns/schemas/output.json +845 -845
package/assets/skills/aqe-v2-v3-migration/schemas/output.json +513 -513
package/assets/skills/brutal-honesty-review/schemas/output.json +291 -291
package/assets/skills/bug-reporting-excellence/schemas/output.json +288 -288
package/assets/skills/chaos-engineering-resilience/evals/chaos-engineering-resilience.yaml +761 -761
package/assets/skills/chaos-engineering-resilience/schemas/output.json +1205 -1205
package/assets/skills/cicd-pipeline-qe-orchestrator/evals/cicd-pipeline-qe-orchestrator.yaml +157 -157
package/assets/skills/cicd-pipeline-qe-orchestrator/schemas/output.json +542 -542
package/assets/skills/code-review-quality/schemas/output.json +264 -264
package/assets/skills/compatibility-testing/evals/compatibility-testing.yaml +410 -410
package/assets/skills/compatibility-testing/schemas/output.json +551 -551
package/assets/skills/compliance-testing/evals/compliance-testing.yaml +1107 -1107
package/assets/skills/compliance-testing/schemas/output.json +845 -845
package/assets/skills/consultancy-practices/schemas/output.json +282 -282
package/assets/skills/contract-testing/evals/contract-testing.yaml +748 -748
package/assets/skills/contract-testing/schemas/output.json +638 -638
package/assets/skills/database-testing/evals/database-testing.yaml +968 -968
package/assets/skills/database-testing/schemas/output.json +1446 -1446
package/assets/skills/debug-loop/SKILL.md +61 -61
package/assets/skills/enterprise-integration-testing/SKILL.md +735 -735
package/assets/skills/enterprise-integration-testing/evals/enterprise-integration-testing.yaml +158 -158
package/assets/skills/enterprise-integration-testing/schemas/output.json +74 -74
package/assets/skills/enterprise-integration-testing/scripts/validate-config.json +25 -25
package/assets/skills/localization-testing/evals/localization-testing.yaml +544 -544
package/assets/skills/localization-testing/schemas/output.json +325 -325
package/assets/skills/middleware-testing-patterns/SKILL.md +798 -798
package/assets/skills/middleware-testing-patterns/evals/middleware-testing-patterns.yaml +153 -153
package/assets/skills/middleware-testing-patterns/schemas/output.json +58 -58
package/assets/skills/middleware-testing-patterns/scripts/validate-config.json +25 -25
package/assets/skills/mobile-testing/evals/mobile-testing.yaml +537 -537
package/assets/skills/mobile-testing/schemas/output.json +318 -318
package/assets/skills/mutation-testing/evals/mutation-testing.yaml +652 -652
package/assets/skills/mutation-testing/schemas/output.json +707 -707
package/assets/skills/mutation-testing/test-data/sample-output.json +295 -295
package/assets/skills/n8n-expression-testing/evals/n8n-expression-testing.yaml +450 -450
package/assets/skills/n8n-expression-testing/schemas/output.json +369 -369
package/assets/skills/n8n-integration-testing-patterns/evals/n8n-integration-testing-patterns.yaml +522 -522
package/assets/skills/n8n-integration-testing-patterns/schemas/output.json +291 -291
package/assets/skills/n8n-security-testing/evals/n8n-security-testing.yaml +493 -493
package/assets/skills/n8n-security-testing/schemas/output.json +293 -293
package/assets/skills/n8n-trigger-testing-strategies/evals/n8n-trigger-testing-strategies.yaml +500 -500
package/assets/skills/n8n-trigger-testing-strategies/schemas/output.json +295 -295
package/assets/skills/n8n-workflow-testing-fundamentals/evals/n8n-workflow-testing-fundamentals.yaml +497 -497
package/assets/skills/n8n-workflow-testing-fundamentals/schemas/output.json +254 -254
package/assets/skills/observability-testing-patterns/SKILL.md +930 -930
package/assets/skills/observability-testing-patterns/evals/observability-testing-patterns.yaml +157 -157
package/assets/skills/observability-testing-patterns/schemas/output.json +58 -58
package/assets/skills/observability-testing-patterns/scripts/validate-config.json +25 -25
package/assets/skills/pentest-validation/SKILL.md +268 -268
package/assets/skills/pentest-validation/evals/pentest-validation.yaml +708 -708
package/assets/skills/pentest-validation/schemas/output.json +281 -281
package/assets/skills/performance-testing/evals/performance-testing.yaml +772 -772
package/assets/skills/performance-testing/schemas/output.json +1184 -1184
package/assets/skills/pr-review/SKILL.md +61 -61
package/assets/skills/qcsd-cicd-swarm/SKILL.md +2206 -2206
package/assets/skills/qcsd-cicd-swarm/evals/qcsd-cicd-swarm.yaml +211 -211
package/assets/skills/qcsd-cicd-swarm/schemas/output.json +86 -86
package/assets/skills/qcsd-cicd-swarm/scripts/validate-config.json +30 -30
package/assets/skills/qcsd-development-swarm/SKILL.md +2154 -2154
package/assets/skills/qcsd-development-swarm/evals/qcsd-development-swarm.yaml +162 -162
package/assets/skills/qcsd-development-swarm/schemas/output.json +72 -72
package/assets/skills/qcsd-development-swarm/scripts/validate-config.json +25 -25
package/assets/skills/qcsd-ideation-swarm/evals/qcsd-ideation-swarm.yaml +138 -138
package/assets/skills/qcsd-ideation-swarm/schemas/output.json +568 -568
package/assets/skills/qcsd-production-swarm/SKILL.md +2781 -2781
package/assets/skills/qcsd-production-swarm/evals/qcsd-production-swarm.yaml +246 -246
package/assets/skills/qcsd-production-swarm/schemas/output.json +505 -505
package/assets/skills/qcsd-production-swarm/scripts/validate-config.json +25 -25
package/assets/skills/qe-chaos-resilience/evals/qe-chaos-resilience.yaml +443 -443
package/assets/skills/qe-chaos-resilience/schemas/output.json +314 -314
package/assets/skills/qe-code-intelligence/evals/qe-code-intelligence.yaml +459 -459
package/assets/skills/qe-code-intelligence/schemas/output.json +315 -315
package/assets/skills/qe-contract-testing/evals/qe-contract-testing.yaml +513 -513
package/assets/skills/qe-contract-testing/schemas/output.json +295 -295
package/assets/skills/qe-coverage-analysis/evals/qe-coverage-analysis.yaml +494 -494
package/assets/skills/qe-coverage-analysis/schemas/output.json +286 -286
package/assets/skills/qe-defect-intelligence/evals/qe-defect-intelligence.yaml +511 -511
package/assets/skills/qe-defect-intelligence/schemas/output.json +283 -283
package/assets/skills/qe-iterative-loop/schemas/output.json +264 -264
package/assets/skills/qe-learning-optimization/evals/qe-learning-optimization.yaml +144 -144
package/assets/skills/qe-learning-optimization/schemas/output.json +288 -288
package/assets/skills/qe-quality-assessment/evals/qe-quality-assessment.yaml +506 -506
package/assets/skills/qe-quality-assessment/schemas/output.json +550 -550
package/assets/skills/qe-requirements-validation/evals/qe-requirements-validation.yaml +598 -598
package/assets/skills/qe-requirements-validation/schemas/output.json +587 -587
package/assets/skills/qe-security-compliance/evals/qe-security-compliance.yaml +595 -595
package/assets/skills/qe-security-compliance/schemas/output.json +498 -498
package/assets/skills/qe-test-execution/evals/qe-test-execution.yaml +607 -607
package/assets/skills/qe-test-execution/schemas/output.json +529 -529
package/assets/skills/qe-test-generation/evals/qe-test-generation.yaml +148 -148
package/assets/skills/qe-test-generation/schemas/output.json +439 -439
package/assets/skills/qe-visual-accessibility/evals/qe-visual-accessibility.yaml +142 -142
package/assets/skills/qe-visual-accessibility/schemas/output.json +491 -491
package/assets/skills/quality-metrics/evals/quality-metrics.yaml +494 -494
package/assets/skills/quality-metrics/schemas/output.json +403 -403
package/assets/skills/refactoring-patterns/schemas/output.json +475 -475
package/assets/skills/regression-testing/evals/regression-testing.yaml +504 -504
package/assets/skills/regression-testing/schemas/output.json +311 -311
package/assets/skills/risk-based-testing/evals/risk-based-testing.yaml +141 -141
package/assets/skills/risk-based-testing/schemas/output.json +480 -480
package/assets/skills/security-testing/evals/security-testing.yaml +789 -789
package/assets/skills/security-testing/schemas/output.json +879 -879
package/assets/skills/security-visual-testing/evals/security-visual-testing.yaml +163 -163
package/assets/skills/security-visual-testing/schemas/output.json +486 -486
package/assets/skills/sfdipot-product-factors/SKILL.md +239 -239
package/assets/skills/sherlock-review/schemas/output.json +297 -297
package/assets/skills/shift-left-testing/evals/shift-left-testing.yaml +145 -145
package/assets/skills/shift-left-testing/schemas/output.json +459 -459
package/assets/skills/shift-right-testing/evals/shift-right-testing.yaml +147 -147
package/assets/skills/shift-right-testing/schemas/output.json +418 -418
package/assets/skills/tdd-london-chicago/schemas/output.json +444 -444
package/assets/skills/technical-writing/schemas/output.json +268 -268
package/assets/skills/test-automation-strategy/evals/test-automation-strategy.yaml +148 -148
package/assets/skills/test-automation-strategy/schemas/output.json +444 -444
package/assets/skills/test-data-management/evals/test-data-management.yaml +504 -504
package/assets/skills/test-data-management/schemas/output.json +284 -284
package/assets/skills/test-design-techniques/evals/test-design-techniques.yaml +142 -142
package/assets/skills/test-design-techniques/schemas/output.json +295 -295
package/assets/skills/test-environment-management/schemas/output.json +310 -310
package/assets/skills/test-idea-rewriting/SKILL.md +229 -229
package/assets/skills/test-reporting-analytics/evals/test-reporting-analytics.yaml +155 -155
package/assets/skills/test-reporting-analytics/schemas/output.json +329 -329
package/assets/skills/testability-scoring/evals/testability-scoring.yaml +814 -814
package/assets/skills/testability-scoring/resources/templates/config.template.js +84 -84
package/assets/skills/testability-scoring/schemas/output.json +606 -606
package/assets/skills/testability-scoring/scripts/generate-html-report.js +1007 -1007
package/assets/skills/verification-quality/evals/verification-quality.yaml +150 -150
package/assets/skills/verification-quality/schemas/output.json +432 -432
package/assets/skills/visual-testing-advanced/evals/visual-testing-advanced.yaml +154 -154
package/assets/skills/visual-testing-advanced/schemas/output.json +294 -294
package/assets/skills/wms-testing-patterns/evals/wms-testing-patterns.yaml +165 -165
package/assets/skills/wms-testing-patterns/schemas/output.json +150 -150
package/assets/skills/wms-testing-patterns/scripts/validate-config.json +51 -51
package/assets/templates/validation-summary.json +56 -56
package/dist/cli/bundle.js +54 -31
package/dist/cli/commands/mcp.d.ts.map +1 -1
package/dist/cli/commands/mcp.js +11 -9
package/dist/cli/commands/mcp.js.map +1 -1
package/dist/init/phases/10-workers.js +2 -2
package/dist/init/phases/10-workers.js.map +1 -1
package/dist/mcp/bundle.js +42 -19
package/dist/shared/language-detector.js +1 -1
package/dist/shared/language-detector.js.map +1 -1
package/dist/shared/parsers/multi-language-parser.d.ts.map +1 -1
package/dist/shared/parsers/multi-language-parser.js +55 -16
package/dist/shared/parsers/multi-language-parser.js.map +1 -1
package/package.json +1 -1
package/scripts/prepare-assets.sh +8 -0

package/.claude/skills/qe-defect-intelligence/evals/qe-defect-intelligence.yaml CHANGED Viewed

@@ -1,511 +1,511 @@
-# =============================================================================
-# AQE Skill Evaluation Test Suite: QE Defect Intelligence v1.0.0
-# =============================================================================
-#
-# Comprehensive evaluation suite for the qe-defect-intelligence skill.
-# Tests ML-based defect prediction, pattern learning from historical data,
-# root cause analysis, and proactive quality management.
-#
-# Schema: .claude/skills/.validation/schemas/skill-eval.schema.json
-# Validator: .claude/skills/qe-defect-intelligence/scripts/validate-config.json
-#
-# Coverage:
-# - Change-based defect prediction
-# - Pattern learning from defect history
-# - Root cause analysis (5-whys, fishbone, fault tree)
-# - Failure pattern detection
-# - Risk scoring and prioritization
-#
-# =============================================================================
-skill: qe-defect-intelligence
-version: 1.0.0
-description: >
-  Comprehensive evaluation suite for the qe-defect-intelligence skill.
-  Tests AI-powered defect prediction, pattern learning from historical data,
-  root cause analysis using multiple methodologies, failure pattern detection,
-  and proactive quality management with risk scoring.
-# =============================================================================
-# Multi-Model Configuration
-# =============================================================================
-models_to_test:
-  - claude-3.5-sonnet
-  - claude-3-haiku
-# =============================================================================
-# MCP Integration Configuration
-# =============================================================================
-mcp_integration:
-  enabled: true
-  namespace: skill-validation
-  query_patterns: true
-  track_outcomes: true
-  store_patterns: true
-  share_learning: true
-  update_quality_gate: true
-  target_agents:
-    - qe-learning-coordinator
-    - qe-queen-coordinator
-    - qe-defect-predictor
-    - qe-root-cause-analyzer
-# =============================================================================
-# ReasoningBank Learning Configuration
-# =============================================================================
-learning:
-  store_success_patterns: true
-  store_failure_patterns: true
-  pattern_ttl_days: 90
-  min_confidence_to_store: 0.7
-  cross_model_comparison: true
-# =============================================================================
-# Result Format Configuration
-# =============================================================================
-result_format:
-  json_output: true
-  markdown_report: true
-  include_raw_output: false
-  include_timing: true
-  include_token_usage: true
-# =============================================================================
-# Environment Setup
-# =============================================================================
-setup:
-  required_tools:
-    - jq
-  environment_variables:
-    DEFECT_PREDICTION_MODEL: "ml"
-    PATTERN_LEARNING_ENABLED: "true"
-    RCA_DEPTH: "5"
-  fixtures: []
-# =============================================================================
-# TEST CASES
-# =============================================================================
-test_cases:
-  # ---------------------------------------------------------------------------
-  # CATEGORY: Defect Prediction
-  # ---------------------------------------------------------------------------
-  - id: tc001_change_based_defect_prediction
-    description: "Predict defect likelihood from code changes"
-    category: prediction
-    priority: critical
-    input:
-      prompt: |
-        Predict defects in PR #456 changes using:
-        1. Code churn (weight: 0.2) - how much code changed
-        2. Complexity (weight: 0.25) - cyclomatic complexity
-        3. Author experience (weight: 0.15) - familiar with module?
-        4. File history (weight: 0.2) - past defects in file
-        5. Test coverage gaps (weight: 0.2) - uncovered changes
-        For each high-risk change, assign risk score 0-1.
-        Which would you flag for extra review?
-      context:
-        pr_number: 456
-        factors: "all"
-        threshold_high: 0.7
-        threshold_medium: 0.4
-    expected_output:
-      must_contain:
-        - "defect"
-        - "predict"
-        - "risk"
-        - "score"
-        - "churn"
-        - "complexity"
-      must_not_contain:
-        - "certain"
-        - "will fail"
-      severity_classification: critical
-      finding_count:
-        min: 1
-    validation:
-      schema_check: true
-      keyword_match_threshold: 0.8
-      reasoning_quality_min: 0.75
-  - id: tc002_defect_risk_scoring
-    description: "Score defect risk across multiple factors"
-    category: prediction
-    priority: critical
-    input:
-      prompt: |
-        Score defect risk for modified PaymentService:
-        - Complexity: cyclomatic 18 (high: > 10)
-        - Change frequency: modified 8 times in 90 days (high)
-        - Bug history: 3 bugs in file past 180 days (concerning)
-        - Test coverage: 65% (below 85% target)
-        - Author experience: first-time modifier (unfamiliar)
-        Calculate overall risk score and recommend actions.
-      context:
-        factors_detailed: true
-        recommendations: true
-    expected_output:
-      must_contain:
-        - "risk"
-        - "score"
-        - "high"
-        - "complexity"
-        - "coverage"
-        - "recommend"
-      must_not_contain:
-        - "low risk"
-        - "unlikely"
-      severity_classification: critical
-    validation:
-      schema_check: true
-      keyword_match_threshold: 0.8
-  # ---------------------------------------------------------------------------
-  # CATEGORY: Pattern Learning
-  # ---------------------------------------------------------------------------
-  - id: tc003_defect_pattern_learning
-    description: "Learn patterns from historical defect data"
-    category: patterns
-    priority: critical
-    input:
-      prompt: |
-        Learn patterns from past 6 months of defects:
-        1. Code-smell-to-defect correlation (e.g., long methods)
-        2. Change coupling patterns (e.g., changes to A, B, C together)
-        3. Test gap correlation (files with < 60% coverage)
-        4. Complexity defect density (high complexity -> more bugs)
-        5. File age patterns (older files more stable)
-        What patterns would reduce future defects?
-      context:
-        defects: "jira:past-6-months"
-        patterns: "all"
-        output: "rules_and_recommendations"
-    expected_output:
-      must_contain:
-        - "pattern"
-        - "learn"
-        - "correlation"
-        - "defect"
-        - "rule"
-      must_not_contain:
-        - "no patterns"
-        - "random"
-      severity_classification: critical
-    validation:
-      schema_check: true
-      keyword_match_threshold: 0.8
-      reasoning_quality_min: 0.75
-  - id: tc004_similar_failure_detection
-    description: "Find similar failures in history to predict patterns"
-    category: patterns
-    priority: high
-    input:
-      prompt: |
-        Test failure: "AuthService.login() timeout in production"
-        Search history for:
-        1. Same module failures
-        2. Same error type (timeout)
-        3. Same time window (peak traffic hours)
-        4. Same root causes
-        5. Resolutions that worked
-        How would you help prevent recurrence?
-      context:
-        failure_analysis: true
-        history_window: "90d"
-    expected_output:
-      must_contain:
-        - "similar"
-        - "failure"
-        - "pattern"
-        - "history"
-        - "root cause"
-      finding_count:
-        min: 1
-    validation:
-      schema_check: true
-      keyword_match_threshold: 0.75
-  # ---------------------------------------------------------------------------
-  # CATEGORY: Root Cause Analysis
-  # ---------------------------------------------------------------------------
-  - id: tc005_five_whys_analysis
-    description: "Perform 5-whys root cause analysis"
-    category: rca
-    priority: critical
-    input:
-      prompt: |
-        Apply 5-whys for test failure:
-        "UserService.getById() returns null for valid ID"
-        1. Why does it return null?
-           - Because query returns no rows
-        2. Why does query return no rows?
-           - Because ID was not saved to database
-        3. Why was ID not saved?
-           - Because transaction rolled back
-        4. Why did transaction rollback?
-           - Because timeout on DB connection
-        5. Why is timeout occurring?
-           - Because connection pool exhausted
-           ROOT CAUSE: Connection pool misconfiguration
-        What's the fix?
-      context:
-        method: "five-whys"
-        depth: 5
-    expected_output:
-      must_contain:
-        - "why"
-        - "root cause"
-        - "transaction"
-        - "fix"
-        - "connection"
-      must_not_contain:
-        - "unclear"
-        - "unknown"
-      severity_classification: critical
-    validation:
-      schema_check: true
-      keyword_match_threshold: 0.8
-      reasoning_quality_min: 0.75
-  - id: tc006_fishbone_diagram_analysis
-    description: "Use fishbone (Ishikawa) analysis for RCA"
-    category: rca
-    priority: high
-    input:
-      prompt: |
-        Organize RCA using fishbone with categories:
-        - PEOPLE: Lack of training, new team member
-        - PROCESS: Missing validation, no error handling
-        - TOOLS: Outdated logger, missing monitoring
-        - ENVIRONMENT: Wrong config, insufficient resources
-        - MATERIALS: Bad test data, missing mocks
-        - MEASUREMENT: No metrics for this code path
-        For test failures in authentication, what causes in each category?
-      context:
-        categories: ["people", "process", "tools", "environment", "materials", "measurement"]
-        problem: "authentication_failures"
-    expected_output:
-      must_contain:
-        - "fishbone"
-        - "people"
-        - "process"
-        - "tools"
-        - "environment"
-      finding_count:
-        min: 1
-    validation:
-      schema_check: true
-      keyword_match_threshold: 0.75
-  - id: tc007_fault_tree_analysis
-    description: "Build fault tree for system failures"
-    category: rca
-    priority: high
-    input:
-      prompt: |
-        Build fault tree for "Login Service Unavailable":
-        Top Event: Login Service Unavailable
-        Intermediate Events:
-        - Database Down OR
-        - API Timeout OR
-        - Authentication Failed
-        Basic Events:
-        - DB connection lost, DB queries slow
-        - Network latency, service crashed
-        - Invalid credentials, expired token
-        How would you use this to prevent failures?
-      context:
-        top_event: "login_unavailable"
-        gate_types: ["AND", "OR", "NOT"]
-    expected_output:
-      must_contain:
-        - "fault tree"
-        - "event"
-        - "basic"
-        - "gate"
-        - "prevent"
-      severity_classification: high
-    validation:
-      schema_check: true
-      keyword_match_threshold: 0.75
-  # ---------------------------------------------------------------------------
-  # CATEGORY: Failure Pattern Recognition
-  # ---------------------------------------------------------------------------
-  - id: tc008_flaky_test_pattern_detection
-    description: "Identify patterns in flaky test failures"
-    category: patterns
-    priority: high
-    input:
-      prompt: |
-        Analyze flaky test: "UserService.getById() flakes 15% of time"
-        Patterns to investigate:
-        1. Time-based: Fails at night? During peak load?
-        2. Data-based: Fails with certain test data?
-        3. Resource-based: Fails when CPU > 80%?
-        4. External service: Fails when API times out?
-        5. Concurrency: Fails in parallel execution?
-        How would you stabilize this test?
-      context:
-        flaky_test: "UserService.getById()"
-        failure_rate: 0.15
-    expected_output:
-      must_contain:
-        - "pattern"
-        - "flaky"
-        - "investigate"
-        - "stabilize"
-        - "correlation"
-      finding_count:
-        min: 1
-    validation:
-      schema_check: true
-      keyword_match_threshold: 0.75
-  - id: tc009_regression_pattern_analysis
-    description: "Identify patterns in regression failures"
-    category: patterns
-    priority: high
-    input:
-      prompt: |
-        Analyze regression: "Checkout flow broke after authentication refactor"
-        Questions:
-        1. Which checkout modules depend on auth?
-        2. What changed in auth API?
-        3. Are there version mismatches?
-        4. Were integration tests skipped?
-        5. Was there compatibility testing?
-        How would you have caught this earlier?
-      context:
-        regression_type: "integration"
-        trigger_change: "auth_refactor"
-    expected_output:
-      must_contain:
-        - "regression"
-        - "pattern"
-        - "dependencies"
-        - "integration"
-        - "compatibility"
-      severity_classification: high
-    validation:
-      schema_check: true
-      keyword_match_threshold: 0.75
-  # ---------------------------------------------------------------------------
-  # CATEGORY: Negative Tests
-  # ---------------------------------------------------------------------------
-  - id: tc010_defect_prevention_strategy
-    description: "Design strategy to prevent predicted defects"
-    category: prevention
-    priority: high
-    input:
-      prompt: |
-        For high-risk changes, recommend:
-        1. Additional code review checkpoints
-        2. Extra testing (unit, integration, e2e)
-        3. Staging environment validation
-        4. Monitoring/alerting plan
-        5. Rollback strategy
-        6. Documentation updates
-        How would you implement this in CI/CD?
-      context:
-        high_risk_detected: true
-        prevention_focus: true
-    expected_output:
-      must_contain:
-        - "prevent"
-        - "review"
-        - "test"
-        - "monitor"
-        - "strategy"
-      finding_count:
-        min: 1
-    validation:
-      schema_check: true
-      allow_partial: true
-# =============================================================================
-# SUCCESS CRITERIA
-# =============================================================================
-success_criteria:
-  pass_rate: 0.8
-  critical_pass_rate: 1.0
-  avg_reasoning_quality: 0.75
-  max_execution_time_ms: 300000
-  cross_model_variance: 0.15
-# =============================================================================
-# METADATA
-# =============================================================================
-metadata:
-  author: "qe-defect-predictor"
-  created: "2026-02-02"
-  last_updated: "2026-02-02"
-  coverage_target: >
-    Change-based defect prediction with multi-factor risk scoring,
-    pattern learning from historical defect data, root cause analysis
-    using 5-whys/fishbone/fault-tree methods, failure pattern detection,
-    flaky test and regression analysis, and comprehensive defect prevention
-    strategies integrated into CI/CD.
+# =============================================================================
+# AQE Skill Evaluation Test Suite: QE Defect Intelligence v1.0.0
+# =============================================================================
+#
+# Comprehensive evaluation suite for the qe-defect-intelligence skill.
+# Tests ML-based defect prediction, pattern learning from historical data,
+# root cause analysis, and proactive quality management.
+#
+# Schema: .claude/skills/.validation/schemas/skill-eval.schema.json
+# Validator: .claude/skills/qe-defect-intelligence/scripts/validate-config.json
+#
+# Coverage:
+# - Change-based defect prediction
+# - Pattern learning from defect history
+# - Root cause analysis (5-whys, fishbone, fault tree)
+# - Failure pattern detection
+# - Risk scoring and prioritization
+#
+# =============================================================================
+skill: qe-defect-intelligence
+version: 1.0.0
+description: >
+  Comprehensive evaluation suite for the qe-defect-intelligence skill.
+  Tests AI-powered defect prediction, pattern learning from historical data,
+  root cause analysis using multiple methodologies, failure pattern detection,
+  and proactive quality management with risk scoring.
+# =============================================================================
+# Multi-Model Configuration
+# =============================================================================
+models_to_test:
+  - claude-3.5-sonnet
+  - claude-3-haiku
+# =============================================================================
+# MCP Integration Configuration
+# =============================================================================
+mcp_integration:
+  enabled: true
+  namespace: skill-validation
+  query_patterns: true
+  track_outcomes: true
+  store_patterns: true
+  share_learning: true
+  update_quality_gate: true
+  target_agents:
+    - qe-learning-coordinator
+    - qe-queen-coordinator
+    - qe-defect-predictor
+    - qe-root-cause-analyzer
+# =============================================================================
+# ReasoningBank Learning Configuration
+# =============================================================================
+learning:
+  store_success_patterns: true
+  store_failure_patterns: true
+  pattern_ttl_days: 90
+  min_confidence_to_store: 0.7
+  cross_model_comparison: true
+# =============================================================================
+# Result Format Configuration
+# =============================================================================
+result_format:
+  json_output: true
+  markdown_report: true
+  include_raw_output: false
+  include_timing: true
+  include_token_usage: true
+# =============================================================================
+# Environment Setup
+# =============================================================================
+setup:
+  required_tools:
+    - jq
+  environment_variables:
+    DEFECT_PREDICTION_MODEL: "ml"
+    PATTERN_LEARNING_ENABLED: "true"
+    RCA_DEPTH: "5"
+  fixtures: []
+# =============================================================================
+# TEST CASES
+# =============================================================================
+test_cases:
+  # ---------------------------------------------------------------------------
+  # CATEGORY: Defect Prediction
+  # ---------------------------------------------------------------------------
+  - id: tc001_change_based_defect_prediction
+    description: "Predict defect likelihood from code changes"
+    category: prediction
+    priority: critical
+    input:
+      prompt: |
+        Predict defects in PR #456 changes using:
+        1. Code churn (weight: 0.2) - how much code changed
+        2. Complexity (weight: 0.25) - cyclomatic complexity
+        3. Author experience (weight: 0.15) - familiar with module?
+        4. File history (weight: 0.2) - past defects in file
+        5. Test coverage gaps (weight: 0.2) - uncovered changes
+        For each high-risk change, assign risk score 0-1.
+        Which would you flag for extra review?
+      context:
+        pr_number: 456
+        factors: "all"
+        threshold_high: 0.7
+        threshold_medium: 0.4
+    expected_output:
+      must_contain:
+        - "defect"
+        - "predict"
+        - "risk"
+        - "score"
+        - "churn"
+        - "complexity"
+      must_not_contain:
+        - "certain"
+        - "will fail"
+      severity_classification: critical
+      finding_count:
+        min: 1
+    validation:
+      schema_check: true
+      keyword_match_threshold: 0.8
+      reasoning_quality_min: 0.75
+  - id: tc002_defect_risk_scoring
+    description: "Score defect risk across multiple factors"
+    category: prediction
+    priority: critical
+    input:
+      prompt: |
+        Score defect risk for modified PaymentService:
+        - Complexity: cyclomatic 18 (high: > 10)
+        - Change frequency: modified 8 times in 90 days (high)
+        - Bug history: 3 bugs in file past 180 days (concerning)
+        - Test coverage: 65% (below 85% target)
+        - Author experience: first-time modifier (unfamiliar)
+        Calculate overall risk score and recommend actions.
+      context:
+        factors_detailed: true
+        recommendations: true
+    expected_output:
+      must_contain:
+        - "risk"
+        - "score"
+        - "high"
+        - "complexity"
+        - "coverage"
+        - "recommend"
+      must_not_contain:
+        - "low risk"
+        - "unlikely"
+      severity_classification: critical
+    validation:
+      schema_check: true
+      keyword_match_threshold: 0.8
+  # ---------------------------------------------------------------------------
+  # CATEGORY: Pattern Learning
+  # ---------------------------------------------------------------------------
+  - id: tc003_defect_pattern_learning
+    description: "Learn patterns from historical defect data"
+    category: patterns
+    priority: critical
+    input:
+      prompt: |
+        Learn patterns from past 6 months of defects:
+        1. Code-smell-to-defect correlation (e.g., long methods)
+        2. Change coupling patterns (e.g., changes to A, B, C together)
+        3. Test gap correlation (files with < 60% coverage)
+        4. Complexity defect density (high complexity -> more bugs)
+        5. File age patterns (older files more stable)
+        What patterns would reduce future defects?
+      context:
+        defects: "jira:past-6-months"
+        patterns: "all"
+        output: "rules_and_recommendations"
+    expected_output:
+      must_contain:
+        - "pattern"
+        - "learn"
+        - "correlation"
+        - "defect"
+        - "rule"
+      must_not_contain:
+        - "no patterns"
+        - "random"
+      severity_classification: critical
+    validation:
+      schema_check: true
+      keyword_match_threshold: 0.8
+      reasoning_quality_min: 0.75
+  - id: tc004_similar_failure_detection
+    description: "Find similar failures in history to predict patterns"
+    category: patterns
+    priority: high
+    input:
+      prompt: |
+        Test failure: "AuthService.login() timeout in production"
+        Search history for:
+        1. Same module failures
+        2. Same error type (timeout)
+        3. Same time window (peak traffic hours)
+        4. Same root causes
+        5. Resolutions that worked
+        How would you help prevent recurrence?
+      context:
+        failure_analysis: true
+        history_window: "90d"
+    expected_output:
+      must_contain:
+        - "similar"
+        - "failure"
+        - "pattern"
+        - "history"
+        - "root cause"
+      finding_count:
+        min: 1
+    validation:
+      schema_check: true
+      keyword_match_threshold: 0.75
+  # ---------------------------------------------------------------------------
+  # CATEGORY: Root Cause Analysis
+  # ---------------------------------------------------------------------------
+  - id: tc005_five_whys_analysis
+    description: "Perform 5-whys root cause analysis"
+    category: rca
+    priority: critical
+    input:
+      prompt: |
+        Apply 5-whys for test failure:
+        "UserService.getById() returns null for valid ID"
+        1. Why does it return null?
+           - Because query returns no rows
+        2. Why does query return no rows?
+           - Because ID was not saved to database
+        3. Why was ID not saved?
+           - Because transaction rolled back
+        4. Why did transaction rollback?
+           - Because timeout on DB connection
+        5. Why is timeout occurring?
+           - Because connection pool exhausted
+           ROOT CAUSE: Connection pool misconfiguration
+        What's the fix?
+      context:
+        method: "five-whys"
+        depth: 5
+    expected_output:
+      must_contain:
+        - "why"
+        - "root cause"
+        - "transaction"
+        - "fix"
+        - "connection"
+      must_not_contain:
+        - "unclear"
+        - "unknown"
+      severity_classification: critical
+    validation:
+      schema_check: true
+      keyword_match_threshold: 0.8
+      reasoning_quality_min: 0.75
+  - id: tc006_fishbone_diagram_analysis
+    description: "Use fishbone (Ishikawa) analysis for RCA"
+    category: rca
+    priority: high
+    input:
+      prompt: |
+        Organize RCA using fishbone with categories:
+        - PEOPLE: Lack of training, new team member
+        - PROCESS: Missing validation, no error handling
+        - TOOLS: Outdated logger, missing monitoring
+        - ENVIRONMENT: Wrong config, insufficient resources
+        - MATERIALS: Bad test data, missing mocks
+        - MEASUREMENT: No metrics for this code path
+        For test failures in authentication, what causes in each category?
+      context:
+        categories: ["people", "process", "tools", "environment", "materials", "measurement"]
+        problem: "authentication_failures"
+    expected_output:
+      must_contain:
+        - "fishbone"
+        - "people"
+        - "process"
+        - "tools"
+        - "environment"
+      finding_count:
+        min: 1
+    validation:
+      schema_check: true
+      keyword_match_threshold: 0.75
+  - id: tc007_fault_tree_analysis
+    description: "Build fault tree for system failures"
+    category: rca
+    priority: high
+    input:
+      prompt: |
+        Build fault tree for "Login Service Unavailable":
+        Top Event: Login Service Unavailable
+        Intermediate Events:
+        - Database Down OR
+        - API Timeout OR
+        - Authentication Failed
+        Basic Events:
+        - DB connection lost, DB queries slow
+        - Network latency, service crashed
+        - Invalid credentials, expired token
+        How would you use this to prevent failures?
+      context:
+        top_event: "login_unavailable"
+        gate_types: ["AND", "OR", "NOT"]
+    expected_output:
+      must_contain:
+        - "fault tree"
+        - "event"
+        - "basic"
+        - "gate"
+        - "prevent"
+      severity_classification: high
+    validation:
+      schema_check: true
+      keyword_match_threshold: 0.75
+  # ---------------------------------------------------------------------------
+  # CATEGORY: Failure Pattern Recognition
+  # ---------------------------------------------------------------------------
+  - id: tc008_flaky_test_pattern_detection
+    description: "Identify patterns in flaky test failures"
+    category: patterns
+    priority: high
+    input:
+      prompt: |
+        Analyze flaky test: "UserService.getById() flakes 15% of time"
+        Patterns to investigate:
+        1. Time-based: Fails at night? During peak load?
+        2. Data-based: Fails with certain test data?
+        3. Resource-based: Fails when CPU > 80%?
+        4. External service: Fails when API times out?
+        5. Concurrency: Fails in parallel execution?
+        How would you stabilize this test?
+      context:
+        flaky_test: "UserService.getById()"
+        failure_rate: 0.15
+    expected_output:
+      must_contain:
+        - "pattern"
+        - "flaky"
+        - "investigate"
+        - "stabilize"
+        - "correlation"
+      finding_count:
+        min: 1
+    validation:
+      schema_check: true
+      keyword_match_threshold: 0.75
+  - id: tc009_regression_pattern_analysis
+    description: "Identify patterns in regression failures"
+    category: patterns
+    priority: high
+    input:
+      prompt: |
+        Analyze regression: "Checkout flow broke after authentication refactor"
+        Questions:
+        1. Which checkout modules depend on auth?
+        2. What changed in auth API?
+        3. Are there version mismatches?
+        4. Were integration tests skipped?
+        5. Was there compatibility testing?
+        How would you have caught this earlier?
+      context:
+        regression_type: "integration"
+        trigger_change: "auth_refactor"
+    expected_output:
+      must_contain:
+        - "regression"
+        - "pattern"
+        - "dependencies"
+        - "integration"
+        - "compatibility"
+      severity_classification: high
+    validation:
+      schema_check: true
+      keyword_match_threshold: 0.75
+  # ---------------------------------------------------------------------------
+  # CATEGORY: Negative Tests
+  # ---------------------------------------------------------------------------
+  - id: tc010_defect_prevention_strategy
+    description: "Design strategy to prevent predicted defects"
+    category: prevention
+    priority: high
+    input:
+      prompt: |
+        For high-risk changes, recommend:
+        1. Additional code review checkpoints
+        2. Extra testing (unit, integration, e2e)
+        3. Staging environment validation
+        4. Monitoring/alerting plan
+        5. Rollback strategy
+        6. Documentation updates
+        How would you implement this in CI/CD?
+      context:
+        high_risk_detected: true
+        prevention_focus: true
+    expected_output:
+      must_contain:
+        - "prevent"
+        - "review"
+        - "test"
+        - "monitor"
+        - "strategy"
+      finding_count:
+        min: 1
+    validation:
+      schema_check: true
+      allow_partial: true
+# =============================================================================
+# SUCCESS CRITERIA
+# =============================================================================
+success_criteria:
+  pass_rate: 0.8
+  critical_pass_rate: 1.0
+  avg_reasoning_quality: 0.75
+  max_execution_time_ms: 300000
+  cross_model_variance: 0.15
+# =============================================================================
+# METADATA
+# =============================================================================
+metadata:
+  author: "qe-defect-predictor"
+  created: "2026-02-02"
+  last_updated: "2026-02-02"
+  coverage_target: >
+    Change-based defect prediction with multi-factor risk scoring,
+    pattern learning from historical defect data, root cause analysis
+    using 5-whys/fishbone/fault-tree methods, failure pattern detection,
+    flaky test and regression analysis, and comprehensive defect prevention
+    strategies integrated into CI/CD.