npm - agentic-qe - Versions diffs - 3.7.9 → 3.7.10 - Mend

agentic-qe 3.7.9 → 3.7.10

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (358) hide show

package/.claude/skills/.validation/README.md +111 -111
package/.claude/skills/.validation/examples/chaos-engineering-output.example.json +530 -530
package/.claude/skills/.validation/examples/performance-testing-output.example.json +252 -252
package/.claude/skills/.validation/examples/security-testing-output.example.json +413 -413
package/.claude/skills/.validation/examples/testability-scoring-output.example.json +350 -350
package/.claude/skills/.validation/schemas/skill-eval.schema.json +462 -462
package/.claude/skills/.validation/schemas/skill-frontmatter.schema.json +341 -341
package/.claude/skills/.validation/schemas/skill-output-meta.schema.json +199 -199
package/.claude/skills/.validation/schemas/skill-output.template.json +610 -610
package/.claude/skills/.validation/skill-validation-mcp-integration.md +250 -250
package/.claude/skills/.validation/templates/eval.template.yaml +366 -366
package/.claude/skills/.validation/templates/schemas/output.json +145 -145
package/.claude/skills/.validation/templates/security-testing-eval.template.yaml +725 -725
package/.claude/skills/.validation/templates/skill-frontmatter.example.yaml +225 -225
package/.claude/skills/.validation/test-data/invalid-output.json +5 -5
package/.claude/skills/.validation/test-data/minimal-output.json +9 -9
package/.claude/skills/.validation/test-data/sample-output.json +73 -73
package/.claude/skills/a11y-ally/evals/a11y-ally.yaml +376 -376
package/.claude/skills/a11y-ally/schemas/output.json +549 -549
package/.claude/skills/accessibility-testing/evals/accessibility-testing.yaml +719 -719
package/.claude/skills/accessibility-testing/schemas/output.json +776 -776
package/.claude/skills/accessibility-testing/test-data/sample-output.json +191 -191
package/.claude/skills/agentic-quality-engineering/schemas/output.json +577 -577
package/.claude/skills/api-testing-patterns/evals/api-testing-patterns.yaml +696 -696
package/.claude/skills/api-testing-patterns/schemas/output.json +845 -845
package/.claude/skills/aqe-v2-v3-migration/schemas/output.json +513 -513
package/.claude/skills/brutal-honesty-review/schemas/output.json +291 -291
package/.claude/skills/bug-reporting-excellence/schemas/output.json +288 -288
package/.claude/skills/chaos-engineering-resilience/evals/chaos-engineering-resilience.yaml +761 -761
package/.claude/skills/chaos-engineering-resilience/schemas/output.json +1205 -1205
package/.claude/skills/cicd-pipeline-qe-orchestrator/evals/cicd-pipeline-qe-orchestrator.yaml +157 -157
package/.claude/skills/cicd-pipeline-qe-orchestrator/schemas/output.json +542 -542
package/.claude/skills/code-review-quality/schemas/output.json +264 -264
package/.claude/skills/compatibility-testing/evals/compatibility-testing.yaml +410 -410
package/.claude/skills/compatibility-testing/schemas/output.json +551 -551
package/.claude/skills/compliance-testing/evals/compliance-testing.yaml +1107 -1107
package/.claude/skills/compliance-testing/schemas/output.json +845 -845
package/.claude/skills/consultancy-practices/schemas/output.json +282 -282
package/.claude/skills/contract-testing/evals/contract-testing.yaml +748 -748
package/.claude/skills/contract-testing/schemas/output.json +638 -638
package/.claude/skills/database-testing/evals/database-testing.yaml +968 -968
package/.claude/skills/database-testing/schemas/output.json +1446 -1446
package/.claude/skills/debug-loop/SKILL.md +61 -61
package/.claude/skills/enterprise-integration-testing/SKILL.md +735 -735
package/.claude/skills/enterprise-integration-testing/evals/enterprise-integration-testing.yaml +158 -158
package/.claude/skills/enterprise-integration-testing/schemas/output.json +74 -74
package/.claude/skills/enterprise-integration-testing/scripts/validate-config.json +25 -25
package/.claude/skills/iterative-loop/SKILL.md +371 -371
package/.claude/skills/localization-testing/evals/localization-testing.yaml +544 -544
package/.claude/skills/localization-testing/schemas/output.json +325 -325
package/.claude/skills/middleware-testing-patterns/SKILL.md +798 -798
package/.claude/skills/middleware-testing-patterns/evals/middleware-testing-patterns.yaml +153 -153
package/.claude/skills/middleware-testing-patterns/schemas/output.json +58 -58
package/.claude/skills/middleware-testing-patterns/scripts/validate-config.json +25 -25
package/.claude/skills/mobile-testing/evals/mobile-testing.yaml +537 -537
package/.claude/skills/mobile-testing/schemas/output.json +318 -318
package/.claude/skills/mutation-testing/evals/mutation-testing.yaml +652 -652
package/.claude/skills/mutation-testing/schemas/output.json +707 -707
package/.claude/skills/mutation-testing/test-data/sample-output.json +295 -295
package/.claude/skills/n8n-expression-testing/evals/n8n-expression-testing.yaml +450 -450
package/.claude/skills/n8n-expression-testing/schemas/output.json +369 -369
package/.claude/skills/n8n-integration-testing-patterns/evals/n8n-integration-testing-patterns.yaml +522 -522
package/.claude/skills/n8n-integration-testing-patterns/schemas/output.json +291 -291
package/.claude/skills/n8n-security-testing/evals/n8n-security-testing.yaml +493 -493
package/.claude/skills/n8n-security-testing/schemas/output.json +293 -293
package/.claude/skills/n8n-trigger-testing-strategies/evals/n8n-trigger-testing-strategies.yaml +500 -500
package/.claude/skills/n8n-trigger-testing-strategies/schemas/output.json +295 -295
package/.claude/skills/n8n-workflow-testing-fundamentals/evals/n8n-workflow-testing-fundamentals.yaml +497 -497
package/.claude/skills/n8n-workflow-testing-fundamentals/schemas/output.json +254 -254
package/.claude/skills/observability-testing-patterns/SKILL.md +930 -930
package/.claude/skills/observability-testing-patterns/evals/observability-testing-patterns.yaml +157 -157
package/.claude/skills/observability-testing-patterns/schemas/output.json +58 -58
package/.claude/skills/observability-testing-patterns/scripts/validate-config.json +25 -25
package/.claude/skills/pentest-validation/SKILL.md +268 -268
package/.claude/skills/pentest-validation/evals/pentest-validation.yaml +708 -708
package/.claude/skills/pentest-validation/schemas/output.json +281 -281
package/.claude/skills/performance-analysis/evals/performance-analysis.yaml +144 -144
package/.claude/skills/performance-analysis/schemas/output.json +588 -588
package/.claude/skills/performance-testing/evals/performance-testing.yaml +772 -772
package/.claude/skills/performance-testing/schemas/output.json +1184 -1184
package/.claude/skills/pr-review/SKILL.md +61 -61
package/.claude/skills/qcsd-cicd-swarm/SKILL.md +2206 -2206
package/.claude/skills/qcsd-cicd-swarm/evals/qcsd-cicd-swarm.yaml +211 -211
package/.claude/skills/qcsd-cicd-swarm/schemas/output.json +86 -86
package/.claude/skills/qcsd-cicd-swarm/scripts/validate-config.json +30 -30
package/.claude/skills/qcsd-development-swarm/SKILL.md +2154 -2154
package/.claude/skills/qcsd-development-swarm/evals/qcsd-development-swarm.yaml +162 -162
package/.claude/skills/qcsd-development-swarm/schemas/output.json +72 -72
package/.claude/skills/qcsd-development-swarm/scripts/validate-config.json +25 -25
package/.claude/skills/qcsd-ideation-swarm/evals/qcsd-ideation-swarm.yaml +138 -138
package/.claude/skills/qcsd-ideation-swarm/schemas/output.json +568 -568
package/.claude/skills/qcsd-production-swarm/SKILL.md +2781 -2781
package/.claude/skills/qcsd-production-swarm/evals/qcsd-production-swarm.yaml +246 -246
package/.claude/skills/qcsd-production-swarm/schemas/output.json +505 -505
package/.claude/skills/qcsd-production-swarm/scripts/validate-config.json +25 -25
package/.claude/skills/qe-chaos-resilience/evals/qe-chaos-resilience.yaml +443 -443
package/.claude/skills/qe-chaos-resilience/schemas/output.json +314 -314
package/.claude/skills/qe-code-intelligence/evals/qe-code-intelligence.yaml +459 -459
package/.claude/skills/qe-code-intelligence/schemas/output.json +315 -315
package/.claude/skills/qe-contract-testing/evals/qe-contract-testing.yaml +513 -513
package/.claude/skills/qe-contract-testing/schemas/output.json +295 -295
package/.claude/skills/qe-coverage-analysis/evals/qe-coverage-analysis.yaml +494 -494
package/.claude/skills/qe-coverage-analysis/schemas/output.json +286 -286
package/.claude/skills/qe-defect-intelligence/evals/qe-defect-intelligence.yaml +511 -511
package/.claude/skills/qe-defect-intelligence/schemas/output.json +283 -283
package/.claude/skills/qe-iterative-loop/schemas/output.json +264 -264
package/.claude/skills/qe-learning-optimization/evals/qe-learning-optimization.yaml +144 -144
package/.claude/skills/qe-learning-optimization/schemas/output.json +288 -288
package/.claude/skills/qe-quality-assessment/evals/qe-quality-assessment.yaml +506 -506
package/.claude/skills/qe-quality-assessment/schemas/output.json +550 -550
package/.claude/skills/qe-requirements-validation/evals/qe-requirements-validation.yaml +598 -598
package/.claude/skills/qe-requirements-validation/schemas/output.json +587 -587
package/.claude/skills/qe-security-compliance/evals/qe-security-compliance.yaml +595 -595
package/.claude/skills/qe-security-compliance/schemas/output.json +498 -498
package/.claude/skills/qe-test-execution/evals/qe-test-execution.yaml +607 -607
package/.claude/skills/qe-test-execution/schemas/output.json +529 -529
package/.claude/skills/qe-test-generation/evals/qe-test-generation.yaml +148 -148
package/.claude/skills/qe-test-generation/schemas/output.json +439 -439
package/.claude/skills/qe-visual-accessibility/evals/qe-visual-accessibility.yaml +142 -142
package/.claude/skills/qe-visual-accessibility/schemas/output.json +491 -491
package/.claude/skills/quality-metrics/evals/quality-metrics.yaml +494 -494
package/.claude/skills/quality-metrics/schemas/output.json +403 -403
package/.claude/skills/refactoring-patterns/schemas/output.json +475 -475
package/.claude/skills/regression-testing/evals/regression-testing.yaml +504 -504
package/.claude/skills/regression-testing/schemas/output.json +311 -311
package/.claude/skills/release/SKILL.md +347 -347
package/.claude/skills/risk-based-testing/evals/risk-based-testing.yaml +141 -141
package/.claude/skills/risk-based-testing/schemas/output.json +480 -480
package/.claude/skills/security-testing/evals/security-testing.yaml +789 -789
package/.claude/skills/security-testing/schemas/output.json +879 -879
package/.claude/skills/security-visual-testing/evals/security-visual-testing.yaml +163 -163
package/.claude/skills/security-visual-testing/schemas/output.json +486 -486
package/.claude/skills/sfdipot-product-factors/SKILL.md +239 -239
package/.claude/skills/sherlock-review/schemas/output.json +297 -297
package/.claude/skills/shift-left-testing/evals/shift-left-testing.yaml +145 -145
package/.claude/skills/shift-left-testing/schemas/output.json +459 -459
package/.claude/skills/shift-right-testing/evals/shift-right-testing.yaml +147 -147
package/.claude/skills/shift-right-testing/schemas/output.json +418 -418
package/.claude/skills/skills-manifest.json +1 -1
package/.claude/skills/tdd-london-chicago/schemas/output.json +444 -444
package/.claude/skills/technical-writing/schemas/output.json +268 -268
package/.claude/skills/test-automation-strategy/evals/test-automation-strategy.yaml +148 -148
package/.claude/skills/test-automation-strategy/schemas/output.json +444 -444
package/.claude/skills/test-data-management/evals/test-data-management.yaml +504 -504
package/.claude/skills/test-data-management/schemas/output.json +284 -284
package/.claude/skills/test-design-techniques/evals/test-design-techniques.yaml +142 -142
package/.claude/skills/test-design-techniques/schemas/output.json +295 -295
package/.claude/skills/test-environment-management/schemas/output.json +310 -310
package/.claude/skills/test-idea-rewriting/SKILL.md +229 -229
package/.claude/skills/test-reporting-analytics/evals/test-reporting-analytics.yaml +155 -155
package/.claude/skills/test-reporting-analytics/schemas/output.json +329 -329
package/.claude/skills/testability-scoring/evals/testability-scoring.yaml +814 -814
package/.claude/skills/testability-scoring/resources/templates/config.template.js +84 -84
package/.claude/skills/testability-scoring/schemas/output.json +606 -606
package/.claude/skills/testability-scoring/scripts/generate-html-report.js +1007 -1007
package/.claude/skills/verification-quality/evals/verification-quality.yaml +150 -150
package/.claude/skills/verification-quality/schemas/output.json +432 -432
package/.claude/skills/visual-testing-advanced/evals/visual-testing-advanced.yaml +154 -154
package/.claude/skills/visual-testing-advanced/schemas/output.json +294 -294
package/.claude/skills/wms-testing-patterns/evals/wms-testing-patterns.yaml +165 -165
package/.claude/skills/wms-testing-patterns/schemas/output.json +150 -150
package/.claude/skills/wms-testing-patterns/scripts/validate-config.json +51 -51
package/CHANGELOG.md +14 -0
package/README.md +169 -900
package/assets/agents/v3/helpers/quality-criteria/evidence-classification.md +116 -116
package/assets/agents/v3/helpers/quality-criteria/htsm-categories.md +139 -139
package/assets/governance/constitution.md +202 -202
package/assets/governance/shards/chaos-resilience.shard.md +221 -221
package/assets/governance/shards/code-intelligence.shard.md +178 -178
package/assets/governance/shards/contract-testing.shard.md +206 -206
package/assets/governance/shards/coverage-analysis.shard.md +146 -146
package/assets/governance/shards/defect-intelligence.shard.md +182 -182
package/assets/governance/shards/learning-optimization.shard.md +248 -248
package/assets/governance/shards/quality-assessment.shard.md +165 -165
package/assets/governance/shards/requirements-validation.shard.md +177 -177
package/assets/governance/shards/security-compliance.shard.md +196 -196
package/assets/governance/shards/test-execution.shard.md +156 -156
package/assets/governance/shards/test-generation.shard.md +128 -128
package/assets/governance/shards/visual-accessibility.shard.md +209 -209
package/assets/hooks/cross-phase-memory.yaml +253 -253
package/assets/patterns/adr-051-booster-patterns.json +78 -78
package/assets/patterns/adr-051-embedding-patterns.json +147 -147
package/assets/patterns/adr-051-integration-summary.json +62 -62
package/assets/patterns/adr-051-reasoning-patterns.json +166 -166
package/assets/patterns/adr-051-router-patterns.json +113 -113
package/assets/patterns/index.json +136 -136
package/assets/skills/.validation/README.md +111 -111
package/assets/skills/.validation/examples/chaos-engineering-output.example.json +530 -530
package/assets/skills/.validation/examples/performance-testing-output.example.json +252 -252
package/assets/skills/.validation/examples/security-testing-output.example.json +413 -413
package/assets/skills/.validation/examples/testability-scoring-output.example.json +350 -350
package/assets/skills/.validation/schemas/skill-eval.schema.json +462 -462
package/assets/skills/.validation/schemas/skill-frontmatter.schema.json +341 -341
package/assets/skills/.validation/schemas/skill-output-meta.schema.json +199 -199
package/assets/skills/.validation/schemas/skill-output.template.json +610 -610
package/assets/skills/.validation/skill-validation-mcp-integration.md +250 -250
package/assets/skills/.validation/templates/eval.template.yaml +366 -366
package/assets/skills/.validation/templates/schemas/output.json +145 -145
package/assets/skills/.validation/templates/security-testing-eval.template.yaml +725 -725
package/assets/skills/.validation/templates/skill-frontmatter.example.yaml +225 -225
package/assets/skills/.validation/test-data/invalid-output.json +5 -5
package/assets/skills/.validation/test-data/minimal-output.json +9 -9
package/assets/skills/.validation/test-data/sample-output.json +73 -73
package/assets/skills/a11y-ally/evals/a11y-ally.yaml +376 -376
package/assets/skills/a11y-ally/schemas/output.json +549 -549
package/assets/skills/accessibility-testing/evals/accessibility-testing.yaml +719 -719
package/assets/skills/accessibility-testing/schemas/output.json +776 -776
package/assets/skills/accessibility-testing/test-data/sample-output.json +191 -191
package/assets/skills/agentic-quality-engineering/schemas/output.json +577 -577
package/assets/skills/api-testing-patterns/evals/api-testing-patterns.yaml +696 -696
package/assets/skills/api-testing-patterns/schemas/output.json +845 -845
package/assets/skills/aqe-v2-v3-migration/schemas/output.json +513 -513
package/assets/skills/brutal-honesty-review/schemas/output.json +291 -291
package/assets/skills/bug-reporting-excellence/schemas/output.json +288 -288
package/assets/skills/chaos-engineering-resilience/evals/chaos-engineering-resilience.yaml +761 -761
package/assets/skills/chaos-engineering-resilience/schemas/output.json +1205 -1205
package/assets/skills/cicd-pipeline-qe-orchestrator/evals/cicd-pipeline-qe-orchestrator.yaml +157 -157
package/assets/skills/cicd-pipeline-qe-orchestrator/schemas/output.json +542 -542
package/assets/skills/code-review-quality/schemas/output.json +264 -264
package/assets/skills/compatibility-testing/evals/compatibility-testing.yaml +410 -410
package/assets/skills/compatibility-testing/schemas/output.json +551 -551
package/assets/skills/compliance-testing/evals/compliance-testing.yaml +1107 -1107
package/assets/skills/compliance-testing/schemas/output.json +845 -845
package/assets/skills/consultancy-practices/schemas/output.json +282 -282
package/assets/skills/contract-testing/evals/contract-testing.yaml +748 -748
package/assets/skills/contract-testing/schemas/output.json +638 -638
package/assets/skills/database-testing/evals/database-testing.yaml +968 -968
package/assets/skills/database-testing/schemas/output.json +1446 -1446
package/assets/skills/debug-loop/SKILL.md +61 -61
package/assets/skills/enterprise-integration-testing/SKILL.md +735 -735
package/assets/skills/enterprise-integration-testing/evals/enterprise-integration-testing.yaml +158 -158
package/assets/skills/enterprise-integration-testing/schemas/output.json +74 -74
package/assets/skills/enterprise-integration-testing/scripts/validate-config.json +25 -25
package/assets/skills/localization-testing/evals/localization-testing.yaml +544 -544
package/assets/skills/localization-testing/schemas/output.json +325 -325
package/assets/skills/middleware-testing-patterns/SKILL.md +798 -798
package/assets/skills/middleware-testing-patterns/evals/middleware-testing-patterns.yaml +153 -153
package/assets/skills/middleware-testing-patterns/schemas/output.json +58 -58
package/assets/skills/middleware-testing-patterns/scripts/validate-config.json +25 -25
package/assets/skills/mobile-testing/evals/mobile-testing.yaml +537 -537
package/assets/skills/mobile-testing/schemas/output.json +318 -318
package/assets/skills/mutation-testing/evals/mutation-testing.yaml +652 -652
package/assets/skills/mutation-testing/schemas/output.json +707 -707
package/assets/skills/mutation-testing/test-data/sample-output.json +295 -295
package/assets/skills/n8n-expression-testing/evals/n8n-expression-testing.yaml +450 -450
package/assets/skills/n8n-expression-testing/schemas/output.json +369 -369
package/assets/skills/n8n-integration-testing-patterns/evals/n8n-integration-testing-patterns.yaml +522 -522
package/assets/skills/n8n-integration-testing-patterns/schemas/output.json +291 -291
package/assets/skills/n8n-security-testing/evals/n8n-security-testing.yaml +493 -493
package/assets/skills/n8n-security-testing/schemas/output.json +293 -293
package/assets/skills/n8n-trigger-testing-strategies/evals/n8n-trigger-testing-strategies.yaml +500 -500
package/assets/skills/n8n-trigger-testing-strategies/schemas/output.json +295 -295
package/assets/skills/n8n-workflow-testing-fundamentals/evals/n8n-workflow-testing-fundamentals.yaml +497 -497
package/assets/skills/n8n-workflow-testing-fundamentals/schemas/output.json +254 -254
package/assets/skills/observability-testing-patterns/SKILL.md +930 -930
package/assets/skills/observability-testing-patterns/evals/observability-testing-patterns.yaml +157 -157
package/assets/skills/observability-testing-patterns/schemas/output.json +58 -58
package/assets/skills/observability-testing-patterns/scripts/validate-config.json +25 -25
package/assets/skills/pentest-validation/SKILL.md +268 -268
package/assets/skills/pentest-validation/evals/pentest-validation.yaml +708 -708
package/assets/skills/pentest-validation/schemas/output.json +281 -281
package/assets/skills/performance-testing/evals/performance-testing.yaml +772 -772
package/assets/skills/performance-testing/schemas/output.json +1184 -1184
package/assets/skills/pr-review/SKILL.md +61 -61
package/assets/skills/qcsd-cicd-swarm/SKILL.md +2206 -2206
package/assets/skills/qcsd-cicd-swarm/evals/qcsd-cicd-swarm.yaml +211 -211
package/assets/skills/qcsd-cicd-swarm/schemas/output.json +86 -86
package/assets/skills/qcsd-cicd-swarm/scripts/validate-config.json +30 -30
package/assets/skills/qcsd-development-swarm/SKILL.md +2154 -2154
package/assets/skills/qcsd-development-swarm/evals/qcsd-development-swarm.yaml +162 -162
package/assets/skills/qcsd-development-swarm/schemas/output.json +72 -72
package/assets/skills/qcsd-development-swarm/scripts/validate-config.json +25 -25
package/assets/skills/qcsd-ideation-swarm/evals/qcsd-ideation-swarm.yaml +138 -138
package/assets/skills/qcsd-ideation-swarm/schemas/output.json +568 -568
package/assets/skills/qcsd-production-swarm/SKILL.md +2781 -2781
package/assets/skills/qcsd-production-swarm/evals/qcsd-production-swarm.yaml +246 -246
package/assets/skills/qcsd-production-swarm/schemas/output.json +505 -505
package/assets/skills/qcsd-production-swarm/scripts/validate-config.json +25 -25
package/assets/skills/qe-chaos-resilience/evals/qe-chaos-resilience.yaml +443 -443
package/assets/skills/qe-chaos-resilience/schemas/output.json +314 -314
package/assets/skills/qe-code-intelligence/evals/qe-code-intelligence.yaml +459 -459
package/assets/skills/qe-code-intelligence/schemas/output.json +315 -315
package/assets/skills/qe-contract-testing/evals/qe-contract-testing.yaml +513 -513
package/assets/skills/qe-contract-testing/schemas/output.json +295 -295
package/assets/skills/qe-coverage-analysis/evals/qe-coverage-analysis.yaml +494 -494
package/assets/skills/qe-coverage-analysis/schemas/output.json +286 -286
package/assets/skills/qe-defect-intelligence/evals/qe-defect-intelligence.yaml +511 -511
package/assets/skills/qe-defect-intelligence/schemas/output.json +283 -283
package/assets/skills/qe-iterative-loop/schemas/output.json +264 -264
package/assets/skills/qe-learning-optimization/evals/qe-learning-optimization.yaml +144 -144
package/assets/skills/qe-learning-optimization/schemas/output.json +288 -288
package/assets/skills/qe-quality-assessment/evals/qe-quality-assessment.yaml +506 -506
package/assets/skills/qe-quality-assessment/schemas/output.json +550 -550
package/assets/skills/qe-requirements-validation/evals/qe-requirements-validation.yaml +598 -598
package/assets/skills/qe-requirements-validation/schemas/output.json +587 -587
package/assets/skills/qe-security-compliance/evals/qe-security-compliance.yaml +595 -595
package/assets/skills/qe-security-compliance/schemas/output.json +498 -498
package/assets/skills/qe-test-execution/evals/qe-test-execution.yaml +607 -607
package/assets/skills/qe-test-execution/schemas/output.json +529 -529
package/assets/skills/qe-test-generation/evals/qe-test-generation.yaml +148 -148
package/assets/skills/qe-test-generation/schemas/output.json +439 -439
package/assets/skills/qe-visual-accessibility/evals/qe-visual-accessibility.yaml +142 -142
package/assets/skills/qe-visual-accessibility/schemas/output.json +491 -491
package/assets/skills/quality-metrics/evals/quality-metrics.yaml +494 -494
package/assets/skills/quality-metrics/schemas/output.json +403 -403
package/assets/skills/refactoring-patterns/schemas/output.json +475 -475
package/assets/skills/regression-testing/evals/regression-testing.yaml +504 -504
package/assets/skills/regression-testing/schemas/output.json +311 -311
package/assets/skills/risk-based-testing/evals/risk-based-testing.yaml +141 -141
package/assets/skills/risk-based-testing/schemas/output.json +480 -480
package/assets/skills/security-testing/evals/security-testing.yaml +789 -789
package/assets/skills/security-testing/schemas/output.json +879 -879
package/assets/skills/security-visual-testing/evals/security-visual-testing.yaml +163 -163
package/assets/skills/security-visual-testing/schemas/output.json +486 -486
package/assets/skills/sfdipot-product-factors/SKILL.md +239 -239
package/assets/skills/sherlock-review/schemas/output.json +297 -297
package/assets/skills/shift-left-testing/evals/shift-left-testing.yaml +145 -145
package/assets/skills/shift-left-testing/schemas/output.json +459 -459
package/assets/skills/shift-right-testing/evals/shift-right-testing.yaml +147 -147
package/assets/skills/shift-right-testing/schemas/output.json +418 -418
package/assets/skills/tdd-london-chicago/schemas/output.json +444 -444
package/assets/skills/technical-writing/schemas/output.json +268 -268
package/assets/skills/test-automation-strategy/evals/test-automation-strategy.yaml +148 -148
package/assets/skills/test-automation-strategy/schemas/output.json +444 -444
package/assets/skills/test-data-management/evals/test-data-management.yaml +504 -504
package/assets/skills/test-data-management/schemas/output.json +284 -284
package/assets/skills/test-design-techniques/evals/test-design-techniques.yaml +142 -142
package/assets/skills/test-design-techniques/schemas/output.json +295 -295
package/assets/skills/test-environment-management/schemas/output.json +310 -310
package/assets/skills/test-idea-rewriting/SKILL.md +229 -229
package/assets/skills/test-reporting-analytics/evals/test-reporting-analytics.yaml +155 -155
package/assets/skills/test-reporting-analytics/schemas/output.json +329 -329
package/assets/skills/testability-scoring/evals/testability-scoring.yaml +814 -814
package/assets/skills/testability-scoring/resources/templates/config.template.js +84 -84
package/assets/skills/testability-scoring/schemas/output.json +606 -606
package/assets/skills/testability-scoring/scripts/generate-html-report.js +1007 -1007
package/assets/skills/verification-quality/evals/verification-quality.yaml +150 -150
package/assets/skills/verification-quality/schemas/output.json +432 -432
package/assets/skills/visual-testing-advanced/evals/visual-testing-advanced.yaml +154 -154
package/assets/skills/visual-testing-advanced/schemas/output.json +294 -294
package/assets/skills/wms-testing-patterns/evals/wms-testing-patterns.yaml +165 -165
package/assets/skills/wms-testing-patterns/schemas/output.json +150 -150
package/assets/skills/wms-testing-patterns/scripts/validate-config.json +51 -51
package/assets/templates/validation-summary.json +56 -56
package/dist/cli/bundle.js +54 -31
package/dist/cli/commands/mcp.d.ts.map +1 -1
package/dist/cli/commands/mcp.js +11 -9
package/dist/cli/commands/mcp.js.map +1 -1
package/dist/init/phases/10-workers.js +2 -2
package/dist/init/phases/10-workers.js.map +1 -1
package/dist/mcp/bundle.js +42 -19
package/dist/shared/language-detector.js +1 -1
package/dist/shared/language-detector.js.map +1 -1
package/dist/shared/parsers/multi-language-parser.d.ts.map +1 -1
package/dist/shared/parsers/multi-language-parser.js +55 -16
package/dist/shared/parsers/multi-language-parser.js.map +1 -1
package/package.json +1 -1
package/scripts/prepare-assets.sh +8 -0

package/.claude/skills/.validation/schemas/skill-eval.schema.json CHANGED Viewed

@@ -1,462 +1,462 @@
-{
-  "$schema": "https://json-schema.org/draft/2020-12/schema",
-  "$id": "https://agentic-qe.dev/schemas/skill-eval.json",
-  "title": "AQE Skill Evaluation Test Suite Schema",
-  "description": "Schema for skill evaluation YAML test suites used in Trust Tier 3 validation. Supports multi-model testing, AQE MCP integration, and ReasoningBank learning.",
-  "type": "object",
-  "required": ["skill", "version", "test_cases", "success_criteria"],
-  "properties": {
-    "skill": {
-      "type": "string",
-      "pattern": "^[a-z][a-z0-9-]*$",
-      "description": "Skill name being evaluated (must match .claude/skills/{skill}/SKILL.md)"
-    },
-    "version": {
-      "type": "string",
-      "pattern": "^\\d+\\.\\d+\\.\\d+$",
-      "description": "Evaluation suite version (semver)"
-    },
-    "description": {
-      "type": "string",
-      "maxLength": 1000,
-      "description": "Description of evaluation suite purpose and coverage goals"
-    },
-    "models_to_test": {
-      "type": "array",
-      "items": {
-        "type": "string",
-        "enum": [
-          "claude-opus-4-5",
-          "claude-sonnet-4",
-          "claude-3.5-sonnet",
-          "claude-3-haiku",
-          "gpt-4o",
-          "gpt-4o-mini",
-          "gpt-4-turbo"
-        ]
-      },
-      "default": ["claude-3.5-sonnet"],
-      "minItems": 1,
-      "uniqueItems": true,
-      "description": "Models to run evaluation against for cross-model validation"
-    },
-    "mcp_integration": {
-      "$ref": "#/$defs/mcp_integration_config",
-      "description": "AQE MCP integration configuration for shared learning"
-    },
-    "learning": {
-      "$ref": "#/$defs/learning_config",
-      "description": "ReasoningBank learning configuration"
-    },
-    "result_format": {
-      "$ref": "#/$defs/result_format",
-      "description": "Output format configuration"
-    },
-    "setup": {
-      "type": "object",
-      "description": "Setup configuration for test environment",
-      "properties": {
-        "required_tools": {
-          "type": "array",
-          "items": { "type": "string" },
-          "description": "Tools that must be available"
-        },
-        "environment_variables": {
-          "type": "object",
-          "additionalProperties": { "type": "string" },
-          "description": "Environment variables to set"
-        },
-        "fixtures": {
-          "type": "array",
-          "items": {
-            "type": "object",
-            "properties": {
-              "name": { "type": "string" },
-              "path": { "type": "string" },
-              "content": { "type": "string" }
-            }
-          },
-          "description": "Test fixtures to create"
-        }
-      }
-    },
-    "test_cases": {
-      "type": "array",
-      "minItems": 1,
-      "items": {
-        "$ref": "#/$defs/test_case"
-      },
-      "description": "Evaluation test cases"
-    },
-    "success_criteria": {
-      "type": "object",
-      "required": ["pass_rate"],
-      "properties": {
-        "pass_rate": {
-          "type": "number",
-          "minimum": 0,
-          "maximum": 1,
-          "description": "Minimum pass rate for suite to pass"
-        },
-        "critical_pass_rate": {
-          "type": "number",
-          "minimum": 0,
-          "maximum": 1,
-          "default": 1.0,
-          "description": "Pass rate required for critical priority tests"
-        },
-        "avg_reasoning_quality": {
-          "type": "number",
-          "minimum": 0,
-          "maximum": 1,
-          "description": "Minimum average reasoning quality score"
-        },
-        "max_execution_time_ms": {
-          "type": "integer",
-          "minimum": 0,
-          "description": "Maximum execution time for test suite"
-        },
-        "cross_model_variance": {
-          "type": "number",
-          "minimum": 0,
-          "maximum": 1,
-          "description": "Maximum allowed variance between models"
-        }
-      }
-    },
-    "metadata": {
-      "type": "object",
-      "properties": {
-        "author": { "type": "string" },
-        "created": { "type": "string", "format": "date" },
-        "last_updated": { "type": "string", "format": "date" },
-        "coverage_target": { "type": "string" }
-      }
-    }
-  },
-  "$defs": {
-    "test_case": {
-      "type": "object",
-      "required": ["id", "description", "input", "expected_output"],
-      "properties": {
-        "id": {
-          "type": "string",
-          "pattern": "^tc\\d{3}_[a-z_]+$",
-          "description": "Test case ID (e.g., tc001_sql_injection)"
-        },
-        "description": {
-          "type": "string",
-          "description": "What this test case validates"
-        },
-        "category": {
-          "type": "string",
-          "description": "Test category for grouping"
-        },
-        "priority": {
-          "type": "string",
-          "enum": ["critical", "high", "medium", "low"],
-          "default": "medium",
-          "description": "Test priority"
-        },
-        "skip": {
-          "type": "boolean",
-          "default": false,
-          "description": "Skip this test case"
-        },
-        "skip_reason": {
-          "type": "string",
-          "description": "Reason for skipping"
-        },
-        "negative_control": {
-          "type": "boolean",
-          "default": false,
-          "description": "When true, grading logic inverts: test passes when must_contain items are ABSENT (skill correctly declines irrelevant prompts)"
-        },
-        "input": {
-          "$ref": "#/$defs/test_input"
-        },
-        "expected_output": {
-          "$ref": "#/$defs/expected_output"
-        },
-        "validation": {
-          "$ref": "#/$defs/validation_config"
-        },
-        "timeout_ms": {
-          "type": "integer",
-          "minimum": 1000,
-          "default": 30000,
-          "description": "Test timeout in milliseconds"
-        }
-      }
-    },
-    "test_input": {
-      "type": "object",
-      "description": "Input provided to the skill",
-      "properties": {
-        "code": {
-          "type": "string",
-          "description": "Code snippet to analyze"
-        },
-        "file_path": {
-          "type": "string",
-          "description": "Path to file to analyze"
-        },
-        "url": {
-          "type": "string",
-          "format": "uri",
-          "description": "URL to analyze"
-        },
-        "prompt": {
-          "type": "string",
-          "description": "Custom prompt for the skill"
-        },
-        "context": {
-          "type": "object",
-          "properties": {
-            "language": {
-              "type": "string",
-              "description": "Programming language"
-            },
-            "framework": {
-              "type": "string",
-              "description": "Framework in use"
-            },
-            "environment": {
-              "type": "string",
-              "enum": ["development", "staging", "production"],
-              "description": "Target environment"
-            }
-          }
-        },
-        "options": {
-          "type": "object",
-          "additionalProperties": true,
-          "description": "Skill-specific options"
-        }
-      }
-    },
-    "expected_output": {
-      "type": "object",
-      "description": "Expected characteristics of skill output",
-      "properties": {
-        "must_contain": {
-          "type": "array",
-          "items": { "type": "string" },
-          "description": "Strings that must appear in output"
-        },
-        "must_not_contain": {
-          "type": "array",
-          "items": { "type": "string" },
-          "description": "Strings that must not appear in output"
-        },
-        "must_match_regex": {
-          "type": "array",
-          "items": { "type": "string" },
-          "description": "Regex patterns output must match"
-        },
-        "severity_classification": {
-          "type": "string",
-          "enum": ["critical", "high", "medium", "low", "info"],
-          "description": "Expected severity classification"
-        },
-        "finding_count": {
-          "type": "object",
-          "properties": {
-            "min": { "type": "integer", "minimum": 0 },
-            "max": { "type": "integer", "minimum": 0 }
-          },
-          "description": "Expected range of findings"
-        },
-        "recommendation_count": {
-          "type": "object",
-          "properties": {
-            "min": { "type": "integer", "minimum": 0 },
-            "max": { "type": "integer", "minimum": 0 }
-          },
-          "description": "Expected range of recommendations"
-        },
-        "schema_path": {
-          "type": "string",
-          "description": "Path to JSON schema for output validation"
-        },
-        "custom_assertions": {
-          "type": "array",
-          "items": {
-            "type": "object",
-            "properties": {
-              "type": {
-                "type": "string",
-                "enum": ["jsonpath", "semantic", "function"]
-              },
-              "expression": { "type": "string" },
-              "expected": {}
-            }
-          },
-          "description": "Custom assertions for complex validation"
-        }
-      }
-    },
-    "validation_config": {
-      "type": "object",
-      "description": "Validation configuration for test case",
-      "properties": {
-        "schema_check": {
-          "type": "boolean",
-          "default": true,
-          "description": "Validate output against schema"
-        },
-        "keyword_match_threshold": {
-          "type": "number",
-          "minimum": 0,
-          "maximum": 1,
-          "default": 0.8,
-          "description": "Minimum keyword match ratio for pass"
-        },
-        "reasoning_quality_min": {
-          "type": "number",
-          "minimum": 0,
-          "maximum": 1,
-          "description": "Minimum reasoning quality score"
-        },
-        "semantic_similarity_min": {
-          "type": "number",
-          "minimum": 0,
-          "maximum": 1,
-          "description": "Minimum semantic similarity to expected"
-        },
-        "allow_partial": {
-          "type": "boolean",
-          "default": false,
-          "description": "Allow partial matches"
-        },
-        "adaptive_rubric": {
-          "type": "boolean",
-          "default": false,
-          "description": "When true, dynamically extracts keywords from test prompt (quoted strings, format words, standards) and adds them to must_contain checks"
-        },
-        "grading_rubric": {
-          "type": "object",
-          "properties": {
-            "completeness": { "type": "number", "minimum": 0, "maximum": 1 },
-            "accuracy": { "type": "number", "minimum": 0, "maximum": 1 },
-            "actionability": { "type": "number", "minimum": 0, "maximum": 1 }
-          },
-          "description": "Weighted grading rubric (weights should sum to 1.0). Computes sub-scores: completeness (must_contain match ratio), accuracy (1 - violation ratio), actionability (code blocks, steps, recommendations)"
-        }
-      }
-    },
-    "mcp_integration_config": {
-      "type": "object",
-      "description": "Configuration for AQE MCP tool integration per MCP Integration Spec",
-      "properties": {
-        "enabled": {
-          "type": "boolean",
-          "default": true,
-          "description": "Enable MCP integration for this eval suite"
-        },
-        "namespace": {
-          "type": "string",
-          "default": "skill-validation",
-          "description": "Memory namespace for storing patterns and outcomes"
-        },
-        "store_patterns": {
-          "type": "boolean",
-          "default": true,
-          "description": "Store successful patterns via mcp__agentic-qe__memory_store"
-        },
-        "query_patterns": {
-          "type": "boolean",
-          "default": true,
-          "description": "Query existing patterns before running via mcp__agentic-qe__memory_query"
-        },
-        "track_outcomes": {
-          "type": "boolean",
-          "default": true,
-          "description": "Track test outcomes via mcp__agentic-qe__test_outcome_track"
-        },
-        "share_learning": {
-          "type": "boolean",
-          "default": true,
-          "description": "Share learning with fleet via mcp__agentic-qe__memory_share"
-        },
-        "update_quality_gate": {
-          "type": "boolean",
-          "default": true,
-          "description": "Update quality gate metrics via mcp__agentic-qe__quality_assess"
-        },
-        "target_agents": {
-          "type": "array",
-          "items": { "type": "string" },
-          "default": ["qe-learning-coordinator", "qe-queen-coordinator"],
-          "description": "Agent IDs to share learning with"
-        }
-      }
-    },
-    "learning_config": {
-      "type": "object",
-      "description": "Configuration for ReasoningBank learning integration",
-      "properties": {
-        "store_success_patterns": {
-          "type": "boolean",
-          "default": true,
-          "description": "Store patterns from successful test runs"
-        },
-        "store_failure_patterns": {
-          "type": "boolean",
-          "default": true,
-          "description": "Store patterns from failures for learning"
-        },
-        "pattern_ttl_days": {
-          "type": "integer",
-          "minimum": 1,
-          "maximum": 365,
-          "default": 90,
-          "description": "Time-to-live for stored patterns in days"
-        },
-        "min_confidence_to_store": {
-          "type": "number",
-          "minimum": 0,
-          "maximum": 1,
-          "default": 0.7,
-          "description": "Minimum confidence score to store pattern"
-        },
-        "cross_model_comparison": {
-          "type": "boolean",
-          "default": true,
-          "description": "Store cross-model behavior comparisons"
-        }
-      }
-    },
-    "result_format": {
-      "type": "object",
-      "description": "Output format configuration for evaluation results",
-      "properties": {
-        "json_output": {
-          "type": "boolean",
-          "default": true,
-          "description": "Output results as JSON"
-        },
-        "markdown_report": {
-          "type": "boolean",
-          "default": false,
-          "description": "Generate markdown report"
-        },
-        "include_raw_output": {
-          "type": "boolean",
-          "default": false,
-          "description": "Include raw LLM output in results"
-        },
-        "include_timing": {
-          "type": "boolean",
-          "default": true,
-          "description": "Include timing information"
-        },
-        "include_token_usage": {
-          "type": "boolean",
-          "default": true,
-          "description": "Include token usage statistics"
-        }
-      }
-    }
-  }
-}
+{
+  "$schema": "https://json-schema.org/draft/2020-12/schema",
+  "$id": "https://agentic-qe.dev/schemas/skill-eval.json",
+  "title": "AQE Skill Evaluation Test Suite Schema",
+  "description": "Schema for skill evaluation YAML test suites used in Trust Tier 3 validation. Supports multi-model testing, AQE MCP integration, and ReasoningBank learning.",
+  "type": "object",
+  "required": ["skill", "version", "test_cases", "success_criteria"],
+  "properties": {
+    "skill": {
+      "type": "string",
+      "pattern": "^[a-z][a-z0-9-]*$",
+      "description": "Skill name being evaluated (must match .claude/skills/{skill}/SKILL.md)"
+    },
+    "version": {
+      "type": "string",
+      "pattern": "^\\d+\\.\\d+\\.\\d+$",
+      "description": "Evaluation suite version (semver)"
+    },
+    "description": {
+      "type": "string",
+      "maxLength": 1000,
+      "description": "Description of evaluation suite purpose and coverage goals"
+    },
+    "models_to_test": {
+      "type": "array",
+      "items": {
+        "type": "string",
+        "enum": [
+          "claude-opus-4-5",
+          "claude-sonnet-4",
+          "claude-3.5-sonnet",
+          "claude-3-haiku",
+          "gpt-4o",
+          "gpt-4o-mini",
+          "gpt-4-turbo"
+        ]
+      },
+      "default": ["claude-3.5-sonnet"],
+      "minItems": 1,
+      "uniqueItems": true,
+      "description": "Models to run evaluation against for cross-model validation"
+    },
+    "mcp_integration": {
+      "$ref": "#/$defs/mcp_integration_config",
+      "description": "AQE MCP integration configuration for shared learning"
+    },
+    "learning": {
+      "$ref": "#/$defs/learning_config",
+      "description": "ReasoningBank learning configuration"
+    },
+    "result_format": {
+      "$ref": "#/$defs/result_format",
+      "description": "Output format configuration"
+    },
+    "setup": {
+      "type": "object",
+      "description": "Setup configuration for test environment",
+      "properties": {
+        "required_tools": {
+          "type": "array",
+          "items": { "type": "string" },
+          "description": "Tools that must be available"
+        },
+        "environment_variables": {
+          "type": "object",
+          "additionalProperties": { "type": "string" },
+          "description": "Environment variables to set"
+        },
+        "fixtures": {
+          "type": "array",
+          "items": {
+            "type": "object",
+            "properties": {
+              "name": { "type": "string" },
+              "path": { "type": "string" },
+              "content": { "type": "string" }
+            }
+          },
+          "description": "Test fixtures to create"
+        }
+      }
+    },
+    "test_cases": {
+      "type": "array",
+      "minItems": 1,
+      "items": {
+        "$ref": "#/$defs/test_case"
+      },
+      "description": "Evaluation test cases"
+    },
+    "success_criteria": {
+      "type": "object",
+      "required": ["pass_rate"],
+      "properties": {
+        "pass_rate": {
+          "type": "number",
+          "minimum": 0,
+          "maximum": 1,
+          "description": "Minimum pass rate for suite to pass"
+        },
+        "critical_pass_rate": {
+          "type": "number",
+          "minimum": 0,
+          "maximum": 1,
+          "default": 1.0,
+          "description": "Pass rate required for critical priority tests"
+        },
+        "avg_reasoning_quality": {
+          "type": "number",
+          "minimum": 0,
+          "maximum": 1,
+          "description": "Minimum average reasoning quality score"
+        },
+        "max_execution_time_ms": {
+          "type": "integer",
+          "minimum": 0,
+          "description": "Maximum execution time for test suite"
+        },
+        "cross_model_variance": {
+          "type": "number",
+          "minimum": 0,
+          "maximum": 1,
+          "description": "Maximum allowed variance between models"
+        }
+      }
+    },
+    "metadata": {
+      "type": "object",
+      "properties": {
+        "author": { "type": "string" },
+        "created": { "type": "string", "format": "date" },
+        "last_updated": { "type": "string", "format": "date" },
+        "coverage_target": { "type": "string" }
+      }
+    }
+  },
+  "$defs": {
+    "test_case": {
+      "type": "object",
+      "required": ["id", "description", "input", "expected_output"],
+      "properties": {
+        "id": {
+          "type": "string",
+          "pattern": "^tc\\d{3}_[a-z_]+$",
+          "description": "Test case ID (e.g., tc001_sql_injection)"
+        },
+        "description": {
+          "type": "string",
+          "description": "What this test case validates"
+        },
+        "category": {
+          "type": "string",
+          "description": "Test category for grouping"
+        },
+        "priority": {
+          "type": "string",
+          "enum": ["critical", "high", "medium", "low"],
+          "default": "medium",
+          "description": "Test priority"
+        },
+        "skip": {
+          "type": "boolean",
+          "default": false,
+          "description": "Skip this test case"
+        },
+        "skip_reason": {
+          "type": "string",
+          "description": "Reason for skipping"
+        },
+        "negative_control": {
+          "type": "boolean",
+          "default": false,
+          "description": "When true, grading logic inverts: test passes when must_contain items are ABSENT (skill correctly declines irrelevant prompts)"
+        },
+        "input": {
+          "$ref": "#/$defs/test_input"
+        },
+        "expected_output": {
+          "$ref": "#/$defs/expected_output"
+        },
+        "validation": {
+          "$ref": "#/$defs/validation_config"
+        },
+        "timeout_ms": {
+          "type": "integer",
+          "minimum": 1000,
+          "default": 30000,
+          "description": "Test timeout in milliseconds"
+        }
+      }
+    },
+    "test_input": {
+      "type": "object",
+      "description": "Input provided to the skill",
+      "properties": {
+        "code": {
+          "type": "string",
+          "description": "Code snippet to analyze"
+        },
+        "file_path": {
+          "type": "string",
+          "description": "Path to file to analyze"
+        },
+        "url": {
+          "type": "string",
+          "format": "uri",
+          "description": "URL to analyze"
+        },
+        "prompt": {
+          "type": "string",
+          "description": "Custom prompt for the skill"
+        },
+        "context": {
+          "type": "object",
+          "properties": {
+            "language": {
+              "type": "string",
+              "description": "Programming language"
+            },
+            "framework": {
+              "type": "string",
+              "description": "Framework in use"
+            },
+            "environment": {
+              "type": "string",
+              "enum": ["development", "staging", "production"],
+              "description": "Target environment"
+            }
+          }
+        },
+        "options": {
+          "type": "object",
+          "additionalProperties": true,
+          "description": "Skill-specific options"
+        }
+      }
+    },
+    "expected_output": {
+      "type": "object",
+      "description": "Expected characteristics of skill output",
+      "properties": {
+        "must_contain": {
+          "type": "array",
+          "items": { "type": "string" },
+          "description": "Strings that must appear in output"
+        },
+        "must_not_contain": {
+          "type": "array",
+          "items": { "type": "string" },
+          "description": "Strings that must not appear in output"
+        },
+        "must_match_regex": {
+          "type": "array",
+          "items": { "type": "string" },
+          "description": "Regex patterns output must match"
+        },
+        "severity_classification": {
+          "type": "string",
+          "enum": ["critical", "high", "medium", "low", "info"],
+          "description": "Expected severity classification"
+        },
+        "finding_count": {
+          "type": "object",
+          "properties": {
+            "min": { "type": "integer", "minimum": 0 },
+            "max": { "type": "integer", "minimum": 0 }
+          },
+          "description": "Expected range of findings"
+        },
+        "recommendation_count": {
+          "type": "object",
+          "properties": {
+            "min": { "type": "integer", "minimum": 0 },
+            "max": { "type": "integer", "minimum": 0 }
+          },
+          "description": "Expected range of recommendations"
+        },
+        "schema_path": {
+          "type": "string",
+          "description": "Path to JSON schema for output validation"
+        },
+        "custom_assertions": {
+          "type": "array",
+          "items": {
+            "type": "object",
+            "properties": {
+              "type": {
+                "type": "string",
+                "enum": ["jsonpath", "semantic", "function"]
+              },
+              "expression": { "type": "string" },
+              "expected": {}
+            }
+          },
+          "description": "Custom assertions for complex validation"
+        }
+      }
+    },
+    "validation_config": {
+      "type": "object",
+      "description": "Validation configuration for test case",
+      "properties": {
+        "schema_check": {
+          "type": "boolean",
+          "default": true,
+          "description": "Validate output against schema"
+        },
+        "keyword_match_threshold": {
+          "type": "number",
+          "minimum": 0,
+          "maximum": 1,
+          "default": 0.8,
+          "description": "Minimum keyword match ratio for pass"
+        },
+        "reasoning_quality_min": {
+          "type": "number",
+          "minimum": 0,
+          "maximum": 1,
+          "description": "Minimum reasoning quality score"
+        },
+        "semantic_similarity_min": {
+          "type": "number",
+          "minimum": 0,
+          "maximum": 1,
+          "description": "Minimum semantic similarity to expected"
+        },
+        "allow_partial": {
+          "type": "boolean",
+          "default": false,
+          "description": "Allow partial matches"
+        },
+        "adaptive_rubric": {
+          "type": "boolean",
+          "default": false,
+          "description": "When true, dynamically extracts keywords from test prompt (quoted strings, format words, standards) and adds them to must_contain checks"
+        },
+        "grading_rubric": {
+          "type": "object",
+          "properties": {
+            "completeness": { "type": "number", "minimum": 0, "maximum": 1 },
+            "accuracy": { "type": "number", "minimum": 0, "maximum": 1 },
+            "actionability": { "type": "number", "minimum": 0, "maximum": 1 }
+          },
+          "description": "Weighted grading rubric (weights should sum to 1.0). Computes sub-scores: completeness (must_contain match ratio), accuracy (1 - violation ratio), actionability (code blocks, steps, recommendations)"
+        }
+      }
+    },
+    "mcp_integration_config": {
+      "type": "object",
+      "description": "Configuration for AQE MCP tool integration per MCP Integration Spec",
+      "properties": {
+        "enabled": {
+          "type": "boolean",
+          "default": true,
+          "description": "Enable MCP integration for this eval suite"
+        },
+        "namespace": {
+          "type": "string",
+          "default": "skill-validation",
+          "description": "Memory namespace for storing patterns and outcomes"
+        },
+        "store_patterns": {
+          "type": "boolean",
+          "default": true,
+          "description": "Store successful patterns via mcp__agentic-qe__memory_store"
+        },
+        "query_patterns": {
+          "type": "boolean",
+          "default": true,
+          "description": "Query existing patterns before running via mcp__agentic-qe__memory_query"
+        },
+        "track_outcomes": {
+          "type": "boolean",
+          "default": true,
+          "description": "Track test outcomes via mcp__agentic-qe__test_outcome_track"
+        },
+        "share_learning": {
+          "type": "boolean",
+          "default": true,
+          "description": "Share learning with fleet via mcp__agentic-qe__memory_share"
+        },
+        "update_quality_gate": {
+          "type": "boolean",
+          "default": true,
+          "description": "Update quality gate metrics via mcp__agentic-qe__quality_assess"
+        },
+        "target_agents": {
+          "type": "array",
+          "items": { "type": "string" },
+          "default": ["qe-learning-coordinator", "qe-queen-coordinator"],
+          "description": "Agent IDs to share learning with"
+        }
+      }
+    },
+    "learning_config": {
+      "type": "object",
+      "description": "Configuration for ReasoningBank learning integration",
+      "properties": {
+        "store_success_patterns": {
+          "type": "boolean",
+          "default": true,
+          "description": "Store patterns from successful test runs"
+        },
+        "store_failure_patterns": {
+          "type": "boolean",
+          "default": true,
+          "description": "Store patterns from failures for learning"
+        },
+        "pattern_ttl_days": {
+          "type": "integer",
+          "minimum": 1,
+          "maximum": 365,
+          "default": 90,
+          "description": "Time-to-live for stored patterns in days"
+        },
+        "min_confidence_to_store": {
+          "type": "number",
+          "minimum": 0,
+          "maximum": 1,
+          "default": 0.7,
+          "description": "Minimum confidence score to store pattern"
+        },
+        "cross_model_comparison": {
+          "type": "boolean",
+          "default": true,
+          "description": "Store cross-model behavior comparisons"
+        }
+      }
+    },
+    "result_format": {
+      "type": "object",
+      "description": "Output format configuration for evaluation results",
+      "properties": {
+        "json_output": {
+          "type": "boolean",
+          "default": true,
+          "description": "Output results as JSON"
+        },
+        "markdown_report": {
+          "type": "boolean",
+          "default": false,
+          "description": "Generate markdown report"
+        },
+        "include_raw_output": {
+          "type": "boolean",
+          "default": false,
+          "description": "Include raw LLM output in results"
+        },
+        "include_timing": {
+          "type": "boolean",
+          "default": true,
+          "description": "Include timing information"
+        },
+        "include_token_usage": {
+          "type": "boolean",
+          "default": true,
+          "description": "Include token usage statistics"
+        }
+      }
+    }
+  }
+}