npm - ppef - Versions diffs - 1.0.0 → 1.1.0 - Mend

ppef 1.0.0 → 1.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (336) hide show

package/README.md +172 -0
package/bin/ppef.mjs +20 -0
package/dist/__tests__/framework-pipeline.integration.test.d.ts +7 -0
package/dist/__tests__/framework-pipeline.integration.test.d.ts.map +1 -0
package/dist/__tests__/framework-pipeline.integration.test.js +415 -0
package/dist/__tests__/framework-pipeline.integration.test.js.map +1 -0
package/dist/__tests__/index-exports.unit.test.d.ts +8 -0
package/dist/__tests__/index-exports.unit.test.d.ts.map +1 -0
package/dist/__tests__/index-exports.unit.test.js +127 -0
package/dist/__tests__/index-exports.unit.test.js.map +1 -0
package/dist/__tests__/registry-executor.integration.test.d.ts +5 -0
package/dist/__tests__/registry-executor.integration.test.d.ts.map +1 -0
package/dist/__tests__/registry-executor.integration.test.js +352 -0
package/dist/__tests__/registry-executor.integration.test.js.map +1 -0
package/dist/__tests__/test-helpers.d.ts +94 -0
package/dist/__tests__/test-helpers.d.ts.map +1 -0
package/dist/__tests__/test-helpers.js +271 -0
package/dist/__tests__/test-helpers.js.map +1 -0
package/dist/aggregation/__tests__/aggregators.unit.test.d.ts +7 -0
package/dist/aggregation/__tests__/aggregators.unit.test.d.ts.map +1 -0
package/dist/aggregation/__tests__/aggregators.unit.test.js +350 -0
package/dist/aggregation/__tests__/aggregators.unit.test.js.map +1 -0
package/dist/aggregation/__tests__/pipeline.unit.test.d.ts +7 -0
package/dist/aggregation/__tests__/pipeline.unit.test.d.ts.map +1 -0
package/dist/aggregation/__tests__/pipeline.unit.test.js +213 -0
package/dist/aggregation/__tests__/pipeline.unit.test.js.map +1 -0
package/dist/aggregation/aggregators.d.ts +63 -0
package/dist/aggregation/aggregators.d.ts.map +1 -0
package/dist/aggregation/aggregators.js +228 -0
package/dist/aggregation/aggregators.js.map +1 -0
package/dist/aggregation/index.d.ts +8 -0
package/dist/aggregation/index.d.ts.map +1 -0
package/dist/aggregation/index.js +8 -0
package/dist/aggregation/index.js.map +1 -0
package/dist/aggregation/pipeline.d.ts +38 -0
package/dist/aggregation/pipeline.d.ts.map +1 -0
package/dist/aggregation/pipeline.js +198 -0
package/dist/aggregation/pipeline.js.map +1 -0
package/dist/claims/__tests__/evaluator.unit.test.d.ts +12 -0
package/dist/claims/__tests__/evaluator.unit.test.d.ts.map +1 -0
package/dist/claims/__tests__/evaluator.unit.test.js +801 -0
package/dist/claims/__tests__/evaluator.unit.test.js.map +1 -0
package/dist/claims/evaluator.d.ts +33 -0
package/dist/claims/evaluator.d.ts.map +1 -0
package/dist/claims/evaluator.js +174 -0
package/dist/claims/evaluator.js.map +1 -0
package/dist/claims/index.d.ts +7 -0
package/dist/claims/index.d.ts.map +1 -0
package/dist/claims/index.js +7 -0
package/dist/claims/index.js.map +1 -0
package/dist/cli/__tests__/aggregate.command.unit.test.d.ts +7 -0
package/dist/cli/__tests__/aggregate.command.unit.test.d.ts.map +1 -0
package/dist/cli/__tests__/aggregate.command.unit.test.js +396 -0
package/dist/cli/__tests__/aggregate.command.unit.test.js.map +1 -0
package/dist/cli/__tests__/commands.unit.test.d.ts +10 -0
package/dist/cli/__tests__/commands.unit.test.d.ts.map +1 -0
package/dist/cli/__tests__/commands.unit.test.js +217 -0
package/dist/cli/__tests__/commands.unit.test.js.map +1 -0
package/dist/cli/__tests__/index.unit.test.d.ts +10 -0
package/dist/cli/__tests__/index.unit.test.d.ts.map +1 -0
package/dist/cli/__tests__/index.unit.test.js +65 -0
package/dist/cli/__tests__/index.unit.test.js.map +1 -0
package/dist/cli/__tests__/logger.unit.test.d.ts +11 -0
package/dist/cli/__tests__/logger.unit.test.d.ts.map +1 -0
package/dist/cli/__tests__/logger.unit.test.js +180 -0
package/dist/cli/__tests__/logger.unit.test.js.map +1 -0
package/dist/cli/__tests__/module-loader.unit.test.d.ts +11 -0
package/dist/cli/__tests__/module-loader.unit.test.d.ts.map +1 -0
package/dist/cli/__tests__/module-loader.unit.test.js +262 -0
package/dist/cli/__tests__/module-loader.unit.test.js.map +1 -0
package/dist/cli/__tests__/output-writer.unit.test.d.ts +10 -0
package/dist/cli/__tests__/output-writer.unit.test.d.ts.map +1 -0
package/dist/cli/__tests__/output-writer.unit.test.js +216 -0
package/dist/cli/__tests__/output-writer.unit.test.js.map +1 -0
package/dist/cli/__tests__/plan.command.unit.test.d.ts +7 -0
package/dist/cli/__tests__/plan.command.unit.test.d.ts.map +1 -0
package/dist/cli/__tests__/plan.command.unit.test.js +289 -0
package/dist/cli/__tests__/plan.command.unit.test.js.map +1 -0
package/dist/cli/__tests__/run.command.unit.test.d.ts +7 -0
package/dist/cli/__tests__/run.command.unit.test.d.ts.map +1 -0
package/dist/cli/__tests__/run.command.unit.test.js +422 -0
package/dist/cli/__tests__/run.command.unit.test.js.map +1 -0
package/dist/cli/__tests__/validate.command.unit.test.d.ts +7 -0
package/dist/cli/__tests__/validate.command.unit.test.d.ts.map +1 -0
package/dist/cli/__tests__/validate.command.unit.test.js +226 -0
package/dist/cli/__tests__/validate.command.unit.test.js.map +1 -0
package/dist/cli/command-deps.d.ts +125 -0
package/dist/cli/command-deps.d.ts.map +1 -0
package/dist/cli/command-deps.js +7 -0
package/dist/cli/command-deps.js.map +1 -0
package/dist/cli/commands/aggregate.d.ts +35 -0
package/dist/cli/commands/aggregate.d.ts.map +1 -0
package/dist/cli/commands/aggregate.js +121 -0
package/dist/cli/commands/aggregate.js.map +1 -0
package/dist/cli/commands/plan.d.ts +36 -0
package/dist/cli/commands/plan.d.ts.map +1 -0
package/dist/cli/commands/plan.js +109 -0
package/dist/cli/commands/plan.js.map +1 -0
package/dist/cli/commands/run.d.ts +33 -0
package/dist/cli/commands/run.d.ts.map +1 -0
package/dist/cli/commands/run.js +185 -0
package/dist/cli/commands/run.js.map +1 -0
package/dist/cli/commands/validate.d.ts +27 -0
package/dist/cli/commands/validate.d.ts.map +1 -0
package/dist/cli/commands/validate.js +88 -0
package/dist/cli/commands/validate.js.map +1 -0
package/dist/cli/config-loader.d.ts +30 -0
package/dist/cli/config-loader.d.ts.map +1 -0
package/dist/cli/config-loader.js +181 -0
package/dist/cli/config-loader.js.map +1 -0
package/dist/cli/index.d.ts +26 -0
package/dist/cli/index.d.ts.map +1 -0
package/dist/cli/index.js +58 -0
package/dist/cli/index.js.map +1 -0
package/dist/cli/logger.d.ts +75 -0
package/dist/cli/logger.d.ts.map +1 -0
package/dist/cli/logger.js +131 -0
package/dist/cli/logger.js.map +1 -0
package/dist/cli/module-loader.d.ts +46 -0
package/dist/cli/module-loader.d.ts.map +1 -0
package/dist/cli/module-loader.js +116 -0
package/dist/cli/module-loader.js.map +1 -0
package/dist/cli/output-writer.d.ts +51 -0
package/dist/cli/output-writer.d.ts.map +1 -0
package/dist/cli/output-writer.js +65 -0
package/dist/cli/output-writer.js.map +1 -0
package/dist/cli/types.d.ts +174 -0
package/dist/cli/types.d.ts.map +1 -0
package/dist/cli/types.js +7 -0
package/dist/cli/types.js.map +1 -0
package/dist/collector/__tests__/result-collector.unit.test.d.ts +7 -0
package/dist/collector/__tests__/result-collector.unit.test.d.ts.map +1 -0
package/dist/collector/__tests__/result-collector.unit.test.js +1021 -0
package/dist/collector/__tests__/result-collector.unit.test.js.map +1 -0
package/dist/collector/__tests__/schema.unit.test.d.ts +7 -0
package/dist/collector/__tests__/schema.unit.test.d.ts.map +1 -0
package/dist/collector/__tests__/schema.unit.test.js +360 -0
package/dist/collector/__tests__/schema.unit.test.js.map +1 -0
package/dist/collector/index.d.ts +8 -0
package/dist/collector/index.d.ts.map +1 -0
package/dist/collector/index.js +8 -0
package/dist/collector/index.js.map +1 -0
package/dist/collector/result-collector.d.ts +159 -0
package/dist/collector/result-collector.d.ts.map +1 -0
package/dist/collector/result-collector.js +213 -0
package/dist/collector/result-collector.js.map +1 -0
package/dist/collector/schema.d.ts +34 -0
package/dist/collector/schema.d.ts.map +1 -0
package/dist/collector/schema.js +145 -0
package/dist/collector/schema.js.map +1 -0
package/dist/executor/__tests__/checkpoint-hash-bug.diagnostic.test.d.ts +10 -0
package/dist/executor/__tests__/checkpoint-hash-bug.diagnostic.test.d.ts.map +1 -0
package/dist/executor/__tests__/checkpoint-hash-bug.diagnostic.test.js +122 -0
package/dist/executor/__tests__/checkpoint-hash-bug.diagnostic.test.js.map +1 -0
package/dist/executor/__tests__/checkpoint-manager.integration.test.d.ts +7 -0
package/dist/executor/__tests__/checkpoint-manager.integration.test.d.ts.map +1 -0
package/dist/executor/__tests__/checkpoint-manager.integration.test.js +330 -0
package/dist/executor/__tests__/checkpoint-manager.integration.test.js.map +1 -0
package/dist/executor/__tests__/checkpoint-manager.unit.test.d.ts +7 -0
package/dist/executor/__tests__/checkpoint-manager.unit.test.d.ts.map +1 -0
package/dist/executor/__tests__/checkpoint-manager.unit.test.js +531 -0
package/dist/executor/__tests__/checkpoint-manager.unit.test.js.map +1 -0
package/dist/executor/__tests__/checkpoint-merge-bug.diagnostic.test.d.ts +8 -0
package/dist/executor/__tests__/checkpoint-merge-bug.diagnostic.test.d.ts.map +1 -0
package/dist/executor/__tests__/checkpoint-merge-bug.diagnostic.test.js +493 -0
package/dist/executor/__tests__/checkpoint-merge-bug.diagnostic.test.js.map +1 -0
package/dist/executor/__tests__/checkpoint-merge-bug.unit.test.d.ts +8 -0
package/dist/executor/__tests__/checkpoint-merge-bug.unit.test.d.ts.map +1 -0
package/dist/executor/__tests__/checkpoint-merge-bug.unit.test.js +164 -0
package/dist/executor/__tests__/checkpoint-merge-bug.unit.test.js.map +1 -0
package/dist/executor/__tests__/checkpoint-storage.unit.test.d.ts +7 -0
package/dist/executor/__tests__/checkpoint-storage.unit.test.d.ts.map +1 -0
package/dist/executor/__tests__/checkpoint-storage.unit.test.js +490 -0
package/dist/executor/__tests__/checkpoint-storage.unit.test.js.map +1 -0
package/dist/executor/__tests__/executor.unit.test.d.ts +7 -0
package/dist/executor/__tests__/executor.unit.test.d.ts.map +1 -0
package/dist/executor/__tests__/executor.unit.test.js +202 -0
package/dist/executor/__tests__/executor.unit.test.js.map +1 -0
package/dist/executor/__tests__/memory-monitor.unit.test.d.ts +7 -0
package/dist/executor/__tests__/memory-monitor.unit.test.d.ts.map +1 -0
package/dist/executor/__tests__/memory-monitor.unit.test.js +285 -0
package/dist/executor/__tests__/memory-monitor.unit.test.js.map +1 -0
package/dist/executor/__tests__/parallel-checkpoint-merge.integration.test.d.ts +12 -0
package/dist/executor/__tests__/parallel-checkpoint-merge.integration.test.d.ts.map +1 -0
package/dist/executor/__tests__/parallel-checkpoint-merge.integration.test.js +196 -0
package/dist/executor/__tests__/parallel-checkpoint-merge.integration.test.js.map +1 -0
package/dist/executor/__tests__/parallel-executor.integration.test.d.ts +7 -0
package/dist/executor/__tests__/parallel-executor.integration.test.d.ts.map +1 -0
package/dist/executor/__tests__/parallel-executor.integration.test.js +249 -0
package/dist/executor/__tests__/parallel-executor.integration.test.js.map +1 -0
package/dist/executor/__tests__/parallel-executor.unit.test.d.ts +8 -0
package/dist/executor/__tests__/parallel-executor.unit.test.d.ts.map +1 -0
package/dist/executor/__tests__/parallel-executor.unit.test.js +473 -0
package/dist/executor/__tests__/parallel-executor.unit.test.js.map +1 -0
package/dist/executor/__tests__/run-id.unit.test.d.ts +8 -0
package/dist/executor/__tests__/run-id.unit.test.d.ts.map +1 -0
package/dist/executor/__tests__/run-id.unit.test.js +156 -0
package/dist/executor/__tests__/run-id.unit.test.js.map +1 -0
package/dist/executor/__tests__/worker-entry.integration.test.d.ts +24 -0
package/dist/executor/__tests__/worker-entry.integration.test.d.ts.map +1 -0
package/dist/executor/__tests__/worker-entry.integration.test.js +82 -0
package/dist/executor/__tests__/worker-entry.integration.test.js.map +1 -0
package/dist/executor/__tests__/worker-entry.unit.test.d.ts +7 -0
package/dist/executor/__tests__/worker-entry.unit.test.d.ts.map +1 -0
package/dist/executor/__tests__/worker-entry.unit.test.js +364 -0
package/dist/executor/__tests__/worker-entry.unit.test.js.map +1 -0
package/dist/executor/checkpoint-manager.d.ts +231 -0
package/dist/executor/checkpoint-manager.d.ts.map +1 -0
package/dist/executor/checkpoint-manager.js +395 -0
package/dist/executor/checkpoint-manager.js.map +1 -0
package/dist/executor/checkpoint-storage.d.ts +230 -0
package/dist/executor/checkpoint-storage.d.ts.map +1 -0
package/dist/executor/checkpoint-storage.js +370 -0
package/dist/executor/checkpoint-storage.js.map +1 -0
package/dist/executor/checkpoint-types.d.ts +48 -0
package/dist/executor/checkpoint-types.d.ts.map +1 -0
package/dist/executor/checkpoint-types.js +8 -0
package/dist/executor/checkpoint-types.js.map +1 -0
package/dist/executor/executor.d.ts +164 -0
package/dist/executor/executor.d.ts.map +1 -0
package/dist/executor/executor.js +408 -0
package/dist/executor/executor.js.map +1 -0
package/dist/executor/index.d.ts +11 -0
package/dist/executor/index.d.ts.map +1 -0
package/dist/executor/index.js +11 -0
package/dist/executor/index.js.map +1 -0
package/dist/executor/memory-monitor.d.ts +115 -0
package/dist/executor/memory-monitor.d.ts.map +1 -0
package/dist/executor/memory-monitor.js +168 -0
package/dist/executor/memory-monitor.js.map +1 -0
package/dist/executor/parallel-executor.d.ts +239 -0
package/dist/executor/parallel-executor.d.ts.map +1 -0
package/dist/executor/parallel-executor.js +329 -0
package/dist/executor/parallel-executor.js.map +1 -0
package/dist/executor/run-id.d.ts +71 -0
package/dist/executor/run-id.d.ts.map +1 -0
package/dist/executor/run-id.js +74 -0
package/dist/executor/run-id.js.map +1 -0
package/dist/executor/worker-entry.d.ts +10 -0
package/dist/executor/worker-entry.d.ts.map +1 -0
package/dist/executor/worker-entry.js +42 -0
package/dist/executor/worker-entry.js.map +1 -0
package/dist/executor/worker-executor.d.ts +156 -0
package/dist/executor/worker-executor.d.ts.map +1 -0
package/dist/executor/worker-executor.js +88 -0
package/dist/executor/worker-executor.js.map +1 -0
package/dist/index.cjs +11 -0
package/dist/index.d.ts +15 -0
package/dist/index.d.ts.map +1 -0
package/dist/index.js +24 -0
package/dist/index.js.map +1 -0
package/dist/registry/case-registry.d.ts +113 -0
package/dist/registry/case-registry.d.ts.map +1 -0
package/dist/registry/case-registry.js +160 -0
package/dist/registry/case-registry.js.map +1 -0
package/dist/registry/index.d.ts +8 -0
package/dist/registry/index.d.ts.map +1 -0
package/dist/registry/index.js +8 -0
package/dist/registry/index.js.map +1 -0
package/dist/registry/sut-registry.d.ts +96 -0
package/dist/registry/sut-registry.d.ts.map +1 -0
package/dist/registry/sut-registry.js +126 -0
package/dist/registry/sut-registry.js.map +1 -0
package/dist/renderers/index.d.ts +10 -0
package/dist/renderers/index.d.ts.map +1 -0
package/dist/renderers/index.js +9 -0
package/dist/renderers/index.js.map +1 -0
package/dist/renderers/latex-renderer.d.ts +84 -0
package/dist/renderers/latex-renderer.d.ts.map +1 -0
package/dist/renderers/latex-renderer.js +208 -0
package/dist/renderers/latex-renderer.js.map +1 -0
package/dist/renderers/types.d.ts +106 -0
package/dist/renderers/types.d.ts.map +1 -0
package/dist/renderers/types.js +23 -0
package/dist/renderers/types.js.map +1 -0
package/dist/robustness/__tests__/analyzer.unit.test.d.ts +11 -0
package/dist/robustness/__tests__/analyzer.unit.test.d.ts.map +1 -0
package/dist/robustness/__tests__/analyzer.unit.test.js +455 -0
package/dist/robustness/__tests__/analyzer.unit.test.js.map +1 -0
package/dist/robustness/__tests__/perturbations.unit.test.d.ts +11 -0
package/dist/robustness/__tests__/perturbations.unit.test.d.ts.map +1 -0
package/dist/robustness/__tests__/perturbations.unit.test.js +284 -0
package/dist/robustness/__tests__/perturbations.unit.test.js.map +1 -0
package/dist/robustness/analyzer.d.ts +61 -0
package/dist/robustness/analyzer.d.ts.map +1 -0
package/dist/robustness/analyzer.js +191 -0
package/dist/robustness/analyzer.js.map +1 -0
package/dist/robustness/index.d.ts +8 -0
package/dist/robustness/index.d.ts.map +1 -0
package/dist/robustness/index.js +8 -0
package/dist/robustness/index.js.map +1 -0
package/dist/robustness/perturbations.d.ts +46 -0
package/dist/robustness/perturbations.d.ts.map +1 -0
package/dist/robustness/perturbations.js +184 -0
package/dist/robustness/perturbations.js.map +1 -0
package/dist/statistical/__tests__/mann-whitney-u.unit.test.d.ts +7 -0
package/dist/statistical/__tests__/mann-whitney-u.unit.test.d.ts.map +1 -0
package/dist/statistical/__tests__/mann-whitney-u.unit.test.js +185 -0
package/dist/statistical/__tests__/mann-whitney-u.unit.test.js.map +1 -0
package/dist/statistical/index.d.ts +8 -0
package/dist/statistical/index.d.ts.map +1 -0
package/dist/statistical/index.js +8 -0
package/dist/statistical/index.js.map +1 -0
package/dist/statistical/mann-whitney-u.d.ts +62 -0
package/dist/statistical/mann-whitney-u.d.ts.map +1 -0
package/dist/statistical/mann-whitney-u.js +127 -0
package/dist/statistical/mann-whitney-u.js.map +1 -0
package/dist/types/aggregate.d.ts +124 -0
package/dist/types/aggregate.d.ts.map +1 -0
package/dist/types/aggregate.js +9 -0
package/dist/types/aggregate.js.map +1 -0
package/dist/types/case.d.ts +105 -0
package/dist/types/case.d.ts.map +1 -0
package/dist/types/case.js +10 -0
package/dist/types/case.js.map +1 -0
package/dist/types/claims.d.ts +122 -0
package/dist/types/claims.d.ts.map +1 -0
package/dist/types/claims.js +14 -0
package/dist/types/claims.js.map +1 -0
package/dist/types/index.d.ts +12 -0
package/dist/types/index.d.ts.map +1 -0
package/dist/types/index.js +7 -0
package/dist/types/index.js.map +1 -0
package/dist/types/perturbation.d.ts +105 -0
package/dist/types/perturbation.d.ts.map +1 -0
package/dist/types/perturbation.js +9 -0
package/dist/types/perturbation.js.map +1 -0
package/dist/types/result.d.ts +150 -0
package/dist/types/result.d.ts.map +1 -0
package/dist/types/result.js +12 -0
package/dist/types/result.js.map +1 -0
package/dist/types/sut.d.ts +128 -0
package/dist/types/sut.d.ts.map +1 -0
package/dist/types/sut.js +12 -0
package/dist/types/sut.js.map +1 -0
package/package.json +290 -7

package/dist/claims/__tests__/evaluator.unit.test.js ADDED Viewed

@@ -0,0 +1,801 @@
+/**
+ * Unit tests for Claims Evaluator
+ *
+ * Tests the evaluateClaim function and related functionality including:
+ * - Satisfied claims with various directions
+ * - Violated claims
+ * - Inconclusive results from missing data
+ * - Evidence computation (delta, ratio, pValue, effectSize)
+ * - Scope filtering with caseClass constraints
+ */
+import { describe, it } from "node:test";
+import { strict as assert } from "node:assert";
+import { createMockAggregate, createMockSummaryStats } from "../../__tests__/test-helpers.js";
+import { evaluateClaim, evaluateClaims, createClaimSummary } from "../evaluator.js";
+/**
+ * Test helpers
+ */
+/**
+ * Create a test claim with defaults.
+ */
+const createTestClaim = (overrides) => ({
+    claimId: "C001",
+    description: "Test claim",
+    sut: "primary-sut",
+    baseline: "baseline-sut",
+    metric: "execution-time",
+    direction: "less",
+    scope: "global",
+    ...overrides,
+});
+/**
+ * Test suites
+ */
+describe("evaluateClaim", () => {
+    describe("satisfied claims - direction 'less'", () => {
+        it("should satisfy claim when primary < baseline", () => {
+            const claim = createTestClaim({
+                sut: "fast-sut",
+                baseline: "slow-sut",
+                direction: "less",
+            });
+            const aggregates = [
+                createMockAggregate("fast-sut", "primary", undefined, {
+                    "execution-time": createMockSummaryStats([80, 85, 90]),
+                }),
+                createMockAggregate("slow-sut", "baseline", undefined, {
+                    "execution-time": createMockSummaryStats([120, 125, 130]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.status, "satisfied");
+            assert.equal(result.claim.claimId, "C001");
+            assert.equal(result.evidence.primaryValue, 85);
+            assert.equal(result.evidence.baselineValue, 125);
+            assert.equal(result.evidence.delta, -40);
+        });
+        it("should satisfy claim with threshold when primary <= baseline - threshold", () => {
+            const claim = createTestClaim({
+                sut: "fast-sut",
+                baseline: "slow-sut",
+                direction: "less",
+                threshold: 10,
+            });
+            const aggregates = [
+                createMockAggregate("fast-sut", "primary", undefined, {
+                    "execution-time": createMockSummaryStats([80, 85, 90]),
+                }),
+                createMockAggregate("slow-sut", "baseline", undefined, {
+                    "execution-time": createMockSummaryStats([100, 105, 110]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.status, "satisfied");
+            assert.equal(result.evidence.delta, -20);
+            assert.equal(result.evidence.delta, -20); // -20 <= -10 threshold
+        });
+    });
+    describe("violated claims - direction 'less'", () => {
+        it("should violate claim when primary > baseline", () => {
+            const claim = createTestClaim({
+                sut: "slow-sut",
+                baseline: "fast-sut",
+                direction: "less",
+            });
+            const aggregates = [
+                createMockAggregate("slow-sut", "primary", undefined, {
+                    "execution-time": createMockSummaryStats([120, 125, 130]),
+                }),
+                createMockAggregate("fast-sut", "baseline", undefined, {
+                    "execution-time": createMockSummaryStats([80, 85, 90]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.status, "violated");
+            assert.equal(result.evidence.delta, 40);
+        });
+        it("should violate claim with threshold when delta not sufficient", () => {
+            const claim = createTestClaim({
+                sut: "fast-sut",
+                baseline: "slow-sut",
+                direction: "less",
+                threshold: 50,
+            });
+            const aggregates = [
+                createMockAggregate("fast-sut", "primary", undefined, {
+                    "execution-time": createMockSummaryStats([80, 85, 90]),
+                }),
+                createMockAggregate("slow-sut", "baseline", undefined, {
+                    "execution-time": createMockSummaryStats([120, 125, 130]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.status, "violated");
+            assert.equal(result.evidence.delta, -40); // -40 > -50 threshold
+        });
+    });
+    describe("satisfied claims - direction 'greater'", () => {
+        it("should satisfy claim when primary > baseline", () => {
+            const claim = createTestClaim({
+                sut: "high-quality",
+                baseline: "low-quality",
+                metric: "accuracy",
+                direction: "greater",
+            });
+            const aggregates = [
+                createMockAggregate("high-quality", "primary", undefined, {
+                    accuracy: createMockSummaryStats([0.9, 0.92, 0.95]),
+                }),
+                createMockAggregate("low-quality", "baseline", undefined, {
+                    accuracy: createMockSummaryStats([0.7, 0.75, 0.8]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.status, "satisfied");
+            assert.ok(Math.abs(result.evidence.delta - 0.17) < 0.01);
+        });
+        it("should satisfy claim with threshold", () => {
+            const claim = createTestClaim({
+                sut: "high-quality",
+                baseline: "low-quality",
+                metric: "accuracy",
+                direction: "greater",
+                threshold: 0.1,
+            });
+            const aggregates = [
+                createMockAggregate("high-quality", "primary", undefined, {
+                    accuracy: createMockSummaryStats([0.9, 0.92, 0.95]),
+                }),
+                createMockAggregate("low-quality", "baseline", undefined, {
+                    accuracy: createMockSummaryStats([0.7, 0.75, 0.8]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.status, "satisfied");
+            assert.ok(Math.abs(result.evidence.delta - 0.17) < 0.01); // 0.17 >= 0.1
+        });
+    });
+    describe("violated claims - direction 'greater'", () => {
+        it("should violate claim when primary < baseline", () => {
+            const claim = createTestClaim({
+                sut: "low-quality",
+                baseline: "high-quality",
+                metric: "accuracy",
+                direction: "greater",
+            });
+            const aggregates = [
+                createMockAggregate("low-quality", "primary", undefined, {
+                    accuracy: createMockSummaryStats([0.7, 0.75, 0.8]),
+                }),
+                createMockAggregate("high-quality", "baseline", undefined, {
+                    accuracy: createMockSummaryStats([0.9, 0.92, 0.95]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.status, "violated");
+            assert.ok(Math.abs(result.evidence.delta - -0.17) < 0.01);
+        });
+    });
+    describe("satisfied claims - direction 'equal'", () => {
+        it("should satisfy claim when values are approximately equal", () => {
+            const claim = createTestClaim({
+                sut: "sut-a",
+                baseline: "sut-b",
+                metric: "output-size",
+                direction: "equal",
+            });
+            const aggregates = [
+                createMockAggregate("sut-a", "primary", undefined, {
+                    "output-size": createMockSummaryStats([100, 100.1, 99.9]),
+                }),
+                createMockAggregate("sut-b", "baseline", undefined, {
+                    "output-size": createMockSummaryStats([100, 100.05, 99.95]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.status, "satisfied");
+            assert.ok(Math.abs(result.evidence.delta) <= 0.001);
+        });
+        it("should satisfy claim with custom threshold", () => {
+            const claim = createTestClaim({
+                sut: "sut-a",
+                baseline: "sut-b",
+                metric: "output-size",
+                direction: "equal",
+                threshold: 5,
+            });
+            const aggregates = [
+                createMockAggregate("sut-a", "primary", undefined, {
+                    "output-size": createMockSummaryStats([100, 102, 98]),
+                }),
+                createMockAggregate("sut-b", "baseline", undefined, {
+                    "output-size": createMockSummaryStats([103, 105, 97]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.status, "satisfied");
+            assert.ok(Math.abs(result.evidence.delta) <= 5);
+        });
+    });
+    describe("violated claims - direction 'equal'", () => {
+        it("should violate claim when values differ significantly", () => {
+            const claim = createTestClaim({
+                sut: "sut-a",
+                baseline: "sut-b",
+                metric: "output-size",
+                direction: "equal",
+            });
+            const aggregates = [
+                createMockAggregate("sut-a", "primary", undefined, {
+                    "output-size": createMockSummaryStats([100, 110, 90]),
+                }),
+                createMockAggregate("sut-b", "baseline", undefined, {
+                    "output-size": createMockSummaryStats([150, 160, 140]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.status, "violated");
+            assert.ok(Math.abs(result.evidence.delta) > 0.001);
+        });
+    });
+    describe("inconclusive - missing primary or baseline", () => {
+        it("should be inconclusive when primary SUT not found", () => {
+            const claim = createTestClaim({
+                sut: "missing-sut",
+                baseline: "baseline-sut",
+            });
+            const aggregates = [
+                createMockAggregate("baseline-sut", "baseline", undefined, {
+                    "execution-time": createMockSummaryStats([100, 110, 120]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.status, "inconclusive");
+            assert.ok(result.inconclusiveReason?.includes("Primary SUT not found"));
+        });
+        it("should be inconclusive when baseline SUT not found", () => {
+            const claim = createTestClaim({
+                sut: "primary-sut",
+                baseline: "missing-sut",
+            });
+            const aggregates = [
+                createMockAggregate("primary-sut", "primary", undefined, {
+                    "execution-time": createMockSummaryStats([80, 85, 90]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.status, "inconclusive");
+            assert.ok(result.inconclusiveReason?.includes("Baseline SUT not found"));
+        });
+        it("should be inconclusive when both SUTs not found", () => {
+            const claim = createTestClaim({
+                sut: "missing-primary",
+                baseline: "missing-baseline",
+            });
+            const aggregates = [
+                createMockAggregate("other-sut", "baseline", undefined, {
+                    "execution-time": createMockSummaryStats([100, 110, 120]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.status, "inconclusive");
+            assert.ok(result.inconclusiveReason?.includes("Primary SUT not found"));
+            assert.ok(result.inconclusiveReason?.includes("Baseline SUT not found"));
+        });
+    });
+    describe("inconclusive - missing metrics", () => {
+        it("should be inconclusive when metric missing from primary", () => {
+            const claim = createTestClaim({
+                metric: "memory-usage",
+            });
+            const aggregates = [
+                createMockAggregate("primary-sut", "primary", undefined, {
+                    "execution-time": createMockSummaryStats([80, 85, 90]),
+                }),
+                createMockAggregate("baseline-sut", "baseline", undefined, {
+                    "memory-usage": createMockSummaryStats([100, 110, 120]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.status, "inconclusive");
+            assert.ok(result.inconclusiveReason?.includes("Metric not found"));
+        });
+        it("should be inconclusive when metric missing from baseline", () => {
+            const claim = createTestClaim({
+                metric: "memory-usage",
+            });
+            const aggregates = [
+                createMockAggregate("primary-sut", "primary", undefined, {
+                    "memory-usage": createMockSummaryStats([80, 85, 90]),
+                }),
+                createMockAggregate("baseline-sut", "baseline", undefined, {
+                    "execution-time": createMockSummaryStats([100, 110, 120]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.status, "inconclusive");
+            assert.ok(result.inconclusiveReason?.includes("Metric not found"));
+        });
+        it("should be inconclusive when metric missing from both", () => {
+            const claim = createTestClaim({
+                metric: "memory-usage",
+            });
+            const aggregates = [
+                createMockAggregate("primary-sut", "primary", undefined, {}),
+                createMockAggregate("baseline-sut", "baseline", undefined, {}),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.status, "inconclusive");
+            assert.ok(result.inconclusiveReason?.includes("Metric not found"));
+        });
+    });
+    describe("evidence computation", () => {
+        it("should compute delta correctly", () => {
+            const claim = createTestClaim({
+                sut: "primary-sut",
+                baseline: "baseline-sut",
+                metric: "execution-time",
+            });
+            const aggregates = [
+                createMockAggregate("primary-sut", "primary", undefined, {
+                    "execution-time": createMockSummaryStats([80, 90, 100]),
+                }),
+                createMockAggregate("baseline-sut", "baseline", undefined, {
+                    "execution-time": createMockSummaryStats([120, 130, 140]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.evidence.primaryValue, 90);
+            assert.equal(result.evidence.baselineValue, 130);
+            assert.equal(result.evidence.delta, -40);
+        });
+        it("should compute ratio correctly", () => {
+            const claim = createTestClaim({
+                sut: "primary-sut",
+                baseline: "baseline-sut",
+            });
+            const aggregates = [
+                createMockAggregate("primary-sut", "primary", undefined, {
+                    "execution-time": createMockSummaryStats([100]),
+                }),
+                createMockAggregate("baseline-sut", "baseline", undefined, {
+                    "execution-time": createMockSummaryStats([200]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.evidence.ratio, 0.5);
+        });
+        it("should handle zero baseline for ratio", () => {
+            const claim = createTestClaim({
+                sut: "primary-sut",
+                baseline: "baseline-sut",
+                metric: "errors",
+            });
+            const aggregates = [
+                createMockAggregate("primary-sut", "primary", undefined, {
+                    errors: createMockSummaryStats([0]),
+                }),
+                createMockAggregate("baseline-sut", "baseline", undefined, {
+                    errors: createMockSummaryStats([0]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.evidence.ratio, Infinity);
+        });
+        it("should compute n as sum of sample sizes", () => {
+            const claim = createTestClaim();
+            const aggregates = [
+                createMockAggregate("primary-sut", "primary", undefined, {
+                    "execution-time": createMockSummaryStats([100, 110, 120]),
+                }),
+                createMockAggregate("baseline-sut", "baseline", undefined, {
+                    "execution-time": createMockSummaryStats([200, 210]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.evidence.n, 5); // 3 + 2
+        });
+        it("should include pValue from comparisons", () => {
+            const claim = createTestClaim();
+            const primaryAgg = createMockAggregate("primary-sut", "primary", undefined, {
+                "execution-time": createMockSummaryStats([80, 85, 90]),
+            });
+            const baselineAgg = createMockAggregate("baseline-sut", "baseline", undefined, {
+                "execution-time": createMockSummaryStats([120, 125, 130]),
+            });
+            // Add comparison data
+            primaryAgg.comparisons = {
+                "baseline-sut": {
+                    deltas: { "execution-time": -40 },
+                    ratios: { "execution-time": 0.68 },
+                    pValue: 0.01,
+                    effectSize: 1.5,
+                },
+            };
+            const aggregates = [primaryAgg, baselineAgg];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.evidence.pValue, 0.01);
+            assert.equal(result.evidence.effectSize, 1.5);
+        });
+        it("should handle missing pValue and effectSize", () => {
+            const claim = createTestClaim();
+            const aggregates = [
+                createMockAggregate("primary-sut", "primary", undefined, {
+                    "execution-time": createMockSummaryStats([80, 85, 90]),
+                }),
+                createMockAggregate("baseline-sut", "baseline", undefined, {
+                    "execution-time": createMockSummaryStats([120, 125, 130]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.evidence.pValue, undefined);
+            assert.equal(result.evidence.effectSize, undefined);
+        });
+    });
+    describe("statistical significance", () => {
+        it("should be inconclusive when pValue exceeds significance level", () => {
+            const claim = createTestClaim({
+                significanceLevel: 0.05,
+            });
+            const primaryAgg = createMockAggregate("primary-sut", "primary", undefined, {
+                "execution-time": createMockSummaryStats([80, 85, 90]),
+            });
+            const baselineAgg = createMockAggregate("baseline-sut", "baseline", undefined, {
+                "execution-time": createMockSummaryStats([120, 125, 130]),
+            });
+            primaryAgg.comparisons = {
+                "baseline-sut": {
+                    deltas: { "execution-time": -40 },
+                    ratios: { "execution-time": 0.68 },
+                    pValue: 0.1, // Not significant
+                    effectSize: 1.5,
+                },
+            };
+            const result = evaluateClaim(claim, [primaryAgg, baselineAgg]);
+            assert.equal(result.status, "inconclusive");
+        });
+        it("should be satisfied when pValue meets significance level", () => {
+            const claim = createTestClaim({
+                direction: "less",
+                significanceLevel: 0.05,
+            });
+            const primaryAgg = createMockAggregate("primary-sut", "primary", undefined, {
+                "execution-time": createMockSummaryStats([80, 85, 90]),
+            });
+            const baselineAgg = createMockAggregate("baseline-sut", "baseline", undefined, {
+                "execution-time": createMockSummaryStats([120, 125, 130]),
+            });
+            primaryAgg.comparisons = {
+                "baseline-sut": {
+                    deltas: { "execution-time": -40 },
+                    ratios: { "execution-time": 0.68 },
+                    pValue: 0.01, // Significant
+                    effectSize: 1.5,
+                },
+            };
+            const result = evaluateClaim(claim, [primaryAgg, baselineAgg]);
+            assert.equal(result.status, "satisfied");
+        });
+        it("should be inconclusive when effectSize below minimum", () => {
+            const claim = createTestClaim({
+                direction: "less",
+                minEffectSize: 0.8,
+            });
+            const primaryAgg = createMockAggregate("primary-sut", "primary", undefined, {
+                "execution-time": createMockSummaryStats([80, 85, 90]),
+            });
+            const baselineAgg = createMockAggregate("baseline-sut", "baseline", undefined, {
+                "execution-time": createMockSummaryStats([120, 125, 130]),
+            });
+            primaryAgg.comparisons = {
+                "baseline-sut": {
+                    deltas: { "execution-time": -40 },
+                    ratios: { "execution-time": 0.68 },
+                    pValue: 0.01,
+                    effectSize: 0.5, // Below minimum
+                },
+            };
+            const result = evaluateClaim(claim, [primaryAgg, baselineAgg]);
+            assert.equal(result.status, "inconclusive");
+        });
+    });
+    describe("scope filtering - byClass with caseClass constraints", () => {
+        it("should filter aggregates to matching caseClass", () => {
+            const claim = createTestClaim({
+                sut: "primary-sut",
+                baseline: "baseline-sut",
+                scope: "caseClass",
+                scopeConstraints: {
+                    caseClass: "scale-free",
+                },
+            });
+            const aggregates = [
+                createMockAggregate("primary-sut", "primary", "scale-free", {
+                    "execution-time": createMockSummaryStats([80, 85, 90]),
+                }),
+                createMockAggregate("primary-sut", "primary", "small-world", {
+                    "execution-time": createMockSummaryStats([200, 210, 220]),
+                }),
+                createMockAggregate("baseline-sut", "baseline", "scale-free", {
+                    "execution-time": createMockSummaryStats([120, 125, 130]),
+                }),
+                createMockAggregate("baseline-sut", "baseline", "small-world", {
+                    "execution-time": createMockSummaryStats([250, 260, 270]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.status, "satisfied");
+            assert.equal(result.evidence.primaryValue, 85); // From scale-free aggregate
+            assert.equal(result.evidence.baselineValue, 125); // From scale-free aggregate
+        });
+        it("should be inconclusive when caseClass not found for primary", () => {
+            const claim = createTestClaim({
+                sut: "primary-sut",
+                baseline: "baseline-sut",
+                scope: "caseClass",
+                scopeConstraints: {
+                    caseClass: "missing-class",
+                },
+            });
+            const aggregates = [
+                createMockAggregate("primary-sut", "primary", "scale-free", {
+                    "execution-time": createMockSummaryStats([80, 85, 90]),
+                }),
+                createMockAggregate("baseline-sut", "baseline", "scale-free", {
+                    "execution-time": createMockSummaryStats([120, 125, 130]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.status, "inconclusive");
+            assert.ok(result.inconclusiveReason?.includes("Primary SUT not found"));
+        });
+        it("should handle multiple caseClass values", () => {
+            const claim = createTestClaim({
+                sut: "primary-sut",
+                baseline: "baseline-sut",
+                scope: "caseClass",
+                scopeConstraints: {
+                    caseClass: ["scale-free", "random"],
+                },
+            });
+            const aggregates = [
+                createMockAggregate("primary-sut", "primary", "scale-free", {
+                    "execution-time": createMockSummaryStats([80, 85, 90]),
+                }),
+                createMockAggregate("primary-sut", "primary", "random", {
+                    "execution-time": createMockSummaryStats([70, 75, 80]),
+                }),
+                createMockAggregate("baseline-sut", "baseline", "scale-free", {
+                    "execution-time": createMockSummaryStats([120, 125, 130]),
+                }),
+                createMockAggregate("baseline-sut", "baseline", "random", {
+                    "execution-time": createMockSummaryStats([110, 115, 120]),
+                }),
+                createMockAggregate("primary-sut", "primary", "small-world", {
+                    "execution-time": createMockSummaryStats([200, 210, 220]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            // Should find scale-free aggregates (first match)
+            assert.equal(result.status, "satisfied");
+            assert.equal(result.evidence.primaryValue, 85);
+            assert.equal(result.evidence.baselineValue, 125);
+        });
+        it("should not filter when no scopeConstraints", () => {
+            const claim = createTestClaim({
+                sut: "primary-sut",
+                baseline: "baseline-sut",
+                scope: "global",
+            });
+            const aggregates = [
+                createMockAggregate("primary-sut", "primary", "scale-free", {
+                    "execution-time": createMockSummaryStats([80, 85, 90]),
+                }),
+                createMockAggregate("baseline-sut", "baseline", "scale-free", {
+                    "execution-time": createMockSummaryStats([120, 125, 130]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.status, "satisfied");
+        });
+    });
+    describe("edge cases", () => {
+        it("should handle NaN values in evidence", () => {
+            const claim = createTestClaim();
+            const primaryAgg = createMockAggregate("primary-sut", "primary", undefined, {});
+            const baselineAgg = createMockAggregate("baseline-sut", "baseline", undefined, {});
+            // Add metric with NaN mean
+            primaryAgg.metrics["test-metric"] = createMockSummaryStats([]);
+            baselineAgg.metrics["test-metric"] = createMockSummaryStats([]);
+            claim.metric = "test-metric";
+            const result = evaluateClaim(claim, [primaryAgg, baselineAgg]);
+            assert.ok(Number.isNaN(result.evidence.primaryValue));
+            assert.ok(Number.isNaN(result.evidence.baselineValue));
+            assert.ok(Number.isNaN(result.evidence.delta));
+            assert.ok(Number.isNaN(result.evidence.ratio));
+        });
+        it("should handle identical primary and baseline values", () => {
+            const claim = createTestClaim({
+                direction: "greater",
+            });
+            const aggregates = [
+                createMockAggregate("primary-sut", "primary", undefined, {
+                    "execution-time": createMockSummaryStats([100, 100, 100]),
+                }),
+                createMockAggregate("baseline-sut", "baseline", undefined, {
+                    "execution-time": createMockSummaryStats([100, 100, 100]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.status, "violated");
+            assert.equal(result.evidence.delta, 0);
+        });
+        it("should handle boundary case for greater with exact threshold", () => {
+            const claim = createTestClaim({
+                sut: "primary-sut",
+                baseline: "baseline-sut",
+                metric: "accuracy",
+                direction: "greater",
+                threshold: 0.17,
+            });
+            const aggregates = [
+                createMockAggregate("primary-sut", "primary", undefined, {
+                    accuracy: createMockSummaryStats([0.9, 0.92, 0.95]),
+                }),
+                createMockAggregate("baseline-sut", "baseline", undefined, {
+                    accuracy: createMockSummaryStats([0.7, 0.75, 0.8]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.status, "satisfied");
+            assert.ok(result.evidence.delta >= 0.17);
+        });
+    });
+    describe("scope filtering - unknown constraint keys", () => {
+        it("should ignore unknown constraint keys", () => {
+            const claim = createTestClaim({
+                sut: "primary-sut",
+                baseline: "baseline-sut",
+                scope: "caseClass",
+                scopeConstraints: {
+                    unknownKey: "some-value",
+                },
+            });
+            const aggregates = [
+                createMockAggregate("primary-sut", "primary", "scale-free", {
+                    "execution-time": createMockSummaryStats([80, 85, 90]),
+                }),
+                createMockAggregate("baseline-sut", "baseline", "scale-free", {
+                    "execution-time": createMockSummaryStats([120, 125, 130]),
+                }),
+            ];
+            const result = evaluateClaim(claim, aggregates);
+            assert.equal(result.status, "satisfied");
+        });
+    });
+});
+describe("evaluateClaims", () => {
+    it("should evaluate multiple claims", () => {
+        const claims = [
+            createTestClaim({
+                claimId: "C001",
+                sut: "fast-sut",
+                baseline: "slow-sut",
+                direction: "less",
+            }),
+            createTestClaim({
+                claimId: "C002",
+                sut: "high-quality",
+                baseline: "low-quality",
+                metric: "accuracy",
+                direction: "greater",
+            }),
+        ];
+        const aggregates = [
+            createMockAggregate("fast-sut", "primary", undefined, {
+                "execution-time": createMockSummaryStats([80, 85, 90]),
+            }),
+            createMockAggregate("slow-sut", "baseline", undefined, {
+                "execution-time": createMockSummaryStats([120, 125, 130]),
+            }),
+            createMockAggregate("high-quality", "primary", undefined, {
+                accuracy: createMockSummaryStats([0.9, 0.92, 0.95]),
+            }),
+            createMockAggregate("low-quality", "baseline", undefined, {
+                accuracy: createMockSummaryStats([0.7, 0.75, 0.8]),
+            }),
+        ];
+        const results = evaluateClaims(claims, aggregates);
+        assert.equal(results.length, 2);
+        assert.equal(results[0].claim.claimId, "C001");
+        assert.equal(results[0].status, "satisfied");
+        assert.equal(results[1].claim.claimId, "C002");
+        assert.equal(results[1].status, "satisfied");
+    });
+});
+describe("createClaimSummary", () => {
+    it("should create summary with correct counts", () => {
+        const evaluations = [
+            {
+                claim: createTestClaim({ claimId: "C001" }),
+                status: "satisfied",
+                evidence: {
+                    primaryValue: 100,
+                    baselineValue: 120,
+                    delta: -20,
+                    ratio: 0.83,
+                },
+            },
+            {
+                claim: createTestClaim({ claimId: "C002" }),
+                status: "violated",
+                evidence: {
+                    primaryValue: 150,
+                    baselineValue: 100,
+                    delta: 50,
+                    ratio: 1.5,
+                },
+            },
+            {
+                claim: createTestClaim({ claimId: "C003" }),
+                status: "inconclusive",
+                evidence: {
+                    primaryValue: Number.NaN,
+                    baselineValue: Number.NaN,
+                    delta: Number.NaN,
+                    ratio: Number.NaN,
+                },
+                inconclusiveReason: "Missing data",
+            },
+        ];
+        const summary = createClaimSummary(evaluations);
+        assert.equal(summary.version, "1.0.0");
+        assert.equal(summary.summary.total, 3);
+        assert.equal(summary.summary.satisfied, 1);
+        assert.equal(summary.summary.violated, 1);
+        assert.equal(summary.summary.inconclusive, 1);
+        assert.equal(summary.summary.satisfactionRate, 0.5); // 1 / (1 + 1)
+        assert.ok(summary.timestamp);
+    });
+    it("should handle empty evaluations array", () => {
+        const summary = createClaimSummary([]);
+        assert.equal(summary.summary.total, 0);
+        assert.equal(summary.summary.satisfied, 0);
+        assert.equal(summary.summary.violated, 0);
+        assert.equal(summary.summary.inconclusive, 0);
+        assert.equal(summary.summary.satisfactionRate, 0);
+    });
+    it("should handle all inconclusive evaluations", () => {
+        const evaluations = [
+            {
+                claim: createTestClaim({ claimId: "C001" }),
+                status: "inconclusive",
+                evidence: {
+                    primaryValue: Number.NaN,
+                    baselineValue: Number.NaN,
+                    delta: Number.NaN,
+                    ratio: Number.NaN,
+                },
+                inconclusiveReason: "Missing data",
+            },
+            {
+                claim: createTestClaim({ claimId: "C002" }),
+                status: "inconclusive",
+                evidence: {
+                    primaryValue: Number.NaN,
+                    baselineValue: Number.NaN,
+                    delta: Number.NaN,
+                    ratio: Number.NaN,
+                },
+                inconclusiveReason: "Missing metric",
+            },
+        ];
+        const summary = createClaimSummary(evaluations);
+        assert.equal(summary.summary.total, 2);
+        assert.equal(summary.summary.satisfied, 0);
+        assert.equal(summary.summary.violated, 0);
+        assert.equal(summary.summary.inconclusive, 2);
+        assert.equal(summary.summary.satisfactionRate, 0); // No definitive results
+    });
+});
+//# sourceMappingURL=evaluator.unit.test.js.map