npm - akm-cli - Versions diffs - 0.6.1 → 0.7.0 - Mend

akm-cli 0.6.1 → 0.7.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (333) hide show

package/CHANGELOG.md +66 -0
package/dist/{cli.js → src/cli.js} +712 -34
package/dist/{commands → src/commands}/config-cli.js +47 -4
package/dist/src/commands/distill.js +283 -0
package/dist/src/commands/events.js +108 -0
package/dist/src/commands/history.js +191 -0
package/dist/{commands → src/commands}/installed-stashes.js +1 -1
package/dist/src/commands/proposal.js +119 -0
package/dist/src/commands/propose.js +171 -0
package/dist/src/commands/reflect.js +193 -0
package/dist/{commands → src/commands}/registry-search.js +71 -7
package/dist/{commands → src/commands}/remember.js +12 -0
package/dist/{commands → src/commands}/search.js +104 -4
package/dist/{commands → src/commands}/self-update.js +4 -3
package/dist/{commands → src/commands}/show.js +73 -0
package/dist/{commands → src/commands}/source-add.js +5 -1
package/dist/{commands → src/commands}/source-manage.js +7 -1
package/dist/{core → src/core}/asset-ref.js +5 -5
package/dist/{core → src/core}/asset-spec.js +12 -0
package/dist/{core → src/core}/common.js +1 -1
package/dist/{core → src/core}/config.js +203 -121
package/dist/{core → src/core}/errors.js +4 -0
package/dist/src/core/events.js +239 -0
package/dist/src/core/lesson-lint.js +86 -0
package/dist/src/core/proposals.js +406 -0
package/dist/src/core/warn.js +72 -0
package/dist/{core → src/core}/write-source.js +80 -5
package/dist/{indexer → src/indexer}/db-search.js +114 -24
package/dist/{indexer → src/indexer}/db.js +76 -23
package/dist/{indexer → src/indexer}/file-context.js +0 -3
package/dist/src/indexer/graph-boost.js +179 -0
package/dist/src/indexer/graph-extraction.js +212 -0
package/dist/{indexer → src/indexer}/indexer.js +88 -7
package/dist/{indexer → src/indexer}/matchers.js +1 -1
package/dist/src/indexer/memory-inference.js +263 -0
package/dist/{indexer → src/indexer}/metadata.js +111 -3
package/dist/{indexer → src/indexer}/search-source.js +4 -2
package/dist/src/integrations/agent/config.js +292 -0
package/dist/src/integrations/agent/detect.js +94 -0
package/dist/src/integrations/agent/index.js +17 -0
package/dist/src/integrations/agent/profiles.js +65 -0
package/dist/src/integrations/agent/prompts.js +167 -0
package/dist/src/integrations/agent/spawn.js +272 -0
package/dist/{integrations → src/integrations}/github.js +9 -3
package/dist/{integrations → src/integrations}/lockfile.js +0 -26
package/dist/{llm → src/llm}/client.js +33 -2
package/dist/{llm → src/llm}/embedders/remote.js +37 -3
package/dist/src/llm/feature-gate.js +108 -0
package/dist/src/llm/graph-extract.js +107 -0
package/dist/src/llm/index-passes.js +35 -0
package/dist/src/llm/memory-infer.js +86 -0
package/dist/{output → src/output}/cli-hints.js +15 -2
package/dist/{output → src/output}/renderers.js +63 -2
package/dist/src/output/shapes.js +523 -0
package/dist/src/output/text.js +1116 -0
package/dist/{registry → src/registry}/build-index.js +19 -8
package/dist/{registry → src/registry}/factory.js +0 -8
package/dist/{registry → src/registry}/providers/static-index.js +6 -3
package/dist/{registry → src/registry}/resolve.js +68 -2
package/dist/{setup → src/setup}/setup.js +52 -5
package/dist/{sources → src/sources}/providers/git.js +7 -15
package/dist/{wiki → src/wiki}/wiki.js +54 -6
package/dist/{workflows → src/workflows}/runs.js +37 -3
package/dist/tests/add-website-source.test.js +119 -0
package/dist/tests/agent/agent-config-loader.test.js +70 -0
package/dist/tests/agent/agent-config.test.js +221 -0
package/dist/tests/agent/agent-detect.test.js +100 -0
package/dist/tests/agent/agent-spawn.test.js +234 -0
package/dist/tests/agent-output.test.js +186 -0
package/dist/tests/architecture/agent-no-llm-sdk-guard.test.js +103 -0
package/dist/tests/architecture/agent-spawn-seam.test.js +193 -0
package/dist/tests/architecture/llm-stateless-seam.test.js +112 -0
package/dist/tests/asset-ref.test.js +192 -0
package/dist/tests/asset-registry.test.js +103 -0
package/dist/tests/asset-spec.test.js +241 -0
package/dist/tests/bench/attribution.test.js +996 -0
package/dist/tests/bench/cleanup-sigint.test.js +83 -0
package/dist/tests/bench/cleanup.js +234 -0
package/dist/tests/bench/cleanup.test.js +166 -0
package/dist/tests/bench/cli.js +1018 -0
package/dist/tests/bench/cli.test.js +445 -0
package/dist/tests/bench/compare.test.js +556 -0
package/dist/tests/bench/corpus.js +317 -0
package/dist/tests/bench/corpus.test.js +258 -0
package/dist/tests/bench/doctor.js +525 -0
package/dist/tests/bench/driver.js +401 -0
package/dist/tests/bench/driver.test.js +584 -0
package/dist/tests/bench/environment.js +233 -0
package/dist/tests/bench/environment.test.js +199 -0
package/dist/tests/bench/evolve-metrics.js +179 -0
package/dist/tests/bench/evolve-metrics.test.js +187 -0
package/dist/tests/bench/evolve.js +647 -0
package/dist/tests/bench/evolve.test.js +624 -0
package/dist/tests/bench/failure-modes.test.js +349 -0
package/dist/tests/bench/feedback-integrity.test.js +457 -0
package/dist/tests/bench/leakage.test.js +228 -0
package/dist/tests/bench/learning-curve.test.js +134 -0
package/dist/tests/bench/metrics.js +2395 -0
package/dist/tests/bench/metrics.test.js +1150 -0
package/dist/tests/bench/no-os-tmpdir-invariant.test.js +43 -0
package/dist/tests/bench/opencode-config.js +194 -0
package/dist/tests/bench/opencode-config.test.js +370 -0
package/dist/tests/bench/report.js +1885 -0
package/dist/tests/bench/report.test.js +1038 -0
package/dist/tests/bench/run-config.js +355 -0
package/dist/tests/bench/run-config.test.js +298 -0
package/dist/tests/bench/run-curate-test.js +32 -0
package/dist/tests/bench/run-failing-tasks.js +56 -0
package/dist/tests/bench/run-full-bench.js +51 -0
package/dist/tests/bench/run-items36-targeted.js +69 -0
package/dist/tests/bench/run-nano-quick.js +42 -0
package/dist/tests/bench/run-waveg-targeted.js +62 -0
package/dist/tests/bench/runner.js +699 -0
package/dist/tests/bench/runner.test.js +958 -0
package/dist/tests/bench/search-bridge.test.js +331 -0
package/dist/tests/bench/tmp.js +131 -0
package/dist/tests/bench/trajectory.js +116 -0
package/dist/tests/bench/trajectory.test.js +127 -0
package/dist/tests/bench/verifier.js +114 -0
package/dist/tests/bench/verifier.test.js +118 -0
package/dist/tests/bench/workflow-evaluator.js +557 -0
package/dist/tests/bench/workflow-evaluator.test.js +421 -0
package/dist/tests/bench/workflow-spec.js +345 -0
package/dist/tests/bench/workflow-spec.test.js +363 -0
package/dist/tests/bench/workflow-trace.js +472 -0
package/dist/tests/bench/workflow-trace.test.js +254 -0
package/dist/tests/benchmark-search-quality.js +536 -0
package/dist/tests/benchmark-suite.js +1441 -0
package/dist/tests/capture-cli.test.js +112 -0
package/dist/tests/cli-errors.test.js +204 -0
package/dist/tests/commands/events.test.js +370 -0
package/dist/tests/commands/history.test.js +418 -0
package/dist/tests/commands/import.test.js +103 -0
package/dist/tests/commands/proposal-cli.test.js +209 -0
package/dist/tests/commands/reflect-propose-cli.test.js +333 -0
package/dist/tests/commands/remember.test.js +97 -0
package/dist/tests/commands/scope-flags.test.js +300 -0
package/dist/tests/commands/search.test.js +537 -0
package/dist/tests/commands/show-indexer-parity.test.js +117 -0
package/dist/tests/commands/show.test.js +294 -0
package/dist/tests/common.test.js +266 -0
package/dist/tests/completions.test.js +142 -0
package/dist/tests/config-cli.test.js +193 -0
package/dist/tests/config-llm-features.test.js +139 -0
package/dist/tests/config.test.js +569 -0
package/dist/tests/contracts/migration-baseline.test.js +43 -0
package/dist/tests/contracts/reflect-propose-envelope.test.js +139 -0
package/dist/tests/contracts/spec-helpers.js +46 -0
package/dist/tests/contracts/v1-spec-section-11-proposal-queue.test.js +228 -0
package/dist/tests/contracts/v1-spec-section-12-agent-config.test.js +56 -0
package/dist/tests/contracts/v1-spec-section-13-lesson-type.test.js +34 -0
package/dist/tests/contracts/v1-spec-section-14-llm-features.test.js +94 -0
package/dist/tests/contracts/v1-spec-section-4-1-asset-types.test.js +39 -0
package/dist/tests/contracts/v1-spec-section-4-2-quality-rules.test.js +44 -0
package/dist/tests/contracts/v1-spec-section-5-configuration.test.js +47 -0
package/dist/tests/contracts/v1-spec-section-6-orchestration.test.js +40 -0
package/dist/tests/contracts/v1-spec-section-7-module-layout.test.js +58 -0
package/dist/tests/contracts/v1-spec-section-8-extension-points.test.js +34 -0
package/dist/tests/contracts/v1-spec-section-9-4-cli-surface.test.js +75 -0
package/dist/tests/contracts/v1-spec-section-9-7-llm-agent-boundary.test.js +36 -0
package/dist/tests/core/write-source.test.js +366 -0
package/dist/tests/curate-command.test.js +87 -0
package/dist/tests/db-scoring.test.js +201 -0
package/dist/tests/db.test.js +654 -0
package/dist/tests/distill-cli-flag.test.js +208 -0
package/dist/tests/distill.test.js +515 -0
package/dist/tests/docker-install.test.js +120 -0
package/dist/tests/e2e.test.js +1419 -0
package/dist/tests/embedder.test.js +340 -0
package/dist/tests/embedding-model-config.test.js +379 -0
package/dist/tests/feedback-command.test.js +172 -0
package/dist/tests/file-context.test.js +552 -0
package/dist/tests/fixtures/scripts/git/summarize-diff.js +9 -0
package/dist/tests/fixtures/scripts/lint/eslint-check.js +7 -0
package/dist/tests/fixtures/stashes/load.js +166 -0
package/dist/tests/fixtures/stashes/load.test.js +97 -0
package/dist/tests/fixtures/stashes/ranking-baseline/scripts/mem0-search.js +12 -0
package/dist/tests/frontmatter.test.js +190 -0
package/dist/tests/fts-field-weighting.test.js +254 -0
package/dist/tests/fuzzy-search.test.js +230 -0
package/dist/tests/git-provider-clone.test.js +45 -0
package/dist/tests/github.test.js +161 -0
package/dist/tests/graph-boost-ranking.test.js +305 -0
package/dist/tests/graph-extraction.test.js +282 -0
package/dist/tests/helpers/usage-events.js +8 -0
package/dist/tests/index-pass-llm.test.js +161 -0
package/dist/tests/indexer.test.js +570 -0
package/dist/tests/info-command.test.js +166 -0
package/dist/tests/init.test.js +69 -0
package/dist/tests/install-script.test.js +246 -0
package/dist/tests/integration/agent-real-profile.test.js +94 -0
package/dist/tests/issue-36-repro.test.js +304 -0
package/dist/tests/issues-191-194.test.js +160 -0
package/dist/tests/lesson-lint.test.js +111 -0
package/dist/tests/llm-client.test.js +115 -0
package/dist/tests/llm-feature-gate.test.js +151 -0
package/dist/tests/llm.test.js +139 -0
package/dist/tests/lockfile.test.js +216 -0
package/dist/tests/manifest.test.js +205 -0
package/dist/tests/markdown.test.js +126 -0
package/dist/tests/matchers-unit.test.js +189 -0
package/dist/tests/memory-inference.test.js +299 -0
package/dist/tests/merge-scoring.test.js +136 -0
package/dist/tests/metadata.test.js +313 -0
package/dist/tests/migration-help.test.js +89 -0
package/dist/tests/origin-resolve.test.js +124 -0
package/dist/tests/output-baseline.test.js +218 -0
package/dist/tests/output-shapes-unit.test.js +478 -0
package/dist/tests/parallel-search.test.js +272 -0
package/dist/tests/parameter-metadata.test.js +365 -0
package/dist/tests/paths.test.js +177 -0
package/dist/tests/progressive-disclosure.test.js +280 -0
package/dist/tests/proposals.test.js +279 -0
package/dist/tests/proposed-quality.test.js +271 -0
package/dist/tests/provider-registry.test.js +32 -0
package/dist/tests/ranking-regression.test.js +548 -0
package/dist/tests/reflect-propose.test.js +455 -0
package/dist/tests/registry-build-index.test.js +394 -0
package/dist/tests/registry-cli.test.js +290 -0
package/dist/tests/registry-index-v2.test.js +430 -0
package/dist/tests/registry-install.test.js +728 -0
package/dist/tests/registry-providers/parity.test.js +189 -0
package/dist/tests/registry-providers/skills-sh.test.js +309 -0
package/dist/tests/registry-providers/static-index.test.js +238 -0
package/dist/tests/registry-resolve.test.js +126 -0
package/dist/tests/registry-search.test.js +923 -0
package/dist/tests/remember-frontmatter.test.js +378 -0
package/dist/tests/remember-unit.test.js +123 -0
package/dist/tests/ripgrep-install.test.js +251 -0
package/dist/tests/ripgrep-resolve.test.js +108 -0
package/dist/tests/ripgrep.test.js +163 -0
package/dist/tests/save-command.test.js +94 -0
package/dist/tests/save-trust-qa-fixes.test.js +270 -0
package/dist/tests/scoring-pipeline.test.js +648 -0
package/dist/tests/search-include-proposed-cli.test.js +118 -0
package/dist/tests/self-update.test.js +442 -0
package/dist/tests/semantic-search-e2e.test.js +512 -0
package/dist/tests/semantic-status.test.js +471 -0
package/dist/tests/setup-run.integration.js +877 -0
package/dist/tests/setup-wizard.test.js +198 -0
package/dist/tests/setup.test.js +131 -0
package/dist/tests/source-add.test.js +11 -0
package/dist/tests/source-clone.test.js +254 -0
package/dist/tests/source-manage.test.js +366 -0
package/dist/tests/source-providers/filesystem.test.js +82 -0
package/dist/tests/source-providers/git.test.js +252 -0
package/dist/tests/source-providers/website.test.js +128 -0
package/dist/tests/source-qa-fixes.test.js +286 -0
package/dist/tests/source-registry.test.js +350 -0
package/dist/tests/source-resolve.test.js +100 -0
package/dist/tests/source-source.test.js +281 -0
package/dist/tests/source.test.js +533 -0
package/dist/tests/tar-utils-scan.test.js +73 -0
package/dist/tests/toggle-components.test.js +73 -0
package/dist/tests/usage-telemetry.test.js +265 -0
package/dist/tests/utility-scoring.test.js +558 -0
package/dist/tests/vault-load-error.test.js +78 -0
package/dist/tests/vault-qa-fixes.test.js +194 -0
package/dist/tests/vault.test.js +429 -0
package/dist/tests/vector-search.test.js +608 -0
package/dist/tests/walker.test.js +252 -0
package/dist/tests/wave2-cluster-bc.test.js +228 -0
package/dist/tests/wave2-cluster-d.test.js +180 -0
package/dist/tests/wave2-cluster-e.test.js +179 -0
package/dist/tests/wiki-qa-fixes.test.js +270 -0
package/dist/tests/wiki.test.js +529 -0
package/dist/tests/workflow-cli.test.js +271 -0
package/dist/tests/workflow-markdown.test.js +171 -0
package/dist/tests/workflow-path-escape.test.js +132 -0
package/dist/tests/workflow-qa-fixes.test.js +395 -0
package/dist/tests/workflows/indexer-rejection.test.js +213 -0
package/docs/README.md +8 -0
package/docs/migration/release-notes/0.7.0.md +244 -0
package/package.json +2 -2
package/dist/core/warn.js +0 -27
package/dist/output/shapes.js +0 -212
package/dist/output/text.js +0 -520
/package/dist/{commands → src/commands}/completions.js +0 -0
/package/dist/{commands → src/commands}/curate.js +0 -0
/package/dist/{commands → src/commands}/info.js +0 -0
/package/dist/{commands → src/commands}/init.js +0 -0
/package/dist/{commands → src/commands}/install-audit.js +0 -0
/package/dist/{commands → src/commands}/migration-help.js +0 -0
/package/dist/{commands → src/commands}/source-clone.js +0 -0
/package/dist/{commands → src/commands}/vault.js +0 -0
/package/dist/{core → src/core}/asset-registry.js +0 -0
/package/dist/{core → src/core}/frontmatter.js +0 -0
/package/dist/{core → src/core}/markdown.js +0 -0
/package/dist/{core → src/core}/paths.js +0 -0
/package/dist/{indexer → src/indexer}/manifest.js +0 -0
/package/dist/{indexer → src/indexer}/search-fields.js +0 -0
/package/dist/{indexer → src/indexer}/semantic-status.js +0 -0
/package/dist/{indexer → src/indexer}/usage-events.js +0 -0
/package/dist/{indexer → src/indexer}/walker.js +0 -0
/package/dist/{llm → src/llm}/embedder.js +0 -0
/package/dist/{llm → src/llm}/embedders/cache.js +0 -0
/package/dist/{llm → src/llm}/embedders/local.js +0 -0
/package/dist/{llm → src/llm}/embedders/types.js +0 -0
/package/dist/{llm → src/llm}/metadata-enhance.js +0 -0
/package/dist/{output → src/output}/context.js +0 -0
/package/dist/{registry → src/registry}/create-provider-registry.js +0 -0
/package/dist/{registry → src/registry}/origin-resolve.js +0 -0
/package/dist/{registry → src/registry}/providers/index.js +0 -0
/package/dist/{registry → src/registry}/providers/skills-sh.js +0 -0
/package/dist/{registry → src/registry}/providers/types.js +0 -0
/package/dist/{registry → src/registry}/types.js +0 -0
/package/dist/{setup → src/setup}/detect.js +0 -0
/package/dist/{setup → src/setup}/ripgrep-install.js +0 -0
/package/dist/{setup → src/setup}/ripgrep-resolve.js +0 -0
/package/dist/{setup → src/setup}/steps.js +0 -0
/package/dist/{sources → src/sources}/include.js +0 -0
/package/dist/{sources → src/sources}/provider-factory.js +0 -0
/package/dist/{sources → src/sources}/provider.js +0 -0
/package/dist/{sources → src/sources}/providers/filesystem.js +0 -0
/package/dist/{sources → src/sources}/providers/index.js +0 -0
/package/dist/{sources → src/sources}/providers/install-types.js +0 -0
/package/dist/{sources → src/sources}/providers/npm.js +0 -0
/package/dist/{sources → src/sources}/providers/provider-utils.js +0 -0
/package/dist/{sources → src/sources}/providers/sync-from-ref.js +0 -0
/package/dist/{sources → src/sources}/providers/tar-utils.js +0 -0
/package/dist/{sources → src/sources}/providers/website.js +0 -0
/package/dist/{sources → src/sources}/resolve.js +0 -0
/package/dist/{sources → src/sources}/types.js +0 -0
/package/dist/{templates → src/templates}/wiki-templates.js +0 -0
/package/dist/{version.js → src/version.js} +0 -0
/package/dist/{workflows → src/workflows}/authoring.js +0 -0
/package/dist/{workflows → src/workflows}/cli.js +0 -0
/package/dist/{workflows → src/workflows}/db.js +0 -0
/package/dist/{workflows → src/workflows}/document-cache.js +0 -0
/package/dist/{workflows → src/workflows}/parser.js +0 -0
/package/dist/{workflows → src/workflows}/renderer.js +0 -0
/package/dist/{workflows → src/workflows}/schema.js +0 -0
/package/dist/{workflows → src/workflows}/validator.js +0 -0

package/dist/tests/bench/feedback-integrity.test.js ADDED Viewed

@@ -0,0 +1,457 @@
+/**
+ * Unit tests for §6.8 feedback-signal integrity (#244).
+ *
+ * Coverage:
+ *   • All four 2×2 quadrants (TP, FP, TN, FN).
+ *   • Per-asset breakdown when an asset has mixed signals across runs.
+ *   • `feedback_agreement < 0.80` triggers the warning marker (markdown +
+ *     structured `warnings[]` JSON entry).
+ *   • `feedback_coverage` correctly counts runs with feedback dispatched
+ *     vs total Phase 1 runs.
+ *   • NaN-safety: zero-feedback asset emits all rates as `null`, never
+ *     `0` or `NaN`.
+ *   • Attribution rule (§6.8): a feedback event is attributed to the run
+ *     that produced it, not to a later run touching the same asset.
+ *
+ * The metric is a pure function over RunResult[] + feedbackLog[]; no spawn
+ * fakes are needed. We build small synthetic streams directly.
+ */
+import { describe, expect, test } from "bun:test";
+import { computeFeedbackIntegrity } from "./metrics";
+import { FEEDBACK_AGREEMENT_WARNING_THRESHOLD, renderEvolveReport, renderFeedbackIntegrityTable } from "./report";
+function fakeRun(overrides) {
+    return {
+        schemaVersion: 1,
+        taskId: "t",
+        arm: "akm",
+        seed: 0,
+        model: "m",
+        outcome: "pass",
+        tokens: { input: 0, output: 0 },
+        wallclockMs: 0,
+        trajectory: { correctAssetLoaded: null, feedbackRecorded: null },
+        events: [],
+        verifierStdout: "",
+        verifierExitCode: 0,
+        assetsLoaded: [],
+        ...overrides,
+    };
+}
+function fb(overrides) {
+    return {
+        taskId: "t",
+        seed: 0,
+        goldRef: "skill:s",
+        signal: "positive",
+        ok: true,
+        ...overrides,
+    };
+}
+describe("computeFeedbackIntegrity — 2x2 quadrants", () => {
+    test("TP: feedback + on a passed run", () => {
+        const phase1 = { akmRuns: [fakeRun({ taskId: "t1", seed: 0, outcome: "pass" })] };
+        const feedbackLog = [fb({ taskId: "t1", seed: 0, goldRef: "skill:a", signal: "positive" })];
+        const m = computeFeedbackIntegrity({ phase1, feedbackLog });
+        expect(m.aggregate.truePositive).toBe(1);
+        expect(m.aggregate.falsePositive).toBe(0);
+        expect(m.aggregate.trueNegative).toBe(0);
+        expect(m.aggregate.falseNegative).toBe(0);
+        expect(m.aggregate.feedback_agreement).toBeCloseTo(1);
+        expect(m.aggregate.feedback_coverage).toBeCloseTo(1);
+        expect(m.perAsset).toHaveLength(1);
+        expect(m.perAsset[0].ref).toBe("skill:a");
+        expect(m.perAsset[0].truePositive).toBe(1);
+        expect(m.perAsset[0].feedback_agreement).toBeCloseTo(1);
+    });
+    test("FP: feedback + on a failed run", () => {
+        const phase1 = { akmRuns: [fakeRun({ taskId: "t1", seed: 0, outcome: "fail" })] };
+        const feedbackLog = [fb({ taskId: "t1", seed: 0, goldRef: "skill:a", signal: "positive" })];
+        const m = computeFeedbackIntegrity({ phase1, feedbackLog });
+        expect(m.aggregate.truePositive).toBe(0);
+        expect(m.aggregate.falsePositive).toBe(1);
+        expect(m.aggregate.trueNegative).toBe(0);
+        expect(m.aggregate.falseNegative).toBe(0);
+        expect(m.aggregate.feedback_agreement).toBeCloseTo(0);
+        expect(m.aggregate.false_positive_rate).toBeCloseTo(1);
+        expect(m.perAsset[0].falsePositive).toBe(1);
+    });
+    test("TN: feedback - on a failed run", () => {
+        const phase1 = { akmRuns: [fakeRun({ taskId: "t1", seed: 0, outcome: "fail" })] };
+        const feedbackLog = [fb({ taskId: "t1", seed: 0, goldRef: "skill:a", signal: "negative" })];
+        const m = computeFeedbackIntegrity({ phase1, feedbackLog });
+        expect(m.aggregate.trueNegative).toBe(1);
+        expect(m.aggregate.feedback_agreement).toBeCloseTo(1);
+        expect(m.aggregate.false_positive_rate).toBeCloseTo(0);
+        expect(m.perAsset[0].trueNegative).toBe(1);
+    });
+    test("FN: feedback - on a passed run", () => {
+        const phase1 = { akmRuns: [fakeRun({ taskId: "t1", seed: 0, outcome: "pass" })] };
+        const feedbackLog = [fb({ taskId: "t1", seed: 0, goldRef: "skill:a", signal: "negative" })];
+        const m = computeFeedbackIntegrity({ phase1, feedbackLog });
+        expect(m.aggregate.falseNegative).toBe(1);
+        expect(m.aggregate.feedback_agreement).toBeCloseTo(0);
+        expect(m.aggregate.false_negative_rate).toBeCloseTo(1);
+        expect(m.perAsset[0].falseNegative).toBe(1);
+    });
+});
+describe("computeFeedbackIntegrity — aggregate over mixed quadrants", () => {
+    test("computes feedback_agreement and rates correctly across mixed runs", () => {
+        // 4 runs covering all four quadrants — exactly one of each.
+        const phase1 = {
+            akmRuns: [
+                fakeRun({ taskId: "tp", seed: 0, outcome: "pass" }),
+                fakeRun({ taskId: "fp", seed: 0, outcome: "fail" }),
+                fakeRun({ taskId: "tn", seed: 0, outcome: "fail" }),
+                fakeRun({ taskId: "fn", seed: 0, outcome: "pass" }),
+            ],
+        };
+        const feedbackLog = [
+            fb({ taskId: "tp", seed: 0, goldRef: "skill:tp", signal: "positive" }),
+            fb({ taskId: "fp", seed: 0, goldRef: "skill:fp", signal: "positive" }),
+            fb({ taskId: "tn", seed: 0, goldRef: "skill:tn", signal: "negative" }),
+            fb({ taskId: "fn", seed: 0, goldRef: "skill:fn", signal: "negative" }),
+        ];
+        const m = computeFeedbackIntegrity({ phase1, feedbackLog });
+        expect(m.aggregate.truePositive).toBe(1);
+        expect(m.aggregate.falsePositive).toBe(1);
+        expect(m.aggregate.trueNegative).toBe(1);
+        expect(m.aggregate.falseNegative).toBe(1);
+        expect(m.aggregate.feedback_agreement).toBeCloseTo(0.5); // 2/4
+        expect(m.aggregate.false_positive_rate).toBeCloseTo(0.5); // 1 / (1+1)
+        expect(m.aggregate.false_negative_rate).toBeCloseTo(0.5); // 1 / (1+1)
+        expect(m.aggregate.feedback_coverage).toBeCloseTo(1);
+        expect(m.perAsset).toHaveLength(4);
+        // Per-asset rows should be sorted by ref
+        expect(m.perAsset.map((r) => r.ref)).toEqual(["skill:fn", "skill:fp", "skill:tn", "skill:tp"]);
+    });
+});
+describe("computeFeedbackIntegrity — per-asset mixed signals", () => {
+    test("aggregates correctly when one asset appears across multiple Phase 1 runs", () => {
+        // skill:shared has 2 TP, 1 FP, 1 TN, 1 FN across 5 runs.
+        const phase1 = {
+            akmRuns: [
+                fakeRun({ taskId: "t", seed: 0, outcome: "pass" }),
+                fakeRun({ taskId: "t", seed: 1, outcome: "pass" }),
+                fakeRun({ taskId: "t", seed: 2, outcome: "fail" }),
+                fakeRun({ taskId: "t", seed: 3, outcome: "fail" }),
+                fakeRun({ taskId: "t", seed: 4, outcome: "pass" }),
+            ],
+        };
+        const feedbackLog = [
+            fb({ taskId: "t", seed: 0, goldRef: "skill:shared", signal: "positive" }), // TP
+            fb({ taskId: "t", seed: 1, goldRef: "skill:shared", signal: "positive" }), // TP
+            fb({ taskId: "t", seed: 2, goldRef: "skill:shared", signal: "positive" }), // FP
+            fb({ taskId: "t", seed: 3, goldRef: "skill:shared", signal: "negative" }), // TN
+            fb({ taskId: "t", seed: 4, goldRef: "skill:shared", signal: "negative" }), // FN
+        ];
+        const m = computeFeedbackIntegrity({ phase1, feedbackLog });
+        expect(m.perAsset).toHaveLength(1);
+        const row = m.perAsset[0];
+        expect(row.ref).toBe("skill:shared");
+        expect(row.truePositive).toBe(2);
+        expect(row.falsePositive).toBe(1);
+        expect(row.trueNegative).toBe(1);
+        expect(row.falseNegative).toBe(1);
+        expect(row.feedback_agreement).toBeCloseTo(3 / 5);
+        expect(row.false_positive_rate).toBeCloseTo(1 / 2); // FP / (FP+TN) = 1/2
+        expect(row.false_negative_rate).toBeCloseTo(1 / 3); // FN / (FN+TP) = 1/3
+    });
+});
+describe("computeFeedbackIntegrity — attribution rule", () => {
+    test("attributes feedback to the run that produced it, not a later run touching the same asset", () => {
+        // skill:contested appears across two Phase 1 runs:
+        //   run #0: passed, feedback +  → TP
+        //   run #1: failed, feedback +  → FP
+        // The naive (wrong) implementation would conflate both events with
+        // run #1's outcome and label both as FP. The correct implementation
+        // joins each event to its own (taskId, seed) → gets one TP, one FP.
+        const phase1 = {
+            akmRuns: [fakeRun({ taskId: "t", seed: 0, outcome: "pass" }), fakeRun({ taskId: "t", seed: 1, outcome: "fail" })],
+        };
+        const feedbackLog = [
+            fb({ taskId: "t", seed: 0, goldRef: "skill:contested", signal: "positive" }),
+            fb({ taskId: "t", seed: 1, goldRef: "skill:contested", signal: "positive" }),
+        ];
+        const m = computeFeedbackIntegrity({ phase1, feedbackLog });
+        expect(m.aggregate.truePositive).toBe(1);
+        expect(m.aggregate.falsePositive).toBe(1);
+        expect(m.aggregate.trueNegative).toBe(0);
+        expect(m.aggregate.falseNegative).toBe(0);
+        expect(m.perAsset[0].truePositive).toBe(1);
+        expect(m.perAsset[0].falsePositive).toBe(1);
+    });
+});
+describe("computeFeedbackIntegrity — feedback_coverage", () => {
+    test("counts runs with feedback dispatched vs total Phase 1 runs", () => {
+        // 4 phase-1 runs, only 2 had feedback dispatched.
+        const phase1 = {
+            akmRuns: [
+                fakeRun({ taskId: "t", seed: 0, outcome: "pass" }),
+                fakeRun({ taskId: "t", seed: 1, outcome: "fail" }),
+                fakeRun({ taskId: "t", seed: 2, outcome: "harness_error" }),
+                fakeRun({ taskId: "t", seed: 3, outcome: "budget_exceeded" }),
+            ],
+        };
+        const feedbackLog = [
+            fb({ taskId: "t", seed: 0, goldRef: "skill:a", signal: "positive" }),
+            fb({ taskId: "t", seed: 1, goldRef: "skill:a", signal: "negative" }),
+        ];
+        const m = computeFeedbackIntegrity({ phase1, feedbackLog });
+        expect(m.aggregate.feedback_coverage).toBeCloseTo(0.5); // 2 of 4
+    });
+    test("zero coverage when no feedback dispatched", () => {
+        const phase1 = { akmRuns: [fakeRun({ taskId: "t", seed: 0, outcome: "pass" })] };
+        const m = computeFeedbackIntegrity({ phase1, feedbackLog: [] });
+        expect(m.aggregate.feedback_coverage).toBe(0);
+        expect(m.aggregate.feedback_agreement).toBe(0);
+        expect(m.perAsset).toEqual([]);
+    });
+    test("zero coverage and zero runs returns 0 (not NaN)", () => {
+        const m = computeFeedbackIntegrity({ phase1: { akmRuns: [] }, feedbackLog: [] });
+        expect(m.aggregate.feedback_coverage).toBe(0);
+        expect(m.aggregate.feedback_agreement).toBe(0);
+        expect(m.aggregate.false_positive_rate).toBe(0);
+        expect(m.aggregate.false_negative_rate).toBe(0);
+        expect(Number.isFinite(m.aggregate.feedback_coverage)).toBe(true);
+        expect(Number.isFinite(m.aggregate.feedback_agreement)).toBe(true);
+    });
+});
+describe("computeFeedbackIntegrity — NaN safety", () => {
+    test("per-asset row with FP+TN === 0 emits null false_positive_rate (only positive feedback on passes)", () => {
+        const phase1 = {
+            akmRuns: [fakeRun({ taskId: "t", seed: 0, outcome: "pass" }), fakeRun({ taskId: "t", seed: 1, outcome: "pass" })],
+        };
+        const feedbackLog = [
+            fb({ taskId: "t", seed: 0, goldRef: "skill:only-tp", signal: "positive" }),
+            fb({ taskId: "t", seed: 1, goldRef: "skill:only-tp", signal: "positive" }),
+        ];
+        const m = computeFeedbackIntegrity({ phase1, feedbackLog });
+        const row = m.perAsset[0];
+        expect(row.feedback_agreement).toBeCloseTo(1);
+        expect(row.false_positive_rate).toBeNull(); // FP+TN === 0
+        expect(row.false_negative_rate).toBeCloseTo(0); // FN/(FN+TP) = 0/2 = 0
+    });
+    test("per-asset row with FN+TP === 0 emits null false_negative_rate (only negative feedback on fails)", () => {
+        const phase1 = {
+            akmRuns: [fakeRun({ taskId: "t", seed: 0, outcome: "fail" }), fakeRun({ taskId: "t", seed: 1, outcome: "fail" })],
+        };
+        const feedbackLog = [
+            fb({ taskId: "t", seed: 0, goldRef: "skill:only-tn", signal: "negative" }),
+            fb({ taskId: "t", seed: 1, goldRef: "skill:only-tn", signal: "negative" }),
+        ];
+        const m = computeFeedbackIntegrity({ phase1, feedbackLog });
+        const row = m.perAsset[0];
+        expect(row.feedback_agreement).toBeCloseTo(1);
+        expect(row.false_negative_rate).toBeNull(); // FN+TP === 0
+        expect(row.false_positive_rate).toBeCloseTo(0); // FP/(FP+TN) = 0/2 = 0
+    });
+    test("ok=false feedback events are excluded from the matrix but still count toward coverage", () => {
+        const phase1 = {
+            akmRuns: [fakeRun({ taskId: "t", seed: 0, outcome: "pass" }), fakeRun({ taskId: "t", seed: 1, outcome: "fail" })],
+        };
+        const feedbackLog = [
+            fb({ taskId: "t", seed: 0, goldRef: "skill:a", signal: "positive", ok: true }),
+            fb({ taskId: "t", seed: 1, goldRef: "skill:a", signal: "negative", ok: false }),
+        ];
+        const m = computeFeedbackIntegrity({ phase1, feedbackLog });
+        // Only the ok=true entry contributes to the matrix (TP=1).
+        expect(m.aggregate.truePositive).toBe(1);
+        expect(m.aggregate.trueNegative).toBe(0);
+        // But coverage counts both attempts.
+        expect(m.aggregate.feedback_coverage).toBeCloseTo(1);
+    });
+    test("harness_error runs are excluded from the matrix even with a stamped feedback event", () => {
+        const phase1 = { akmRuns: [fakeRun({ taskId: "t", seed: 0, outcome: "harness_error" })] };
+        const feedbackLog = [fb({ taskId: "t", seed: 0, goldRef: "skill:a", signal: "positive" })];
+        const m = computeFeedbackIntegrity({ phase1, feedbackLog });
+        expect(m.aggregate.truePositive).toBe(0);
+        expect(m.aggregate.falsePositive).toBe(0);
+        expect(m.perAsset).toEqual([]);
+    });
+    test("feedback for a run not present in akmRuns is silently dropped", () => {
+        const phase1 = { akmRuns: [fakeRun({ taskId: "real", seed: 0, outcome: "pass" })] };
+        const feedbackLog = [fb({ taskId: "ghost", seed: 99, goldRef: "skill:a", signal: "positive" })];
+        const m = computeFeedbackIntegrity({ phase1, feedbackLog });
+        expect(m.aggregate.truePositive).toBe(0);
+        expect(m.perAsset).toEqual([]);
+        // Coverage still records the dispatch attempt — operator wanted feedback.
+        expect(m.aggregate.feedback_coverage).toBeCloseTo(1);
+    });
+});
+// ── Render-side coverage ───────────────────────────────────────────────────
+function emptyUtilityReport() {
+    // Build a minimal §13.3-shaped utility report. The renderer reads
+    // many subfields; we stub them to safe zeros.
+    return {
+        timestamp: "2026-04-27T00:00:00Z",
+        branch: "test",
+        commit: "deadbee",
+        model: "m",
+        corpus: { domains: 0, tasks: 0, slice: "all", seedsPerArm: 1 },
+        aggregateNoakm: { passRate: 0, tokensPerPass: 0, tokensPerRun: null, wallclockMs: 0 },
+        aggregateAkm: { passRate: 0, tokensPerPass: 0, tokensPerRun: null, wallclockMs: 0 },
+        aggregateDelta: {
+            passRate: 0,
+            tokensPerPass: 0,
+            tokensPerRun: null,
+            wallclockMs: 0,
+        },
+        trajectoryAkm: {
+            correctAssetLoaded: null,
+            feedbackRecorded: 0,
+        },
+        failureModes: { byLabel: {}, byTask: {} },
+        tasks: [],
+        warnings: [],
+        akmRuns: [],
+        taskMetadata: [],
+        goldRankRecords: [],
+    };
+}
+function evolveInputWith(metrics) {
+    return {
+        timestamp: "2026-04-27T00:00:00Z",
+        branch: "test",
+        commit: "deadbee",
+        model: "m",
+        domain: "test",
+        seedsPerArm: 1,
+        proposals: { rows: [], totalProposals: 0, totalAccepted: 0, acceptanceRate: 0, lintPassRate: 0 },
+        longitudinal: {
+            improvementSlope: 0.1,
+            overSyntheticLift: 0.05,
+            degradationCount: 0,
+            degradations: [],
+            prePassRate: 0.5,
+            postPassRate: 0.6,
+            syntheticPassRate: 0.55,
+        },
+        arms: { pre: emptyUtilityReport(), post: emptyUtilityReport(), synthetic: emptyUtilityReport() },
+        warnings: [],
+        ...(metrics ? { feedbackIntegrity: metrics } : {}),
+    };
+}
+describe("renderFeedbackIntegrityTable", () => {
+    test("emits aggregate matrix + per-asset rows", () => {
+        const phase1 = {
+            akmRuns: [fakeRun({ taskId: "t", seed: 0, outcome: "pass" }), fakeRun({ taskId: "t", seed: 1, outcome: "fail" })],
+        };
+        const feedbackLog = [
+            fb({ taskId: "t", seed: 0, goldRef: "skill:a", signal: "positive" }),
+            fb({ taskId: "t", seed: 1, goldRef: "skill:a", signal: "negative" }),
+        ];
+        const m = computeFeedbackIntegrity({ phase1, feedbackLog });
+        const md = renderFeedbackIntegrityTable(m);
+        expect(md).toContain("Feedback-signal integrity");
+        expect(md).toContain("feedback_agreement | 1.00");
+        expect(md).toContain("feedback_coverage | 1.00");
+        expect(md).toContain("`skill:a`");
+    });
+    test("renders n/a when a per-asset rate is null", () => {
+        const phase1 = { akmRuns: [fakeRun({ taskId: "t", seed: 0, outcome: "pass" })] };
+        const feedbackLog = [fb({ taskId: "t", seed: 0, goldRef: "skill:a", signal: "positive" })];
+        const m = computeFeedbackIntegrity({ phase1, feedbackLog });
+        const md = renderFeedbackIntegrityTable(m);
+        // Only TP — false_positive_rate denom is 0 → null → "n/a".
+        expect(md).toContain("n/a");
+    });
+    test("renders 'No feedback events recorded' when perAsset is empty", () => {
+        const m = {
+            aggregate: {
+                truePositive: 0,
+                falsePositive: 0,
+                trueNegative: 0,
+                falseNegative: 0,
+                feedback_agreement: 0,
+                false_positive_rate: 0,
+                false_negative_rate: 0,
+                feedback_coverage: 0,
+            },
+            perAsset: [],
+        };
+        expect(renderFeedbackIntegrityTable(m)).toContain("No feedback events recorded");
+    });
+});
+describe("renderEvolveReport — feedback_agreement headline + warning marker", () => {
+    test("places real feedback_agreement after improvement_slope when metrics provided", () => {
+        const metrics = computeFeedbackIntegrity({
+            phase1: { akmRuns: [fakeRun({ taskId: "t", seed: 0, outcome: "pass" })] },
+            feedbackLog: [fb({ taskId: "t", seed: 0, goldRef: "skill:a", signal: "positive" })],
+        });
+        const { markdown, json } = renderEvolveReport(evolveInputWith(metrics));
+        // feedback_agreement is on a line directly after improvement_slope.
+        const slopeIdx = markdown.indexOf("improvement_slope:");
+        const agreementIdx = markdown.indexOf("feedback_agreement:");
+        expect(slopeIdx).toBeGreaterThanOrEqual(0);
+        expect(agreementIdx).toBeGreaterThan(slopeIdx);
+        expect(markdown).toContain("feedback_agreement: 1.00");
+        expect(markdown).not.toContain("pending (#244)");
+        // JSON envelope carries `feedback_integrity` as a top-level key.
+        const parsed = json;
+        expect(parsed.feedback_integrity).toBeDefined();
+        expect(parsed.warnings.some((w) => w.startsWith("feedback_agreement_below_threshold"))).toBe(false);
+    });
+    test("placeholder remains when metrics omitted (legacy path)", () => {
+        const { markdown, json } = renderEvolveReport(evolveInputWith(undefined));
+        expect(markdown).toContain("_feedback_agreement: pending (#244)_");
+        const parsed = json;
+        expect(parsed.feedback_integrity).toBeUndefined();
+    });
+    test("agreement < 0.80 prepends warning marker to markdown and structured warnings[]", () => {
+        // 1 TP + 4 FP → agreement = 1/5 = 0.20.
+        const phase1 = {
+            akmRuns: [
+                fakeRun({ taskId: "t", seed: 0, outcome: "pass" }),
+                fakeRun({ taskId: "t", seed: 1, outcome: "fail" }),
+                fakeRun({ taskId: "t", seed: 2, outcome: "fail" }),
+                fakeRun({ taskId: "t", seed: 3, outcome: "fail" }),
+                fakeRun({ taskId: "t", seed: 4, outcome: "fail" }),
+            ],
+        };
+        const feedbackLog = [
+            fb({ taskId: "t", seed: 0, goldRef: "skill:a", signal: "positive" }),
+            fb({ taskId: "t", seed: 1, goldRef: "skill:a", signal: "positive" }),
+            fb({ taskId: "t", seed: 2, goldRef: "skill:a", signal: "positive" }),
+            fb({ taskId: "t", seed: 3, goldRef: "skill:a", signal: "positive" }),
+            fb({ taskId: "t", seed: 4, goldRef: "skill:a", signal: "positive" }),
+        ];
+        const metrics = computeFeedbackIntegrity({ phase1, feedbackLog });
+        expect(metrics.aggregate.feedback_agreement).toBeCloseTo(0.2);
+        expect(metrics.aggregate.feedback_agreement).toBeLessThan(FEEDBACK_AGREEMENT_WARNING_THRESHOLD);
+        const { markdown, json } = renderEvolveReport(evolveInputWith(metrics));
+        // Marker appears above the headline, not after it.
+        const warnIdx = markdown.indexOf("feedback_agreement = 0.20");
+        const slopeIdx = markdown.indexOf("**improvement_slope:");
+        expect(warnIdx).toBeGreaterThanOrEqual(0);
+        expect(warnIdx).toBeLessThan(slopeIdx);
+        expect(markdown).toContain("Track B headline numbers");
+        // Structured warning surfaces in the JSON envelope.
+        const parsed = json;
+        expect(parsed.warnings.some((w) => w.startsWith("feedback_agreement_below_threshold"))).toBe(true);
+    });
+    test("agreement at exactly 0.80 does NOT trigger the warning marker", () => {
+        // 4 TP + 1 FP → agreement = 4/5 = 0.80 exactly.
+        const phase1 = {
+            akmRuns: [
+                fakeRun({ taskId: "t", seed: 0, outcome: "pass" }),
+                fakeRun({ taskId: "t", seed: 1, outcome: "pass" }),
+                fakeRun({ taskId: "t", seed: 2, outcome: "pass" }),
+                fakeRun({ taskId: "t", seed: 3, outcome: "pass" }),
+                fakeRun({ taskId: "t", seed: 4, outcome: "fail" }),
+            ],
+        };
+        const feedbackLog = [
+            fb({ taskId: "t", seed: 0, goldRef: "skill:a", signal: "positive" }),
+            fb({ taskId: "t", seed: 1, goldRef: "skill:a", signal: "positive" }),
+            fb({ taskId: "t", seed: 2, goldRef: "skill:a", signal: "positive" }),
+            fb({ taskId: "t", seed: 3, goldRef: "skill:a", signal: "positive" }),
+            fb({ taskId: "t", seed: 4, goldRef: "skill:a", signal: "positive" }),
+        ];
+        const metrics = computeFeedbackIntegrity({ phase1, feedbackLog });
+        expect(metrics.aggregate.feedback_agreement).toBeCloseTo(0.8);
+        const { markdown, json } = renderEvolveReport(evolveInputWith(metrics));
+        expect(markdown).not.toContain("Track B headline numbers");
+        const parsed = json;
+        expect(parsed.warnings.some((w) => w.startsWith("feedback_agreement_below_threshold"))).toBe(false);
+    });
+});