npm - akm-cli - Versions diffs - 0.7.0 → 0.7.2 - Mend

akm-cli 0.7.0 → 0.7.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (332) hide show

package/CHANGELOG.md +8 -0
package/dist/{src/cli.js → cli.js} +22 -8
package/dist/{src/commands → commands}/installed-stashes.js +1 -1
package/dist/{src/commands → commands}/source-add.js +1 -1
package/dist/{src/core → core}/common.js +16 -1
package/dist/{src/core → core}/config.js +5 -2
package/dist/{src/indexer → indexer}/db-search.js +16 -1
package/dist/{src/indexer → indexer}/graph-extraction.js +5 -3
package/dist/{src/indexer → indexer}/indexer.js +27 -11
package/dist/{src/indexer → indexer}/memory-inference.js +47 -58
package/dist/{src/indexer → indexer}/search-source.js +1 -1
package/dist/{src/llm → llm}/client.js +61 -1
package/dist/{src/llm → llm}/embedder.js +8 -5
package/dist/{src/llm → llm}/embedders/local.js +8 -2
package/dist/{src/llm → llm}/embedders/remote.js +4 -2
package/dist/{src/llm → llm}/graph-extract.js +4 -4
package/dist/llm/memory-infer.js +114 -0
package/dist/{src/llm → llm}/metadata-enhance.js +2 -2
package/dist/{src/output → output}/cli-hints.js +2 -0
package/dist/{src/setup → setup}/setup.js +30 -20
package/dist/sources/providers/website.js +27 -0
package/dist/{src/sources/providers/website.js → sources/website-ingest.js} +38 -51
package/docs/README.md +7 -0
package/docs/migration/release-notes/0.7.0.md +14 -0
package/package.json +11 -8
package/dist/src/llm/memory-infer.js +0 -86
package/dist/tests/add-website-source.test.js +0 -119
package/dist/tests/agent/agent-config-loader.test.js +0 -70
package/dist/tests/agent/agent-config.test.js +0 -221
package/dist/tests/agent/agent-detect.test.js +0 -100
package/dist/tests/agent/agent-spawn.test.js +0 -234
package/dist/tests/agent-output.test.js +0 -186
package/dist/tests/architecture/agent-no-llm-sdk-guard.test.js +0 -103
package/dist/tests/architecture/agent-spawn-seam.test.js +0 -193
package/dist/tests/architecture/llm-stateless-seam.test.js +0 -112
package/dist/tests/asset-ref.test.js +0 -192
package/dist/tests/asset-registry.test.js +0 -103
package/dist/tests/asset-spec.test.js +0 -241
package/dist/tests/bench/attribution.test.js +0 -996
package/dist/tests/bench/cleanup-sigint.test.js +0 -83
package/dist/tests/bench/cleanup.js +0 -234
package/dist/tests/bench/cleanup.test.js +0 -166
package/dist/tests/bench/cli.js +0 -1018
package/dist/tests/bench/cli.test.js +0 -445
package/dist/tests/bench/compare.test.js +0 -556
package/dist/tests/bench/corpus.js +0 -317
package/dist/tests/bench/corpus.test.js +0 -258
package/dist/tests/bench/doctor.js +0 -525
package/dist/tests/bench/driver.js +0 -401
package/dist/tests/bench/driver.test.js +0 -584
package/dist/tests/bench/environment.js +0 -233
package/dist/tests/bench/environment.test.js +0 -199
package/dist/tests/bench/evolve-metrics.js +0 -179
package/dist/tests/bench/evolve-metrics.test.js +0 -187
package/dist/tests/bench/evolve.js +0 -647
package/dist/tests/bench/evolve.test.js +0 -624
package/dist/tests/bench/failure-modes.test.js +0 -349
package/dist/tests/bench/feedback-integrity.test.js +0 -457
package/dist/tests/bench/leakage.test.js +0 -228
package/dist/tests/bench/learning-curve.test.js +0 -134
package/dist/tests/bench/metrics.js +0 -2395
package/dist/tests/bench/metrics.test.js +0 -1150
package/dist/tests/bench/no-os-tmpdir-invariant.test.js +0 -43
package/dist/tests/bench/opencode-config.js +0 -194
package/dist/tests/bench/opencode-config.test.js +0 -370
package/dist/tests/bench/report.js +0 -1885
package/dist/tests/bench/report.test.js +0 -1038
package/dist/tests/bench/run-config.js +0 -355
package/dist/tests/bench/run-config.test.js +0 -298
package/dist/tests/bench/run-curate-test.js +0 -32
package/dist/tests/bench/run-failing-tasks.js +0 -56
package/dist/tests/bench/run-full-bench.js +0 -51
package/dist/tests/bench/run-items36-targeted.js +0 -69
package/dist/tests/bench/run-nano-quick.js +0 -42
package/dist/tests/bench/run-waveg-targeted.js +0 -62
package/dist/tests/bench/runner.js +0 -699
package/dist/tests/bench/runner.test.js +0 -958
package/dist/tests/bench/search-bridge.test.js +0 -331
package/dist/tests/bench/tmp.js +0 -131
package/dist/tests/bench/trajectory.js +0 -116
package/dist/tests/bench/trajectory.test.js +0 -127
package/dist/tests/bench/verifier.js +0 -114
package/dist/tests/bench/verifier.test.js +0 -118
package/dist/tests/bench/workflow-evaluator.js +0 -557
package/dist/tests/bench/workflow-evaluator.test.js +0 -421
package/dist/tests/bench/workflow-spec.js +0 -345
package/dist/tests/bench/workflow-spec.test.js +0 -363
package/dist/tests/bench/workflow-trace.js +0 -472
package/dist/tests/bench/workflow-trace.test.js +0 -254
package/dist/tests/benchmark-search-quality.js +0 -536
package/dist/tests/benchmark-suite.js +0 -1441
package/dist/tests/capture-cli.test.js +0 -112
package/dist/tests/cli-errors.test.js +0 -204
package/dist/tests/commands/events.test.js +0 -370
package/dist/tests/commands/history.test.js +0 -418
package/dist/tests/commands/import.test.js +0 -103
package/dist/tests/commands/proposal-cli.test.js +0 -209
package/dist/tests/commands/reflect-propose-cli.test.js +0 -333
package/dist/tests/commands/remember.test.js +0 -97
package/dist/tests/commands/scope-flags.test.js +0 -300
package/dist/tests/commands/search.test.js +0 -537
package/dist/tests/commands/show-indexer-parity.test.js +0 -117
package/dist/tests/commands/show.test.js +0 -294
package/dist/tests/common.test.js +0 -266
package/dist/tests/completions.test.js +0 -142
package/dist/tests/config-cli.test.js +0 -193
package/dist/tests/config-llm-features.test.js +0 -139
package/dist/tests/config.test.js +0 -569
package/dist/tests/contracts/migration-baseline.test.js +0 -43
package/dist/tests/contracts/reflect-propose-envelope.test.js +0 -139
package/dist/tests/contracts/spec-helpers.js +0 -46
package/dist/tests/contracts/v1-spec-section-11-proposal-queue.test.js +0 -228
package/dist/tests/contracts/v1-spec-section-12-agent-config.test.js +0 -56
package/dist/tests/contracts/v1-spec-section-13-lesson-type.test.js +0 -34
package/dist/tests/contracts/v1-spec-section-14-llm-features.test.js +0 -94
package/dist/tests/contracts/v1-spec-section-4-1-asset-types.test.js +0 -39
package/dist/tests/contracts/v1-spec-section-4-2-quality-rules.test.js +0 -44
package/dist/tests/contracts/v1-spec-section-5-configuration.test.js +0 -47
package/dist/tests/contracts/v1-spec-section-6-orchestration.test.js +0 -40
package/dist/tests/contracts/v1-spec-section-7-module-layout.test.js +0 -58
package/dist/tests/contracts/v1-spec-section-8-extension-points.test.js +0 -34
package/dist/tests/contracts/v1-spec-section-9-4-cli-surface.test.js +0 -75
package/dist/tests/contracts/v1-spec-section-9-7-llm-agent-boundary.test.js +0 -36
package/dist/tests/core/write-source.test.js +0 -366
package/dist/tests/curate-command.test.js +0 -87
package/dist/tests/db-scoring.test.js +0 -201
package/dist/tests/db.test.js +0 -654
package/dist/tests/distill-cli-flag.test.js +0 -208
package/dist/tests/distill.test.js +0 -515
package/dist/tests/docker-install.test.js +0 -120
package/dist/tests/e2e.test.js +0 -1419
package/dist/tests/embedder.test.js +0 -340
package/dist/tests/embedding-model-config.test.js +0 -379
package/dist/tests/feedback-command.test.js +0 -172
package/dist/tests/file-context.test.js +0 -552
package/dist/tests/fixtures/scripts/git/summarize-diff.js +0 -9
package/dist/tests/fixtures/scripts/lint/eslint-check.js +0 -7
package/dist/tests/fixtures/stashes/load.js +0 -166
package/dist/tests/fixtures/stashes/load.test.js +0 -97
package/dist/tests/fixtures/stashes/ranking-baseline/scripts/mem0-search.js +0 -12
package/dist/tests/frontmatter.test.js +0 -190
package/dist/tests/fts-field-weighting.test.js +0 -254
package/dist/tests/fuzzy-search.test.js +0 -230
package/dist/tests/git-provider-clone.test.js +0 -45
package/dist/tests/github.test.js +0 -161
package/dist/tests/graph-boost-ranking.test.js +0 -305
package/dist/tests/graph-extraction.test.js +0 -282
package/dist/tests/helpers/usage-events.js +0 -8
package/dist/tests/index-pass-llm.test.js +0 -161
package/dist/tests/indexer.test.js +0 -570
package/dist/tests/info-command.test.js +0 -166
package/dist/tests/init.test.js +0 -69
package/dist/tests/install-script.test.js +0 -246
package/dist/tests/integration/agent-real-profile.test.js +0 -94
package/dist/tests/issue-36-repro.test.js +0 -304
package/dist/tests/issues-191-194.test.js +0 -160
package/dist/tests/lesson-lint.test.js +0 -111
package/dist/tests/llm-client.test.js +0 -115
package/dist/tests/llm-feature-gate.test.js +0 -151
package/dist/tests/llm.test.js +0 -139
package/dist/tests/lockfile.test.js +0 -216
package/dist/tests/manifest.test.js +0 -205
package/dist/tests/markdown.test.js +0 -126
package/dist/tests/matchers-unit.test.js +0 -189
package/dist/tests/memory-inference.test.js +0 -299
package/dist/tests/merge-scoring.test.js +0 -136
package/dist/tests/metadata.test.js +0 -313
package/dist/tests/migration-help.test.js +0 -89
package/dist/tests/origin-resolve.test.js +0 -124
package/dist/tests/output-baseline.test.js +0 -218
package/dist/tests/output-shapes-unit.test.js +0 -478
package/dist/tests/parallel-search.test.js +0 -272
package/dist/tests/parameter-metadata.test.js +0 -365
package/dist/tests/paths.test.js +0 -177
package/dist/tests/progressive-disclosure.test.js +0 -280
package/dist/tests/proposals.test.js +0 -279
package/dist/tests/proposed-quality.test.js +0 -271
package/dist/tests/provider-registry.test.js +0 -32
package/dist/tests/ranking-regression.test.js +0 -548
package/dist/tests/reflect-propose.test.js +0 -455
package/dist/tests/registry-build-index.test.js +0 -394
package/dist/tests/registry-cli.test.js +0 -290
package/dist/tests/registry-index-v2.test.js +0 -430
package/dist/tests/registry-install.test.js +0 -728
package/dist/tests/registry-providers/parity.test.js +0 -189
package/dist/tests/registry-providers/skills-sh.test.js +0 -309
package/dist/tests/registry-providers/static-index.test.js +0 -238
package/dist/tests/registry-resolve.test.js +0 -126
package/dist/tests/registry-search.test.js +0 -923
package/dist/tests/remember-frontmatter.test.js +0 -378
package/dist/tests/remember-unit.test.js +0 -123
package/dist/tests/ripgrep-install.test.js +0 -251
package/dist/tests/ripgrep-resolve.test.js +0 -108
package/dist/tests/ripgrep.test.js +0 -163
package/dist/tests/save-command.test.js +0 -94
package/dist/tests/save-trust-qa-fixes.test.js +0 -270
package/dist/tests/scoring-pipeline.test.js +0 -648
package/dist/tests/search-include-proposed-cli.test.js +0 -118
package/dist/tests/self-update.test.js +0 -442
package/dist/tests/semantic-search-e2e.test.js +0 -512
package/dist/tests/semantic-status.test.js +0 -471
package/dist/tests/setup-run.integration.js +0 -877
package/dist/tests/setup-wizard.test.js +0 -198
package/dist/tests/setup.test.js +0 -131
package/dist/tests/source-add.test.js +0 -11
package/dist/tests/source-clone.test.js +0 -254
package/dist/tests/source-manage.test.js +0 -366
package/dist/tests/source-providers/filesystem.test.js +0 -82
package/dist/tests/source-providers/git.test.js +0 -252
package/dist/tests/source-providers/website.test.js +0 -128
package/dist/tests/source-qa-fixes.test.js +0 -286
package/dist/tests/source-registry.test.js +0 -350
package/dist/tests/source-resolve.test.js +0 -100
package/dist/tests/source-source.test.js +0 -281
package/dist/tests/source.test.js +0 -533
package/dist/tests/tar-utils-scan.test.js +0 -73
package/dist/tests/toggle-components.test.js +0 -73
package/dist/tests/usage-telemetry.test.js +0 -265
package/dist/tests/utility-scoring.test.js +0 -558
package/dist/tests/vault-load-error.test.js +0 -78
package/dist/tests/vault-qa-fixes.test.js +0 -194
package/dist/tests/vault.test.js +0 -429
package/dist/tests/vector-search.test.js +0 -608
package/dist/tests/walker.test.js +0 -252
package/dist/tests/wave2-cluster-bc.test.js +0 -228
package/dist/tests/wave2-cluster-d.test.js +0 -180
package/dist/tests/wave2-cluster-e.test.js +0 -179
package/dist/tests/wiki-qa-fixes.test.js +0 -270
package/dist/tests/wiki.test.js +0 -529
package/dist/tests/workflow-cli.test.js +0 -271
package/dist/tests/workflow-markdown.test.js +0 -171
package/dist/tests/workflow-path-escape.test.js +0 -132
package/dist/tests/workflow-qa-fixes.test.js +0 -395
package/dist/tests/workflows/indexer-rejection.test.js +0 -213
/package/dist/{src/commands → commands}/completions.js +0 -0
/package/dist/{src/commands → commands}/config-cli.js +0 -0
/package/dist/{src/commands → commands}/curate.js +0 -0
/package/dist/{src/commands → commands}/distill.js +0 -0
/package/dist/{src/commands → commands}/events.js +0 -0
/package/dist/{src/commands → commands}/history.js +0 -0
/package/dist/{src/commands → commands}/info.js +0 -0
/package/dist/{src/commands → commands}/init.js +0 -0
/package/dist/{src/commands → commands}/install-audit.js +0 -0
/package/dist/{src/commands → commands}/migration-help.js +0 -0
/package/dist/{src/commands → commands}/proposal.js +0 -0
/package/dist/{src/commands → commands}/propose.js +0 -0
/package/dist/{src/commands → commands}/reflect.js +0 -0
/package/dist/{src/commands → commands}/registry-search.js +0 -0
/package/dist/{src/commands → commands}/remember.js +0 -0
/package/dist/{src/commands → commands}/search.js +0 -0
/package/dist/{src/commands → commands}/self-update.js +0 -0
/package/dist/{src/commands → commands}/show.js +0 -0
/package/dist/{src/commands → commands}/source-clone.js +0 -0
/package/dist/{src/commands → commands}/source-manage.js +0 -0
/package/dist/{src/commands → commands}/vault.js +0 -0
/package/dist/{src/core → core}/asset-ref.js +0 -0
/package/dist/{src/core → core}/asset-registry.js +0 -0
/package/dist/{src/core → core}/asset-spec.js +0 -0
/package/dist/{src/core → core}/errors.js +0 -0
/package/dist/{src/core → core}/events.js +0 -0
/package/dist/{src/core → core}/frontmatter.js +0 -0
/package/dist/{src/core → core}/lesson-lint.js +0 -0
/package/dist/{src/core → core}/markdown.js +0 -0
/package/dist/{src/core → core}/paths.js +0 -0
/package/dist/{src/core → core}/proposals.js +0 -0
/package/dist/{src/core → core}/warn.js +0 -0
/package/dist/{src/core → core}/write-source.js +0 -0
/package/dist/{src/indexer → indexer}/db.js +0 -0
/package/dist/{src/indexer → indexer}/file-context.js +0 -0
/package/dist/{src/indexer → indexer}/graph-boost.js +0 -0
/package/dist/{src/indexer → indexer}/manifest.js +0 -0
/package/dist/{src/indexer → indexer}/matchers.js +0 -0
/package/dist/{src/indexer → indexer}/metadata.js +0 -0
/package/dist/{src/indexer → indexer}/search-fields.js +0 -0
/package/dist/{src/indexer → indexer}/semantic-status.js +0 -0
/package/dist/{src/indexer → indexer}/usage-events.js +0 -0
/package/dist/{src/indexer → indexer}/walker.js +0 -0
/package/dist/{src/integrations → integrations}/agent/config.js +0 -0
/package/dist/{src/integrations → integrations}/agent/detect.js +0 -0
/package/dist/{src/integrations → integrations}/agent/index.js +0 -0
/package/dist/{src/integrations → integrations}/agent/profiles.js +0 -0
/package/dist/{src/integrations → integrations}/agent/prompts.js +0 -0
/package/dist/{src/integrations → integrations}/agent/spawn.js +0 -0
/package/dist/{src/integrations → integrations}/github.js +0 -0
/package/dist/{src/integrations → integrations}/lockfile.js +0 -0
/package/dist/{src/llm → llm}/embedders/cache.js +0 -0
/package/dist/{src/llm → llm}/embedders/types.js +0 -0
/package/dist/{src/llm → llm}/feature-gate.js +0 -0
/package/dist/{src/llm → llm}/index-passes.js +0 -0
/package/dist/{src/output → output}/context.js +0 -0
/package/dist/{src/output → output}/renderers.js +0 -0
/package/dist/{src/output → output}/shapes.js +0 -0
/package/dist/{src/output → output}/text.js +0 -0
/package/dist/{src/registry → registry}/build-index.js +0 -0
/package/dist/{src/registry → registry}/create-provider-registry.js +0 -0
/package/dist/{src/registry → registry}/factory.js +0 -0
/package/dist/{src/registry → registry}/origin-resolve.js +0 -0
/package/dist/{src/registry → registry}/providers/index.js +0 -0
/package/dist/{src/registry → registry}/providers/skills-sh.js +0 -0
/package/dist/{src/registry → registry}/providers/static-index.js +0 -0
/package/dist/{src/registry → registry}/providers/types.js +0 -0
/package/dist/{src/registry → registry}/resolve.js +0 -0
/package/dist/{src/registry → registry}/types.js +0 -0
/package/dist/{src/setup → setup}/detect.js +0 -0
/package/dist/{src/setup → setup}/ripgrep-install.js +0 -0
/package/dist/{src/setup → setup}/ripgrep-resolve.js +0 -0
/package/dist/{src/setup → setup}/steps.js +0 -0
/package/dist/{src/sources → sources}/include.js +0 -0
/package/dist/{src/sources → sources}/provider-factory.js +0 -0
/package/dist/{src/sources → sources}/provider.js +0 -0
/package/dist/{src/sources → sources}/providers/filesystem.js +0 -0
/package/dist/{src/sources → sources}/providers/git.js +0 -0
/package/dist/{src/sources → sources}/providers/index.js +0 -0
/package/dist/{src/sources → sources}/providers/install-types.js +0 -0
/package/dist/{src/sources → sources}/providers/npm.js +0 -0
/package/dist/{src/sources → sources}/providers/provider-utils.js +0 -0
/package/dist/{src/sources → sources}/providers/sync-from-ref.js +0 -0
/package/dist/{src/sources → sources}/providers/tar-utils.js +0 -0
/package/dist/{src/sources → sources}/resolve.js +0 -0
/package/dist/{src/sources → sources}/types.js +0 -0
/package/dist/{src/templates → templates}/wiki-templates.js +0 -0
/package/dist/{src/version.js → version.js} +0 -0
/package/dist/{src/wiki → wiki}/wiki.js +0 -0
/package/dist/{src/workflows → workflows}/authoring.js +0 -0
/package/dist/{src/workflows → workflows}/cli.js +0 -0
/package/dist/{src/workflows → workflows}/db.js +0 -0
/package/dist/{src/workflows → workflows}/document-cache.js +0 -0
/package/dist/{src/workflows → workflows}/parser.js +0 -0
/package/dist/{src/workflows → workflows}/renderer.js +0 -0
/package/dist/{src/workflows → workflows}/runs.js +0 -0
/package/dist/{src/workflows → workflows}/schema.js +0 -0
/package/dist/{src/workflows → workflows}/validator.js +0 -0

package/dist/tests/bench/driver.test.js DELETED Viewed

@@ -1,584 +0,0 @@
-/**
- * Unit tests for the bench driver — exercises every RunResult outcome
- * (`pass`, `fail`, `budget_exceeded`, `harness_error`) via an injected fake
- * spawn. Real opencode is never invoked.
- */
-import { afterAll, beforeAll, describe, expect, test } from "bun:test";
-import fs from "node:fs";
-import path from "node:path";
-import { _ISOLATED_ENV_NAMES, _SCRUBBED_OPERATOR_ENV_NAMES, buildIsolatedEnv, buildSanitizedEnvSource, createIsolationDirs, EVENTS_READ_CAP_BYTES, parseTokenUsage, readRunEvents, runOne, stripAkmStashDir, } from "./driver";
-import { benchMkdtemp } from "./tmp";
-function asReadableStream(text) {
-    const bytes = new TextEncoder().encode(text);
-    return new ReadableStream({
-        start(controller) {
-            controller.enqueue(bytes);
-            controller.close();
-        },
-    });
-}
-/**
- * Build a spawn fn that scripts the agent run first, then any subsequent
- * verifier run. Distinguishes by command: opencode is the configured `bin`
- * for the built-in opencode profile (i.e. cmd[0] === "opencode"); anything
- * else is a verifier.
- */
-function scriptedSpawn(agent, verifier) {
-    const invocations = [];
-    const spawn = (cmd, options) => {
-        invocations.push({ cmd, env: options.env });
-        const isAgent = cmd[0] === "opencode";
-        const config = isAgent ? agent : (verifier ?? { exitCode: 0, stdout: "" });
-        if (isAgent && agent.throwSync)
-            throw agent.throwSync;
-        let resolveExit = () => { };
-        const exited = new Promise((resolve) => {
-            resolveExit = resolve;
-            if (!(isAgent && agent.hangsUntilKilled))
-                resolve(config.exitCode);
-        });
-        const proc = {
-            exitCode: isAgent && agent.hangsUntilKilled ? null : config.exitCode,
-            exited,
-            stdout: asReadableStream(config.stdout ?? ""),
-            stderr: asReadableStream(config.stderr ?? ""),
-            stdin: null,
-            kill() {
-                // Honour kill so timeout path resolves cleanly.
-                resolveExit(143);
-            },
-        };
-        return proc;
-    };
-    return { spawn, invocations };
-}
-const baseOptions = {
-    track: "utility",
-    arm: "noakm",
-    taskId: "_example/example-task",
-    workspace: "",
-    model: "anthropic/claude-opus-4-7",
-    seed: 0,
-    budgetTokens: 100000,
-    budgetWallMs: 60_000,
-    verifier: "regex",
-    taskDir: "",
-    expectedMatch: "ok",
-};
-describe("runOne", () => {
-    let workspace;
-    beforeAll(() => {
-        workspace = benchMkdtemp("bench-driver-test-");
-    });
-    afterAll(() => {
-        fs.rmSync(workspace, { recursive: true, force: true });
-    });
-    test("pass: agent exits 0, verifier exits 0", async () => {
-        const { spawn, invocations } = scriptedSpawn({ exitCode: 0, stdout: "ok" });
-        const result = await runOne({ ...baseOptions, workspace, spawn });
-        expect(result.outcome).toBe("pass");
-        expect(result.verifierExitCode).toBe(0);
-        expect(result.taskId).toBe("_example/example-task");
-        expect(result.model).toBe("anthropic/claude-opus-4-7");
-        expect(result.seed).toBe(0);
-        expect(result.schemaVersion).toBe(1);
-        expect(invocations[0]?.cmd[0]).toBe("opencode");
-    });
-    test("fail: agent exits 0 but verifier rejects output", async () => {
-        const { spawn } = scriptedSpawn({ exitCode: 0, stdout: "nope" });
-        const result = await runOne({ ...baseOptions, workspace, spawn });
-        expect(result.outcome).toBe("fail");
-        expect(result.verifierExitCode).toBe(1);
-    });
-    test("budget_exceeded: agent times out (runAgent reason: timeout)", async () => {
-        const { spawn } = scriptedSpawn({ exitCode: 0, hangsUntilKilled: true });
-        const result = await runOne({
-            ...baseOptions,
-            workspace,
-            spawn,
-            // Tiny budget so the timer fires before the fake agent ever exits.
-            budgetWallMs: 50,
-        });
-        expect(result.outcome).toBe("budget_exceeded");
-    });
-    test("harness_error: agent spawn throws synchronously", async () => {
-        const { spawn } = scriptedSpawn({ exitCode: 0, throwSync: new Error("ENOENT") });
-        const result = await runOne({ ...baseOptions, workspace, spawn });
-        expect(result.outcome).toBe("harness_error");
-    });
-    test("budget_exceeded: parsed token usage exceeds budgetTokens", async () => {
-        // Agent reports 70k input + 50k output = 120k tokens, budget is 100k.
-        // Verifier should NOT run; outcome must be budget_exceeded.
-        const { spawn } = scriptedSpawn({
-            exitCode: 0,
-            stdout: "input_tokens: 70000 output_tokens: 50000",
-        });
-        const result = await runOne({
-            ...baseOptions,
-            workspace,
-            spawn,
-            budgetTokens: 100_000,
-        });
-        expect(result.outcome).toBe("budget_exceeded");
-        expect(result.tokens.input + result.tokens.output).toBeGreaterThan(100_000);
-        expect(result.tokens.input).toBe(70_000);
-        expect(result.tokens.output).toBe(50_000);
-        expect(result.tokenMeasurement).toBe("parsed");
-    });
-    test("tokenMeasurement: parsed when stdout reports tokens", async () => {
-        const { spawn } = scriptedSpawn({
-            exitCode: 0,
-            stdout: "ok\ninput_tokens: 10 output_tokens: 5",
-        });
-        const result = await runOne({ ...baseOptions, workspace, spawn });
-        expect(result.outcome).toBe("pass");
-        expect(result.tokenMeasurement).toBe("parsed");
-        expect(result.tokens.input).toBe(10);
-        expect(result.tokens.output).toBe(5);
-    });
-    test("tokenMeasurement: missing when stdout has no token line — and budget is NOT enforced", async () => {
-        // Agent never reports tokens. budgetTokens is 1, but the harness must not
-        // mark this as budget_exceeded (issue #252) — measurement is missing.
-        const { spawn } = scriptedSpawn({ exitCode: 0, stdout: "ok" });
-        const result = await runOne({ ...baseOptions, workspace, spawn, budgetTokens: 1 });
-        expect(result.tokenMeasurement).toBe("missing");
-        expect(result.tokens).toEqual({ input: 0, output: 0 });
-        expect(result.outcome).not.toBe("budget_exceeded");
-    });
-    test("tokenMeasurement: harness_error path leaves measurement as 'missing'", async () => {
-        const { spawn } = scriptedSpawn({ exitCode: 0, throwSync: new Error("ENOENT") });
-        const result = await runOne({ ...baseOptions, workspace, spawn });
-        expect(result.outcome).toBe("harness_error");
-        // No agent stdout was ever observed → measurement stays at the default.
-        expect(result.tokenMeasurement).toBe("missing");
-    });
-    test("isolation: child env carries pinned XDG/OPENCODE/AKM dirs and not operator values", async () => {
-        const sentinel = "/tmp/operator-config-must-not-leak";
-        const priors = {};
-        for (const name of _ISOLATED_ENV_NAMES) {
-            priors[name] = process.env[name];
-            process.env[name] = sentinel;
-        }
-        try {
-            const { spawn, invocations } = scriptedSpawn({ exitCode: 0, stdout: "ok" });
-            await runOne({
-                ...baseOptions,
-                workspace,
-                stashDir: "/tmp/some-stash",
-                arm: "akm",
-                spawn,
-            });
-            const childEnv = invocations[0]?.env ?? {};
-            // Each isolated key MUST be present and MUST NOT equal the operator sentinel.
-            for (const name of _ISOLATED_ENV_NAMES) {
-                expect(childEnv[name]).toBeDefined();
-                expect(childEnv[name]).not.toBe(sentinel);
-            }
-            expect(childEnv.AKM_STASH_DIR).toBe("/tmp/some-stash");
-            expect(childEnv.BENCH_OPENCODE_MODEL).toBe("anthropic/claude-opus-4-7");
-        }
-        finally {
-            for (const name of _ISOLATED_ENV_NAMES) {
-                if (priors[name] === undefined)
-                    delete process.env[name];
-                else
-                    process.env[name] = priors[name];
-            }
-        }
-    });
-    // ── #271: operator-env isolation (OPENCODE_API_KEY/ANTHROPIC_API_KEY/AKM_CONFIG_DIR)
-    test("operator env isolation: bench child never inherits OPENCODE_API_KEY/ANTHROPIC_API_KEY/AKM_CONFIG_DIR (#271)", async () => {
-        // Even though `OPENCODE_API_KEY` is in the opencode profile's
-        // `envPassthrough` list, the bench driver MUST scrub these operator-env
-        // names before profile.envPassthrough copies them into the child. This
-        // is the regression guard the #271 review identified — without it,
-        // operator credentials and the operator's `AKM_CONFIG_DIR` would leak
-        // into every (task × arm × seed) child.
-        const sentinels = {
-            OPENCODE_API_KEY: "sentinel-A-must-not-leak",
-            ANTHROPIC_API_KEY: "sentinel-B-must-not-leak",
-            AKM_CONFIG_DIR: "sentinel-C-must-not-leak",
-        };
-        const priors = {};
-        for (const [name, value] of Object.entries(sentinels)) {
-            priors[name] = process.env[name];
-            process.env[name] = value;
-        }
-        try {
-            const { spawn, invocations } = scriptedSpawn({ exitCode: 0, stdout: "ok" });
-            await runOne({
-                ...baseOptions,
-                workspace,
-                arm: "akm",
-                stashDir: "/tmp/some-stash",
-                spawn,
-            });
-            const childEnv = invocations[0]?.env ?? {};
-            // None of the operator sentinels reach the child env that runAgent
-            // hands to spawn — neither as a key:value pair nor as a substring
-            // match (paranoid: confirm the literal sentinel strings are absent
-            // even from values like `OPENCODE_CONFIG`).
-            for (const name of _SCRUBBED_OPERATOR_ENV_NAMES) {
-                expect(childEnv[name]).toBeUndefined();
-            }
-            for (const sentinel of Object.values(sentinels)) {
-                for (const value of Object.values(childEnv)) {
-                    expect(value).not.toContain(sentinel);
-                }
-            }
-            // The explicit bench keys ARE present and pinned to the per-run
-            // tmpdirs (sanity: the scrubbing didn't accidentally drop them).
-            expect(childEnv.XDG_CACHE_HOME).toBeDefined();
-            expect(childEnv.XDG_CONFIG_HOME).toBeDefined();
-            expect(childEnv.OPENCODE_CONFIG).toBeDefined();
-            expect(childEnv.AKM_STASH_DIR).toBe("/tmp/some-stash");
-            expect(childEnv.BENCH_OPENCODE_MODEL).toBe("anthropic/claude-opus-4-7");
-        }
-        finally {
-            for (const [name, prior] of Object.entries(priors)) {
-                if (prior === undefined)
-                    delete process.env[name];
-                else
-                    process.env[name] = prior;
-            }
-        }
-    });
-    // ── #261: synthetic-arm AKM_STASH_DIR isolation ─────────────────────────────
-    test("synthetic arm: child env never carries AKM_STASH_DIR (recurrence guard for #243 fixup)", async () => {
-        // CRITICAL: synthetic-arm runs MUST NOT carry AKM_STASH_DIR. Without
-        // this guard the operator's real AKM_STASH_DIR leaks in via parent-env
-        // inheritance — exactly the failure mode the #243 fixup chased. We
-        // exercise both the explicit-stashDir case (bad caller passes one
-        // anyway) and the no-stashDir case.
-        const operatorStash = "/tmp/operator-stash-must-never-leak-into-synthetic";
-        const prior = process.env.AKM_STASH_DIR;
-        process.env.AKM_STASH_DIR = operatorStash;
-        try {
-            // 1) Synthetic arm with NO stashDir option: AKM_STASH_DIR must be
-            //    absent in the child env.
-            const { spawn, invocations } = scriptedSpawn({ exitCode: 0, stdout: "ok" });
-            await runOne({
-                ...baseOptions,
-                workspace,
-                arm: "synthetic",
-                spawn,
-            });
-            const childEnv1 = invocations[0]?.env ?? {};
-            expect(childEnv1.AKM_STASH_DIR).toBeUndefined();
-            expect(childEnv1.AKM_STASH_DIR).not.toBe(operatorStash);
-            // 2) Even when a buggy caller forwards a stashDir to the synthetic
-            //    arm, the driver MUST refuse to wire it into the child env.
-            const { spawn: spawn2, invocations: invocations2 } = scriptedSpawn({ exitCode: 0, stdout: "ok" });
-            await runOne({
-                ...baseOptions,
-                workspace,
-                arm: "synthetic",
-                stashDir: "/tmp/buggy-caller-stash",
-                spawn: spawn2,
-            });
-            const childEnv2 = invocations2[0]?.env ?? {};
-            expect(childEnv2.AKM_STASH_DIR).toBeUndefined();
-        }
-        finally {
-            if (prior === undefined)
-                delete process.env.AKM_STASH_DIR;
-            else
-                process.env.AKM_STASH_DIR = prior;
-        }
-    });
-    // ── opencodeProviders: materialise tests ──────────────────────────────────
-    test("runOne with opencodeProviders writes opencode.json into OPENCODE_CONFIG before spawn", async () => {
-        // We need to capture the OPENCODE_CONFIG path from the child env to
-        // check the file was written. We do this by saving it from the spawn
-        // invocation then checking AFTER the run returns (before dir teardown
-        // occurs — note: driver tears down dirs in finally; but we copy the path
-        // from the invocation). Actually: dirs are torn down in the driver's
-        // finally block AFTER runAgent returns, so by the time our fake spawn
-        // is called the file SHOULD be present. We check via a closure.
-        let capturedOpencodeCfgDir;
-        let fileExistedAtSpawnTime = false;
-        const checkingSpawn = (cmd, options) => {
-            // Capture the OPENCODE_CONFIG dir from the child env.
-            const env = options.env;
-            if (env?.OPENCODE_CONFIG) {
-                capturedOpencodeCfgDir = env.OPENCODE_CONFIG;
-                // OPENCODE_CONFIG now points directly to the opencode.json file.
-                fileExistedAtSpawnTime = require("node:fs").existsSync(env.OPENCODE_CONFIG);
-            }
-            // Behave like the normal fake (agent exits 0, stdout = "ok").
-            const { spawn: inner } = scriptedSpawn({ exitCode: 0, stdout: "ok" });
-            return inner(cmd, options);
-        };
-        const fakeProviders = {
-            source: "/fake/providers.json",
-            providers: {
-                testprov: {
-                    npm: "@ai-sdk/openai-compatible",
-                    options: { baseURL: "http://localhost:9999/v1" },
-                },
-            },
-            defaultModel: "testprov/my-model",
-        };
-        const result = await runOne({
-            ...baseOptions,
-            workspace,
-            model: "testprov/my-model",
-            spawn: checkingSpawn,
-            opencodeProviders: fakeProviders,
-        });
-        // The run should succeed or fail on the verifier — the key thing is it
-        // is not harness_error from the provider materialise step.
-        expect(result.outcome).not.toBe("harness_error");
-        // The file MUST have existed at spawn time.
-        expect(fileExistedAtSpawnTime).toBe(true);
-        // Regression: the OPENCODE_CONFIG dir is torn down after the run.
-        if (capturedOpencodeCfgDir) {
-            // Dir should be cleaned up by the driver's finally block.
-            // (We can't assert it's gone because the test itself runs in the same
-            //  process; just verify the captured path was non-empty.)
-            expect(capturedOpencodeCfgDir.length).toBeGreaterThan(0);
-        }
-    });
-    test("runOne WITHOUT opencodeProviders writes minimal stub to OPENCODE_CONFIG (regression guard)", async () => {
-        let capturedDir;
-        let filesAtSpawnTime = [];
-        let stubContent;
-        const checkingSpawn = (cmd, options) => {
-            const env = options.env;
-            if (env?.OPENCODE_CONFIG) {
-                capturedDir = env.OPENCODE_CONFIG;
-                try {
-                    // OPENCODE_CONFIG points to the file, so read it directly.
-                    stubContent = require("node:fs").readFileSync(env.OPENCODE_CONFIG, "utf8");
-                    filesAtSpawnTime = ["opencode.json"];
-                }
-                catch {
-                    filesAtSpawnTime = [];
-                }
-            }
-            const { spawn: inner } = scriptedSpawn({ exitCode: 0, stdout: "ok" });
-            return inner(cmd, options);
-        };
-        await runOne({
-            ...baseOptions,
-            workspace,
-            spawn: checkingSpawn,
-            // No opencodeProviders
-        });
-        expect(capturedDir).toBeDefined();
-        // Without opencodeProviders, the driver writes a minimal stub opencode.json.
-        expect(filesAtSpawnTime).toEqual(["opencode.json"]);
-        expect(stubContent).toBeDefined();
-        const parsed = JSON.parse(stubContent ?? "{}");
-        expect(parsed.$schema).toBe("https://opencode.ai/config.json");
-        expect(parsed.provider).toBeUndefined();
-    });
-    test("runOne falls back to model-only stub when provider prefix not in map (cloud/built-in models)", async () => {
-        // "opencode" is a BUILTIN_CLOUD_PREFIX — not in fakeProviders — should write
-        // a model-only stub and proceed rather than returning harness_error. Built-in
-        // cloud models like "opencode/big-pickle" resolve via opencode's own registry
-        // and do NOT need a custom provider entry.
-        const fakeProviders = {
-            source: "/fake/providers.json",
-            providers: { myprov: {} },
-        };
-        let stubContent;
-        const checkingSpawn = (cmd, options) => {
-            const env = options.env;
-            if (env?.OPENCODE_CONFIG) {
-                try {
-                    stubContent = require("node:fs").readFileSync(env.OPENCODE_CONFIG, "utf8");
-                }
-                catch {
-                    /* file may not exist */
-                }
-            }
-            const { spawn: inner } = scriptedSpawn({ exitCode: 0, stdout: "ok" });
-            return inner(cmd, options);
-        };
-        const result = await runOne({
-            ...baseOptions,
-            workspace,
-            model: "opencode/big-pickle",
-            spawn: checkingSpawn,
-            opencodeProviders: fakeProviders,
-        });
-        // Should NOT be harness_error — built-in cloud prefix falls back to stub.
-        expect(result.outcome).not.toBe("harness_error");
-        // The written stub should have model key but no provider block.
-        expect(stubContent).toBeDefined();
-        const written = JSON.parse(stubContent ?? "{}");
-        expect(written.model).toBe("opencode/big-pickle");
-        expect(written.provider).toBeUndefined();
-    });
-    test("harness_error: custom provider prefix without opencodeProviders refuses to run", async () => {
-        // "shredder/qwen/qwen3.5-9b" has a custom prefix. Without opencodeProviders,
-        // opencode would silently fall back to a cloud model and burn API credits.
-        // The harness must refuse to run rather than allow that.
-        const { spawn } = scriptedSpawn({ exitCode: 0, stdout: "ok" });
-        const result = await runOne({
-            ...baseOptions,
-            workspace,
-            model: "shredder/qwen/qwen3.5-9b",
-            spawn,
-            // opencodeProviders deliberately omitted
-        });
-        expect(result.outcome).toBe("harness_error");
-        // Error surfaces via setupBenchEnvironment (may be wrapped in "environment setup failed")
-        expect(result.verifierStdout).toMatch(/custom provider prefix|environment setup failed/);
-    });
-});
-describe("driver helpers", () => {
-    test("createIsolationDirs creates four dirs under a single root", () => {
-        const dirs = createIsolationDirs();
-        try {
-            expect(fs.existsSync(dirs.cacheHome)).toBe(true);
-            expect(fs.existsSync(dirs.configHome)).toBe(true);
-            expect(fs.existsSync(dirs.opencodeConfig)).toBe(true);
-            expect(dirs.cacheHome.startsWith(dirs.root)).toBe(true);
-        }
-        finally {
-            fs.rmSync(dirs.root, { recursive: true, force: true });
-        }
-    });
-    test("stripAkmStashDir deletes AKM_STASH_DIR in place (#261 synthetic-arm guard)", () => {
-        const env = {
-            AKM_STASH_DIR: "/tmp/operator-stash",
-            XDG_CACHE_HOME: "/tmp/cache",
-        };
-        const result = stripAkmStashDir(env);
-        expect(result).toBe(env); // mutates in place + returns same ref
-        expect(env.AKM_STASH_DIR).toBeUndefined();
-        expect(env.XDG_CACHE_HOME).toBe("/tmp/cache"); // siblings untouched
-        // No-op on env without AKM_STASH_DIR.
-        const env2 = { XDG_CACHE_HOME: "/tmp/cache" };
-        stripAkmStashDir(env2);
-        expect(env2).toEqual({ XDG_CACHE_HOME: "/tmp/cache" });
-    });
-    test("buildSanitizedEnvSource strips OPENCODE_API_KEY/ANTHROPIC_API_KEY/AKM_CONFIG_DIR (#271)", () => {
-        const source = {
-            OPENCODE_API_KEY: "leak-A",
-            ANTHROPIC_API_KEY: "leak-B",
-            AKM_CONFIG_DIR: "/operator/akm",
-            PATH: "/usr/bin",
-            HOME: "/home/op",
-            OPENCODE_CONFIG: "/operator/opencode",
-            UNRELATED: "kept",
-        };
-        const result = buildSanitizedEnvSource(source);
-        // Operator names removed.
-        expect(result.OPENCODE_API_KEY).toBeUndefined();
-        expect(result.ANTHROPIC_API_KEY).toBeUndefined();
-        expect(result.AKM_CONFIG_DIR).toBeUndefined();
-        // Everything else preserved verbatim.
-        expect(result.PATH).toBe("/usr/bin");
-        expect(result.HOME).toBe("/home/op");
-        expect(result.OPENCODE_CONFIG).toBe("/operator/opencode");
-        expect(result.UNRELATED).toBe("kept");
-        // Result is a copy, not the same reference (caller can mutate freely).
-        expect(result).not.toBe(source);
-        // Source object is untouched.
-        expect(source.OPENCODE_API_KEY).toBe("leak-A");
-    });
-    test("buildSanitizedEnvSource defaults to process.env when no source given", () => {
-        const prior = process.env.OPENCODE_API_KEY;
-        process.env.OPENCODE_API_KEY = "default-source-leak";
-        try {
-            const result = buildSanitizedEnvSource();
-            expect(result.OPENCODE_API_KEY).toBeUndefined();
-        }
-        finally {
-            if (prior === undefined)
-                delete process.env.OPENCODE_API_KEY;
-            else
-                process.env.OPENCODE_API_KEY = prior;
-        }
-    });
-    test("buildIsolatedEnv pins the four isolation keys plus model", () => {
-        const dirs = createIsolationDirs("/tmp/stash");
-        try {
-            const env = buildIsolatedEnv(dirs, "model-x");
-            expect(env.XDG_CACHE_HOME).toBe(dirs.cacheHome);
-            expect(env.XDG_CONFIG_HOME).toBe(dirs.configHome);
-            expect(env.OPENCODE_CONFIG).toBe(path.join(dirs.opencodeConfig, "opencode.json"));
-            expect(env.AKM_STASH_DIR).toBe("/tmp/stash");
-            expect(env.BENCH_OPENCODE_MODEL).toBe("model-x");
-        }
-        finally {
-            fs.rmSync(dirs.root, { recursive: true, force: true });
-        }
-    });
-    test("parseTokenUsage extracts numbers when present, missing otherwise", () => {
-        // No matchable token line at all → measurement is "missing", not a real zero (issue #252).
-        expect(parseTokenUsage("")).toEqual({ input: 0, output: 0, measurement: "missing" });
-        expect(parseTokenUsage("noise")).toEqual({ input: 0, output: 0, measurement: "missing" });
-        // Both keys present → "parsed" with the actual numbers.
-        expect(parseTokenUsage("input_tokens: 123 output_tokens: 456")).toEqual({
-            input: 123,
-            output: 456,
-            measurement: "parsed",
-        });
-        // Only one key present → still "parsed", missing key defaults to 0.
-        expect(parseTokenUsage("input_tokens: 99")).toEqual({ input: 99, output: 0, measurement: "parsed" });
-        expect(parseTokenUsage("output_tokens: 55")).toEqual({ input: 0, output: 55, measurement: "parsed" });
-    });
-    test("readRunEvents returns [] when events.jsonl is missing and parses lines when present", () => {
-        const tmp = benchMkdtemp("bench-events-");
-        try {
-            expect(readRunEvents(tmp)).toEqual([]);
-            const akm = path.join(tmp, "akm");
-            fs.mkdirSync(akm, { recursive: true });
-            fs.writeFileSync(path.join(akm, "events.jsonl"), `${JSON.stringify({ schemaVersion: 1, ts: "2026-04-27T00:00:00Z", eventType: "feedback" })}\n`);
-            const events = readRunEvents(tmp);
-            expect(events.length).toBe(1);
-            expect(events[0]?.eventType).toBe("feedback");
-        }
-        finally {
-            fs.rmSync(tmp, { recursive: true, force: true });
-        }
-    });
-    test("readRunEvents caps reads at EVENTS_READ_CAP_BYTES and records a warning when exceeded", () => {
-        const tmp = benchMkdtemp("bench-events-cap-");
-        try {
-            const akm = path.join(tmp, "akm");
-            fs.mkdirSync(akm, { recursive: true });
-            const eventsPath = path.join(akm, "events.jsonl");
-            // Write a leading parseable record, then a giant filler line that
-            // pushes total size past the cap.
-            const firstLine = `${JSON.stringify({ schemaVersion: 1, ts: "2026-04-27T00:00:00Z", eventType: "feedback" })}\n`;
-            const fd = fs.openSync(eventsPath, "w");
-            try {
-                fs.writeSync(fd, firstLine);
-                // Filler line: a single very long line that — combined with the
-                // first — exceeds the cap. We cap at 16MiB so write 17MiB of 'x'.
-                const fillerSize = EVENTS_READ_CAP_BYTES + 1024 * 1024;
-                const chunk = Buffer.alloc(64 * 1024, "x".charCodeAt(0));
-                let written = 0;
-                while (written < fillerSize) {
-                    const remaining = fillerSize - written;
-                    const toWrite = remaining < chunk.length ? chunk.subarray(0, remaining) : chunk;
-                    fs.writeSync(fd, toWrite);
-                    written += toWrite.length;
-                }
-                fs.writeSync(fd, "\n");
-            }
-            finally {
-                fs.closeSync(fd);
-            }
-            const totalSize = fs.statSync(eventsPath).size;
-            expect(totalSize).toBeGreaterThan(EVENTS_READ_CAP_BYTES);
-            const warnings = [];
-            const events = readRunEvents(tmp, { warnings });
-            // The first parseable record should still be returned from the prefix.
-            expect(events.length).toBe(1);
-            expect(events[0]?.eventType).toBe("feedback");
-            // A warning was appended that mentions the cap and the actual size.
-            expect(warnings.length).toBe(1);
-            expect(warnings[0]).toContain("events.jsonl truncated");
-            expect(warnings[0]).toContain(String(EVENTS_READ_CAP_BYTES));
-        }
-        finally {
-            fs.rmSync(tmp, { recursive: true, force: true });
-        }
-    });
-});