npm - @kweaver-ai/kweaver-sdk - Versions diffs - 0.8.1 → 0.8.3 - Mend

@kweaver-ai/kweaver-sdk 0.8.1 → 0.8.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (214) hide show

package/README.md +40 -52
package/README.zh.md +41 -46
package/dist/agent-providers/index.d.ts +7 -0
package/dist/agent-providers/index.js +5 -0
package/dist/agent-providers/prompt-template.d.ts +62 -0
package/dist/agent-providers/prompt-template.js +105 -0
package/dist/agent-providers/prompts/rubric-judge-v1.prompt.md +51 -0
package/dist/agent-providers/prompts/within-trace-synthesizer-v1.prompt.md +60 -0
package/dist/agent-providers/providers/claude-code-subprocess.d.ts +74 -0
package/dist/agent-providers/providers/claude-code-subprocess.js +259 -0
package/dist/agent-providers/providers/stub.d.ts +47 -0
package/dist/agent-providers/providers/stub.js +77 -0
package/dist/agent-providers/registry.d.ts +45 -0
package/dist/agent-providers/registry.js +77 -0
package/dist/agent-providers/types.d.ts +91 -0
package/dist/agent-providers/types.js +25 -0
package/dist/api/agent-chat.js +8 -6
package/dist/api/context-loader.d.ts +1 -0
package/dist/api/resources.d.ts +94 -0
package/dist/api/resources.js +166 -0
package/dist/api/semantic-search.d.ts +5 -0
package/dist/api/semantic-search.js +5 -0
package/dist/api/skills.d.ts +75 -2
package/dist/api/skills.js +108 -12
package/dist/api/trace.d.ts +5 -0
package/dist/api/trace.js +4 -0
package/dist/cli.js +109 -15
package/dist/client.d.ts +3 -3
package/dist/client.js +5 -5
package/dist/commands/agent/mode.d.ts +6 -0
package/dist/commands/agent/mode.js +75 -0
package/dist/commands/agent-members.js +27 -11
package/dist/commands/agent.js +469 -286
package/dist/commands/auth.js +184 -71
package/dist/commands/bkn-metric.js +37 -16
package/dist/commands/bkn-ops.js +164 -86
package/dist/commands/bkn-query.js +99 -31
package/dist/commands/bkn-schema.d.ts +3 -3
package/dist/commands/bkn-schema.js +127 -86
package/dist/commands/bkn.js +153 -114
package/dist/commands/call.js +23 -13
package/dist/commands/config.js +22 -12
package/dist/commands/context-loader.js +625 -49
package/dist/commands/dataflow.js +14 -6
package/dist/commands/ds.js +52 -30
package/dist/commands/explore.js +18 -15
package/dist/commands/model.js +53 -42
package/dist/commands/resource.d.ts +1 -0
package/dist/commands/{dataview.js → resource.js} +62 -84
package/dist/commands/skill.d.ts +21 -1
package/dist/commands/skill.js +567 -43
package/dist/commands/token.js +11 -0
package/dist/commands/tool.js +46 -29
package/dist/commands/toolbox.js +31 -15
package/dist/commands/trace.d.ts +26 -1
package/dist/commands/trace.js +515 -15
package/dist/commands/vega.js +466 -250
package/dist/help/format.d.ts +65 -0
package/dist/help/format.js +141 -0
package/dist/index.d.ts +5 -5
package/dist/index.js +3 -3
package/dist/resources/bkn.d.ts +5 -0
package/dist/resources/bkn.js +5 -0
package/dist/resources/{dataviews.d.ts → resources.d.ts} +10 -11
package/dist/resources/{dataviews.js → resources.js} +12 -13
package/dist/resources/skills.d.ts +17 -1
package/dist/resources/skills.js +32 -1
package/dist/trace-ai/diagnose/agent-binding.d.ts +67 -0
package/dist/trace-ai/diagnose/agent-binding.js +257 -0
package/dist/trace-ai/diagnose/builtin-rules/tool-retry-intent-mismatch.yaml +68 -0
package/dist/trace-ai/diagnose/index.d.ts +32 -0
package/dist/trace-ai/diagnose/index.js +246 -0
package/dist/trace-ai/diagnose/output-schema-converter.d.ts +24 -0
package/dist/trace-ai/diagnose/output-schema-converter.js +81 -0
package/dist/trace-ai/diagnose/query-extractor.d.ts +14 -0
package/dist/trace-ai/diagnose/query-extractor.js +45 -0
package/dist/trace-ai/diagnose/report-assembler.d.ts +31 -0
package/dist/{trace-core → trace-ai}/diagnose/report-assembler.js +19 -9
package/dist/trace-ai/diagnose/report-markdown.d.ts +18 -0
package/dist/trace-ai/diagnose/report-markdown.js +192 -0
package/dist/{trace-core → trace-ai}/diagnose/rule-loader.js +42 -8
package/dist/{trace-core → trace-ai}/diagnose/schemas.d.ts +77 -2
package/dist/trace-ai/diagnose/schemas.js +154 -0
package/dist/trace-ai/diagnose/signal-probe.d.ts +17 -0
package/dist/trace-ai/diagnose/signal-probe.js +39 -0
package/dist/trace-ai/diagnose/synthesizer-agent.d.ts +40 -0
package/dist/trace-ai/diagnose/synthesizer-agent.js +158 -0
package/dist/{trace-core → trace-ai}/diagnose/trace-shaper.js +1 -0
package/dist/{trace-core → trace-ai}/diagnose/types.d.ts +55 -6
package/dist/trace-ai/eval-set/assertion-evaluator.d.ts +29 -0
package/dist/trace-ai/eval-set/assertion-evaluator.js +100 -0
package/dist/trace-ai/eval-set/builder.d.ts +36 -0
package/dist/trace-ai/eval-set/builder.js +126 -0
package/dist/trace-ai/eval-set/index.d.ts +15 -0
package/dist/trace-ai/eval-set/index.js +10 -0
package/dist/trace-ai/eval-set/output-writer.d.ts +27 -0
package/dist/trace-ai/eval-set/output-writer.js +126 -0
package/dist/trace-ai/eval-set/query-picker.d.ts +37 -0
package/dist/trace-ai/eval-set/query-picker.js +147 -0
package/dist/trace-ai/eval-set/redactor.d.ts +42 -0
package/dist/trace-ai/eval-set/redactor.js +133 -0
package/dist/trace-ai/eval-set/rubric-templates/answer-match-reference.prompt.md +19 -0
package/dist/trace-ai/eval-set/schemas.d.ts +136 -0
package/dist/trace-ai/eval-set/schemas.js +130 -0
package/dist/trace-ai/eval-set/semantic-match-provider.d.ts +33 -0
package/dist/trace-ai/eval-set/semantic-match-provider.js +51 -0
package/dist/trace-ai/eval-set/test-runner.d.ts +34 -0
package/dist/trace-ai/eval-set/test-runner.js +153 -0
package/dist/trace-ai/eval-set/types.d.ts +46 -0
package/dist/trace-ai/eval-set/types.js +8 -0
package/dist/trace-ai/exp/bundle-writer.d.ts +10 -0
package/dist/trace-ai/exp/bundle-writer.js +54 -0
package/dist/trace-ai/exp/claude-binary.d.ts +5 -0
package/dist/trace-ai/exp/claude-binary.js +30 -0
package/dist/trace-ai/exp/coordinator.d.ts +45 -0
package/dist/trace-ai/exp/coordinator.js +203 -0
package/dist/trace-ai/exp/eval-runner.d.ts +14 -0
package/dist/trace-ai/exp/eval-runner.js +47 -0
package/dist/trace-ai/exp/exp-store/abort-signal.d.ts +3 -0
package/dist/trace-ai/exp/exp-store/abort-signal.js +27 -0
package/dist/trace-ai/exp/exp-store/candidate-lineage-yaml.d.ts +4 -0
package/dist/trace-ai/exp/exp-store/candidate-lineage-yaml.js +37 -0
package/dist/trace-ai/exp/exp-store/events-jsonl.d.ts +17 -0
package/dist/trace-ai/exp/exp-store/events-jsonl.js +60 -0
package/dist/trace-ai/exp/exp-store/exp-registry.d.ts +6 -0
package/dist/trace-ai/exp/exp-store/exp-registry.js +41 -0
package/dist/trace-ai/exp/exp-store/index.d.ts +46 -0
package/dist/trace-ai/exp/exp-store/index.js +59 -0
package/dist/trace-ai/exp/exp-store/lock.d.ts +3 -0
package/dist/trace-ai/exp/exp-store/lock.js +73 -0
package/dist/trace-ai/exp/exp-store/mission-md.d.ts +3 -0
package/dist/trace-ai/exp/exp-store/mission-md.js +37 -0
package/dist/trace-ai/exp/exp-store/readme-template.d.ts +5 -0
package/dist/trace-ai/exp/exp-store/readme-template.js +25 -0
package/dist/trace-ai/exp/exp-store/round-yaml.d.ts +3 -0
package/dist/trace-ai/exp/exp-store/round-yaml.js +33 -0
package/dist/trace-ai/exp/index.d.ts +8 -0
package/dist/trace-ai/exp/index.js +238 -0
package/dist/trace-ai/exp/info.d.ts +35 -0
package/dist/trace-ai/exp/info.js +120 -0
package/dist/trace-ai/exp/patch/agent-config.d.ts +1 -0
package/dist/trace-ai/exp/patch/agent-config.js +26 -0
package/dist/trace-ai/exp/patch/index.d.ts +2 -0
package/dist/trace-ai/exp/patch/index.js +13 -0
package/dist/trace-ai/exp/patch/skill.d.ts +1 -0
package/dist/trace-ai/exp/patch/skill.js +24 -0
package/dist/trace-ai/exp/providers/synthesizer-client.d.ts +14 -0
package/dist/trace-ai/exp/providers/synthesizer-client.js +39 -0
package/dist/trace-ai/exp/providers/triage-client.d.ts +19 -0
package/dist/trace-ai/exp/providers/triage-client.js +51 -0
package/dist/trace-ai/exp/schemas.d.ts +147 -0
package/dist/trace-ai/exp/schemas.js +50 -0
package/dist/trace-ai/exp/scoring.d.ts +2 -0
package/dist/trace-ai/exp/scoring.js +46 -0
package/dist/trace-ai/scan/aggregator.d.ts +20 -0
package/dist/trace-ai/scan/aggregator.js +26 -0
package/dist/trace-ai/scan/artifacts/paths.d.ts +12 -0
package/dist/trace-ai/scan/artifacts/paths.js +18 -0
package/dist/trace-ai/scan/artifacts/writer.d.ts +67 -0
package/dist/trace-ai/scan/artifacts/writer.js +96 -0
package/dist/trace-ai/scan/batched-rubric.d.ts +55 -0
package/dist/trace-ai/scan/batched-rubric.js +159 -0
package/dist/trace-ai/scan/cross-trace-synthesizer.d.ts +24 -0
package/dist/trace-ai/scan/cross-trace-synthesizer.js +93 -0
package/dist/trace-ai/scan/index.d.ts +31 -0
package/dist/trace-ai/scan/index.js +390 -0
package/dist/trace-ai/scan/prompts/builtin/cross-trace-synthesizer-v1.prompt.md +44 -0
package/dist/trace-ai/scan/prompts/builtin/rubric-judge-batch-v1.prompt.md +44 -0
package/dist/trace-ai/scan/runner.d.ts +25 -0
package/dist/trace-ai/scan/runner.js +42 -0
package/dist/trace-ai/scan/sampler.d.ts +18 -0
package/dist/trace-ai/scan/sampler.js +81 -0
package/dist/trace-ai/scan/scan-summary-markdown.d.ts +2 -0
package/dist/trace-ai/scan/scan-summary-markdown.js +71 -0
package/dist/trace-ai/scan/scan-summary-schema.d.ts +73 -0
package/dist/trace-ai/scan/scan-summary-schema.js +61 -0
package/dist/trace-ai/scan/single-agent-validator.d.ts +23 -0
package/dist/trace-ai/scan/single-agent-validator.js +42 -0
package/dist/trace-ai/scan/traces-list-parser.d.ts +15 -0
package/dist/trace-ai/scan/traces-list-parser.js +46 -0
package/package.json +2 -2
package/dist/api/dataviews.d.ts +0 -117
package/dist/api/dataviews.js +0 -265
package/dist/commands/dataview.d.ts +0 -8
package/dist/trace-core/diagnose/index.d.ts +0 -9
package/dist/trace-core/diagnose/index.js +0 -104
package/dist/trace-core/diagnose/report-assembler.d.ts +0 -12
package/dist/trace-core/diagnose/schemas.js +0 -94
package/dist/trace-core/diagnose/signal-probe.d.ts +0 -5
package/dist/trace-core/diagnose/signal-probe.js +0 -21
/package/dist/{trace-core → trace-ai}/diagnose/builtin-rules/excessive-tool-calls-per-turn.d.ts +0 -0
/package/dist/{trace-core → trace-ai}/diagnose/builtin-rules/excessive-tool-calls-per-turn.js +0 -0
/package/dist/{trace-core → trace-ai}/diagnose/builtin-rules/excessive-tool-calls-per-turn.yaml +0 -0
/package/dist/{trace-core → trace-ai}/diagnose/builtin-rules/llm-response-truncated-no-continue.d.ts +0 -0
/package/dist/{trace-core → trace-ai}/diagnose/builtin-rules/llm-response-truncated-no-continue.js +0 -0
/package/dist/{trace-core → trace-ai}/diagnose/builtin-rules/llm-response-truncated-no-continue.yaml +0 -0
/package/dist/{trace-core → trace-ai}/diagnose/builtin-rules/register.d.ts +0 -0
/package/dist/{trace-core → trace-ai}/diagnose/builtin-rules/register.js +0 -0
/package/dist/{trace-core → trace-ai}/diagnose/builtin-rules/retrieval-empty-no-fallback.d.ts +0 -0
/package/dist/{trace-core → trace-ai}/diagnose/builtin-rules/retrieval-empty-no-fallback.js +0 -0
/package/dist/{trace-core → trace-ai}/diagnose/builtin-rules/retrieval-empty-no-fallback.yaml +0 -0
/package/dist/{trace-core → trace-ai}/diagnose/builtin-rules/tool-error-swallowed.d.ts +0 -0
/package/dist/{trace-core → trace-ai}/diagnose/builtin-rules/tool-error-swallowed.js +0 -0
/package/dist/{trace-core → trace-ai}/diagnose/builtin-rules/tool-error-swallowed.yaml +0 -0
/package/dist/{trace-core → trace-ai}/diagnose/builtin-rules/tool-loop-no-state-change.d.ts +0 -0
/package/dist/{trace-core → trace-ai}/diagnose/builtin-rules/tool-loop-no-state-change.js +0 -0
/package/dist/{trace-core → trace-ai}/diagnose/builtin-rules/tool-loop-no-state-change.yaml +0 -0
/package/dist/{trace-core → trace-ai}/diagnose/predicate-registry.d.ts +0 -0
/package/dist/{trace-core → trace-ai}/diagnose/predicate-registry.js +0 -0
/package/dist/{trace-core → trace-ai}/diagnose/rule-loader.d.ts +0 -0
/package/dist/{trace-core → trace-ai}/diagnose/synthesizer-template.d.ts +0 -0
/package/dist/{trace-core → trace-ai}/diagnose/synthesizer-template.js +0 -0
/package/dist/{trace-core → trace-ai}/diagnose/trace-shaper.d.ts +0 -0
/package/dist/{trace-core → trace-ai}/diagnose/types.js +0 -0

package/dist/trace-ai/exp/index.js ADDED Viewed

@@ -0,0 +1,238 @@
+// src/trace-ai/exp/index.ts
+import path from "node:path";
+import fs from "node:fs/promises";
+import { fileURLToPath } from "node:url";
+import { ExpStore } from "./exp-store/index.js";
+import { ExperimentCoordinator } from "./coordinator.js";
+import { ClaudeCodeSynthesizer } from "./providers/synthesizer-client.js";
+import { ClaudeCodeTriageClient } from "./providers/triage-client.js";
+import { runEval } from "./eval-runner.js";
+import { defaultRegistry } from "../../agent-providers/registry.js";
+import { ClaudeCodeSubprocessProvider } from "../../agent-providers/providers/claude-code-subprocess.js";
+import { PromptTemplateRegistry } from "../../agent-providers/prompt-template.js";
+import { createBuiltinSemanticMatchProvider } from "../eval-set/semantic-match-provider.js";
+import { ensureValidToken } from "../../auth/oauth.js";
+import { fetchAgentInfo, sendChatRequest } from "../../api/agent-chat.js";
+import { getTracesByConversation } from "../../api/conversations.js";
+import { upsertRegistry, listRegistry } from "./exp-store/exp-registry.js";
+import { runInfo, runList, getHealthChecks } from "./info.js";
+import { resolveClaudeBinary } from "./claude-binary.js";
+const __expIndexDir = path.dirname(fileURLToPath(import.meta.url));
+const EVAL_SET_RUBRIC_DIR = path.join(__expIndexDir, "..", "eval-set", "rubric-templates");
+function ensureProvider() {
+    if (!defaultRegistry.has("claude-code")) {
+        defaultRegistry.register(new ClaudeCodeSubprocessProvider({
+            binary: resolveClaudeBinary(),
+            defaultTimeoutMs: 120_000,
+        }), { setAsDefault: true });
+    }
+}
+export function parseExpArgs(argv) {
+    const [sub, dir, ...flags] = argv;
+    const validSubs = ["run", "resume", "show", "status", "abort", "doctor", "list", "info"];
+    if (!validSubs.includes(sub)) {
+        throw new Error(`Unknown exp subcommand: ${sub}. Use: ${validSubs.join(", ")}`);
+    }
+    const isDiscoveryCmd = sub === "list" || sub === "info";
+    const expDir = isDiscoveryCmd
+        ? (dir ? path.resolve(dir) : "")
+        : path.resolve(dir ?? ".");
+    return {
+        subcommand: sub,
+        expDir,
+        newRun: flags.includes("--new-run"),
+        json: flags.includes("--json"),
+    };
+}
+export async function runExpCommand(argv) {
+    const args = parseExpArgs(argv);
+    switch (args.subcommand) {
+        case "list": {
+            if (args.expDir) {
+                await runList([{ path: args.expDir, last_active_ts: new Date().toISOString() }]);
+            }
+            else {
+                const entries = await listRegistry();
+                await runList(entries);
+            }
+            return 0;
+        }
+        case "info": {
+            let expDir = args.expDir;
+            if (!expDir) {
+                const entries = await listRegistry();
+                if (entries.length === 0) {
+                    process.stderr.write("Error: no experiments in registry. Run 'trace exp run <dir>' first, or provide a path: trace exp info <dir>\n");
+                    return 1;
+                }
+                expDir = entries[0].path;
+                process.stderr.write(`Using most recent: ${expDir}\n`);
+            }
+            await runInfo(expDir, { json: args.json });
+            return 0;
+        }
+        case "run": {
+            ensureProvider();
+            const store = new ExpStore(args.expDir);
+            const replayed = await store.replayState();
+            if (!replayed.isTerminal && replayed.currentRound > 0 && !replayed.lastFailure) {
+                process.stderr.write(`Error: experiment in progress (state: ${replayed.currentState}). Use exp resume.\n`);
+                return 2;
+            }
+            if (replayed.isTerminal && !args.newRun) {
+                process.stderr.write(`Error: experiment already in terminal state ${replayed.currentState}. Use --new-run to start fresh.\n`);
+                return 2;
+            }
+            if (replayed.isTerminal && args.newRun) {
+                await store.archiveState();
+            }
+            await upsertRegistry(args.expDir, new Date().toISOString());
+            const coord = await makeCoordinator(args.expDir);
+            await coord.run();
+            return 0;
+        }
+        case "resume": {
+            ensureProvider();
+            const store = new ExpStore(args.expDir);
+            const replayed = await store.replayState();
+            if (replayed.currentState !== "Deciding") {
+                process.stderr.write(`Error: cannot resume — experiment is in state ${replayed.currentState}. Only Deciding state supports resume.\n`);
+                return 2;
+            }
+            await upsertRegistry(args.expDir, new Date().toISOString());
+            const coord = await makeCoordinator(args.expDir);
+            await coord.resume();
+            return 0;
+        }
+        case "show": {
+            const store = new ExpStore(args.expDir);
+            const replayed = await store.replayState();
+            const rounds = await store.readAllRounds();
+            const lineage = await store.readLineage();
+            const mission = await store.readMission().catch(() => null);
+            process.stdout.write(`State: ${replayed.currentState}  Round: ${replayed.currentRound}\n`);
+            if (mission?.next_change) {
+                process.stdout.write(`Suggested next change:\n  target: ${mission.next_change.target}\n  hypothesis: ${mission.next_change.hypothesis}\n`);
+            }
+            if (rounds.length > 0) {
+                const last = rounds[rounds.length - 1];
+                process.stdout.write(`Last round scores: outcome=${last.scores?.outcome.toFixed(2) ?? "?"}, trajectory=${last.scores?.trajectory.toFixed(2) ?? "?"}\n`);
+                if (last.triage_conclusion) {
+                    process.stdout.write(`Triage: ${last.triage_conclusion.diagnoses.join("; ")}\n`);
+                }
+            }
+            process.stdout.write(`Lineage: ${lineage.length} versions\n`);
+            return 0;
+        }
+        case "status": {
+            const store = new ExpStore(args.expDir);
+            const replayed = await store.replayState();
+            process.stdout.write(`${args.expDir}: ${replayed.currentState} (round ${replayed.currentRound})\n`);
+            return 0;
+        }
+        case "abort": {
+            const store = new ExpStore(args.expDir);
+            await store.writeAbortSignal();
+            process.stdout.write(`Abort signal written. Running process will stop at next checkpoint.\n`);
+            return 0;
+        }
+        case "doctor": {
+            const store = new ExpStore(args.expDir);
+            return runDoctor(args.expDir, store);
+        }
+    }
+}
+async function runDoctor(expDir, store) {
+    let ok = true;
+    const check = (label, pass, msg) => {
+        process.stdout.write(`${pass ? "✓" : "✗"} ${label}${pass ? "" : `: ${msg}`}\n`);
+        if (!pass)
+            ok = false;
+    };
+    try {
+        const mission = await store.readMission();
+        check("mission.md valid", true, "");
+        for (const es of mission.eval_sets) {
+            const esPath = path.join(expDir, es.path);
+            try {
+                await fs.access(esPath);
+                check(`eval_set ${es.path}`, true, "");
+            }
+            catch {
+                check(`eval_set ${es.path}`, false, `not found: ${esPath}`);
+            }
+        }
+        const candPath = path.join(expDir, mission.current_candidate.path);
+        try {
+            await fs.access(candPath);
+            check("current_candidate readable", true, "");
+        }
+        catch {
+            check("current_candidate readable", false, `not found: ${candPath}`);
+        }
+    }
+    catch (e) {
+        check("mission.md valid", false, String(e));
+    }
+    const health = await getHealthChecks(expDir);
+    check("claude-code provider available", health.provider_available, "run: npx @anthropic-ai/claude-code --version");
+    check("no step_failed in events", health.no_step_failed, "step_failed found in events.jsonl");
+    return ok ? 0 : 1;
+}
+async function makeCoordinator(expDir) {
+    let baseUrl = process.env["KWEAVER_BASE_URL"] ?? "";
+    let token = process.env["KWEAVER_TOKEN"] ?? "";
+    const bd = process.env["KWEAVER_BUSINESS_DOMAIN"] ?? "bd_public";
+    if (!baseUrl || !token) {
+        const t = await ensureValidToken();
+        if (!baseUrl)
+            baseUrl = t.baseUrl;
+        if (!token)
+            token = t.accessToken;
+    }
+    let semanticMatchProvider;
+    try {
+        const provider = defaultRegistry.resolve({ requiredCapabilities: ["structured_output"] });
+        if (provider && (await provider.isAvailable())) {
+            const promptRegistry = new PromptTemplateRegistry();
+            await promptRegistry.loadBuiltinDir(EVAL_SET_RUBRIC_DIR);
+            semanticMatchProvider = createBuiltinSemanticMatchProvider({ provider, promptRegistry, lang: "zh" });
+        }
+    }
+    catch {
+        process.stderr.write("warn: could not create semantic-match provider — semantic_match assertions will be skipped\n");
+    }
+    return new ExperimentCoordinator({
+        expDir,
+        synthesizer: new ClaudeCodeSynthesizer(),
+        triage: new ClaudeCodeTriageClient(),
+        runEval: ({ evalSetPaths, candidatePath, round }) => runEval({
+            evalSetPaths,
+            candidatePath,
+            expDir,
+            round,
+            maxParallel: 2,
+            deps: {
+                fetchAgent: async (agentId) => fetchAgentInfo({ baseUrl, accessToken: token, agentId, version: "latest", businessDomain: bd }),
+                sendChat: async ({ agentInfo, query }) => {
+                    const result = await sendChatRequest({
+                        baseUrl,
+                        accessToken: token,
+                        agentId: agentInfo.id,
+                        agentKey: agentInfo.key,
+                        agentVersion: agentInfo.version,
+                        query,
+                        stream: true,
+                        businessDomain: bd,
+                    });
+                    return { text: result.text, conversationId: result.conversationId };
+                },
+                fetchTrace: async (conversationId) => {
+                    const r = await getTracesByConversation({ baseUrl, accessToken: token, conversationId, businessDomain: bd });
+                    return { spans: r.spans };
+                },
+                semanticMatchProvider,
+            },
+        }),
+    });
+}

package/dist/trace-ai/exp/info.d.ts ADDED Viewed

@@ -0,0 +1,35 @@
+import type { ThreeAxisScores } from "./schemas.js";
+export interface HealthChecks {
+    mission_valid: boolean;
+    eval_set_valid: boolean;
+    candidate_readable: boolean;
+    provider_available: boolean;
+    no_step_failed: boolean;
+}
+export interface ExpSnapshot {
+    workspace: string;
+    state: string;
+    round: number;
+    scores: ThreeAxisScores | null;
+    triage_summary: string | null;
+    suggested_next: {
+        target: string;
+        hypothesis: string;
+    } | null;
+    lineage_versions: number;
+    health: HealthChecks;
+}
+export declare function getHealthChecks(expDir: string): Promise<HealthChecks>;
+export declare function buildExpSnapshot(expDir: string): Promise<ExpSnapshot>;
+export declare function formatSnapshotYaml(snap: ExpSnapshot): string;
+export declare function formatSnapshotTableRow(entry: {
+    path: string;
+    last_active_ts: string;
+}, snap: ExpSnapshot | null): string;
+export declare function runInfo(expDir: string, opts?: {
+    json?: boolean;
+}): Promise<void>;
+export declare function runList(registryEntries: Array<{
+    path: string;
+    last_active_ts: string;
+}>): Promise<void>;

package/dist/trace-ai/exp/info.js ADDED Viewed

@@ -0,0 +1,120 @@
+// src/trace-ai/exp/info.ts
+import path from "node:path";
+import fs from "node:fs/promises";
+import yaml from "js-yaml";
+import { ExpStore } from "./exp-store/index.js";
+import { defaultRegistry } from "../../agent-providers/registry.js";
+export async function getHealthChecks(expDir) {
+    const store = new ExpStore(expDir);
+    let mission_valid = false;
+    let eval_set_valid = false;
+    let candidate_readable = false;
+    try {
+        const mission = await store.readMission();
+        mission_valid = true;
+        let allEvalSetsOk = true;
+        for (const es of mission.eval_sets) {
+            try {
+                await fs.access(path.join(expDir, es.path));
+            }
+            catch {
+                allEvalSetsOk = false;
+            }
+        }
+        eval_set_valid = allEvalSetsOk;
+        try {
+            await fs.access(path.join(expDir, mission.current_candidate.path));
+            candidate_readable = true;
+        }
+        catch {
+            candidate_readable = false;
+        }
+    }
+    catch { /* mission_valid stays false */ }
+    let provider_available = false;
+    try {
+        provider_available = defaultRegistry.resolve({ preferred: "claude-code" }) !== null;
+    }
+    catch {
+        provider_available = false;
+    }
+    const replayed = await store.replayState();
+    const no_step_failed = replayed.lastFailure === null;
+    return { mission_valid, eval_set_valid, candidate_readable, provider_available, no_step_failed };
+}
+export async function buildExpSnapshot(expDir) {
+    // Throw early if the experiment directory doesn't exist, so callers (e.g.
+    // runList) can catch and render a "(missing)" row instead of returning a
+    // phantom "Init" snapshot for a non-existent path.
+    await fs.access(expDir);
+    const store = new ExpStore(expDir);
+    const replayed = await store.replayState();
+    const rounds = await store.readAllRounds();
+    const lineage = await store.readLineage();
+    const mission = await store.readMission().catch(() => null);
+    const health = await getHealthChecks(expDir);
+    const lastRound = rounds.length > 0 ? rounds[rounds.length - 1] : null;
+    const scores = lastRound?.scores ?? null;
+    const triage_summary = lastRound?.triage_conclusion?.diagnoses.join("; ") ?? null;
+    const suggested_next = mission?.next_change
+        ? { target: mission.next_change.target, hypothesis: mission.next_change.hypothesis }
+        : null;
+    return {
+        workspace: expDir,
+        state: replayed.currentState,
+        round: replayed.currentRound,
+        scores: scores ?? null,
+        triage_summary,
+        suggested_next,
+        lineage_versions: lineage.length,
+        health,
+    };
+}
+export function formatSnapshotYaml(snap) {
+    return yaml.dump(snap, { lineWidth: -1 });
+}
+export function formatSnapshotTableRow(entry, snap) {
+    if (snap === null) {
+        return [entry.path.padEnd(50), "(missing)"].join("  ");
+    }
+    const outcome = snap.scores?.outcome.toFixed(2) ?? "-";
+    const trajectory = snap.scores?.trajectory.toFixed(2) ?? "-";
+    const lastActive = entry.last_active_ts.replace("T", " ").slice(0, 19);
+    return [
+        entry.path.padEnd(50),
+        snap.state.padEnd(12),
+        String(snap.round).padEnd(6),
+        outcome.padEnd(8),
+        trajectory.padEnd(10),
+        lastActive,
+    ].join("  ");
+}
+export async function runInfo(expDir, opts = {}) {
+    const snap = await buildExpSnapshot(expDir);
+    if (opts.json) {
+        process.stdout.write(JSON.stringify(snap, null, 2) + "\n");
+    }
+    else {
+        process.stdout.write(formatSnapshotYaml(snap));
+    }
+}
+export async function runList(registryEntries) {
+    const header = [
+        "PATH".padEnd(50),
+        "STATE".padEnd(12),
+        "ROUND".padEnd(6),
+        "OUTCOME".padEnd(8),
+        "TRAJECTORY".padEnd(10),
+        "LAST_ACTIVE",
+    ].join("  ");
+    process.stdout.write(header + "\n");
+    process.stdout.write("-".repeat(header.length) + "\n");
+    for (const entry of registryEntries) {
+        let snap = null;
+        try {
+            snap = await buildExpSnapshot(entry.path);
+        }
+        catch { /* missing path */ }
+        process.stdout.write(formatSnapshotTableRow(entry, snap) + "\n");
+    }
+}

package/dist/trace-ai/exp/patch/agent-config.d.ts ADDED Viewed

	@@ -0,0 +1 @@
1	+ export declare function applyAgentConfigPatch(candidate: Record<string, unknown>, patchJson: string): Record<string, unknown>;

package/dist/trace-ai/exp/patch/agent-config.js ADDED Viewed

@@ -0,0 +1,26 @@
+// src/trace-ai/exp/patch/agent-config.ts
+export function applyAgentConfigPatch(candidate, patchJson) {
+    const patch = JSON.parse(patchJson);
+    if (!patch.agent)
+        throw new Error("agent.* patch must have an 'agent' key");
+    // Only the agent sub-tree is patched; extra top-level keys in patchJson are intentionally ignored.
+    // Callers should scope patch JSON to { agent: { ... } } only.
+    const result = structuredClone(candidate);
+    result["agent"] = mergePatch(result["agent"], patch["agent"]);
+    return result;
+}
+function mergePatch(target, patch) {
+    const result = { ...target };
+    for (const [k, v] of Object.entries(patch)) {
+        if (v === null) {
+            delete result[k];
+        }
+        else if (typeof v === "object" && !Array.isArray(v)) {
+            result[k] = mergePatch(result[k] ?? {}, v);
+        }
+        else {
+            result[k] = v;
+        }
+    }
+    return result;
+}

package/dist/trace-ai/exp/patch/index.d.ts ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ import type { NextChange } from "../schemas.js";
2	+ export declare function applyPatch(candidate: Record<string, unknown>, change: NextChange): Record<string, unknown>;

package/dist/trace-ai/exp/patch/index.js ADDED Viewed

@@ -0,0 +1,13 @@
+import { applyAgentConfigPatch } from "./agent-config.js";
+import { applySkillPatch } from "./skill.js";
+export function applyPatch(candidate, change) {
+    const prefix = change.target.split(".")[0];
+    switch (prefix) {
+        case "agent":
+            return applyAgentConfigPatch(candidate, change.patch);
+        case "skill":
+            return applySkillPatch(candidate, change.patch);
+        default:
+            throw new Error(`Unsupported target prefix "${prefix}" — only agent.* and skill.* are supported in MVP-C`);
+    }
+}

package/dist/trace-ai/exp/patch/skill.d.ts ADDED Viewed

	@@ -0,0 +1 @@
1	+ export declare function applySkillPatch(candidate: Record<string, unknown>, patchJson: string): Record<string, unknown>;

package/dist/trace-ai/exp/patch/skill.js ADDED Viewed

@@ -0,0 +1,24 @@
+export function applySkillPatch(candidate, patchJson) {
+    const patch = JSON.parse(patchJson);
+    if (!patch.skills)
+        throw new Error("skill.* patch must have a 'skills' key");
+    const result = structuredClone(candidate);
+    let skills = result["skills"] ?? [];
+    // Order is significant: remove → add → swap
+    if (patch.skills.remove) {
+        const toRemove = new Set(patch.skills.remove);
+        skills = skills.filter(s => !toRemove.has(s.name));
+    }
+    if (patch.skills.add) {
+        skills = [...skills, ...patch.skills.add];
+    }
+    if (patch.skills.swap) {
+        const { from, to } = patch.skills.swap;
+        const matched = skills.some(s => s.name === from);
+        if (!matched)
+            throw new Error(`skill.swap: skill "${from}" not found in candidate`);
+        skills = skills.map(s => s.name === from ? to : s);
+    }
+    result["skills"] = skills;
+    return result;
+}

package/dist/trace-ai/exp/providers/synthesizer-client.d.ts ADDED Viewed

@@ -0,0 +1,14 @@
+import type { Mission, NextChange, RoundData } from "../schemas.js";
+export interface SynthesizerInput {
+    mission: Mission;
+    candidateConfig: Record<string, unknown>;
+    prevRound?: RoundData;
+    prevRounds: RoundData[];
+    crossRoundMemoryRef?: string;
+}
+export interface SynthesizerClient {
+    generate(input: SynthesizerInput): Promise<NextChange>;
+}
+export declare class ClaudeCodeSynthesizer implements SynthesizerClient {
+    generate(input: SynthesizerInput): Promise<NextChange>;
+}

package/dist/trace-ai/exp/providers/synthesizer-client.js ADDED Viewed

@@ -0,0 +1,39 @@
+// src/trace-ai/exp/providers/synthesizer-client.ts
+import yaml from "js-yaml";
+import { defaultRegistry } from "../../../agent-providers/registry.js";
+import { NextChangeSchema } from "../schemas.js";
+export class ClaudeCodeSynthesizer {
+    async generate(input) {
+        const provider = defaultRegistry.resolve({ preferred: "claude-code" });
+        if (!provider)
+            throw new Error("claude-code provider not available");
+        const prevSummary = input.prevRounds.map(r => `Round ${r.round}: outcome=${r.scores?.outcome.toFixed(2) ?? "?"}, hints=${r.triage_conclusion?.hints.join("; ") ?? "none"}`).join("\n");
+        const prompt = `You are an agent optimization assistant. Given an experiment goal and round results, suggest the next change to try.
+GOAL: ${input.mission.goal}
+CURRENT CANDIDATE CONFIG:
+${yaml.dump(input.candidateConfig, { lineWidth: 80 })}
+PREVIOUS ROUNDS:
+${prevSummary || "None (first round)"}
+${input.prevRound?.triage_conclusion ? `TRIAGE HINTS FROM LAST ROUND:\n${input.prevRound.triage_conclusion.hints.join("\n")}` : ""}
+${input.crossRoundMemoryRef ? `CROSS-ROUND CONTEXT: ${input.crossRoundMemoryRef}` : ""}
+Respond with a JSON object with exactly these fields:
+- "target": one of "agent.system_prompt", "agent.temperature", "agent.model", "skill.add", "skill.remove", "skill.swap"
+- "hypothesis": brief explanation of why this change might help
+- "patch": a JSON Merge Patch string to apply to the candidate config
+Example for changing system_prompt:
+{"target": "agent.system_prompt", "hypothesis": "Add explicit stop condition", "patch": "{\"agent\":{\"system_prompt\":\"New prompt here\"}}"}`;
+        const response = await provider.invoke({
+            prompt,
+            outputSchema: NextChangeSchema,
+            correlationId: `synthesizer-${Date.now()}`,
+        });
+        return response.output;
+    }
+}

package/dist/trace-ai/exp/providers/triage-client.d.ts ADDED Viewed

@@ -0,0 +1,19 @@
+import type { RoundData } from "../schemas.js";
+export interface TriageInput {
+    currentRound: RoundData;
+    prevRounds: RoundData[];
+    candidateConfig: Record<string, unknown>;
+    crossRoundMemoryRef?: string;
+}
+export interface TriageResult {
+    diagnoses: string[];
+    hints: string[];
+    verdict: "continue" | "publish";
+    new_memory_token: string;
+}
+export interface TriageClient {
+    triage(input: TriageInput): Promise<TriageResult>;
+}
+export declare class ClaudeCodeTriageClient implements TriageClient {
+    triage(input: TriageInput): Promise<TriageResult>;
+}

package/dist/trace-ai/exp/providers/triage-client.js ADDED Viewed

@@ -0,0 +1,51 @@
+// src/trace-ai/exp/providers/triage-client.ts
+import { z } from "zod";
+import { defaultRegistry } from "../../../agent-providers/registry.js";
+const TriageOutputSchema = z.object({
+    diagnoses: z.array(z.string()),
+    hints: z.array(z.string()),
+    verdict: z.enum(["continue", "publish"]),
+    new_memory_token: z.string(),
+});
+export class ClaudeCodeTriageClient {
+    async triage(input) {
+        const provider = defaultRegistry.resolve({ preferred: "claude-code" });
+        if (!provider)
+            throw new Error("claude-code provider not available");
+        const r = input.currentRound;
+        const scoresSummary = r.scores
+            ? `outcome=${r.scores.outcome.toFixed(2)}, trajectory=${r.scores.trajectory.toFixed(2)}, guardrail=${r.scores.guardrail.toFixed(2)}`
+            : "no scores";
+        const failedQueries = (r.per_query_results ?? [])
+            .filter(q => q.assertion_results.some(a => a.verdict === "fail"))
+            .map(q => `${q.query_id}: ${q.assertion_results.filter(a => a.verdict === "fail").map(a => a.type).join(", ")}`)
+            .join("\n");
+        // candidateConfig is available for future prompt enrichment; omitted here to keep the prompt focused on scores.
+        const prompt = `You are an agent evaluation triager. Analyze the current round results and recommend next steps.
+ROUND ${r.round} SCORES: ${scoresSummary}
+FAILED QUERIES:
+${failedQueries || "None"}
+TRAJECTORY ISSUES:
+${(r.per_query_results ?? []).filter(q => q.trajectory_summary.retry_count > 1).map(q => `${q.query_id}: ${q.trajectory_summary.retry_count} retries`).join("\n") || "None"}
+PREVIOUS ROUND HISTORY:
+${input.prevRounds.map(pr => `Round ${pr.round}: outcome=${pr.scores?.outcome.toFixed(2) ?? "?"}, verdict=${pr.triage_conclusion?.verdict ?? "?"}`).join("\n") || "None"}
+${input.crossRoundMemoryRef ? `CONTEXT FROM PREVIOUS TRIAGE: ${input.crossRoundMemoryRef}` : ""}
+Respond with JSON:
+- "diagnoses": list of root cause observations
+- "hints": list of specific suggestions for next change
+- "verdict": "continue" if more rounds needed, "publish" if this candidate is good enough
+- "new_memory_token": brief summary of key findings to carry forward (1-2 sentences)`;
+        const response = await provider.invoke({
+            prompt,
+            outputSchema: TriageOutputSchema,
+            correlationId: `triage-${Date.now()}`,
+        });
+        return response.output;
+    }
+}