npm - @botbotgo/agent-harness - Versions diffs - 0.0.475 → 0.0.476 - Mend

@botbotgo/agent-harness 0.0.475 → 0.0.476

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (227) hide show

package/README.md +3 -1234
package/README.zh.md +3 -1191
package/dist/acp.js +1 -1
package/dist/api.js +1 -404
package/dist/benchmark/checkpoint-resume-cost-benchmark.js +1 -55
package/dist/benchmark/deepagent-local-model-benchmark.js +2 -35
package/dist/benchmark/upstream-runtime-ab-benchmark.js +1 -179
package/dist/cli/chat-interactive.js +25 -244
package/dist/cli/chat-rendering.js +6 -100
package/dist/cli/chat-stream.js +23 -512
package/dist/cli/chat-ui.js +21 -199
package/dist/cli/chat-workspace.js +2 -210
package/dist/cli/main.js +21 -428
package/dist/cli/managed-service-commands.js +9 -63
package/dist/cli/managed-service.js +2 -137
package/dist/cli/options-init-chat.js +1 -108
package/dist/cli/options-runtime.js +1 -158
package/dist/cli/options-serve.js +1 -282
package/dist/cli/options.js +2 -19
package/dist/cli/process-guards.js +1 -139
package/dist/cli/request-tree.js +7 -296
package/dist/cli/runtime-commands.js +12 -258
package/dist/cli/runtime-output.js +16 -155
package/dist/cli/server-commands.js +16 -270
package/dist/cli/workspace.js +1 -67
package/dist/cli.js +1 -7
package/dist/client/acp.js +1 -1
package/dist/client/in-process.js +1 -67
package/dist/client/index.js +1 -2
package/dist/client/types.js +0 -1
package/dist/client.js +1 -1
package/dist/contracts/core.js +1 -1
package/dist/contracts/runtime-evaluation.js +0 -1
package/dist/contracts/runtime-memory.js +0 -1
package/dist/contracts/runtime-observability.js +0 -1
package/dist/contracts/runtime-requests.js +0 -1
package/dist/contracts/runtime-scheduling.js +0 -1
package/dist/contracts/runtime.js +1 -27
package/dist/contracts/types.js +1 -3
package/dist/contracts/workspace.js +0 -1
package/dist/flow/build-flow-graph.js +1 -50
package/dist/flow/export-mermaid.js +2 -464
package/dist/flow/export-sequence-mermaid.js +2 -325
package/dist/flow/flow-graph-normalization.js +1 -214
package/dist/flow/flow-graph-runtime.js +1 -107
package/dist/flow/flow-graph-upstream.js +1 -494
package/dist/flow/index.js +1 -3
package/dist/flow/types.js +0 -1
package/dist/index.js +1 -5
package/dist/init-project.js +1 -1
package/dist/knowledge/config.js +1 -32
package/dist/knowledge/contracts.js +0 -1
package/dist/knowledge/index.js +1 -2
package/dist/knowledge/module.js +12 -909
package/dist/knowledge/procedural/config.js +1 -125
package/dist/knowledge/procedural/index.js +1 -2
package/dist/knowledge/procedural/manager.js +9 -345
package/dist/mcp.js +1 -2
package/dist/package-version.d.ts +1 -1
package/dist/package-version.js +1 -2
package/dist/persistence/file-store.js +3 -758
package/dist/persistence/sqlite-request-context-store.js +5 -54
package/dist/persistence/sqlite-request-queue-store.js +10 -108
package/dist/persistence/sqlite-runtime.js +1 -86
package/dist/persistence/sqlite-store.js +62 -810
package/dist/persistence/types.js +0 -1
package/dist/projections/presentation.js +37 -206
package/dist/projections/request-events.js +2 -502
package/dist/projections/upstream-events.js +1 -201
package/dist/protocol/a2a/http-discovery.js +1 -178
package/dist/protocol/a2a/http-rpc.js +6 -622
package/dist/protocol/a2a/http.js +1 -138
package/dist/protocol/a2a/task-state.js +3 -317
package/dist/protocol/acp/client.js +8 -294
package/dist/protocol/acp/harness-client.js +1 -218
package/dist/protocol/acp/http.js +5 -130
package/dist/protocol/acp/server.js +1 -310
package/dist/protocol/acp/stdio.js +2 -69
package/dist/protocol/ag-ui/http.js +3 -378
package/dist/protocol/mcp/server.js +1 -428
package/dist/resource/backend/workspace-scoped-backend.js +1 -319
package/dist/resource/isolation.js +1 -237
package/dist/resource/mcp/tool-support.js +3 -296
package/dist/resource/mcp-tool-support.js +1 -2
package/dist/resource/providers/resource-provider.js +1 -215
package/dist/resource/resource-impl.js +1 -3
package/dist/resource/resource-types.js +0 -1
package/dist/resource/resource.js +1 -1
package/dist/resource/sources.js +1 -247
package/dist/resource/tools/function-tool-resolver.js +2 -272
package/dist/runtime/adapter/compat/deepagent-compat.js +1 -29
package/dist/runtime/adapter/compat/openai-compatible.js +1 -55
package/dist/runtime/adapter/direct-builtin-utility.js +2 -90
package/dist/runtime/adapter/flow/execution-context.js +1 -71
package/dist/runtime/adapter/flow/invocation-flow.js +8 -425
package/dist/runtime/adapter/flow/invoke-runtime.js +1 -20
package/dist/runtime/adapter/flow/stream-runtime.js +11 -1395
package/dist/runtime/adapter/invocation-result.js +2 -473
package/dist/runtime/adapter/local-tool-invocation.js +6 -638
package/dist/runtime/adapter/middleware/context-hygiene.js +1 -83
package/dist/runtime/adapter/middleware-assembly.js +5 -477
package/dist/runtime/adapter/model/invocation-request.js +3 -183
package/dist/runtime/adapter/model/message-assembly.js +1 -28
package/dist/runtime/adapter/model/model-providers.js +23 -1115
package/dist/runtime/adapter/model/prompted-json-tool-call-capture.js +1 -40
package/dist/runtime/adapter/model/prompted-json-tool-policy.js +1 -22
package/dist/runtime/adapter/resilience.js +1 -104
package/dist/runtime/adapter/runtime-adapter-support.js +3 -141
package/dist/runtime/adapter/runtime-shell.js +5 -166
package/dist/runtime/adapter/stream-event-projection.js +2 -622
package/dist/runtime/adapter/stream-text-consumption.js +1 -18
package/dist/runtime/adapter/terminal-status.js +2 -67
package/dist/runtime/adapter/tool/builtin-middleware-tools.js +6 -627
package/dist/runtime/adapter/tool/declared-middleware.js +1 -154
package/dist/runtime/adapter/tool/interrupt-policy.js +1 -34
package/dist/runtime/adapter/tool/provider-tool.js +1 -25
package/dist/runtime/adapter/tool/resolved-tool.js +1 -225
package/dist/runtime/adapter/tool/tool-arguments.js +3 -486
package/dist/runtime/adapter/tool/tool-hitl.js +1 -346
package/dist/runtime/adapter/tool/tool-name-mapping.js +1 -128
package/dist/runtime/adapter/tool/tool-output-artifacts.js +2 -88
package/dist/runtime/adapter/tool/tool-replay.js +1 -37
package/dist/runtime/adapter/tool-resolution.js +1 -86
package/dist/runtime/adapter/upstream-configurable-keys.js +1 -2
package/dist/runtime/agent-runtime-adapter.js +60 -2338
package/dist/runtime/agent-runtime-assembly.js +7 -249
package/dist/runtime/env/runtime-env.js +1 -62
package/dist/runtime/harness/background-runtime.js +1 -8
package/dist/runtime/harness/bindings.js +1 -58
package/dist/runtime/harness/events/event-bus.js +1 -16
package/dist/runtime/harness/events/event-sink.js +1 -61
package/dist/runtime/harness/events/events.js +1 -80
package/dist/runtime/harness/events/listener-runtime.js +1 -13
package/dist/runtime/harness/events/runtime-event-operations.js +1 -9
package/dist/runtime/harness/events/streaming.js +1 -100
package/dist/runtime/harness/events/timeline.js +1 -52
package/dist/runtime/harness/public-shapes.js +1 -186
package/dist/runtime/harness/run/artifact-paths.js +1 -15
package/dist/runtime/harness/run/governance.js +1 -295
package/dist/runtime/harness/run/helpers.js +1 -71
package/dist/runtime/harness/run/inspection.js +1 -409
package/dist/runtime/harness/run/operator-overview.js +1 -80
package/dist/runtime/harness/run/queue-diagnostics.js +1 -15
package/dist/runtime/harness/run/recovery.js +1 -162
package/dist/runtime/harness/run/resources.js +1 -60
package/dist/runtime/harness/run/resume.js +1 -56
package/dist/runtime/harness/run/routing.js +1 -48
package/dist/runtime/harness/run/run-lifecycle.js +1 -66
package/dist/runtime/harness/run/run-operations.js +1 -217
package/dist/runtime/harness/run/run-queue.js +1 -43
package/dist/runtime/harness/run/run-slot-acquisition.js +1 -157
package/dist/runtime/harness/run/session-records.js +1 -97
package/dist/runtime/harness/run/start-run.js +1 -120
package/dist/runtime/harness/run/startup-runtime.js +1 -69
package/dist/runtime/harness/run/stream-run.js +8 -1418
package/dist/runtime/harness/run/surface-semantics.js +1 -79
package/dist/runtime/harness/runtime-defaults.js +1 -39
package/dist/runtime/harness/system/boundary-analysis.js +1 -234
package/dist/runtime/harness/system/health-monitor.js +1 -258
package/dist/runtime/harness/system/inventory.js +1 -129
package/dist/runtime/harness/system/mem0-ingestion-sync.js +5 -345
package/dist/runtime/harness/system/policy-engine.js +1 -175
package/dist/runtime/harness/system/runtime-memory-candidates.js +4 -110
package/dist/runtime/harness/system/runtime-memory-consolidation.js +1 -51
package/dist/runtime/harness/system/runtime-memory-manager.js +10 -693
package/dist/runtime/harness/system/runtime-memory-policy.js +1 -155
package/dist/runtime/harness/system/runtime-memory-records.js +11 -577
package/dist/runtime/harness/system/runtime-memory-sync.js +5 -206
package/dist/runtime/harness/system/session-memory-sync.js +3 -113
package/dist/runtime/harness/system/skill-requirements.js +1 -112
package/dist/runtime/harness/system/store.js +9 -365
package/dist/runtime/harness/tool-gateway/index.js +1 -2
package/dist/runtime/harness/tool-gateway/policy.js +1 -45
package/dist/runtime/harness/tool-gateway/validation.js +1 -176
package/dist/runtime/harness/tool-schema.js +1 -3
package/dist/runtime/harness.js +3 -1490
package/dist/runtime/index.js +1 -3
package/dist/runtime/layout/runtime-layout.js +1 -31
package/dist/runtime/maintenance/checkpoint-maintenance.js +2 -178
package/dist/runtime/maintenance/file-checkpoint-saver.js +1 -106
package/dist/runtime/maintenance/runtime-record-maintenance.js +2 -169
package/dist/runtime/maintenance/sqlite-checkpoint-saver.js +4 -289
package/dist/runtime/parsing/output-content.js +10 -550
package/dist/runtime/parsing/output-parsing.js +1 -4
package/dist/runtime/parsing/output-recovery.js +3 -213
package/dist/runtime/parsing/output-tool-args.js +7 -663
package/dist/runtime/parsing/stream-event-parsing.js +3 -362
package/dist/runtime/prompts/runtime-prompts.js +4 -73
package/dist/runtime/scheduling/system-schedule-manager.js +11 -532
package/dist/runtime/skills/skill-metadata.js +1 -197
package/dist/runtime/startup-tracing.js +2 -37
package/dist/runtime/support/compiled-binding.js +1 -290
package/dist/runtime/support/embedding-models.js +1 -118
package/dist/runtime/support/harness-support.js +5 -137
package/dist/runtime/support/llamaindex.js +1 -108
package/dist/runtime/support/runtime-adapter-options.js +1 -29
package/dist/runtime/support/runtime-factories.js +1 -51
package/dist/runtime/support/vector-stores.js +9 -270
package/dist/scaffold/init-project.js +54 -233
package/dist/tooling/extensions.js +1 -311
package/dist/tooling/module-loader.js +1 -55
package/dist/tools.js +1 -176
package/dist/utils/agent-display.js +1 -18
package/dist/utils/bundled-text.js +4 -39
package/dist/utils/compiled-binding.js +1 -33
package/dist/utils/fs.js +2 -45
package/dist/utils/id.js +1 -9
package/dist/utils/message-content.js +1 -30
package/dist/utils/object.js +1 -6
package/dist/workspace/agent-binding-compiler.js +3 -613
package/dist/workspace/compile.js +1 -472
package/dist/workspace/framework-contract-validation.js +2 -322
package/dist/workspace/index.js +1 -1
package/dist/workspace/object-loader-paths.js +1 -71
package/dist/workspace/object-loader-readers.js +1 -187
package/dist/workspace/object-loader.js +1 -754
package/dist/workspace/resource-compilers.js +1 -374
package/dist/workspace/support/agent-capabilities.js +1 -37
package/dist/workspace/support/agent-execution-config.js +1 -44
package/dist/workspace/support/discovery.js +1 -147
package/dist/workspace/support/source-collectors.js +1 -30
package/dist/workspace/support/source-protocols.js +2 -192
package/dist/workspace/support/workspace-ref-utils.js +1 -362
package/dist/workspace/tool-hydration.js +1 -280
package/dist/workspace/validate.js +1 -99
package/dist/workspace/yaml-object-reader.js +1 -285
package/package.json +7 -3

package/dist/benchmark/upstream-runtime-ab-benchmark.js CHANGED Viewed

@@ -1,179 +1 @@
-export const DEFAULT_UPSTREAM_BENCHMARK_PATHS = Object.freeze([
-    "harness",
-    "harness-minimal-upstream",
-    "raw-langchain-v1",
-    "raw-deepagent",
-]);
-export const DEFAULT_UPSTREAM_BENCHMARK_WORKLOAD = "tool";
-export const DEFAULT_UPSTREAM_BENCHMARK_SCENARIOS = Object.freeze([
-    "normal",
-    "complex",
-    "extreme",
-]);
-function average(values) {
-    return Number((values.reduce((sum, value) => sum + value, 0) / values.length).toFixed(2));
-}
-function median(values) {
-    const sorted = [...values].sort((left, right) => left - right);
-    const middle = Math.floor(sorted.length / 2);
-    if (sorted.length % 2 === 0) {
-        return Number((((sorted[middle - 1] ?? 0) + (sorted[middle] ?? 0)) / 2).toFixed(2));
-    }
-    return Number((sorted[middle] ?? 0).toFixed(2));
-}
-function percentile(values, quantile) {
-    const sorted = [...values].sort((left, right) => left - right);
-    const index = Math.max(0, Math.min(sorted.length - 1, Math.ceil(sorted.length * quantile) - 1));
-    return Number(sorted[index].toFixed(2));
-}
-function averageOrNull(values) {
-    return values.length > 0 ? average(values) : null;
-}
-function medianOrNull(values) {
-    return values.length > 0 ? median(values) : null;
-}
-function percentileOrNull(values, quantile) {
-    return values.length > 0 ? percentile(values, quantile) : null;
-}
-function trimValues(values, trimFraction) {
-    if (values.length <= 2) {
-        return [...values];
-    }
-    const sorted = [...values].sort((left, right) => left - right);
-    const trimCount = Math.min(Math.floor(sorted.length * trimFraction), Math.floor((sorted.length - 1) / 2));
-    return sorted.slice(trimCount, sorted.length - trimCount);
-}
-function trimmedAverageOrNull(values, trimFraction) {
-    return values.length > 0 ? average(trimValues(values, trimFraction)) : null;
-}
-export function resolveUpstreamBenchmarkPaths(rawValue) {
-    if (!rawValue) {
-        return [...DEFAULT_UPSTREAM_BENCHMARK_PATHS];
-    }
-    const parsed = rawValue
-        .split(",")
-        .map((value) => value.trim().toLowerCase())
-        .filter((value) => value === "harness" ||
-        value === "harness-minimal-upstream" ||
-        value === "raw-langchain-v1" ||
-        value === "raw-deepagent");
-    return parsed.length > 0 ? parsed : [...DEFAULT_UPSTREAM_BENCHMARK_PATHS];
-}
-export function resolveUpstreamBenchmarkWorkload(rawValue) {
-    return rawValue?.trim().toLowerCase() === "no-tool" ? "no-tool" : DEFAULT_UPSTREAM_BENCHMARK_WORKLOAD;
-}
-export function resolveUpstreamBenchmarkScenarios(rawValue) {
-    if (!rawValue) {
-        return [...DEFAULT_UPSTREAM_BENCHMARK_SCENARIOS];
-    }
-    const parsed = rawValue
-        .split(",")
-        .map((value) => value.trim().toLowerCase())
-        .filter((value) => value === "normal" || value === "complex" || value === "extreme");
-    return parsed.length > 0 ? parsed : [...DEFAULT_UPSTREAM_BENCHMARK_SCENARIOS];
-}
-export function extractLastMatchingToken(output, prefixes) {
-    const normalized = output.replace(/\s+/g, " ").trim();
-    let matched = "";
-    for (const prefix of prefixes) {
-        let searchIndex = normalized.indexOf(prefix);
-        while (searchIndex >= 0) {
-            const suffix = normalized.slice(searchIndex);
-            const token = (suffix.split(/\s/)[0] ?? suffix).trim();
-            if (token.length > 0) {
-                matched = token;
-            }
-            searchIndex = normalized.indexOf(prefix, searchIndex + prefix.length);
-        }
-    }
-    return matched || normalized;
-}
-export function aggregateUpstreamBenchmarkRuns(providerLabel, model, scenario, path, runs) {
-    const successfulRuns = runs.filter((run) => run.status === "completed");
-    const totalValues = successfulRuns.map((run) => run.totalMs);
-    const firstTokenValues = successfulRuns
-        .map((run) => run.firstTokenMs)
-        .filter((value) => value !== null);
-    return {
-        providerLabel,
-        model,
-        scenario,
-        path,
-        repetitions: runs.length,
-        successCount: successfulRuns.length,
-        failureCount: runs.length - successfulRuns.length,
-        avgTotalMs: averageOrNull(totalValues),
-        trimmedAvgTotalMs: trimmedAverageOrNull(totalValues, 0.1),
-        medianTotalMs: medianOrNull(totalValues),
-        p95TotalMs: percentileOrNull(totalValues, 0.95),
-        avgFirstTokenMs: averageOrNull(firstTokenValues),
-        trimmedAvgFirstTokenMs: trimmedAverageOrNull(firstTokenValues, 0.1),
-        medianFirstTokenMs: medianOrNull(firstTokenValues),
-        p95FirstTokenMs: percentileOrNull(firstTokenValues, 0.95),
-        avgSetupMs: averageOrNull(successfulRuns.map((run) => run.setupMs).filter((value) => value !== null)),
-        avgFirstToolMs: averageOrNull(successfulRuns.map((run) => run.firstToolMs).filter((value) => value !== null)),
-        avgLastToolMs: averageOrNull(successfulRuns.map((run) => run.lastToolMs).filter((value) => value !== null)),
-        avgFinalOutputMs: averageOrNull(successfulRuns.map((run) => run.finalOutputMs).filter((value) => value !== null)),
-        avgCleanupMs: averageOrNull(successfulRuns.map((run) => run.cleanupMs).filter((value) => value !== null)),
-        avgOutputLength: averageOrNull(successfulRuns.map((run) => run.outputLength)),
-        avgNormalizedOutputLength: averageOrNull(successfulRuns.map((run) => run.normalizedOutputLength)),
-        avgToolCallCount: averageOrNull(successfulRuns.map((run) => run.toolCallCount)),
-        exactOutputMatchCount: successfulRuns.filter((run) => run.exactOutputMatch).length,
-    };
-}
-export function withUpstreamBenchmarkCleanup(summary, cleanupMs) {
-    return {
-        ...summary,
-        cleanupMs,
-    };
-}
-export function summarizeUpstreamBenchmarkPhases(checkpoints) {
-    let previousAtMs = 0;
-    const durations = {};
-    for (const checkpoint of checkpoints) {
-        const key = `${checkpoint.label}Ms`;
-        if (checkpoint.atMs === null) {
-            durations[key] = null;
-            continue;
-        }
-        durations[key] = Number((checkpoint.atMs - previousAtMs).toFixed(2));
-        previousAtMs = checkpoint.atMs;
-    }
-    return durations;
-}
-export function selectUpstreamBenchmarkRunsByTemperature(runs, temperature) {
-    return runs.filter((run) => (temperature === "cold" ? run.runNumber === 1 : run.runNumber > 1));
-}
-export function summarizeUpstreamBenchmarkDurations(values) {
-    return {
-        count: values.length,
-        totalMs: Number(values.reduce((sum, value) => sum + value, 0).toFixed(2)),
-        avgMs: values.length > 0 ? average(values) : null,
-        maxMs: values.length > 0 ? Number(Math.max(...values).toFixed(2)) : null,
-    };
-}
-function computeOverhead(candidate, baseline) {
-    if (candidate === null || baseline === null) {
-        return { delta: null, pct: null };
-    }
-    const delta = Number((candidate - baseline).toFixed(2));
-    if (baseline === 0) {
-        return { delta, pct: null };
-    }
-    return {
-        delta,
-        pct: Number((((candidate - baseline) / baseline) * 100).toFixed(2)),
-    };
-}
-export function compareUpstreamBenchmarkPaths(baseline, candidate) {
-    const total = computeOverhead(candidate.avgTotalMs, baseline.avgTotalMs);
-    const firstToken = computeOverhead(candidate.avgFirstTokenMs, baseline.avgFirstTokenMs);
-    return {
-        baselinePath: baseline.path,
-        candidatePath: candidate.path,
-        avgTotalMsDelta: total.delta,
-        avgTotalMsOverheadPct: total.pct,
-        avgFirstTokenMsDelta: firstToken.delta,
-        avgFirstTokenMsOverheadPct: firstToken.pct,
-    };
-}
+const m=Object.freeze(["harness","harness-minimal-upstream","raw-langchain-v1","raw-deepagent"]),d="tool",p=Object.freeze(["normal","complex","extreme"]);function c(t){return Number((t.reduce((n,e)=>n+e,0)/t.length).toFixed(2))}function x(t){const n=[...t].sort((l,a)=>l-a),e=Math.floor(n.length/2);return n.length%2===0?Number((((n[e-1]??0)+(n[e]??0))/2).toFixed(2)):Number((n[e]??0).toFixed(2))}function T(t,n){const e=[...t].sort((a,o)=>a-o),l=Math.max(0,Math.min(e.length-1,Math.ceil(e.length*n)-1));return Number(e[l].toFixed(2))}function s(t){return t.length>0?c(t):null}function h(t){return t.length>0?x(t):null}function g(t,n){return t.length>0?T(t,n):null}function k(t,n){if(t.length<=2)return[...t];const e=[...t].sort((a,o)=>a-o),l=Math.min(Math.floor(e.length*n),Math.floor((e.length-1)/2));return e.slice(l,e.length-l)}function f(t,n){return t.length>0?c(k(t,n)):null}function F(t){if(!t)return[...m];const n=t.split(",").map(e=>e.trim().toLowerCase()).filter(e=>e==="harness"||e==="harness-minimal-upstream"||e==="raw-langchain-v1"||e==="raw-deepagent");return n.length>0?n:[...m]}function O(t){return t?.trim().toLowerCase()==="no-tool"?"no-tool":d}function N(t){if(!t)return[...p];const n=t.split(",").map(e=>e.trim().toLowerCase()).filter(e=>e==="normal"||e==="complex"||e==="extreme");return n.length>0?n:[...p]}function C(t,n){const e=t.replace(/\s+/g," ").trim();let l="";for(const a of n){let o=e.indexOf(a);for(;o>=0;){const u=e.slice(o),i=(u.split(/\s/)[0]??u).trim();i.length>0&&(l=i),o=e.indexOf(a,o+a.length)}}return l||e}function v(t,n,e,l,a){const o=a.filter(r=>r.status==="completed"),u=o.map(r=>r.totalMs),i=o.map(r=>r.firstTokenMs).filter(r=>r!==null);return{providerLabel:t,model:n,scenario:e,path:l,repetitions:a.length,successCount:o.length,failureCount:a.length-o.length,avgTotalMs:s(u),trimmedAvgTotalMs:f(u,.1),medianTotalMs:h(u),p95TotalMs:g(u,.95),avgFirstTokenMs:s(i),trimmedAvgFirstTokenMs:f(i,.1),medianFirstTokenMs:h(i),p95FirstTokenMs:g(i,.95),avgSetupMs:s(o.map(r=>r.setupMs).filter(r=>r!==null)),avgFirstToolMs:s(o.map(r=>r.firstToolMs).filter(r=>r!==null)),avgLastToolMs:s(o.map(r=>r.lastToolMs).filter(r=>r!==null)),avgFinalOutputMs:s(o.map(r=>r.finalOutputMs).filter(r=>r!==null)),avgCleanupMs:s(o.map(r=>r.cleanupMs).filter(r=>r!==null)),avgOutputLength:s(o.map(r=>r.outputLength)),avgNormalizedOutputLength:s(o.map(r=>r.normalizedOutputLength)),avgToolCallCount:s(o.map(r=>r.toolCallCount)),exactOutputMatchCount:o.filter(r=>r.exactOutputMatch).length}}function A(t,n){return{...t,cleanupMs:n}}function U(t){let n=0;const e={};for(const l of t){const a=`${l.label}Ms`;if(l.atMs===null){e[a]=null;continue}e[a]=Number((l.atMs-n).toFixed(2)),n=l.atMs}return e}function B(t,n){return t.filter(e=>n==="cold"?e.runNumber===1:e.runNumber>1)}function L(t){return{count:t.length,totalMs:Number(t.reduce((n,e)=>n+e,0).toFixed(2)),avgMs:t.length>0?c(t):null,maxMs:t.length>0?Number(Math.max(...t).toFixed(2)):null}}function M(t,n){if(t===null||n===null)return{delta:null,pct:null};const e=Number((t-n).toFixed(2));return n===0?{delta:e,pct:null}:{delta:e,pct:Number(((t-n)/n*100).toFixed(2))}}function P(t,n){const e=M(n.avgTotalMs,t.avgTotalMs),l=M(n.avgFirstTokenMs,t.avgFirstTokenMs);return{baselinePath:t.path,candidatePath:n.path,avgTotalMsDelta:e.delta,avgTotalMsOverheadPct:e.pct,avgFirstTokenMsDelta:l.delta,avgFirstTokenMsOverheadPct:l.pct}}export{m as DEFAULT_UPSTREAM_BENCHMARK_PATHS,p as DEFAULT_UPSTREAM_BENCHMARK_SCENARIOS,d as DEFAULT_UPSTREAM_BENCHMARK_WORKLOAD,v as aggregateUpstreamBenchmarkRuns,P as compareUpstreamBenchmarkPaths,C as extractLastMatchingToken,F as resolveUpstreamBenchmarkPaths,N as resolveUpstreamBenchmarkScenarios,O as resolveUpstreamBenchmarkWorkload,B as selectUpstreamBenchmarkRunsByTemperature,L as summarizeUpstreamBenchmarkDurations,U as summarizeUpstreamBenchmarkPhases,A as withUpstreamBenchmarkCleanup};

package/dist/cli/chat-interactive.js CHANGED Viewed

@@ -1,244 +1,25 @@
-import { streamChatMessage } from "./chat-stream.js";
-import { renderChatContext, renderChatHelp, renderChatPromptLine, renderRequestEvents } from "./chat-ui.js";
-import { normalizeChatCommand } from "./chat-workspace.js";
-import { renderApprovalList, renderHealthSnapshot, renderOperatorOverview, renderRequestList } from "./runtime-output.js";
-async function* iterateChatLines(lineReader, renderPrompt) {
-    lineReader.setPrompt(renderPrompt());
-    lineReader.prompt();
-    for await (const line of lineReader) {
-        yield line;
-        lineReader.setPrompt(renderPrompt());
-        lineReader.prompt();
-    }
-}
-function isObject(value) {
-    return typeof value === "object" && value !== null && !Array.isArray(value);
-}
-function formatTimestamp(value) {
-    return typeof value === "string" && value.trim().length > 0 ? value.trim() : null;
-}
-function renderSessionSummaries(summaries) {
-    if (summaries.length === 0) {
-        return "No sessions found.\n";
-    }
-    return summaries.map((summary) => {
-        const sessionId = typeof summary.sessionId === "string" ? summary.sessionId : "unknown";
-        const agentId = typeof summary.currentAgentId === "string"
-            ? summary.currentAgentId
-            : typeof summary.entryAgentId === "string"
-                ? summary.entryAgentId
-                : "unknown";
-        const state = typeof summary.currentState === "string" ? summary.currentState : "unknown";
-        const messageCount = typeof summary.messageCount === "number" ? ` messages=${summary.messageCount}` : "";
-        const title = typeof summary.title === "string" ? ` title=${summary.title}` : "";
-        const snippet = typeof summary.snippet === "string" ? ` snippet=${summary.snippet}` : "";
-        return `${sessionId} agent=${agentId} state=${state}${messageCount}${title}${snippet}`;
-    }).join("\n") + "\n";
-}
-function renderRequestTraceItems(traceItems) {
-    if (traceItems.length === 0) {
-        return "No trace items recorded.\n";
-    }
-    return traceItems.map((item) => {
-        const surfaceItem = isObject(item.surfaceItem) ? item.surfaceItem : {};
-        const kind = typeof surfaceItem.kind === "string" ? surfaceItem.kind : "unknown";
-        const name = typeof surfaceItem.id === "string" ? surfaceItem.id : typeof surfaceItem.name === "string" ? surfaceItem.name : "unknown";
-        const agentId = typeof surfaceItem.agentId === "string" ? ` agent=${surfaceItem.agentId}` : "";
-        const status = typeof item.status === "string" ? ` status=${item.status}` : "";
-        return `${kind}:${name}${agentId}${status}`;
-    }).join("\n") + "\n";
-}
-export async function runInteractiveChatLoop(input) {
-    let activeAgentId = input.activeAgentId;
-    let activeSessionId = input.activeSessionId;
-    let latestRequestId;
-    try {
-        for await (const raw of iterateChatLines(input.lineReader, () => renderChatPromptLine({
-            agentId: activeAgentId,
-            sessionId: activeSessionId,
-            requestId: latestRequestId,
-            color: input.useColor,
-        }))) {
-            const trimmed = raw.trim();
-            if (!trimmed) {
-                continue;
-            }
-            const chatCommand = normalizeChatCommand(trimmed);
-            if (!chatCommand) {
-                const streamed = await streamChatMessage({
-                    client: input.client,
-                    stdout: input.stdout,
-                    stdoutStream: input.stdoutStream,
-                    stderr: input.stderr,
-                    stderrStream: input.stderrStream,
-                    agentId: activeAgentId,
-                    sessionId: activeSessionId,
-                    message: trimmed,
-                    modelInfo: input.workspaceModelInfo,
-                    requestEvents: input.requestEvents,
-                    liveRequestTree: input.requestEvents && input.chatIsTty,
-                    colorRequestTree: input.useColor,
-                    showToolResults: input.requestEvents,
-                    showRunningState: false,
-                });
-                activeSessionId = streamed.sessionId;
-                latestRequestId = streamed.requestId;
-                activeAgentId = streamed.agentId ?? activeAgentId;
-                continue;
-            }
-            if (chatCommand.name === "exit" || chatCommand.name === "quit") {
-                break;
-            }
-            if (chatCommand.name === "help") {
-                input.stdout(renderChatHelp());
-                continue;
-            }
-            if (chatCommand.name === "context") {
-                input.stdout(renderChatContext({
-                    agentId: activeAgentId,
-                    sessionId: activeSessionId,
-                    requestId: latestRequestId,
-                }));
-                continue;
-            }
-            if (chatCommand.name === "new") {
-                activeSessionId = undefined;
-                latestRequestId = undefined;
-                input.stdout(renderChatContext({
-                    agentId: activeAgentId,
-                    sessionId: activeSessionId,
-                    requestId: latestRequestId,
-                }));
-                continue;
-            }
-            if (chatCommand.name === "agent") {
-                if (!chatCommand.arg) {
-                    input.stdout(activeAgentId ? `${activeAgentId}\n` : "No active agent override.\n");
-                    continue;
-                }
-                activeAgentId = chatCommand.arg;
-                input.stdout(`agent=${activeAgentId}\n`);
-                continue;
-            }
-            if (chatCommand.name === "session") {
-                input.stdout(activeSessionId ? `${activeSessionId}\n` : "No active session.\n");
-                continue;
-            }
-            if (chatCommand.name === "request") {
-                if (!chatCommand.arg) {
-                    input.stdout(latestRequestId ? `${latestRequestId}\n` : "No active request.\n");
-                    continue;
-                }
-                const selected = await input.client.getRequest(chatCommand.arg);
-                if (!selected) {
-                    input.stdout(`Request not found: ${chatCommand.arg}\n`);
-                    continue;
-                }
-                latestRequestId = selected.requestId;
-                activeSessionId = selected.sessionId;
-                activeAgentId = selected.agentId;
-                input.stdout(`request=${latestRequestId} session=${activeSessionId}\n`);
-                continue;
-            }
-            if (chatCommand.name === "sessions") {
-                const summaries = await input.client.listSessionSummaries(input.agentFilter ? { agentId: input.agentFilter } : undefined);
-                input.stdout(renderSessionSummaries(summaries));
-                continue;
-            }
-            if (chatCommand.name === "requests") {
-                const requests = await input.client.listRequests(activeSessionId
-                    ? { sessionId: activeSessionId }
-                    : activeAgentId
-                        ? { agentId: activeAgentId }
-                        : undefined);
-                input.stdout(renderRequestList(requests));
-                continue;
-            }
-            if (chatCommand.name === "resume") {
-                if (!chatCommand.arg) {
-                    input.stdout("Usage: /resume <sessionId>\n");
-                    continue;
-                }
-                const session = await input.client.getSession(chatCommand.arg);
-                if (!session) {
-                    input.stdout(`Session not found: ${chatCommand.arg}\n`);
-                    continue;
-                }
-                activeSessionId = chatCommand.arg;
-                latestRequestId = session.latestRequestId;
-                activeAgentId = session.entryAgentId ?? session.currentAgentId ?? activeAgentId;
-                input.stdout(`session=${activeSessionId}\n`);
-                continue;
-            }
-            if (chatCommand.name === "cancel") {
-                if (!latestRequestId) {
-                    input.stdout("No active request.\n");
-                    continue;
-                }
-                const result = await input.client.cancelRequest({
-                    requestId: latestRequestId,
-                    reason: "Cancelled from chat CLI",
-                });
-                activeSessionId = result.sessionId;
-                latestRequestId = result.requestId;
-                input.stdout(`${result.state}: ${result.output}\n`);
-                continue;
-            }
-            if (chatCommand.name === "approvals") {
-                const approvals = await input.client.listApprovals(activeSessionId ? { sessionId: activeSessionId, status: "pending" } : { status: "pending" });
-                input.stdout(renderApprovalList(approvals));
-                continue;
-            }
-            if ((chatCommand.name === "approve" || chatCommand.name === "reject") && chatCommand.arg) {
-                const result = await input.client.resolveApproval({
-                    approvalId: chatCommand.arg,
-                    decision: chatCommand.name === "approve" ? "approve" : "reject",
-                    ...(activeSessionId ? { sessionId: activeSessionId } : {}),
-                });
-                activeSessionId = result.sessionId;
-                latestRequestId = result.requestId;
-                input.stdout(`${result.state}: ${result.output}\n`);
-                continue;
-            }
-            if (chatCommand.name === "events") {
-                if (!activeSessionId || !latestRequestId) {
-                    input.stdout("No active request.\n");
-                    continue;
-                }
-                const events = await input.client.listRequestEvents({
-                    sessionId: activeSessionId,
-                    requestId: latestRequestId,
-                });
-                input.stdout(renderRequestEvents(events));
-                continue;
-            }
-            if (chatCommand.name === "trace") {
-                if (!activeSessionId || !latestRequestId) {
-                    input.stdout("No active request.\n");
-                    continue;
-                }
-                const traceItems = await input.client.listRequestTraceItems({
-                    sessionId: activeSessionId,
-                    requestId: latestRequestId,
-                });
-                input.stdout(renderRequestTraceItems(traceItems));
-                continue;
-            }
-            if (chatCommand.name === "health") {
-                const health = await input.client.getHealth();
-                input.stdout(renderHealthSnapshot(health, input.workspacePath));
-                continue;
-            }
-            if (chatCommand.name === "overview") {
-                const overview = await input.client.getOperatorOverview({ limit: 5 });
-                input.stdout(renderOperatorOverview(overview, input.workspacePath));
-                continue;
-            }
-            input.stdout("Unknown chat command. Use /help.\n");
-        }
-    }
-    finally {
-        input.lineReader.close();
-    }
-    return { activeAgentId, activeSessionId, latestRequestId };
-}
+import{streamChatMessage as c}from"./chat-stream.js";import{renderChatContext as d,renderChatHelp as u,renderChatPromptLine as f,renderRequestEvents as l}from"./chat-ui.js";import{normalizeChatCommand as g}from"./chat-workspace.js";import{renderApprovalList as I,renderHealthSnapshot as m,renderOperatorOverview as q,renderRequestList as v}from"./runtime-output.js";async function*w(e,t){e.setPrompt(t()),e.prompt();for await(const n of e)yield n,e.setPrompt(t()),e.prompt()}function $(e){return typeof e=="object"&&e!==null&&!Array.isArray(e)}function R(e){return typeof e=="string"&&e.trim().length>0?e.trim():null}function h(e){return e.length===0?`No sessions found.
+`:e.map(t=>{const n=typeof t.sessionId=="string"?t.sessionId:"unknown",r=typeof t.currentAgentId=="string"?t.currentAgentId:typeof t.entryAgentId=="string"?t.entryAgentId:"unknown",i=typeof t.currentState=="string"?t.currentState:"unknown",a=typeof t.messageCount=="number"?` messages=${t.messageCount}`:"",o=typeof t.title=="string"?` title=${t.title}`:"",s=typeof t.snippet=="string"?` snippet=${t.snippet}`:"";return`${n} agent=${r} state=${i}${a}${o}${s}`}).join(`
+`)+`
+`}function C(e){return e.length===0?`No trace items recorded.
+`:e.map(t=>{const n=$(t.surfaceItem)?t.surfaceItem:{},r=typeof n.kind=="string"?n.kind:"unknown",i=typeof n.id=="string"?n.id:typeof n.name=="string"?n.name:"unknown",a=typeof n.agentId=="string"?` agent=${n.agentId}`:"",o=typeof t.status=="string"?` status=${t.status}`:"";return`${r}:${i}${a}${o}`}).join(`
+`)+`
+`}async function y(e){let t=e.activeAgentId,n=e.activeSessionId,r;try{for await(const i of w(e.lineReader,()=>f({agentId:t,sessionId:n,requestId:r,color:e.useColor}))){const a=i.trim();if(!a)continue;const o=g(a);if(!o){const s=await c({client:e.client,stdout:e.stdout,stdoutStream:e.stdoutStream,stderr:e.stderr,stderrStream:e.stderrStream,agentId:t,sessionId:n,message:a,modelInfo:e.workspaceModelInfo,requestEvents:e.requestEvents,liveRequestTree:e.requestEvents&&e.chatIsTty,colorRequestTree:e.useColor,showToolResults:e.requestEvents,showRunningState:!1});n=s.sessionId,r=s.requestId,t=s.agentId??t;continue}if(o.name==="exit"||o.name==="quit")break;if(o.name==="help"){e.stdout(u());continue}if(o.name==="context"){e.stdout(d({agentId:t,sessionId:n,requestId:r}));continue}if(o.name==="new"){n=void 0,r=void 0,e.stdout(d({agentId:t,sessionId:n,requestId:r}));continue}if(o.name==="agent"){if(!o.arg){e.stdout(t?`${t}
+`:`No active agent override.
+`);continue}t=o.arg,e.stdout(`agent=${t}
+`);continue}if(o.name==="session"){e.stdout(n?`${n}
+`:`No active session.
+`);continue}if(o.name==="request"){if(!o.arg){e.stdout(r?`${r}
+`:`No active request.
+`);continue}const s=await e.client.getRequest(o.arg);if(!s){e.stdout(`Request not found: ${o.arg}
+`);continue}r=s.requestId,n=s.sessionId,t=s.agentId,e.stdout(`request=${r} session=${n}
+`);continue}if(o.name==="sessions"){const s=await e.client.listSessionSummaries(e.agentFilter?{agentId:e.agentFilter}:void 0);e.stdout(h(s));continue}if(o.name==="requests"){const s=await e.client.listRequests(n?{sessionId:n}:t?{agentId:t}:void 0);e.stdout(v(s));continue}if(o.name==="resume"){if(!o.arg){e.stdout(`Usage: /resume <sessionId>
+`);continue}const s=await e.client.getSession(o.arg);if(!s){e.stdout(`Session not found: ${o.arg}
+`);continue}n=o.arg,r=s.latestRequestId,t=s.entryAgentId??s.currentAgentId??t,e.stdout(`session=${n}
+`);continue}if(o.name==="cancel"){if(!r){e.stdout(`No active request.
+`);continue}const s=await e.client.cancelRequest({requestId:r,reason:"Cancelled from chat CLI"});n=s.sessionId,r=s.requestId,e.stdout(`${s.state}: ${s.output}
+`);continue}if(o.name==="approvals"){const s=await e.client.listApprovals(n?{sessionId:n,status:"pending"}:{status:"pending"});e.stdout(I(s));continue}if((o.name==="approve"||o.name==="reject")&&o.arg){const s=await e.client.resolveApproval({approvalId:o.arg,decision:o.name==="approve"?"approve":"reject",...n?{sessionId:n}:{}});n=s.sessionId,r=s.requestId,e.stdout(`${s.state}: ${s.output}
+`);continue}if(o.name==="events"){if(!n||!r){e.stdout(`No active request.
+`);continue}const s=await e.client.listRequestEvents({sessionId:n,requestId:r});e.stdout(l(s));continue}if(o.name==="trace"){if(!n||!r){e.stdout(`No active request.
+`);continue}const s=await e.client.listRequestTraceItems({sessionId:n,requestId:r});e.stdout(C(s));continue}if(o.name==="health"){const s=await e.client.getHealth();e.stdout(m(s,e.workspacePath));continue}if(o.name==="overview"){const s=await e.client.getOperatorOverview({limit:5});e.stdout(q(s,e.workspacePath));continue}e.stdout(`Unknown chat command. Use /help.
+`)}}finally{e.lineReader.close()}return{activeAgentId:t,activeSessionId:n,latestRequestId:r}}export{y as runInteractiveChatLoop};

package/dist/cli/chat-rendering.js CHANGED Viewed

@@ -1,100 +1,6 @@
-import { markdownToConsole } from "../projections/presentation.js";
-import { renderChatRuntimeFailure } from "./chat-workspace.js";
-export function countRenderedLines(text) {
-    return text.replace(/\n$/, "").split("\n").length;
-}
-export function renderChatTextChunk(text, modelInfo) {
-    return markdownToConsole(renderChatRuntimeFailure(text, modelInfo));
-}
-export function renderChatRequestRunning(input) {
-    const parts = [
-        input.sessionId ? `session=${input.sessionId}` : undefined,
-        input.requestId ? `request=${input.requestId}` : undefined,
-        input.agentId ? `agent=${input.agentId}` : undefined,
-        "running: waiting for model output",
-    ].filter((part) => typeof part === "string" && part.length > 0);
-    return `\n${parts.join(" ")}\n`;
-}
-export function summarizeChatToolResult(output, isError) {
-    return isError ? summarizeChatToolOutput(output, "failed") : summarizeChatToolOutput(output, "completed");
-}
-function summarizeChatToolOutput(output, fallback) {
-    if (typeof output === "string") {
-        const trimmed = output.trim();
-        return trimmed.length > 0 ? truncateChatToolPreview(trimmed, 240) : fallback;
-    }
-    if (typeof output === "number" || typeof output === "boolean") {
-        return String(output);
-    }
-    if (!output || typeof output !== "object") {
-        return fallback;
-    }
-    const typed = output;
-    const content = extractChatToolTextContent(output);
-    if (content && content.trim().length > 0) {
-        return truncateChatToolPreview(content.trim(), 240);
-    }
-    const summary = typeof typed.summary === "object" && typed.summary !== null ? typed.summary : undefined;
-    if (summary) {
-        return truncateChatToolPreview(JSON.stringify(summary, null, 2), 240);
-    }
-    return truncateChatToolPreview(JSON.stringify(output, null, 2), 240);
-}
-function truncateChatToolPreview(value, maxChars = 800) {
-    if (value.length <= maxChars) {
-        return value;
-    }
-    return `${value.slice(0, maxChars - 15)}\n...[truncated]`;
-}
-function extractChatToolTextContent(value) {
-    if (typeof value === "string") {
-        return value;
-    }
-    if (Array.isArray(value)) {
-        return value
-            .map((item) => extractChatToolTextContent(item))
-            .filter((item) => item.trim().length > 0)
-            .join("\n");
-    }
-    if (!value || typeof value !== "object") {
-        return "";
-    }
-    const typed = value;
-    if (typeof typed.text === "string") {
-        return typed.text;
-    }
-    if (typeof typed.content === "string") {
-        return typed.content;
-    }
-    if (typed.content !== undefined) {
-        const nestedContent = extractChatToolTextContent(typed.content);
-        if (nestedContent.trim().length > 0) {
-            return nestedContent;
-        }
-    }
-    if (typed.kwargs !== undefined) {
-        const nestedKwargs = extractChatToolTextContent(typed.kwargs);
-        if (nestedKwargs.trim().length > 0) {
-            return nestedKwargs;
-        }
-    }
-    if (typed.message !== undefined) {
-        const nestedMessage = extractChatToolTextContent(typed.message);
-        if (nestedMessage.trim().length > 0) {
-            return nestedMessage;
-        }
-    }
-    if (typed.body !== undefined) {
-        const nestedBody = extractChatToolTextContent(typed.body);
-        if (nestedBody.trim().length > 0) {
-            return nestedBody;
-        }
-    }
-    if (typed.answer !== undefined) {
-        const nestedAnswer = extractChatToolTextContent(typed.answer);
-        if (nestedAnswer.trim().length > 0) {
-            return nestedAnswer;
-        }
-    }
-    return "";
-}
+import{markdownToConsole as m}from"../projections/presentation.js";import{renderChatRuntimeFailure as u}from"./chat-workspace.js";function a(e){return e.replace(/\n$/,"").split(`
+`).length}function l(e,n){return m(u(e,n))}function y(e){return`
+${[e.sessionId?`session=${e.sessionId}`:void 0,e.requestId?`request=${e.requestId}`:void 0,e.agentId?`agent=${e.agentId}`:void 0,"running: waiting for model output"].filter(t=>typeof t=="string"&&t.length>0).join(" ")}
+`}function h(e,n){return n?d(e,"failed"):d(e,"completed")}function d(e,n){if(typeof e=="string"){const f=e.trim();return f.length>0?i(f,240):n}if(typeof e=="number"||typeof e=="boolean")return String(e);if(!e||typeof e!="object")return n;const t=e,o=r(e);if(o&&o.trim().length>0)return i(o.trim(),240);const s=typeof t.summary=="object"&&t.summary!==null?t.summary:void 0;return i(JSON.stringify(s||e,null,2),240)}function i(e,n=800){return e.length<=n?e:`${e.slice(0,n-15)}
+...[truncated]`}function r(e){if(typeof e=="string")return e;if(Array.isArray(e))return e.map(t=>r(t)).filter(t=>t.trim().length>0).join(`
+`);if(!e||typeof e!="object")return"";const n=e;if(typeof n.text=="string")return n.text;if(typeof n.content=="string")return n.content;if(n.content!==void 0){const t=r(n.content);if(t.trim().length>0)return t}if(n.kwargs!==void 0){const t=r(n.kwargs);if(t.trim().length>0)return t}if(n.message!==void 0){const t=r(n.message);if(t.trim().length>0)return t}if(n.body!==void 0){const t=r(n.body);if(t.trim().length>0)return t}if(n.answer!==void 0){const t=r(n.answer);if(t.trim().length>0)return t}return""}export{a as countRenderedLines,y as renderChatRequestRunning,l as renderChatTextChunk,h as summarizeChatToolResult};