npm - salmon-loop - Versions diffs - 0.2.13 → 0.3.0 - Mend

salmon-loop 0.2.13 → 0.3.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (224) hide show

package/dist/cli/argv/headless-detection.js +27 -0
package/dist/cli/chat-flow.js +11 -0
package/dist/cli/chat.js +160 -24
package/dist/cli/commands/chat.js +14 -7
package/dist/cli/commands/flow-mode.js +63 -0
package/dist/cli/commands/registry.js +2 -0
package/dist/cli/commands/run/benchmark-artifacts.js +41 -0
package/dist/cli/commands/run/early-errors.js +23 -0
package/dist/cli/commands/run/handler.js +115 -27
package/dist/cli/commands/run/headless-error-writer.js +8 -0
package/dist/cli/commands/run/loop-params.js +2 -0
package/dist/cli/commands/run/mode.js +2 -5
package/dist/cli/commands/run/parse-options.js +16 -0
package/dist/cli/commands/run/persist-session.js +10 -1
package/dist/cli/commands/run/preflight.js +10 -0
package/dist/cli/commands/run/reporter-factory.js +4 -0
package/dist/cli/commands/run/runtime-llm.js +38 -11
package/dist/cli/commands/run/runtime-options.js +2 -2
package/dist/cli/commands/serve.js +97 -77
package/dist/cli/commands/tool-names.js +78 -78
package/dist/cli/headless/anthropic-stream-normalized-encoder.js +6 -1
package/dist/cli/headless/json-protocol.js +37 -0
package/dist/cli/headless/native-stream-normalized-encoder.js +6 -1
package/dist/cli/headless/protocol-metadata.js +22 -0
package/dist/cli/headless/stream-json-protocol.js +34 -1
package/dist/cli/index.js +6 -4
package/dist/cli/locales/en.js +30 -6
package/dist/cli/program-bootstrap.js +10 -5
package/dist/cli/program-commands.js +5 -1
package/dist/cli/reporters/anthropic-stream.js +7 -1
package/dist/cli/reporters/json.js +4 -0
package/dist/cli/reporters/stream-json.js +17 -2
package/dist/cli/run-cli.js +5 -3
package/dist/cli/slash/runtime.js +27 -12
package/dist/cli/ui/components/CommandInput.js +7 -3
package/dist/cli/ui/components/CommandSuggestionList.js +1 -1
package/dist/cli/utils/command-option-source.js +13 -0
package/dist/cli/utils/verify-resolver.js +8 -4
package/dist/cli/utils/worktree-prepare-resolver.js +7 -3
package/dist/core/adapters/fs/file-adapter.js +6 -0
package/dist/core/adapters/fs/filesystem.js +2 -1
package/dist/core/adapters/git/git-adapter.js +78 -1
package/dist/core/backends/salmon-loop/task-executor.js +1 -0
package/dist/core/benchmark/patch-artifact.js +124 -0
package/dist/core/benchmark/swe-bench.js +25 -0
package/dist/core/config/load.js +18 -11
package/dist/core/config/resolve-llm.js +12 -0
package/dist/core/config/resolvers/server.js +0 -6
package/dist/core/config/validate.js +73 -21
package/dist/core/context/gatherers/metadata-gatherer.js +1 -0
package/dist/core/context/gatherers/ripgrep-gatherer.js +84 -2
package/dist/core/context/keywords.js +18 -4
package/dist/core/context/service-deps.js +2 -2
package/dist/core/context/service.js +8 -0
package/dist/core/context/steps/context-gather.js +38 -0
package/dist/core/context/summarization/summarizer.js +55 -12
package/dist/core/context/targeting/target-resolver.js +4 -4
package/dist/core/extensions/index.js +23 -5
package/dist/core/extensions/merge.js +14 -0
package/dist/core/extensions/paths.js +31 -0
package/dist/core/extensions/schemas.js +8 -5
package/dist/core/facades/cli-chat.js +6 -2
package/dist/core/facades/cli-command-chat.js +1 -0
package/dist/core/facades/cli-command-tool-names.js +2 -0
package/dist/core/facades/cli-observability.js +1 -1
package/dist/core/facades/cli-program-bootstrap.js +1 -0
package/dist/core/facades/cli-run-handler.js +4 -2
package/dist/core/facades/cli-run-persist-session.js +1 -0
package/dist/core/facades/cli-serve.js +4 -4
package/dist/core/facades/cli-utils-worktree.js +1 -1
package/dist/core/failure/diagnostics.js +53 -1
package/dist/core/grizzco/dsl/llm-strategy.js +4 -1
package/dist/core/grizzco/engine/outcome/loop-result-mapper.js +67 -9
package/dist/core/grizzco/engine/pipeline/pipeline.js +6 -2
package/dist/core/grizzco/engine/transaction/attempt-failure.js +90 -15
package/dist/core/grizzco/engine/transaction/report-mapper.js +17 -3
package/dist/core/grizzco/engine/transaction/transaction-runner.js +165 -7
package/dist/core/grizzco/flows/AutopilotFlow.js +18 -0
package/dist/core/grizzco/flows/flow-dispatch.js +11 -0
package/dist/core/grizzco/steps/answer.js +13 -14
package/dist/core/grizzco/steps/autopilot.js +396 -0
package/dist/core/grizzco/steps/cache-sharing.js +29 -0
package/dist/core/grizzco/steps/explore.js +37 -21
package/dist/core/grizzco/steps/generateReview.js +2 -5
package/dist/core/grizzco/steps/patch/apply-check.js +10 -0
package/dist/core/grizzco/steps/patch/diff-normalization.js +70 -0
package/dist/core/grizzco/steps/patch/diff-salvage.js +46 -0
package/dist/core/grizzco/steps/patch/prompt-input.js +42 -0
package/dist/core/grizzco/steps/patch.js +105 -146
package/dist/core/grizzco/steps/plan.js +101 -25
package/dist/core/grizzco/steps/preflight.js +5 -6
package/dist/core/grizzco/steps/request-assembly.js +78 -0
package/dist/core/grizzco/steps/research.js +39 -36
package/dist/core/grizzco/steps/tool-runtime.js +47 -0
package/dist/core/grizzco/steps/verify-shared.js +23 -0
package/dist/core/grizzco/steps/verify.js +13 -21
package/dist/core/interaction/orchestration/facade.js +1 -1
package/dist/core/llm/ai-sdk/chat-executor.js +2 -0
package/dist/core/llm/ai-sdk/high-level-phase-specs.js +63 -0
package/dist/core/llm/ai-sdk/message-mapper.js +40 -10
package/dist/core/llm/ai-sdk/provider-factory.js +14 -0
package/dist/core/llm/ai-sdk/request-params.js +113 -1
package/dist/core/llm/ai-sdk/result-mapper.js +16 -0
package/dist/core/llm/ai-sdk.js +112 -27
package/dist/core/llm/capabilities.js +12 -0
package/dist/core/llm/contracts/repair.js +36 -30
package/dist/core/llm/errors.js +83 -2
package/dist/core/llm/message-composition.js +7 -22
package/dist/core/llm/phase-router.js +29 -10
package/dist/core/llm/redact.js +28 -3
package/dist/core/llm/registry.js +2 -0
package/dist/core/llm/request-augmentation.js +55 -0
package/dist/core/llm/request-envelope.js +334 -0
package/dist/core/llm/shared-request-assembly.js +35 -0
package/dist/core/llm/stream-utils.js +13 -4
package/dist/core/llm/utils.js +18 -29
package/dist/core/memory/relevant-retrieval.js +144 -0
package/dist/core/observability/logger.js +11 -2
package/dist/core/patch/diff.js +1 -0
package/dist/core/prompts/registry.js +39 -2
package/dist/core/prompts/runtime.js +50 -12
package/dist/core/prompts/templates/phases/patch_user.hbs +2 -5
package/dist/core/prompts/templates/phases/research_user.hbs +11 -0
package/dist/core/prompts/templates/phases/review_user.hbs +3 -0
package/dist/core/prompts/templates/system/answer_system.hbs +5 -0
package/dist/core/prompts/templates/system/autopilot_system.hbs +11 -0
package/dist/core/prompts/templates/system/explore_system.hbs +14 -23
package/dist/core/prompts/templates/system/main_system.hbs +4 -16
package/dist/core/prompts/templates/system/patch_system.hbs +39 -8
package/dist/core/prompts/templates/system/plan_system.hbs +86 -1
package/dist/core/prompts/templates/system/research_system.hbs +2 -0
package/dist/core/protocols/a2a/agent-card.js +5 -3
package/dist/core/protocols/a2a/sdk/executor.js +2 -1
package/dist/core/protocols/a2a/sdk/server.js +0 -1
package/dist/core/protocols/acp/formal-agent.js +300 -58
package/dist/core/protocols/acp/handlers.js +5 -1
package/dist/core/protocols/acp/permission-provider.js +1 -1
package/dist/core/protocols/shared/flow-mode-mapping.js +23 -0
package/dist/core/public-capabilities/flow-mode-metadata.js +39 -0
package/dist/core/public-capabilities/projections.js +29 -0
package/dist/core/public-capabilities/registry.js +26 -0
package/dist/core/public-capabilities/types.js +2 -0
package/dist/core/runtime/agent-server-runtime.js +47 -43
package/dist/core/runtime/execution-profile.js +67 -0
package/dist/core/session/artifact-state.js +160 -0
package/dist/core/session/compaction/index.js +183 -0
package/dist/core/session/compaction/microcompact.js +78 -0
package/dist/core/session/compaction/tracking.js +48 -0
package/dist/core/session/compaction/types.js +11 -0
package/dist/core/session/compression.js +8 -0
package/dist/core/session/manager.js +244 -8
package/dist/core/session/pruning-strategy.js +55 -9
package/dist/core/session/replacement-preview-provider.js +24 -0
package/dist/core/session/replacement-state.js +131 -0
package/dist/core/session/resume-repair/pipeline.js +79 -0
package/dist/core/session/resume-repair/stages/load-raw-archive-state.js +40 -0
package/dist/core/session/resume-repair/stages/reattach-runtime-state.js +8 -0
package/dist/core/session/resume-repair/stages/recover-orphaned-branches.js +10 -0
package/dist/core/session/resume-repair/stages/relink-boundary-and-tail.js +36 -0
package/dist/core/session/resume-repair/stages/replay-startup-hooks.js +23 -0
package/dist/core/session/resume-repair/stages/rescue-stale-metadata.js +17 -0
package/dist/core/session/resume-repair/types.js +2 -0
package/dist/core/session/summary-sync.js +164 -13
package/dist/core/session/token-tracker.js +6 -0
package/dist/core/skills/audit.js +34 -0
package/dist/core/skills/bridge.js +84 -7
package/dist/core/skills/discovery.js +94 -0
package/dist/core/skills/feature-flags.js +52 -0
package/dist/core/skills/index.js +1 -1
package/dist/core/skills/loader.js +195 -20
package/dist/core/skills/parser.js +296 -24
package/dist/core/skills/permissions.js +117 -0
package/dist/core/skills/runtime/MicroTaskRunner.js +10 -4
package/dist/core/skills/runtime/SkillRunner.js +240 -61
package/dist/core/strata/layers/shadow-driver/shadow-driver.js +37 -7
package/dist/core/strata/layers/worktree.js +67 -10
package/dist/core/strata/runtime/synchronizer.js +29 -2
package/dist/core/streaming/stream-assembler.js +75 -31
package/dist/core/sub-agent/context-snapshot.js +156 -0
package/dist/core/sub-agent/core/loop.js +1 -1
package/dist/core/sub-agent/core/manager.js +119 -20
package/dist/core/sub-agent/dispatch-policy.js +29 -0
package/dist/core/sub-agent/prefix-consistency.js +48 -0
package/dist/core/sub-agent/registry-defaults.js +4 -0
package/dist/core/sub-agent/tools/task-spawn.js +79 -2
package/dist/core/sub-agent/types.js +134 -5
package/dist/core/tools/audit.js +13 -4
package/dist/core/tools/builtin/ast-grep.js +1 -1
package/dist/core/tools/builtin/ast.js +1 -1
package/dist/core/tools/builtin/benchmark.js +360 -0
package/dist/core/tools/builtin/code-search/backends/rg.js +2 -1
package/dist/core/tools/builtin/code-search/executor.js +6 -1
package/dist/core/tools/builtin/code-search/spec.js +26 -2
package/dist/core/tools/builtin/fs.js +256 -23
package/dist/core/tools/builtin/git.js +2 -2
package/dist/core/tools/builtin/index.js +51 -2
package/dist/core/tools/builtin/interaction.js +8 -1
package/dist/core/tools/builtin/plan.js +37 -15
package/dist/core/tools/builtin/shell.js +1 -1
package/dist/core/tools/loader.js +39 -16
package/dist/core/tools/mapper.js +17 -3
package/dist/core/tools/mcp/client.js +2 -1
package/dist/core/tools/parallel/scheduler.js +35 -4
package/dist/core/tools/permissions/permission-rules.js +5 -10
package/dist/core/tools/policy.js +6 -1
package/dist/core/tools/recoverable-tool-errors.js +10 -0
package/dist/core/tools/router.js +24 -6
package/dist/core/tools/session.js +458 -48
package/dist/core/tools/tool-visibility.js +62 -0
package/dist/core/tools/types.js +9 -1
package/dist/core/types/execution.js +4 -0
package/dist/core/types/flow-mode.js +8 -0
package/dist/core/utils/path.js +52 -0
package/dist/core/verification/runner.js +4 -1
package/dist/core/version.js +17 -0
package/dist/languages/typescript/index.js +4 -1
package/dist/locales/en.js +35 -2
package/dist/utils/eol.js +1 -1
package/package.json +14 -7
package/scripts/fix-es-abstract-compat.js +77 -0
package/dist/core/runtime/fastify-server-bundle.js +0 -26
package/dist/core/runtime/sidecar-fastify-plugin.js +0 -35
package/dist/core/runtime/sidecar-paths.js +0 -47
package/dist/core/runtime/sidecar-route-catalog.js +0 -103

package/dist/cli/commands/run/handler.js CHANGED Viewed

@@ -1,12 +1,13 @@
 import { randomUUID } from 'crypto';
-import { buildSessionConversationContext, createPluginRegistry, createPromptRegistry, getExitCode, getDefaultSessionContextBudgetTokens, getLogger, normalizePermissionMode, setPluginRegistry, setPromptRegistry, } from '../../../core/facades/cli-run-handler.js';
+import { buildEffectiveConversationContext, createPluginRegistry, createPromptRegistry, getExitCode, getDefaultSessionContextBudgetTokens, getLogger, normalizePermissionMode, resolveExecutionProfile, SilentReporter, setPluginRegistry, setPromptRegistry, } from '../../../core/facades/cli-run-handler.js';
 import { createStdoutWriter } from '../../headless/stdout-writer.js';
 import { text } from '../../locales/index.js';
-import { StderrLogReporter } from '../../reporters/stderr-log-reporter.js';
+import { getOptionValueSourceWithGlobalFallback } from '../../utils/command-option-source.js';
 import { createOutcomeReporter } from '../../utils/outcome-reporter.js';
 import { resolveOutputFormat } from '../../utils/output-format.js';
 import { resolveCliCommonOptions } from '../../utils/resolve-cli-config.js';
 import { buildRunAssistantMessage } from './assistant-message.js';
+import { attachRunBenchmarkArtifacts } from './benchmark-artifacts.js';
 import { resolveRunConfig } from './config-resolution.js';
 import { handleEarlyRunCommandErrors } from './early-errors.js';
 import { executeRunLoop } from './execute.js';
@@ -58,12 +59,16 @@ export async function handleRunCommand(options, command) {
     const headlessIncludeToolOutput = parsed.headlessIncludeToolOutput;
     const headlessIncludeAuthorizationDecisions = parsed.headlessIncludeAuthorizationDecisions;
     const allowOutsideCacheRoot = parsed.allowOutsideCacheRoot;
+    const exportPatchPath = parsed.exportPatchPath;
+    const sweBenchInstanceId = parsed.sweBenchInstanceId;
+    const sweBenchModelName = parsed.sweBenchModelName;
+    const sweBenchPredictionsPath = parsed.sweBenchPredictionsPath;
     const stdoutWriter = createStdoutWriter();
     const instruction = parsed.instruction;
     const printMode = Boolean(printInstruction);
     const useGui = !headlessOutput && !printMode && allOptions.gui !== false && process.stdout.isTTY;
     if (headlessOutput) {
-        getLogger().setReporter(new StderrLogReporter());
+        getLogger().setReporter(new SilentReporter());
     }
     const wantSessionPersistence = !allOptions.printConfig &&
         (headlessOutput ||
@@ -94,6 +99,9 @@ export async function handleRunCommand(options, command) {
         continueSession,
         resumeSessionId,
         jsonSchemaSpec,
+        sweBenchInstanceId,
+        sweBenchModelName,
+        sweBenchPredictionsPath,
         sessionIdForOutput,
         headlessErrorWriter,
     });
@@ -149,6 +157,7 @@ export async function handleRunCommand(options, command) {
         repoPath: runPath,
         validate: Boolean(allOptions.validate),
         useGui,
+        headlessOutput,
         preflightPolicy,
     });
     if (allOptions.validate && !instruction)
@@ -158,6 +167,7 @@ export async function handleRunCommand(options, command) {
             exitCode: params.exitCode,
             message: params.message,
             errorCode: params.errorCode,
+            auditPath: params.auditPath,
             repoPath: params.repoPath,
             instruction: params.instruction,
             sessionId: sessionIdForOutput ?? randomUUID(),
@@ -181,6 +191,7 @@ export async function handleRunCommand(options, command) {
         resolvedConfig,
         cliOptions: allOptions,
         outputFormat,
+        headlessOutput,
         writeJsonFailure: ({ message, repoPath }) => writeJsonFailure({ message, repoPath }),
     });
     if (!runtimeOptions.ok) {
@@ -205,24 +216,54 @@ export async function handleRunCommand(options, command) {
         return;
     }
     const instructionText = instruction;
-    const rawPermissionMode = allOptions.mode ?? resolvedConfig.permissionMode ?? 'interactive';
-    const permissionMode = normalizePermissionMode(rawPermissionMode);
-    if (!permissionMode) {
-        getLogger().error(`Invalid --mode "${String(rawPermissionMode)}". Expected "interactive" or "yolo".`);
+    const actModeOptionSource = typeof command.getOptionValueSource === 'function'
+        ? command.getOptionValueSource('actMode')
+        : undefined;
+    const rawActMode = actModeOptionSource === 'cli' ? allOptions.actMode : undefined;
+    const mode = resolveRunMode(rawActMode);
+    if (!mode) {
+        const invalidMode = String(rawActMode ?? allOptions.actMode);
+        getLogger().error(text.cli.invalidActMode(invalidMode));
+        if (outputFormat === 'json') {
+            writeJsonFailure({
+                message: text.cli.invalidActMode(invalidMode),
+                errorCode: 'USAGE_ERROR',
+                instruction,
+                repoPath: runPath,
+            });
+        }
+        else if (outputFormat === 'stream-json') {
+            headlessErrorWriter.writeUsageError({
+                sessionId: sessionIdForOutput ?? randomUUID(),
+                message: text.cli.invalidActMode(invalidMode),
+                instruction,
+            });
+        }
         process.exitCode = 1;
         return;
     }
-    const rawMode = String(allOptions.actMode || 'patch');
-    const mode = resolveRunMode(rawMode);
-    if (!mode) {
-        getLogger().error(text.cli.invalidActMode(rawMode));
+    const profile = resolveExecutionProfile(mode);
+    const permissionModeOptionSource = getOptionValueSourceWithGlobalFallback(command, 'mode');
+    const rawPermissionMode = (permissionModeOptionSource === 'cli' ? allOptions.mode : undefined) ??
+        resolvedConfig.permissionMode ??
+        profile.defaultPermissionMode ??
+        'interactive';
+    const permissionMode = normalizePermissionMode(rawPermissionMode);
+    if (!permissionMode) {
+        const message = `Invalid --mode "${String(rawPermissionMode)}". Expected "interactive" or "yolo".`;
+        getLogger().error(message);
         if (outputFormat === 'json') {
-            writeJsonFailure({ message: text.cli.invalidActMode(rawMode), repoPath: runPath });
+            writeJsonFailure({
+                message,
+                errorCode: 'USAGE_ERROR',
+                instruction,
+                repoPath: runPath,
+            });
         }
         else if (outputFormat === 'stream-json') {
             headlessErrorWriter.writeUsageError({
                 sessionId: sessionIdForOutput ?? randomUUID(),
-                message: text.cli.invalidActMode(rawMode),
+                message,
                 instruction,
             });
         }
@@ -235,6 +276,8 @@ export async function handleRunCommand(options, command) {
         if (outputFormat === 'json') {
             writeJsonFailure({
                 message: text.cli.invalidEnvironmentMode(rawEnvironmentMode),
+                errorCode: 'USAGE_ERROR',
+                instruction,
                 repoPath: runPath,
             });
         }
@@ -258,8 +301,19 @@ export async function handleRunCommand(options, command) {
         return;
     }
     const extensionResolution = extensionsResult.extensionResolution;
+    const operationalHeadlessWarnings = [];
     if (!effectiveVerify) {
-        getLogger().warn(text.verify.noCommandFound);
+        if (!headlessOutput) {
+            getLogger().warn(text.verify.noCommandFound);
+        }
+        else {
+            operationalHeadlessWarnings.push({
+                code: 'VERIFY_COMMAND_MISSING',
+                message: text.verify.noCommandFound,
+                source: 'verify.runtime',
+                severity: 'warning',
+            });
+        }
     }
     const verboseLevel = commonOptions.options.verboseLevel;
     logRunVerboseSummary({
@@ -274,10 +328,14 @@ export async function handleRunCommand(options, command) {
         dryRun: allOptions.dryRun,
         configPath: resolvedConfig.source.used ? resolvedConfig.source.path || '' : undefined,
     });
+    let lastKnownAuditPath;
+    let activeReporter;
+    let activeReporterStarted = false;
     try {
-        const { llm } = createRuntimeLlmAndWarn({
+        const { llm, headlessWarnings } = createRuntimeLlmAndWarn({
             llmConfig: resolvedConfig.llm,
             langfuseEnabled: resolvedConfig.observability.langfuse.enabled,
+            headlessOutput,
         });
         let structuredOutputState = { ok: true, candidate: null };
         const reporter = createRunReporter({
@@ -289,6 +347,7 @@ export async function handleRunCommand(options, command) {
             writer: stdoutWriter,
             verbose: Boolean(allOptions.verbose),
             model: resolvedConfig.llm.models?.selectedModelId,
+            includeToolInput: headlessIncludeToolInput,
             getStructuredOutput: () => structuredOutputState.ok ? structuredOutputState.candidate : null,
             getPayloadOverrides: () => {
                 if (structuredOutputState.ok)
@@ -305,8 +364,11 @@ export async function handleRunCommand(options, command) {
                     structuredOutputError: structuredOutputState.errorReason,
                 };
             },
+            getWarnings: () => [...headlessWarnings, ...operationalHeadlessWarnings],
         });
+        activeReporter = reporter;
         reporter.onStart(instructionText);
+        activeReporterStarted = true;
         const applyBackOnDirty = allOptions.applyBackOnDirty === 'abort' ? 'abort' : '3way';
         const outcomeReporter = createOutcomeReporter({
             enabled: resolvedConfig.observability.langfuse.outcome,
@@ -320,11 +382,18 @@ export async function handleRunCommand(options, command) {
             process.env.S8P_MODEL;
         const shouldInjectSessionContext = Boolean(continueSession || resumeSessionId);
         const conversationContext = shouldInjectSessionContext && sessionManager
-            ? buildSessionConversationContext(sessionManager.getMessages(), {
+            ? buildEffectiveConversationContext({
+                llm,
+                sessionManager,
                 budgetTokens: getDefaultSessionContextBudgetTokens({ modelId: modelIdForBudget }),
-                summaryState: sessionManager.getSummaryState(),
             })
             : [];
+        const artifactHints = shouldInjectSessionContext
+            ? sessionManager?.getArtifactState()
+            : undefined;
+        const replacementState = shouldInjectSessionContext
+            ? sessionManager?.getReplacementState()
+            : undefined;
         const loopParams = buildRunLoopParams({
             instruction: instructionText,
             verify: effectiveVerify,
@@ -332,17 +401,18 @@ export async function handleRunCommand(options, command) {
             llm,
             languagePlugins,
             conversationContext: conversationContext.length > 0 ? conversationContext : undefined,
+            artifactHints,
+            replacementState,
             mode,
             dryRun: allOptions.dryRun,
             forceReset: allOptions.forceReset,
             file: allOptions.file,
             selection: allOptions.selection,
             verbose: verboseLevel,
-            checkpointStrategy: permissionMode === 'yolo' &&
-                typeof command.getOptionValueSource === 'function' &&
-                command.getOptionValueSource('checkpointStrategy') !== 'cli'
-                ? 'direct'
-                : allOptions.checkpointStrategy,
+            checkpointStrategy: getOptionValueSourceWithGlobalFallback(command, 'checkpointStrategy') === 'cli'
+                ? allOptions.checkpointStrategy
+                : (profile.defaultCheckpointStrategy ??
+                    allOptions.checkpointStrategy),
             environmentMode: rawEnvironmentMode,
             applyBackOnDirty,
             worktreePrepare: effectiveWorktreePrepare,
@@ -360,11 +430,9 @@ export async function handleRunCommand(options, command) {
             headlessIncludeToolOutput,
             headlessIncludeAuthorizationDecisions,
             allowOutsideCacheRoot,
-            permissionRules: permissionMode === 'yolo'
-                ? undefined
-                : allowedToolRules.length > 0 || disallowedToolRules.length > 0
-                    ? { allow: allowedToolRules, deny: disallowedToolRules }
-                    : undefined,
+            permissionRules: allowedToolRules.length > 0 || disallowedToolRules.length > 0
+                ? { allow: allowedToolRules, deny: disallowedToolRules }
+                : undefined,
             permissionMode,
         });
         const buildAssistantMessage = (result) => buildRunAssistantMessage({ mode, result });
@@ -384,6 +452,15 @@ export async function handleRunCommand(options, command) {
                 logMode: resolvedConfig.ui.logMode,
             },
         });
+        lastKnownAuditPath = result.auditPath;
+        await attachRunBenchmarkArtifacts({
+            result,
+            repoPath: runPath,
+            exportPatchPath,
+            sweBenchInstanceId,
+            sweBenchModelName,
+            sweBenchPredictionsPath,
+        });
         structuredOutputState = await buildStructuredOutputState({
             outputFormat,
             jsonSchemaSpec,
@@ -418,12 +495,23 @@ export async function handleRunCommand(options, command) {
                 message: text.cli.unexpectedError(msg),
                 repoPath: runPath,
                 instruction,
+                auditPath: lastKnownAuditPath,
             });
         }
+        else if (outputFormat === 'stream-json' &&
+            rawOutputProfile !== 'anthropic' &&
+            rawOutputProfile !== 'openai' &&
+            activeReporterStarted &&
+            activeReporter) {
+            const error = new Error(text.cli.unexpectedError(msg));
+            error.auditPath = lastKnownAuditPath;
+            activeReporter.onError(error);
+        }
         else if (outputFormat === 'stream-json') {
             headlessErrorWriter.writeUnexpectedError({
                 sessionId: sessionIdForOutput ?? resumeSessionId ?? randomUUID(),
                 message: text.cli.unexpectedError(msg),
+                auditPath: lastKnownAuditPath,
             });
         }
         process.exitCode = 1;

package/dist/cli/commands/run/headless-error-writer.js CHANGED Viewed

@@ -6,6 +6,7 @@ import { OpenAiStreamEncoder } from '../../headless/openai-stream-encoder.js';
 import { encodeStreamEnd, encodeStreamFailure, encodeStreamStart, } from '../../headless/stream-json-protocol.js';
 function writeStreamJsonEarlyFailure(params) {
     const at = new Date();
+    let eventSeq = 0;
     params.writer.writeJsonLine(encodeStreamStart({
         uuid: randomUUID(),
         mode: 'run',
@@ -13,12 +14,15 @@ function writeStreamJsonEarlyFailure(params) {
         sessionId: params.sessionId,
         instruction: params.instruction,
         at,
+        eventSeq: eventSeq++,
     }));
     params.writer.writeJsonLine(encodeStreamFailure({
         uuid: randomUUID(),
         sessionId: params.sessionId,
         at,
         message: params.message,
+        auditPath: params.auditPath,
+        eventSeq: eventSeq++,
     }));
     params.writer.writeJsonLine(encodeStreamEnd({
         uuid: randomUUID(),
@@ -26,6 +30,7 @@ function writeStreamJsonEarlyFailure(params) {
         at,
         success: false,
         exitCode: params.exitCode ?? 1,
+        eventSeq: eventSeq++,
     }));
 }
 function writeAnthropicEarlyFailure(params) {
@@ -84,6 +89,7 @@ export function createHeadlessErrorWriter(ctx) {
             instruction: params.instruction,
             message: params.message,
             errorCode: params.errorCode,
+            auditPath: params.auditPath,
             exitCode: params.exitCode ?? 1,
         }));
     };
@@ -137,6 +143,7 @@ export function createHeadlessErrorWriter(ctx) {
                 message: params.message,
                 repoPath: ctx.repoPath,
                 instruction: params.instruction,
+                auditPath: params.auditPath,
                 sessionId,
             });
             return;
@@ -163,6 +170,7 @@ export function createHeadlessErrorWriter(ctx) {
                     repoPath: ctx.repoPath,
                     sessionId,
                     message: params.message,
+                    auditPath: params.auditPath,
                     instruction: params.instruction,
                 });
             }

package/dist/cli/commands/run/loop-params.js CHANGED Viewed

@@ -6,6 +6,8 @@ export function buildRunLoopParams(params) {
         repoPath: params.repoPath,
         llm: params.llm,
         conversationContext: params.conversationContext,
+        artifactHints: params.artifactHints,
+        replacementState: params.replacementState,
         mode: params.mode,
         dryRun: params.dryRun,
         forceReset: params.forceReset,

package/dist/cli/commands/run/mode.js CHANGED Viewed

@@ -1,8 +1,5 @@
+import { parseFlowMode } from '../../../core/types/flow-mode.js';
 export function resolveRunMode(raw) {
-    const value = String(raw || 'patch');
-    if (value === 'patch' || value === 'review' || value === 'debug' || value === 'research') {
-        return value;
-    }
-    return undefined;
+    return parseFlowMode(raw || 'autopilot');
 }
 //# sourceMappingURL=mode.js.map

package/dist/cli/commands/run/parse-options.js CHANGED Viewed

@@ -41,6 +41,18 @@ export function parseRunCommandOptions(command) {
     const headlessIncludeToolOutput = Boolean(allOptions.headlessIncludeToolOutput);
     const headlessIncludeAuthorizationDecisions = Boolean(allOptions.headlessIncludeAuthorizationDecisions);
     const allowOutsideCacheRoot = Boolean(allOptions.allowOutsideCacheRoot);
+    const exportPatchPath = typeof allOptions.exportPatch === 'string'
+        ? allOptions.exportPatch
+        : undefined;
+    const sweBenchInstanceId = typeof allOptions.sweBenchInstanceId === 'string'
+        ? allOptions.sweBenchInstanceId
+        : undefined;
+    const sweBenchModelName = typeof allOptions.sweBenchModelName === 'string'
+        ? allOptions.sweBenchModelName
+        : undefined;
+    const sweBenchPredictionsPath = typeof allOptions.sweBenchPredictions === 'string'
+        ? allOptions.sweBenchPredictions
+        : undefined;
     const instruction = explicitInstruction ?? printInstruction;
     const allowedToolRules = splitToolRules(allOptions.allowedTools);
     const disallowedToolRules = splitToolRules(allOptions.disallowedTools);
@@ -60,6 +72,10 @@ export function parseRunCommandOptions(command) {
         headlessIncludeToolOutput,
         headlessIncludeAuthorizationDecisions,
         allowOutsideCacheRoot,
+        exportPatchPath,
+        sweBenchInstanceId,
+        sweBenchModelName,
+        sweBenchPredictionsPath,
         allowedToolRules,
         disallowedToolRules,
     };

package/dist/cli/commands/run/persist-session.js CHANGED Viewed

@@ -1,4 +1,4 @@
-import { refreshSessionSummary, } from '../../../core/facades/cli-run-persist-session.js';
+import { buildSessionArtifactStateFromLoopResult, refreshSessionSummary, } from '../../../core/facades/cli-run-persist-session.js';
 export async function persistRunSession(params) {
     if (!params.sessionManager || typeof params.instruction !== 'string')
         return;
@@ -20,6 +20,15 @@ export async function persistRunSession(params) {
                 iterationId,
             });
         }
+        params.sessionManager.mergeArtifactState(buildSessionArtifactStateFromLoopResult(params.result));
+        for (const preview of params.result.artifactHints?.toolResultPreviewArtifacts ?? []) {
+            params.sessionManager.freezeReplacementDecision({
+                toolResultId: `${preview.label}::${preview.artifact.handle}`,
+                decision: 'replaced',
+                preview: preview.label,
+                sourceArtifactHandle: preview.artifact.handle,
+            });
+        }
         await refreshSessionSummary({
             sessionManager: params.sessionManager,
             llm: params.llm,

package/dist/cli/commands/run/preflight.js CHANGED Viewed

@@ -46,10 +46,18 @@ function buildFailureMessage(details) {
 }
 async function runValidateCommand(params) {
     const maxBytesPerStream = 500_000;
+    const env = params.headlessOutput
+        ? {
+            ...process.env,
+            NO_COLOR: process.env.NO_COLOR ?? '1',
+            FORCE_COLOR: '0',
+        }
+        : process.env;
     const result = await spawnCommand({
         command: params.cmd,
         args: params.args,
         cwd: params.repoPath,
+        env,
         windowsHide: true,
         maxStdoutBytes: maxBytesPerStream,
         maxStderrBytes: maxBytesPerStream,
@@ -101,6 +109,7 @@ export async function runPreflight(params) {
                     cmd: lintCommand.command,
                     args: lintCommand.args,
                     useGui: params.useGui,
+                    headlessOutput: params.headlessOutput,
                 });
             }
             catch (error) {
@@ -126,6 +135,7 @@ export async function runPreflight(params) {
                     cmd: testCommand.command,
                     args: testCommand.args,
                     useGui: params.useGui,
+                    headlessOutput: params.headlessOutput,
                 });
             }
             catch (error) {

package/dist/cli/commands/run/reporter-factory.js CHANGED Viewed

@@ -22,6 +22,7 @@ export function createRunReporter(params) {
                 repoPath: params.repoPath,
                 sessionId: params.sessionIdForOutput,
                 writer: params.writer,
+                includeToolInput: params.includeToolInput,
             });
         }
         if (profile === 'openai') {
@@ -35,6 +36,8 @@ export function createRunReporter(params) {
             repoPath: params.repoPath,
             sessionId: params.sessionIdForOutput,
             writer: params.writer,
+            getWarnings: params.getWarnings,
+            includeToolInput: params.includeToolInput,
         });
     }
     if (params.outputFormat === 'json') {
@@ -45,6 +48,7 @@ export function createRunReporter(params) {
             writer: params.writer,
             getStructuredOutput: params.getStructuredOutput,
             getPayloadOverrides: params.getPayloadOverrides,
+            getWarnings: params.getWarnings,
         });
     }
     return new StandardReporter(params.verbose);

package/dist/cli/commands/run/runtime-llm.js CHANGED Viewed

@@ -1,5 +1,32 @@
 import { createPhaseRoutingLlm, createRuntimeLlm, EXECUTION_PHASES, getLogger, Phase, } from '../../../core/facades/cli-run-runtime-llm.js';
 import { text } from '../../locales/index.js';
+function runtimeWarningMessage(code, params) {
+    if (code === 'API_KEY_MISSING')
+        return text.cli.apiKeyMissing;
+    if (code === 'PROVIDER_NOT_SUPPORTED') {
+        return text.cli.providerNotSupported(String(params.llmType));
+    }
+    if (code === 'CLIENT_PACKAGE_NOT_SUPPORTED') {
+        return text.cli.clientPackageNotSupported(String(params.clientPackage || ''));
+    }
+    return code;
+}
+function toHeadlessWarning(code, params) {
+    if (code === 'API_KEY_MISSING') {
+        return {
+            code: 'LLM_CREDENTIAL_MISSING',
+            message: 'LLM credential not configured; using StubLLM. Configure provider credentials to use a real LLM.',
+            source: 'llm.runtime',
+            severity: 'warning',
+        };
+    }
+    return {
+        code,
+        message: runtimeWarningMessage(code, params).replace(/^\[WARN\]\s*/, ''),
+        source: 'llm.runtime',
+        severity: 'warning',
+    };
+}
 export function createRuntimeLlmAndWarn(params) {
     const runtimeLlm = createRuntimeLlm(params.llmConfig, {
         langfuseEnabled: params.langfuseEnabled,
@@ -8,7 +35,7 @@ export function createRuntimeLlmAndWarn(params) {
     const phaseToProviderModel = params.llmConfig?.routing?.phaseToProviderModel;
     const phaseLlms = {};
     if (phaseToProviderModel && typeof phaseToProviderModel === 'object') {
-        const validPhases = new Set([...EXECUTION_PHASES, Phase.SLASH]);
+        const validPhases = new Set([...EXECUTION_PHASES, Phase.SLASH, Phase.AUTOPILOT]);
         for (const [phase, target] of Object.entries(phaseToProviderModel)) {
             if (!validPhases.has(phase))
                 continue;
@@ -29,6 +56,7 @@ export function createRuntimeLlmAndWarn(params) {
                     selectedModelId: target.model?.id,
                     selectedModelSlot: target.model?.slot || 'default',
                 },
+                capabilities: target.capabilities,
             };
             const created = createRuntimeLlm(perPhaseConfig, { langfuseEnabled: params.langfuseEnabled });
             warnings.push(...created.warnings);
@@ -40,17 +68,16 @@ export function createRuntimeLlmAndWarn(params) {
         : runtimeLlm.llm;
     const llmType = params.llmConfig?.type;
     const clientPackage = params.llmConfig?.clientPackage;
-    for (const w of Array.from(new Set(warnings))) {
-        if (w === 'API_KEY_MISSING') {
-            getLogger().warn(text.cli.apiKeyMissing);
-        }
-        else if (w === 'PROVIDER_NOT_SUPPORTED') {
-            getLogger().warn(text.cli.providerNotSupported(String(llmType)));
-        }
-        else if (w === 'CLIENT_PACKAGE_NOT_SUPPORTED') {
-            getLogger().warn(text.cli.clientPackageNotSupported(String(clientPackage || '')));
+    const uniqueWarnings = Array.from(new Set(warnings));
+    for (const w of uniqueWarnings) {
+        if (!params.headlessOutput) {
+            getLogger().warn(runtimeWarningMessage(w, { llmType, clientPackage }));
         }
     }
-    return { llm, warnings: Array.from(new Set(warnings)) };
+    return {
+        llm,
+        warnings: uniqueWarnings,
+        headlessWarnings: uniqueWarnings.map((w) => toHeadlessWarning(w, { llmType, clientPackage })),
+    };
 }
 //# sourceMappingURL=runtime-llm.js.map

package/dist/cli/commands/run/runtime-options.js CHANGED Viewed

@@ -23,8 +23,8 @@ export async function resolveRunRuntimeOptions(params) {
     if (wantPartialMessages && !llmOutput.kinds.includes('plan')) {
         llmOutput.kinds.push('plan');
     }
-    const effectiveVerify = await resolveVerifyOption(params.repoPath, params.cliOptions.verify, params.resolvedConfig.verify.command);
-    const effectiveWorktreePrepare = await resolveWorktreePrepareOption(params.repoPath, params.cliOptions.checkpointStrategy, params.cliOptions.worktreePrepare);
+    const effectiveVerify = await resolveVerifyOption(params.repoPath, params.cliOptions.verify, params.resolvedConfig.verify.command, { quiet: params.headlessOutput });
+    const effectiveWorktreePrepare = await resolveWorktreePrepareOption(params.repoPath, params.cliOptions.checkpointStrategy, params.cliOptions.worktreePrepare, { quiet: params.headlessOutput });
     return { ok: true, llmOutput, effectiveVerify, effectiveWorktreePrepare };
 }
 //# sourceMappingURL=runtime-options.js.map