npm - agency-lang - Versions diffs - 0.5.0 → 0.6.0 - Mend

agency-lang 0.5.0 → 0.6.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (532) hide show

package/dist/lib/agents/agency-agent/agent.agency +283 -108
package/dist/lib/agents/agency-agent/agent.js +1666 -403
package/dist/lib/agents/agency-agent/images/images.js +1 -0
package/dist/lib/agents/agency-agent/lib/config.agency +3 -3
package/dist/lib/agents/agency-agent/lib/config.js +1 -0
package/dist/lib/agents/agency-agent/lib/defaultPolicy.agency +33 -1
package/dist/lib/agents/agency-agent/lib/defaultPolicy.js +163 -3
package/dist/lib/agents/agency-agent/lib/utils.js +18 -0
package/dist/lib/agents/agency-agent/prompts/codeSample.js +17 -0
package/dist/lib/agents/agency-agent/shared.agency +101 -2
package/dist/lib/agents/agency-agent/shared.js +540 -2
package/dist/lib/agents/agency-agent/subagents/code.agency +77 -49
package/dist/lib/agents/agency-agent/subagents/code.js +141 -93
package/dist/lib/agents/agency-agent/subagents/explorer.agency +11 -13
package/dist/lib/agents/agency-agent/subagents/explorer.js +48 -20
package/dist/lib/agents/agency-agent/subagents/oracle.agency +11 -12
package/dist/lib/agents/agency-agent/subagents/oracle.js +48 -18
package/dist/lib/agents/agency-agent/subagents/research.agency +9 -3
package/dist/lib/agents/agency-agent/subagents/research.js +17 -2
package/dist/lib/agents/agency-agent/subagents/review.agency +6 -6
package/dist/lib/agents/agency-agent/subagents/review.js +27 -60
package/dist/lib/agents/agency-agent/tests/agentTurn.agency +15 -0
package/dist/lib/agents/agency-agent/{subagents/oneShot.js → tests/agentTurn.js} +77 -75
package/dist/lib/agents/agency-agent/tests/agentTurn.test.json +12 -0
package/dist/lib/agents/agency-agent/tests/execPolicy.agency +46 -0
package/dist/lib/agents/agency-agent/tests/execPolicy.js +795 -0
package/dist/lib/agents/agency-agent/tests/execPolicy.test.json +34 -0
package/dist/lib/agents/agency-agent/tests/toolWiring.agency +60 -0
package/dist/lib/agents/agency-agent/tests/toolWiring.js +726 -0
package/dist/lib/agents/agency-agent/tests/toolWiring.test.json +32 -0
package/dist/lib/agents/agency-agent/toolWiring.js +696 -0
package/dist/lib/agents/docs/cli/cli/eval-judge.md +7 -7
package/dist/lib/agents/docs/cli/cli/eval.md +26 -91
package/dist/lib/agents/docs/cli/cli/optimize.md +181 -0
package/dist/lib/agents/docs/cli/eval-judge.md +7 -7
package/dist/lib/agents/docs/cli/eval.md +26 -91
package/dist/lib/agents/docs/cli/optimize.md +181 -0
package/dist/lib/agents/docs/guide/effects-and-raises.md +156 -0
package/dist/lib/agents/docs/guide/guide/effects-and-raises.md +156 -0
package/dist/lib/agents/docs/guide/guide/handlers.md +2 -2
package/dist/lib/agents/docs/guide/guide/partial-application.md +26 -0
package/dist/lib/agents/docs/guide/guide/policies.md +3 -3
package/dist/lib/agents/docs/guide/guide/serving.md +1 -1
package/dist/lib/agents/docs/guide/guide/structured-interrupts.md +8 -8
package/dist/lib/agents/docs/guide/guide/troubleshooting.md +56 -1
package/dist/lib/agents/docs/guide/guide/ts-interop.md +1 -1
package/dist/lib/agents/docs/guide/handlers.md +2 -2
package/dist/lib/agents/docs/guide/partial-application.md +26 -0
package/dist/lib/agents/docs/guide/policies.md +3 -3
package/dist/lib/agents/docs/guide/serving.md +1 -1
package/dist/lib/agents/docs/guide/structured-interrupts.md +8 -8
package/dist/lib/agents/docs/guide/troubleshooting.md +56 -1
package/dist/lib/agents/docs/guide/ts-interop.md +1 -1
package/dist/lib/agents/eval/goalJudge.agency +24 -0
package/dist/lib/agents/eval/goalJudge.js +311 -0
package/dist/lib/agents/{judge.js → eval/judge.js} +11 -6
package/dist/lib/agents/eval/judgePairwise.js +313 -0
package/dist/lib/agents/gepaReflect.js +316 -0
package/dist/lib/agents/mutatePrompt.js +9 -9
package/dist/lib/agents/optimize/gepaReflect.agency +58 -0
package/dist/lib/agents/optimize/gepaReflect.js +325 -0
package/dist/lib/agents/{mutatePrompt.agency → optimize/mutatePrompt.agency} +7 -1
package/dist/lib/agents/optimize/mutatePrompt.js +313 -0
package/dist/lib/agents/policy/agent.agency +14 -14
package/dist/lib/agents/policy/agent.js +67 -34
package/dist/lib/agents/review/agent.js +8 -0
package/dist/lib/analysis/interrupts.d.ts +3 -3
package/dist/lib/analysis/interrupts.js +1 -1
package/dist/lib/analysis/interrupts.test.js +6 -6
package/dist/lib/backends/agencyGenerator.d.ts +2 -0
package/dist/lib/backends/agencyGenerator.js +32 -5
package/dist/lib/backends/anthropicApiKey.codegen.test.js +34 -0
package/dist/lib/backends/maxToolResultChars.codegen.test.js +32 -0
package/dist/lib/backends/raisesFormat.test.d.ts +1 -0
package/dist/lib/backends/raisesFormat.test.js +59 -0
package/dist/lib/backends/typescriptBuilder/assignmentEmitter.d.ts +5 -2
package/dist/lib/backends/typescriptBuilder/assignmentEmitter.js +10 -7
package/dist/lib/backends/typescriptBuilder/scopeManager.d.ts +11 -0
package/dist/lib/backends/typescriptBuilder/scopeManager.js +20 -0
package/dist/lib/backends/typescriptBuilder/scopeManager.test.d.ts +1 -0
package/dist/lib/backends/typescriptBuilder/scopeManager.test.js +29 -0
package/dist/lib/backends/typescriptBuilder.js +47 -21
package/dist/lib/backends/typescriptGenerator/typeToString.d.ts +0 -3
package/dist/lib/backends/typescriptGenerator/typeToString.js +19 -0
package/dist/lib/cli/commands.js +30 -2
package/dist/lib/cli/doc.js +11 -11
package/dist/lib/cli/doc.test.js +9 -9
package/dist/lib/cli/doctor.d.ts +5 -0
package/dist/lib/cli/doctor.js +43 -0
package/dist/lib/cli/eval/optimize.d.ts +14 -10
package/dist/lib/cli/eval/optimize.js +137 -68
package/dist/lib/cli/eval/optimize.test.js +132 -129
package/dist/lib/cli/eval/run.d.ts +22 -15
package/dist/lib/cli/eval/run.js +38 -26
package/dist/lib/cli/eval/run.test.js +22 -22
package/dist/lib/cli/evalJudge.d.ts +1 -1
package/dist/lib/cli/evalJudge.js +24 -24
package/dist/lib/cli/evalJudge.test.js +17 -17
package/dist/lib/cli/interrupts.js +2 -2
package/dist/lib/cli/interrupts.test.js +9 -9
package/dist/lib/cli/policy.js +11 -11
package/dist/lib/cli/runAgencyAgent.js +5 -1
package/dist/lib/cli/runAgencyAgent.test.js +6 -3
package/dist/lib/cli/serve.js +8 -8
package/dist/lib/cli/util.d.ts +45 -1
package/dist/lib/cli/util.js +31 -20
package/dist/lib/cli/util.test.d.ts +1 -0
package/dist/lib/cli/util.test.js +19 -0
package/dist/lib/compilationUnit.d.ts +4 -4
package/dist/lib/compilationUnit.js +13 -11
package/dist/lib/compiler/compileClosure.d.ts +1 -1
package/dist/lib/compiler/compileClosure.js +12 -5
package/dist/lib/config.d.ts +30 -0
package/dist/lib/config.js +11 -0
package/dist/lib/eval/extract.d.ts +9 -0
package/dist/lib/eval/extract.js +24 -7
package/dist/lib/eval/extract.test.js +68 -28
package/dist/lib/eval/ids.d.ts +1 -1
package/dist/lib/eval/ids.js +2 -2
package/dist/lib/eval/judge/pairwise.d.ts +3 -3
package/dist/lib/eval/judge/pairwise.js +8 -8
package/dist/lib/eval/judge/pairwise.test.js +6 -6
package/dist/lib/eval/judge/suite.d.ts +8 -8
package/dist/lib/eval/judge/suite.js +42 -41
package/dist/lib/eval/judge/suite.test.js +37 -37
package/dist/lib/eval/judge/types.d.ts +6 -5
package/dist/lib/eval/loadInputs.d.ts +11 -0
package/dist/lib/eval/loadInputs.js +97 -0
package/dist/lib/eval/loadInputs.test.d.ts +1 -0
package/dist/lib/eval/loadInputs.test.js +79 -0
package/dist/lib/eval/readRun.d.ts +5 -5
package/dist/lib/eval/readRun.js +12 -12
package/dist/lib/eval/readRun.test.js +37 -37
package/dist/lib/eval/runArtifacts.d.ts +18 -18
package/dist/lib/eval/runArtifacts.js +40 -39
package/dist/lib/eval/runArtifacts.test.js +29 -29
package/dist/lib/eval/{runEvalTask.d.ts → runEvalInput.d.ts} +13 -13
package/dist/lib/eval/{runEvalTask.js → runEvalInput.js} +15 -14
package/dist/lib/eval/runTypes.d.ts +22 -8
package/dist/lib/eval/statelogParser.d.ts +1 -1
package/dist/lib/eval/statelogParser.js +2 -2
package/dist/lib/eval/statelogParser.test.js +2 -2
package/dist/lib/eval/types.d.ts +5 -5
package/dist/lib/importPaths.d.ts +5 -0
package/dist/lib/importPaths.js +7 -0
package/dist/lib/ir/builders.d.ts +1 -1
package/dist/lib/ir/builders.js +2 -2
package/dist/lib/ir/prettyPrint.js +9 -0
package/dist/lib/ir/prettyPrint.test.js +11 -0
package/dist/lib/ir/tsIR.d.ts +5 -0
package/dist/lib/logsViewer/summary.js +12 -10
package/dist/lib/lsp/builtinHover.js +2 -2
package/dist/lib/lsp/diagnostics.js +2 -2
package/dist/lib/lsp/semantics.d.ts +3 -3
package/dist/lib/lsp/semantics.js +20 -20
package/dist/lib/optimize/artifacts.d.ts +1 -1
package/dist/lib/optimize/artifacts.js +1 -1
package/dist/lib/optimize/artifacts.test.js +3 -3
package/dist/lib/optimize/baseOptimizer.d.ts +109 -0
package/dist/lib/optimize/baseOptimizer.js +217 -0
package/dist/lib/optimize/baseOptimizer.test.d.ts +1 -0
package/dist/lib/optimize/baseOptimizer.test.js +180 -0
package/dist/lib/optimize/candidatePool.d.ts +17 -0
package/dist/lib/optimize/candidatePool.js +20 -0
package/dist/lib/optimize/candidatePool.test.d.ts +1 -0
package/dist/lib/optimize/candidatePool.test.js +25 -0
package/dist/lib/optimize/evalCache.d.ts +11 -0
package/dist/lib/optimize/evalCache.js +16 -0
package/dist/lib/optimize/evalCache.test.d.ts +1 -0
package/dist/lib/optimize/evalCache.test.js +28 -0
package/dist/lib/optimize/gepaReflect.d.ts +9 -0
package/dist/lib/optimize/gepaReflect.js +9 -0
package/dist/lib/optimize/gepaReflect.test.d.ts +1 -0
package/dist/lib/optimize/gepaReflect.test.js +20 -0
package/dist/lib/optimize/goalJudgeFile.d.ts +12 -0
package/dist/lib/optimize/goalJudgeFile.js +17 -0
package/dist/lib/optimize/goalJudgeFile.test.d.ts +1 -0
package/dist/lib/optimize/goalJudgeFile.test.js +18 -0
package/dist/lib/optimize/gradeBreakdown.d.ts +22 -0
package/dist/lib/optimize/gradeBreakdown.js +20 -0
package/dist/lib/optimize/gradeBreakdown.test.d.ts +1 -0
package/dist/lib/optimize/gradeBreakdown.test.js +31 -0
package/dist/lib/optimize/grading/agencyRunner.d.ts +31 -0
package/dist/lib/optimize/grading/agencyRunner.js +46 -0
package/dist/lib/optimize/grading/agencyRunner.test.d.ts +1 -0
package/dist/lib/optimize/grading/agencyRunner.test.js +19 -0
package/dist/lib/optimize/grading/aggregate.d.ts +10 -0
package/dist/lib/optimize/grading/aggregate.js +23 -0
package/dist/lib/optimize/grading/aggregate.test.d.ts +1 -0
package/dist/lib/optimize/grading/aggregate.test.js +33 -0
package/dist/lib/optimize/grading/baseGrader.d.ts +26 -0
package/dist/lib/optimize/grading/baseGrader.js +52 -0
package/dist/lib/optimize/grading/baseGrader.test.d.ts +1 -0
package/dist/lib/optimize/grading/baseGrader.test.js +63 -0
package/dist/lib/optimize/grading/functionGrader.d.ts +32 -0
package/dist/lib/optimize/grading/functionGrader.js +63 -0
package/dist/lib/optimize/grading/functionGrader.test.d.ts +1 -0
package/dist/lib/optimize/grading/functionGrader.test.js +49 -0
package/dist/lib/optimize/grading/getPath.d.ts +8 -0
package/dist/lib/optimize/grading/getPath.js +26 -0
package/dist/lib/optimize/grading/getPath.test.d.ts +1 -0
package/dist/lib/optimize/grading/getPath.test.js +29 -0
package/dist/lib/optimize/grading/grade.d.ts +7 -0
package/dist/lib/optimize/grading/grade.js +10 -0
package/dist/lib/optimize/grading/grade.test.d.ts +1 -0
package/dist/lib/optimize/grading/grade.test.js +15 -0
package/dist/lib/optimize/grading/graders/builtinGraders.d.ts +34 -0
package/dist/lib/optimize/grading/graders/builtinGraders.js +104 -0
package/dist/lib/optimize/grading/graders/builtinGraders.test.d.ts +1 -0
package/dist/lib/optimize/grading/graders/builtinGraders.test.js +77 -0
package/dist/lib/optimize/grading/graders/humanGrader.d.ts +36 -0
package/dist/lib/optimize/grading/graders/humanGrader.js +75 -0
package/dist/lib/optimize/grading/graders/humanGrader.test.d.ts +1 -0
package/dist/lib/optimize/grading/graders/humanGrader.test.js +70 -0
package/dist/lib/optimize/grading/graders/llmJudge.d.ts +17 -0
package/dist/lib/optimize/grading/graders/llmJudge.js +36 -0
package/dist/lib/optimize/grading/graders/llmJudge.test.d.ts +1 -0
package/dist/lib/optimize/grading/graders/llmJudge.test.js +47 -0
package/dist/lib/optimize/grading/scorecard.d.ts +29 -0
package/dist/lib/optimize/grading/scorecard.js +37 -0
package/dist/lib/optimize/grading/scorecard.test.d.ts +1 -0
package/dist/lib/optimize/grading/scorecard.test.js +105 -0
package/dist/lib/optimize/grading/types.d.ts +51 -0
package/dist/lib/optimize/grading/types.js +1 -0
package/dist/lib/optimize/gradingModule.d.ts +10 -0
package/dist/lib/optimize/gradingModule.js +47 -0
package/dist/lib/optimize/gradingModule.test.d.ts +1 -0
package/dist/lib/optimize/gradingModule.test.js +40 -0
package/dist/lib/optimize/inputs.d.ts +2 -0
package/dist/lib/optimize/inputs.js +9 -0
package/dist/lib/optimize/inputs.test.d.ts +1 -0
package/dist/lib/optimize/inputs.test.js +17 -0
package/dist/lib/optimize/loop.d.ts +2 -2
package/dist/lib/optimize/loop.js +38 -35
package/dist/lib/optimize/loop.test.js +11 -11
package/dist/lib/optimize/mutator.d.ts +28 -4
package/dist/lib/optimize/mutator.js +19 -13
package/dist/lib/optimize/mutator.test.js +25 -12
package/dist/lib/optimize/optimizer.d.ts +30 -0
package/dist/lib/optimize/optimizer.js +1 -0
package/dist/lib/optimize/optimizerModule.d.ts +9 -0
package/dist/lib/optimize/optimizerModule.js +47 -0
package/dist/lib/optimize/optimizerModule.test.d.ts +1 -0
package/dist/lib/optimize/optimizerModule.test.js +30 -0
package/dist/lib/optimize/optimizers/example.d.ts +48 -0
package/dist/lib/optimize/optimizers/example.js +82 -0
package/dist/lib/optimize/optimizers/example.test.d.ts +1 -0
package/dist/lib/optimize/optimizers/example.test.js +67 -0
package/dist/lib/optimize/optimizers/gepa.d.ts +37 -0
package/dist/lib/optimize/optimizers/gepa.js +139 -0
package/dist/lib/optimize/optimizers/gepa.test.d.ts +1 -0
package/dist/lib/optimize/optimizers/gepa.test.js +131 -0
package/dist/lib/optimize/optimizers/greedyReflective.d.ts +35 -0
package/dist/lib/optimize/optimizers/greedyReflective.js +132 -0
package/dist/lib/optimize/optimizers/greedyReflective.test.d.ts +1 -0
package/dist/lib/optimize/optimizers/greedyReflective.test.js +134 -0
package/dist/lib/optimize/pareto.d.ts +13 -0
package/dist/lib/optimize/pareto.js +17 -0
package/dist/lib/optimize/pareto.test.d.ts +1 -0
package/dist/lib/optimize/pareto.test.js +28 -0
package/dist/lib/optimize/public.d.ts +24 -0
package/dist/lib/optimize/public.js +18 -0
package/dist/lib/optimize/public.test.d.ts +1 -0
package/dist/lib/optimize/public.test.js +22 -0
package/dist/lib/optimize/reflectionFeedback.d.ts +9 -0
package/dist/lib/optimize/reflectionFeedback.js +71 -0
package/dist/lib/optimize/reflectionFeedback.test.d.ts +1 -0
package/dist/lib/optimize/reflectionFeedback.test.js +58 -0
package/dist/lib/optimize/registry.d.ts +5 -0
package/dist/lib/optimize/registry.js +24 -0
package/dist/lib/optimize/registry.test.d.ts +1 -0
package/dist/lib/optimize/registry.test.js +38 -0
package/dist/lib/optimize/report.d.ts +14 -0
package/dist/lib/optimize/report.js +58 -0
package/dist/lib/optimize/report.test.d.ts +1 -0
package/dist/lib/optimize/report.test.js +32 -0
package/dist/lib/optimize/reporter.d.ts +56 -6
package/dist/lib/optimize/reporter.js +75 -3
package/dist/lib/optimize/reporter.test.js +70 -11
package/dist/lib/optimize/rng.d.ts +8 -0
package/dist/lib/optimize/rng.js +34 -0
package/dist/lib/optimize/rng.test.d.ts +1 -0
package/dist/lib/optimize/rng.test.js +25 -0
package/dist/lib/optimize/sourceMutator.d.ts +2 -0
package/dist/lib/optimize/sourceMutator.js +16 -2
package/dist/lib/optimize/sourceMutator.test.js +16 -2
package/dist/lib/optimize/targets.d.ts +2 -0
package/dist/lib/optimize/targets.js +4 -0
package/dist/lib/optimize/types.d.ts +13 -3
package/dist/lib/optimize/validationSplit.d.ts +8 -0
package/dist/lib/optimize/validationSplit.js +14 -0
package/dist/lib/optimize/validationSplit.test.d.ts +1 -0
package/dist/lib/optimize/validationSplit.test.js +25 -0
package/dist/lib/optimize/workspace.d.ts +42 -0
package/dist/lib/optimize/workspace.js +100 -0
package/dist/lib/optimize/workspace.test.d.ts +1 -0
package/dist/lib/optimize/workspace.test.js +103 -0
package/dist/lib/parser.js +2 -2
package/dist/lib/parsers/effectSet.test.d.ts +1 -0
package/dist/lib/parsers/effectSet.test.js +96 -0
package/dist/lib/parsers/handleBlock.test.js +20 -1
package/dist/lib/parsers/interruptStatement.test.js +29 -8
package/dist/lib/parsers/parsers.d.ts +4 -0
package/dist/lib/parsers/parsers.js +154 -14
package/dist/lib/parsers/raiseStatement.test.d.ts +1 -0
package/dist/lib/parsers/raiseStatement.test.js +64 -0
package/dist/lib/parsers/raisesClause.test.d.ts +1 -0
package/dist/lib/parsers/raisesClause.test.js +87 -0
package/dist/lib/preprocessors/resolveReExports.js +39 -2
package/dist/lib/preprocessors/resolveReExports.test.js +117 -0
package/dist/lib/preprocessors/typescriptPreprocessor.d.ts +16 -0
package/dist/lib/preprocessors/typescriptPreprocessor.js +127 -52
package/dist/lib/runtime/agencyFunction.d.ts +14 -0
package/dist/lib/runtime/agencyFunction.js +28 -0
package/dist/lib/runtime/agencyFunction.test.js +49 -0
package/dist/lib/runtime/agencyInterrupt.d.ts +3 -3
package/dist/lib/runtime/agencyInterrupt.js +2 -2
package/dist/lib/runtime/agencyInterrupt.test.js +18 -18
package/dist/lib/runtime/call.js +13 -0
package/dist/lib/runtime/configOverrides.d.ts +1 -0
package/dist/lib/runtime/deterministicClient.d.ts +1 -1
package/dist/lib/runtime/deterministicClient.test.js +9 -9
package/dist/lib/runtime/errors.d.ts +3 -3
package/dist/lib/runtime/errors.js +12 -5
package/dist/lib/runtime/interrupts.d.ts +3 -3
package/dist/lib/runtime/interrupts.js +12 -12
package/dist/lib/runtime/interrupts.test.js +3 -3
package/dist/lib/runtime/ipc.configOverrides.test.js +4 -4
package/dist/lib/runtime/ipc.d.ts +2 -2
package/dist/lib/runtime/ipc.js +3 -3
package/dist/lib/runtime/isDebugger.test.js +3 -3
package/dist/lib/runtime/node.js +3 -0
package/dist/lib/runtime/policy.d.ts +1 -1
package/dist/lib/runtime/policy.js +1 -1
package/dist/lib/runtime/policy.test.js +22 -22
package/dist/lib/runtime/prompt.d.ts +31 -0
package/dist/lib/runtime/prompt.js +183 -15
package/dist/lib/runtime/prompt.test.d.ts +1 -0
package/dist/lib/runtime/prompt.test.js +79 -0
package/dist/lib/runtime/runBatch.js +17 -0
package/dist/lib/runtime/runBatch.test.js +1 -1
package/dist/lib/runtime/state/context.d.ts +15 -0
package/dist/lib/runtime/state/context.js +60 -18
package/dist/lib/runtime/state/globalStore.js +3 -0
package/dist/lib/runtime/state/stateStack.d.ts +13 -0
package/dist/lib/runtime/state/stateStack.js +30 -0
package/dist/lib/runtime/types.d.ts +1 -1
package/dist/lib/runtime/utils.d.ts +1 -0
package/dist/lib/runtime/utils.js +6 -1
package/dist/lib/serve/discovery.d.ts +2 -2
package/dist/lib/serve/discovery.js +7 -7
package/dist/lib/serve/discovery.test.js +9 -9
package/dist/lib/serve/http/adapter.js +2 -2
package/dist/lib/serve/http/adapter.test.js +8 -8
package/dist/lib/serve/mcp/adapter.js +16 -16
package/dist/lib/serve/mcp/adapter.test.js +15 -15
package/dist/lib/serve/mcp/httpTransport.test.js +1 -1
package/dist/lib/serve/mcp/interruptLoop.test.js +2 -2
package/dist/lib/serve/types.d.ts +3 -3
package/dist/lib/statelogClient.d.ts +19 -5
package/dist/lib/statelogClient.js +32 -10
package/dist/lib/statelogClient.test.js +48 -0
package/dist/lib/stdlib/agencyEval.d.ts +18 -18
package/dist/lib/stdlib/agencyEval.js +29 -29
package/dist/lib/stdlib/cli.d.ts +46 -0
package/dist/lib/stdlib/cli.js +275 -19
package/dist/lib/stdlib/fs.d.ts +5 -8
package/dist/lib/stdlib/fs.js +28 -18
package/dist/lib/stdlib/layout/axis.d.ts +3 -0
package/dist/lib/stdlib/layout/axis.js +25 -2
package/dist/lib/stdlib/layout/barchart.d.ts +33 -0
package/dist/lib/stdlib/layout/barchart.js +217 -0
package/dist/lib/stdlib/layout/box.d.ts +2 -0
package/dist/lib/stdlib/layout/box.js +12 -1
package/dist/lib/stdlib/layout/nodes.d.ts +7 -1
package/dist/lib/stdlib/layout/nodes.js +33 -2
package/dist/lib/stdlib/layout/render.d.ts +4 -5
package/dist/lib/stdlib/layout/render.js +60 -124
package/dist/lib/stdlib/layout/sizing.d.ts +15 -0
package/dist/lib/stdlib/layout/sizing.js +38 -0
package/dist/lib/stdlib/layout/table.d.ts +2 -0
package/dist/lib/stdlib/layout/table.js +7 -0
package/dist/lib/stdlib/layout.d.ts +12 -1
package/dist/lib/stdlib/layout.js +11 -7
package/dist/lib/stdlib/llm.d.ts +29 -0
package/dist/lib/stdlib/llm.js +29 -0
package/dist/lib/stdlib/memory.d.ts +1 -0
package/dist/lib/stdlib/memory.js +5 -0
package/dist/lib/stdlib/shell.d.ts +1 -1
package/dist/lib/stdlib/shell.js +38 -5
package/dist/lib/stdlib/statelog.d.ts +2 -2
package/dist/lib/stdlib/statelog.js +5 -5
package/dist/lib/stdlib/syntax-themes.d.ts +17 -0
package/dist/lib/stdlib/syntax-themes.js +423 -0
package/dist/lib/stdlib/syntax.d.ts +13 -1
package/dist/lib/stdlib/syntax.js +81 -69
package/dist/lib/stdlib/ui.d.ts +1 -1
package/dist/lib/stdlib/ui.js +27 -2
package/dist/lib/symbolTable.d.ts +8 -5
package/dist/lib/symbolTable.js +12 -8
package/dist/lib/symbolTable.test.js +6 -6
package/dist/lib/templates/backends/typescriptGenerator/blockSetup.d.ts +2 -1
package/dist/lib/templates/backends/typescriptGenerator/blockSetup.js +1 -0
package/dist/lib/templates/backends/typescriptGenerator/forkBlockSetup.d.ts +2 -1
package/dist/lib/templates/backends/typescriptGenerator/forkBlockSetup.js +1 -0
package/dist/lib/templates/backends/typescriptGenerator/functionCatchFailure.d.ts +1 -1
package/dist/lib/templates/backends/typescriptGenerator/functionCatchFailure.js +9 -0
package/dist/lib/templates/backends/typescriptGenerator/imports.d.ts +1 -1
package/dist/lib/templates/backends/typescriptGenerator/imports.js +1 -0
package/dist/lib/templates/backends/typescriptGenerator/interruptAssignment.d.ts +2 -2
package/dist/lib/templates/backends/typescriptGenerator/interruptAssignment.js +1 -1
package/dist/lib/templates/backends/typescriptGenerator/interruptReturn.d.ts +2 -2
package/dist/lib/templates/backends/typescriptGenerator/interruptReturn.js +1 -1
package/dist/lib/templates/cli/optimizeReport.d.ts +9 -0
package/dist/lib/templates/cli/optimizeReport.js +18 -0
package/dist/lib/templates/cli/standaloneHttp.d.ts +2 -2
package/dist/lib/templates/cli/standaloneHttp.js +2 -2
package/dist/lib/templates/cli/standaloneMcp.d.ts +2 -2
package/dist/lib/templates/cli/standaloneMcp.js +2 -2
package/dist/lib/templates/cli/standaloneMcpHttp.d.ts +2 -2
package/dist/lib/templates/cli/standaloneMcpHttp.js +2 -2
package/dist/lib/typeChecker/agencyFunctionMethods.test.d.ts +1 -0
package/dist/lib/typeChecker/agencyFunctionMethods.test.js +91 -0
package/dist/lib/typeChecker/builtins.d.ts +17 -0
package/dist/lib/typeChecker/builtins.js +36 -0
package/dist/lib/typeChecker/effectSetImport.test.d.ts +1 -0
package/dist/lib/typeChecker/effectSetImport.test.js +46 -0
package/dist/lib/typeChecker/effectSets.d.ts +26 -0
package/dist/lib/typeChecker/effectSets.js +64 -0
package/dist/lib/typeChecker/effectSets.test.d.ts +1 -0
package/dist/lib/typeChecker/effectSets.test.js +48 -0
package/dist/lib/typeChecker/index.d.ts +1 -1
package/dist/lib/typeChecker/index.js +12 -8
package/dist/lib/typeChecker/interruptAnalysis.d.ts +6 -6
package/dist/lib/typeChecker/interruptAnalysis.js +20 -20
package/dist/lib/typeChecker/interruptAnalysis.test.js +16 -16
package/dist/lib/typeChecker/interruptCallGraph.test.js +2 -2
package/dist/lib/typeChecker/raisesDiagnostic.d.ts +18 -0
package/dist/lib/typeChecker/raisesDiagnostic.js +58 -0
package/dist/lib/typeChecker/raisesDiagnostic.test.d.ts +1 -0
package/dist/lib/typeChecker/raisesDiagnostic.test.js +91 -0
package/dist/lib/typeChecker/synthesizer.js +8 -29
package/dist/lib/typeChecker/testUtils.d.ts +13 -0
package/dist/lib/typeChecker/testUtils.js +37 -0
package/dist/lib/typeChecker/types.d.ts +3 -3
package/dist/lib/types/function.d.ts +6 -0
package/dist/lib/types/graphNode.d.ts +3 -0
package/dist/lib/types/handleBlock.d.ts +1 -0
package/dist/lib/types/interruptStatement.d.ts +4 -1
package/dist/lib/types/literals.d.ts +3 -0
package/dist/lib/types/typeHints.d.ts +13 -0
package/dist/lib/types.d.ts +3 -0
package/dist/lib/utils/diff.d.ts +37 -5
package/dist/lib/utils/diff.js +288 -24
package/dist/lib/utils/diff.test.js +157 -19
package/dist/lib/utils/node.js +9 -1
package/dist/lib/utils/termcolors.d.ts +13 -0
package/dist/lib/utils/termcolors.js +22 -0
package/dist/scripts/agency.js +54 -33
package/dist/scripts/agency.test.js +2 -2
package/package.json +9 -2
package/stdlib/agency/eval.agency +57 -56
package/stdlib/agency/eval.js +88 -70
package/stdlib/agency.js +50 -0
package/stdlib/agent.js +29 -0
package/stdlib/args.js +5 -0
package/stdlib/array.js +41 -0
package/stdlib/browser.js +5 -0
package/stdlib/calendar.js +20 -0
package/stdlib/chart.agency +157 -0
package/stdlib/chart.js +982 -0
package/stdlib/cli.agency +6 -0
package/stdlib/cli.js +30 -4
package/stdlib/clipboard.js +8 -0
package/stdlib/concurrency.js +5 -0
package/stdlib/date.js +47 -0
package/stdlib/email.js +11 -0
package/stdlib/fs.agency +35 -107
package/stdlib/fs.js +253 -449
package/stdlib/http.js +11 -0
package/stdlib/imessage.js +5 -0
package/stdlib/index.agency +64 -2
package/stdlib/index.js +562 -28
package/stdlib/keyring.js +14 -0
package/stdlib/layout.agency +2 -228
package/stdlib/layout.js +57 -1226
package/stdlib/llm.agency +91 -0
package/stdlib/llm.js +787 -0
package/stdlib/markdown.js +14 -0
package/stdlib/math.js +14 -0
package/stdlib/memory.agency +19 -2
package/stdlib/memory.js +151 -4
package/stdlib/oauth.js +14 -0
package/stdlib/object.js +17 -0
package/stdlib/path.js +23 -0
package/stdlib/policy.agency +180 -73
package/stdlib/policy.js +649 -77
package/stdlib/schemas.js +1 -0
package/stdlib/search.js +5 -0
package/stdlib/shell.agency +44 -2
package/stdlib/shell.js +330 -61
package/stdlib/skills.agency +50 -6
package/stdlib/skills.js +223 -28
package/stdlib/sms.js +5 -0
package/stdlib/speech.js +11 -0
package/stdlib/statelog.agency +15 -15
package/stdlib/statelog.js +57 -37
package/stdlib/strategy.js +19 -0
package/stdlib/syntax.agency +175 -2
package/stdlib/syntax.js +666 -8
package/stdlib/system.js +35 -0
package/stdlib/table.agency +202 -0
package/stdlib/table.js +1427 -0
package/stdlib/thread.js +20 -0
package/stdlib/threads.js +17 -0
package/stdlib/types.js +1 -0
package/stdlib/ui.agency +20 -1
package/stdlib/ui.js +243 -18
package/stdlib/validators.js +35 -0
package/stdlib/weather.js +11 -0
package/stdlib/wikipedia.js +11 -0
package/dist/lib/agents/agency-agent/subagents/oneShot.agency +0 -49
package/dist/lib/eval/loadTasks.d.ts +0 -6
package/dist/lib/eval/loadTasks.js +0 -81
package/dist/lib/eval/loadTasks.test.js +0 -60
package/dist/lib/optimize/tasks.d.ts +0 -2
package/dist/lib/optimize/tasks.js +0 -9
package/dist/lib/optimize/tasks.test.js +0 -17
/package/dist/lib/agents/{judge.agency → eval/judge.agency} +0 -0
/package/dist/lib/agents/{judgePairwise.agency → eval/judgePairwise.agency} +0 -0
/package/dist/lib/{eval/loadTasks.test.d.ts → backends/anthropicApiKey.codegen.test.d.ts} +0 -0
/package/dist/lib/{optimize/tasks.test.d.ts → backends/maxToolResultChars.codegen.test.d.ts} +0 -0

package/dist/lib/agents/agency-agent/agent.agency CHANGED Viewed

@@ -1,8 +1,8 @@
 import { getVersion } from "std::agency"
-import { route } from "std::agent"
 import { parseArgs } from "std::args"
 import { clearMessages, pushMessage, repl, clearScreen } from "std::cli"
 import { today } from "std::date"
+import { setAgentCwd } from "std::index"
 import { box, render } from "std::layout"
 import { setMemoryId } from "std::memory"
 import {
@@ -25,15 +25,11 @@ import {
   recommendedAutoApprovePolicy,
  } from "./lib/defaultPolicy.agency"
 import { truncate, formatArgs, formatToolResponse } from "./lib/utils.agency"
-import { codeSysPrompt, codeTools, codeAgent } from "./subagents/code.agency"
+import { configureModels } from "./shared.agency"
+import { codeAgent } from "./subagents/code.agency"
 import { explorerAgent } from "./subagents/explorer.agency"
-import { oneShotAgent } from "./subagents/oneShot.agency"
 import { oracleAgent } from "./subagents/oracle.agency"
-import {
-  researchSysPrompt,
-  researchTools,
-  researchAgent,
- } from "./subagents/research.agency"
+import { researchAgent } from "./subagents/research.agency"
 import { reviewAgent } from "./subagents/review.agency"
@@ -65,8 +61,8 @@ import { reviewAgent } from "./subagents/review.agency"
  *
  * This file's responsibilities collapse to:
  *   1. Per-turn callback (`_runTurn`) wiring the user message into
- *      route() and printing the reply into the scroll output.
- *   2. Per-kind ALWAYS_FIELDS map for the policy handler's
+ *      `mainAgent` and printing the reply into the scroll output.
+ *   2. Per-effect ALWAYS_FIELDS map for the policy handler's
  *      "approve-always-here" option.
  *   3. Wire the two specialists into one `RouterConfig`.
  *
@@ -91,17 +87,28 @@ let VERBOSE: boolean = false
 // scroll-output writes when stdout is destined for a Unix pipe.
 let _isInteractive: boolean = true
+// Live tool-call tracing. Always shown in the interactive REPL; in
+// one-shot mode it's suppressed so piped output is just the reply,
+// unless the user opts in with `--verbose` / `--debug` (AGENT_DEBUG).
+def _showTraces(): boolean {
+  return _isInteractive || VERBOSE || AGENT_DEBUG
+}
 callback("onToolCallStart") as data {
-  pushMessage(color.yellow("⏺ ${data.toolName}(${formatArgs(data.args)})"))
+  if (_showTraces()) {
+    pushMessage(color.yellow("⏺ ${data.toolName}(${formatArgs(data.args)})"))
+  }
 }
 callback("onToolCallEnd") as data {
-  if (data.result is success(_result)) {
-    pushMessage(color.dim.green("${formatToolResponse(_result)}"))
-  } else if (data.result is failure(_error)) {
-    pushMessage(color.red(" ⎿  Error: ${_error}"))
-  } else {
-    pushMessage(color.dim("${formatToolResponse(data.result)}"))
+  if (_showTraces()) {
+    if (data.result is success(_result)) {
+      pushMessage(color.dim.green("${formatToolResponse(_result)}"))
+    } else if (data.result is failure(_error)) {
+      pushMessage(color.red(" ⎿  Error: ${_error}"))
+    } else {
+      pushMessage(color.dim("${formatToolResponse(data.result)}"))
+    }
   }
 }
@@ -178,6 +185,7 @@ def builtinPalette(): Record<string, string> {
     "/exit": "Exit the agent",
     "/clear": "Clear the conversation transcript",
     "/cost": "Show cumulative LLM cost and tokens",
+    "/paste": "Multi-line paste mode (Ctrl+D submits, Ctrl+C cancels)",
     "/help": "Show available slash commands"
   }
 }
@@ -220,7 +228,7 @@ def _runTurn(msg: string): boolean {
     return true
   }
   if (trimmed == "/help") {
-    pushMessage("Commands: /exit, /clear, /cost, /help")
+    pushMessage("Commands: /exit, /clear, /cost, /paste, /help")
     return true
   }
   if (trimmed == "/cost") {
@@ -228,10 +236,9 @@ def _runTurn(msg: string): boolean {
     pushMessage("Tokens: ${getTokens()}")
     return true
   }
-  // Expand `/foo args` to the rendered command body. Unknown `/foo`
-  // inputs fall through unchanged — matches Claude Code.
-  const prompt = expandSlash(msg, projectCommands)
-  const reply = mainAgent(prompt)
+  // Hand the message to the agent. `agentReply` does the slash-command
+  // expansion and the actual agent work; the REPL just renders the reply.
+  const reply = agentReply(msg)
   if (reply != "" && reply != null && reply != undefined) {
     pushMessage(highlight("${reply}\n", language: "markdown"))
   } else {
@@ -241,6 +248,12 @@ def _runTurn(msg: string): boolean {
 }
 let first = true
+// Valid `--agent` targets. Empty / "main" routes through the coordinator;
+// the rest route the starting prompt's first turn directly to that
+// subagent. Used to validate the flag and to dispatch in `agentReplyVia`.
+static const START_AGENTS = ["main", "code", "research", "oracle", "explorer", "review"]
 static const mainAgentSystemPrompt = """
 You are the top-level coordinator of an Agency-language assistant. You
 receive every user message and decide how to respond.
@@ -386,6 +399,15 @@ parse → SymbolTable.build → preprocess → TypeScriptBuilder → printTs
 Keep diagrams small. Skip them where prose or code is clearer —
 diagrams earn their space by showing **relationships** or **flow**.
+## Be proactive
+When the user asks you to look at, debug, or change a file or some code,
+**delegate to `codeAgent` to do it** — don't ask the user to paste a file
+or describe code a subagent could read. The code agent has `read`, `glob`,
+and `ls` and resolves relative paths against the user's working directory
+automatically, so a bare filename like `foo.agency` is enough. Only ask
+the user for information you genuinely cannot obtain through a subagent.
 ## Answer before action
 When the user asks a question, asks for an opinion, or asks how to
@@ -408,7 +430,10 @@ def mainAgent(prompt: string): string {
   thread(label: "main", summarize: true, session: "main") {
     setMemoryId("main")
     if (first) {
-      systemMessage(mainAgentSystemPrompt)
+      // `_context` carries the per-run grounding (date, cwd, AGENTS.md),
+      // set by `setupSession`. Appending it to the system prompt is what
+      // actually gets that context to the LLM.
+      systemMessage(mainAgentSystemPrompt + _context)
       first = false
     }
     const result = llm(prompt, {
@@ -419,28 +444,39 @@ def mainAgent(prompt: string): string {
   return result
 }
-def routeAgent(prompt: string): string {
-  const reply = route(
-    {
-    start: "code",
-    agents: {
-      code: {
-        type: "agent",
-        name: "code",
-        agent: codeAgent
-      },
-      research: {
-        type: "agent",
-        name: "research",
-        agent: researchAgent
-      }
-    },
-    maxHops: 3,
-    context: _context
-  },
-    prompt,
-  )
-  return reply
+// Dispatch one turn. `target` empty (or "main") runs the coordinator
+// `mainAgent`, which routes as usual; any subagent name routes the turn
+// directly to that subagent. All subagents share `(userMsg, allowHandoff)`
+// and the seed turn never hands off (allowHandoff: false). Used by both
+// the one-shot path and the interactive seed turn.
+export def agentReplyVia(target: string, userMsg: string): string {
+  const expanded = expandSlash(userMsg, projectCommands)
+  if (target == "code") {
+    return codeAgent(expanded, false)
+  }
+  if (target == "research") {
+    return researchAgent(expanded, false)
+  }
+  if (target == "oracle") {
+    return oracleAgent(expanded, false)
+  }
+  if (target == "explorer") {
+    return explorerAgent(expanded, false)
+  }
+  if (target == "review") {
+    return reviewAgent(expanded, false)
+  }
+  return mainAgent(expanded)
+}
+// The agent's core turn, decoupled from the terminal: expand any project
+// slash command, then run the prompt through `mainAgent` and return the
+// reply. The REPL (`main` / `_runTurn`) owns input, output, and built-in
+// commands; everything the *agent* does for a user message lives here, so
+// it can be driven and tested without a terminal or user input. See
+// `tests/agentTurn.agency`.
+export def agentReply(userMsg: string): string {
+  return agentReplyVia("", userMsg)
 }
 def roundedCost(): string {
@@ -461,9 +497,15 @@ def sample(arr: any[]): any {
 def printHeader() {
   const fig = sample(figs)
-  const data = box(title: "Agency", padding: 1, borderColor: "cyan", titleColor: "cyan") as b {
+  const data = box(
+    title: "Agency",
+    padding: 1,
+    borderColor: "cyan",
+    titleColor: "cyan",
+    width: "full",
+  ) as b {
     b.row(gap: 1) as r {
-      r.column() as left {
+      r.column(width: "66%") as left {
         left.text("Welcome to the Agency Agent!", bold: true)
         left.text("Ask me to write code, look up docs, or just chat.")
         left.text("All costs are estimates. Actual costs may be higher.", dim: true)
@@ -472,8 +514,8 @@ def printHeader() {
         left.text("/help for commands · /exit to quit", dim: true)
       }
       r.vline()
-      r.column() as right {
-        right.raw(fig)
+      r.column(width: "30%", align: "center") as right {
+        right.raw(fig, align: "center")
       }
     }
   }
@@ -501,6 +543,103 @@ def givePolicyChoice() {
   }
 }
+// Shared session setup for both interactive and one-shot modes. Builds
+// the per-run grounding context, loads (or initializes) the policy, and
+// returns the installed CLI policy handler. `interactive` gates the
+// first-run policy-choice prompt: one-shot has no user to answer it, so
+// it falls back to the recommended default (reads/web auto-approved;
+// writes still require approval, which a non-interactive run can't
+// grant — those tasks block, which is the safe behavior).
+def setupSession(interactive: boolean): any {
+  // Point every path-taking tool at the user's working directory so the
+  // agent's relative file/shell commands resolve against where the user
+  // launched it. The user (via the agent) can change this later with
+  // setAgentCwd.
+  setAgentCwd(cwd())
+  // Grounding: the LLM shouldn't have to ask where it is or what day it
+  // is. Project context: inline an AGENTS.md from the workspace root if
+  // present so the LLM follows the project's conventions.
+  const projectContext = loadAgentsMd(cwd()) with approve
+  _context = "\n\nCurrent date: ${today()}\nCurrent working directory: ${cwd()}${projectContext}"
+  const policy = parsePolicyFile(POLICY_PATH)
+  if (policy is failure(f)) {
+    if (f.status == "doesnt-exist") {
+      if (interactive) {
+        print(color.yellow("No existing policy found at ${POLICY_PATH}."))
+        setPolicy(POLICY_PATH, givePolicyChoice())
+      } else {
+        setPolicy(POLICY_PATH, recommendedAutoApprovePolicy)
+      }
+    } else {
+      print(color.red("Failed to load policy: ${JSON.stringify(f.error)}"))
+      process.exit(1)
+    }
+  } else {
+    setPolicy(POLICY_PATH, policy.value)
+  }
+  // Bind the handler to a local var so `with handler` parses (the
+  // `with` clause only accepts an identifier, not a call expression).
+  return cliPolicyHandler(file: POLICY_PATH, fields: ALWAYS_FIELDS)
+}
+// One-shot entry: run a single turn through the same `mainAgent` the
+// REPL uses, with the same session setup and policy handler, and return
+// the reply. Used for `agency agent -p "..."`, a positional query, or
+// piped stdin. Slash commands are expanded so `-p /foo bar` works like
+// typing it in the REPL; the loop-only built-ins (`/exit` etc.) are
+// meaningless here and aren't checked.
+def oneShotAgent(target: string, prompt: string): string {
+  _isInteractive = false
+  const handler = setupSession(false)
+  let reply: string = ""
+  handle {
+    reply = agentReplyVia(target, prompt)
+  } with (data) {
+    return handler(data)
+  }
+  return reply
+}
+// Render one seeded turn into the REPL scroll area: echo the auto-run
+// prompt so the user sees what was asked, then push the agent's reply.
+// Mirrors the reply-rendering half of `_runTurn`.
+def _runSeedTurn(target: string, msg: string) {
+  pushMessage(color.dim("> ${msg}"))
+  const reply = agentReplyVia(target, msg)
+  if (reply != "" && reply != null && reply != undefined) {
+    pushMessage(highlight("${reply}\n", language: "markdown"))
+  } else {
+    pushMessage(color.red("No reply generated."))
+  }
+}
+// Start the interactive REPL. When `seedPrompt` is non-empty it is run as
+// the first turn (routed via `seedTarget`) *inside* the handle block so
+// its interrupts reach the policy `handler`; the user is then left at the
+// prompt. `seedPrompt == ""` is the plain REPL with no seed. Subsequent
+// turns always go through `_runTurn` (the coordinator) regardless of
+// `seedTarget` — the target only kicks off the first turn.
+def startInteractive(handler: any, seedTarget: string, seedPrompt: string) {
+  handle {
+    if (seedPrompt != "") {
+      _runSeedTurn(seedTarget, seedPrompt)
+    }
+    repl(
+      status: _buildStatus,
+      onSubmit: _runTurn,
+      prompt: "> ",
+      historyFile: HISTORY_PATH,
+      historyMax: 1000,
+      paletteCommands: mergedPalette(),
+    )
+  } with (data) {
+    return handler(data)
+  }
+  print(color.cyan("\nGoodbye!"))
+}
 node main() {
   // Parse CLI flags first — `parseArgs` exits on --help / --version /
   // usage errors, before any handlers or the TUI are installed.
@@ -522,6 +661,31 @@ node main() {
       verbose: {
         type: "boolean",
         description: "Echo tool-call starts to stdout in non-interactive mode"
+      },
+      model: {
+        type: "string",
+        description: "Model for all LLM calls (overrides provider auto-detection)"
+      },
+      fastmodel: {
+        type: "string",
+        description: "Model for ordinary work (default: per detected provider)"
+      },
+      slowmodel: {
+        type: "string",
+        description: "Model for deep reasoning, e.g. the oracle/explorer subagents"
+      },
+      provider: {
+        type: "string",
+        description: "Force the LLM provider (use when a model name doesn't imply one)"
+      },
+      interactive: {
+        type: "boolean",
+        short: "i",
+        description: "Run the given prompt as the first turn of an interactive session, then hand over the REPL (instead of one-shot)"
+      },
+      agent: {
+        type: "string",
+        description: "Route the starting prompt to a named subagent: code, research, oracle, explorer, review (default: coordinator)"
       }
     }
   },
@@ -534,74 +698,85 @@ node main() {
     VERBOSE = true
   }
-  setTitle("Agency Agent")
-  clearScreen()
+  // Resolve which models to use. Explicit flags win; otherwise detect a
+  // provider from API-key env vars and use that provider's defaults. The
+  // fast model becomes the run-wide default via `setModel`; the slow
+  // model is read by the deep-reasoning subagents (oracle, explorer).
+  // Resolve + apply the fast/slow models. Absent string flags read as
+  // `undefined`, and agency's `== null` does not match `undefined`, so
+  // normalize via `??` (which does treat `undefined` as nullish) to "".
+  configureModels(
+    args.flags.model ?? "",
+    args.flags.fastmodel ?? "",
+    args.flags.slowmodel ?? "",
+    args.flags.provider ?? "",
+  )
   // Positional args (everything after flags) are joined with spaces to
-  // form the one-shot prompt. `--` ends flag parsing if a positional
+  // form the starting prompt. `--` ends flag parsing if a positional
   // would otherwise look like a flag.
   const positionalQuery = args.positionals.join(" ")
   const hasQuery = positionalQuery != ""
+  const startAgent = args.flags.agent ?? ""
+  const wantInteractive = args.flags.interactive
+  // Validate the target subagent name up front (empty = coordinator).
+  if (startAgent != "" && !START_AGENTS.includes(startAgent)) {
+    print(
+      color.red(
+      "Unknown --agent value: ${startAgent}. Valid: ${START_AGENTS.join(", ")}",
+    ),
+    )
+    process.exit(1)
+  }
-  // Non-interactive (piped) invocation: read the whole prompt from
-  // stdin, run one turn of `route()`, write the reply to stdout, and
-  // exit. No banner, no REPL, no slash commands. This lets the agent
-  // behave like a normal Unix filter: `echo "..." | pnpm run agency agent`.
-  //
-  // Also entered when `--print` / `-p` is passed, or when a positional
-  // query is given. In those cases stdin isn't read — the prompt comes
-  // from the positional.
-  const forceOneShot = args.flags.print || hasQuery
-  if (forceOneShot || !isTTY()) {
-    const result = oneShotAgent()
-    print(result)
+  // Seeded interactive: run the given prompt as the first turn, then hand
+  // the REPL to the user. Requires a seed prompt and a TTY (the REPL reads
+  // stdin). `--print` wins if both are passed — its whole job is to print
+  // and exit with no REPL. Without a TTY (or with `--print`) we fall
+  // through to one-shot below; `--interactive` with no prompt falls through
+  // to the plain REPL.
+  if (wantInteractive && hasQuery && isTTY() && !args.flags.print) {
+    setTitle("Agency Agent")
+    clearScreen()
+    printHeader()
+    const seededHandler = setupSession(true)
+    startInteractive(seededHandler, startAgent, positionalQuery)
     process.exit(0)
   }
-  printHeader()
-  // Grounding: the LLM should not have to ask the user where it is
-  // or what day it is. Both are appended once per run so they ride
-  // with the first system message in each specialist's thread.
-  //
-  // Project context: if the user keeps an AGENTS.md at the workspace
-  // root (Anthropic / Pi / Aider all read it), inline it so the LLM
-  // automatically follows the project's conventions.
-  const projectContext = loadAgentsMd(cwd()) with approve
-  _context = "\n\nCurrent date: ${today()}\nCurrent working directory: ${cwd()}${projectContext}"
-  const policy = parsePolicyFile(POLICY_PATH)
-  if (policy is failure(f)) {
-    const { status, error } = f
-    print(f, status, error)
-    if (status == "doesnt-exist") {
-      print(color.yellow("No existing policy found at ${POLICY_PATH}."))
-      const choice = givePolicyChoice()
-      setPolicy(POLICY_PATH, choice)
-    } else {
-      print(color.red("Failed to load policy: ${JSON.stringify(error)}"))
-      process.exit(1)
+  // One-shot invocation: run one turn through the same agent the REPL uses
+  // and write the reply to stdout. No banner, no REPL. Entered when
+  // `--print` / `-p` is passed, a positional query is given, or stdin is
+  // piped (no TTY) — so the agent behaves like a Unix filter:
+  // `echo "..." | agency agent`. `--interactive` is NOT a one-shot trigger
+  // on its own: with a TTY and no prompt it falls through to the plain
+  // REPL; without a TTY the `!isTTY()` check below routes it here to
+  // degrade gracefully. The prompt comes from the positional when present,
+  // otherwise from stdin. (Title/clearScreen are skipped so piped output
+  // stays free of escape codes.)
+  const forceOneShot = args.flags.print || hasQuery
+  if (forceOneShot || !isTTY()) {
+    let prompt = positionalQuery
+    if (!hasQuery) {
+      const fromStdin = readStdin()
+      if (fromStdin == null || fromStdin == "") {
+        process.exit(0)
+      }
+      prompt = fromStdin
     }
-  } else {
-    setPolicy(POLICY_PATH, policy.value)
+    print(oneShotAgent(startAgent, prompt))
+    process.exit(0)
   }
-  // Bind the handler to a local var so `with handler` parses (the
-  // `with` clause only accepts an identifier, not a call expression).
-  const handler = cliPolicyHandler(file: POLICY_PATH, fields: ALWAYS_FIELDS)
-  // The `repl()` widget owns the runloop; every Enter dispatches into
-  // `_runTurn` which calls `route()`. Interrupts raised inside
-  // route() propagate to the policy handler installed by the enclosing
-  // `handle` block via the AsyncLocalStorage handler stack.
-  handle {
-    repl(
-      status: _buildStatus,
-      onSubmit: _runTurn,
-      prompt: "> ",
-      historyFile: HISTORY_PATH,
-      historyMax: 1000,
-      paletteCommands: mergedPalette(),
-    )
-  } with handler
-  print(color.cyan("\nGoodbye!"))
+  // Plain interactive REPL (no seed). `startInteractive` owns the runloop;
+  // every Enter dispatches into `_runTurn` which calls `mainAgent`.
+  // Interrupts raised during a turn propagate to the policy handler
+  // installed by the enclosing `handle` block via the AsyncLocalStorage
+  // handler stack.
+  setTitle("Agency Agent")
+  clearScreen()
+  printHeader()
+  const handler = setupSession(true)
+  startInteractive(handler, "", "")
 }