npm - zeitlich - Versions diffs - 0.2.13 → 0.2.14 - Mend

zeitlich 0.2.13 → 0.2.14

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (135) hide show

package/README.md +49 -38
package/dist/adapters/sandbox/daytona/index.cjs +205 -0
package/dist/adapters/sandbox/daytona/index.cjs.map +1 -0
package/dist/adapters/sandbox/daytona/index.d.cts +86 -0
package/dist/adapters/sandbox/daytona/index.d.ts +86 -0
package/dist/adapters/sandbox/daytona/index.js +202 -0
package/dist/adapters/sandbox/daytona/index.js.map +1 -0
package/dist/adapters/sandbox/inmemory/index.cjs +174 -0
package/dist/adapters/sandbox/inmemory/index.cjs.map +1 -0
package/dist/adapters/sandbox/inmemory/index.d.cts +28 -0
package/dist/adapters/sandbox/inmemory/index.d.ts +28 -0
package/dist/adapters/sandbox/inmemory/index.js +172 -0
package/dist/adapters/sandbox/inmemory/index.js.map +1 -0
package/dist/adapters/sandbox/virtual/index.cjs +405 -0
package/dist/adapters/sandbox/virtual/index.cjs.map +1 -0
package/dist/adapters/sandbox/virtual/index.d.cts +85 -0
package/dist/adapters/sandbox/virtual/index.d.ts +85 -0
package/dist/adapters/sandbox/virtual/index.js +400 -0
package/dist/adapters/sandbox/virtual/index.js.map +1 -0
package/dist/adapters/thread/google-genai/index.cjs +284 -0
package/dist/adapters/thread/google-genai/index.cjs.map +1 -0
package/dist/adapters/thread/google-genai/index.d.cts +145 -0
package/dist/adapters/thread/google-genai/index.d.ts +145 -0
package/dist/adapters/thread/google-genai/index.js +278 -0
package/dist/adapters/thread/google-genai/index.js.map +1 -0
package/dist/adapters/{langchain → thread/langchain}/index.cjs +7 -9
package/dist/adapters/thread/langchain/index.cjs.map +1 -0
package/dist/adapters/{langchain → thread/langchain}/index.d.cts +17 -21
package/dist/adapters/{langchain → thread/langchain}/index.d.ts +17 -21
package/dist/adapters/{langchain → thread/langchain}/index.js +7 -9
package/dist/adapters/thread/langchain/index.js.map +1 -0
package/dist/index.cjs +816 -545
package/dist/index.cjs.map +1 -1
package/dist/index.d.cts +235 -74
package/dist/index.d.ts +235 -74
package/dist/index.js +804 -540
package/dist/index.js.map +1 -1
package/dist/types-B4C9txdq.d.ts +389 -0
package/dist/{thread-manager-qc0g5Rvd.d.cts → types-B9ljZewB.d.cts} +1 -6
package/dist/{thread-manager-qc0g5Rvd.d.ts → types-B9ljZewB.d.ts} +1 -6
package/dist/types-BMXzv7TN.d.cts +476 -0
package/dist/types-BMXzv7TN.d.ts +476 -0
package/dist/types-BVP87m_W.d.cts +121 -0
package/dist/types-CDubRtad.d.cts +115 -0
package/dist/types-CDubRtad.d.ts +115 -0
package/dist/types-CwwgQ_9H.d.ts +121 -0
package/dist/types-GpMU4b0w.d.cts +389 -0
package/dist/workflow.cjs +444 -318
package/dist/workflow.cjs.map +1 -1
package/dist/workflow.d.cts +271 -222
package/dist/workflow.d.ts +271 -222
package/dist/workflow.js +440 -316
package/dist/workflow.js.map +1 -1
package/package.json +59 -6
package/src/adapters/sandbox/daytona/filesystem.ts +136 -0
package/src/adapters/sandbox/daytona/index.ts +149 -0
package/src/adapters/sandbox/daytona/types.ts +34 -0
package/src/adapters/sandbox/inmemory/index.ts +213 -0
package/src/adapters/sandbox/virtual/filesystem.ts +345 -0
package/src/adapters/sandbox/virtual/index.ts +88 -0
package/src/adapters/sandbox/virtual/mutations.ts +38 -0
package/src/adapters/sandbox/virtual/provider.ts +101 -0
package/src/adapters/sandbox/virtual/tree.ts +82 -0
package/src/adapters/sandbox/virtual/types.ts +127 -0
package/src/adapters/sandbox/virtual/virtual-sandbox.test.ts +523 -0
package/src/adapters/sandbox/virtual/with-virtual-sandbox.ts +91 -0
package/src/adapters/thread/google-genai/activities.ts +121 -0
package/src/adapters/thread/google-genai/index.ts +41 -0
package/src/adapters/thread/google-genai/model-invoker.ts +154 -0
package/src/adapters/thread/google-genai/thread-manager.ts +169 -0
package/src/adapters/{langchain → thread/langchain}/activities.ts +11 -15
package/src/adapters/{langchain → thread/langchain}/index.ts +1 -1
package/src/adapters/{langchain → thread/langchain}/model-invoker.ts +15 -18
package/src/adapters/{langchain → thread/langchain}/thread-manager.ts +1 -1
package/src/index.ts +32 -24
package/src/lib/activity.ts +87 -0
package/src/lib/hooks/index.ts +11 -0
package/src/lib/hooks/types.ts +98 -0
package/src/lib/model/helpers.ts +6 -0
package/src/lib/model/index.ts +13 -0
package/src/lib/{model-invoker.ts → model/types.ts} +18 -1
package/src/lib/sandbox/index.ts +19 -0
package/src/lib/sandbox/manager.ts +76 -0
package/src/lib/sandbox/sandbox.test.ts +158 -0
package/src/lib/{fs.ts → sandbox/tree.ts} +6 -6
package/src/lib/sandbox/types.ts +164 -0
package/src/lib/session/index.ts +11 -0
package/src/lib/{session.ts → session/session.ts} +76 -48
package/src/lib/session/types.ts +93 -0
package/src/lib/skills/fs-provider.ts +16 -15
package/src/lib/skills/handler.ts +31 -0
package/src/lib/skills/index.ts +5 -1
package/src/lib/skills/register.ts +20 -0
package/src/lib/skills/tool.ts +47 -0
package/src/lib/state/index.ts +9 -0
package/src/lib/{state-manager.ts → state/manager.ts} +10 -147
package/src/lib/state/types.ts +134 -0
package/src/lib/subagent/define.ts +71 -0
package/src/lib/subagent/handler.ts +99 -0
package/src/lib/subagent/index.ts +13 -0
package/src/lib/subagent/register.ts +53 -0
package/src/lib/subagent/tool.ts +80 -0
package/src/lib/subagent/types.ts +92 -0
package/src/lib/thread/index.ts +7 -0
package/src/lib/{thread-manager.ts → thread/manager.ts} +1 -33
package/src/lib/thread/types.ts +33 -0
package/src/lib/tool-router/auto-append.ts +55 -0
package/src/lib/tool-router/index.ts +41 -0
package/src/lib/tool-router/router.ts +462 -0
package/src/lib/tool-router/types.ts +478 -0
package/src/lib/tool-router/with-sandbox.ts +70 -0
package/src/lib/types.ts +5 -382
package/src/tools/bash/bash.test.ts +53 -55
package/src/tools/bash/handler.ts +23 -51
package/src/tools/edit/handler.ts +67 -81
package/src/tools/glob/handler.ts +60 -17
package/src/tools/read-file/handler.ts +67 -0
package/src/tools/read-skill/handler.ts +1 -31
package/src/tools/read-skill/tool.ts +5 -47
package/src/tools/subagent/handler.ts +1 -100
package/src/tools/subagent/tool.ts +5 -93
package/src/tools/task-create/handler.ts +1 -1
package/src/tools/task-get/handler.ts +1 -1
package/src/tools/task-list/handler.ts +1 -1
package/src/tools/task-update/handler.ts +1 -1
package/src/tools/write-file/handler.ts +47 -0
package/src/workflow.ts +88 -47
package/tsup.config.ts +8 -1
package/dist/adapters/langchain/index.cjs.map +0 -1
package/dist/adapters/langchain/index.js.map +0 -1
package/dist/model-invoker-y_zlyMqu.d.cts +0 -892
package/dist/model-invoker-y_zlyMqu.d.ts +0 -892
package/src/lib/tool-router.ts +0 -977
package/src/lib/workflow-helpers.ts +0 -50
/package/src/lib/{thread-id.ts → thread/id.ts} +0 -0

package/src/lib/types.ts CHANGED Viewed

@@ -1,16 +1,3 @@
-import type {
-  InferToolResults,
-  ParsedToolCallUnion,
-  RawToolCall,
-  ToolCallResultUnion,
-  ToolHandlerResponse,
-  ToolMap,
-} from "./tool-router";
-import type { Skill } from "./skills/types";
-import type { Duration } from "@temporalio/common";
-import type { z } from "zod";
 // ============================================================================
 // Framework-agnostic message types
 // ============================================================================
@@ -24,6 +11,10 @@ export type MessageContent = string | ContentPart[];
 /** Content returned by a tool handler */
 export type ToolMessageContent = MessageContent;
+// ============================================================================
+// Agent core types
+// ============================================================================
 /**
  * Agent execution status
  */
@@ -74,33 +65,6 @@ export interface TokenUsage {
   reasonTokens?: number;
 }
-/**
- * Agent response from LLM invocation
- */
-export interface AgentResponse<M = unknown> {
-  message: M;
-  rawToolCalls: RawToolCall[];
-  usage?: TokenUsage;
-}
-/**
- * Thread operations required by a session.
- * Consumers provide these — typically by wrapping Temporal activities.
- */
-export interface ThreadOps {
-  /** Initialize an empty thread */
-  initializeThread(threadId: string): Promise<void>;
-  /** Append a human message to the thread */
-  appendHumanMessage(
-    threadId: string,
-    content: string | MessageContent
-  ): Promise<void>;
-  /** Append a tool result to the thread */
-  appendToolResult(config: ToolResultConfig): Promise<void>;
-  /** Append a system message to the thread */
-  appendSystemMessage(threadId: string, content: string): Promise<void>;
-}
 /**
  * Configuration for a Zeitlich agent
  */
@@ -111,43 +75,6 @@ export interface AgentConfig {
   description?: string;
 }
-/**
- * Configuration for a Zeitlich agent session
- */
-export interface SessionConfig<T extends ToolMap, M = unknown> {
-  /** The thread ID to use for the session (defaults to a short generated ID) */
-  threadId?: string;
-  /** Metadata for the session */
-  metadata?: Record<string, unknown>;
-  /** Whether to append the system prompt as message to the thread */
-  appendSystemPrompt?: boolean;
-  /** How many turns to run the session for */
-  maxTurns?: number;
-  /** Workflow-specific runAgent activity (with tools pre-bound) */
-  runAgent: RunAgentActivity<M>;
-  /** Thread operations (initialize, append messages, parse tool calls) */
-  threadOps?: ThreadOps;
-  /** Tool router for processing tool calls (optional if agent has no tools) */
-  tools?: T;
-  /** Subagent configurations */
-  subagents?: SubagentConfig[];
-  /** Skills available to this agent (metadata + instructions, loaded activity-side) */
-  skills?: Skill[];
-  /** Session lifecycle hooks */
-  hooks?: Hooks<T, ToolCallResultUnion<InferToolResults<T>>>;
-  /** Whether to process tools in parallel */
-  processToolsInParallel?: boolean;
-  /**
-   * Build context message content from agent-specific context.
-   * Returns MessageContent array for the initial HumanMessage.
-   */
-  buildContextMessage: () => MessageContent | Promise<MessageContent>;
-  /** When true, skip thread initialization and system prompt — append only the new human message to the existing thread. */
-  continueThread?: boolean;
-  /** How long to wait for input before cancelling the workflow */
-  waitForInputTimeout?: Duration;
-}
 /**
  * A JSON-serializable tool definition for state storage.
  * Uses a plain JSON Schema object instead of a live Zod instance,
@@ -171,13 +98,6 @@ export interface RunAgentConfig extends AgentConfig {
   metadata?: Record<string, unknown>;
 }
-/**
- * Type signature for workflow-specific runAgent activity
- */
-export type RunAgentActivity<M = unknown> = (
-  config: RunAgentConfig
-) => Promise<AgentResponse<M>>;
 /**
  * Configuration for appending a tool result
  */
@@ -190,84 +110,6 @@ export interface ToolResultConfig {
   content: ToolMessageContent;
 }
-// ============================================================================
-// Subagent Configuration
-// ============================================================================
-export type SubagentWorkflow<TResult extends z.ZodType = z.ZodType> = (
-  input: SubagentInput
-) => Promise<ToolHandlerResponse<z.infer<TResult> | null>>;
-/** Infer the z.infer'd result type from a SubagentConfig, or null if no schema */
-export type InferSubagentResult<T extends SubagentConfig> =
-  T extends SubagentConfig<infer S> ? z.infer<S> : null;
-/**
- * Configuration for a subagent that can be spawned by the parent workflow.
- *
- * @template TResult - Zod schema type for validating the child workflow's result
- */
-export interface SubagentConfig<TResult extends z.ZodType = z.ZodType> {
-  /** Identifier used in Task tool's subagent parameter */
-  agentName: string;
-  /** Description shown to the parent agent explaining what this subagent does */
-  description: string;
-  /** Whether this subagent is available (default: true). Disabled subagents are excluded from the Subagent tool. */
-  enabled?: boolean;
-  /** Temporal workflow function or type name (used with executeChild) */
-  workflow: string | SubagentWorkflow<TResult>;
-  /** Optional task queue - defaults to parent's queue if not specified */
-  taskQueue?: string;
-  /** Optional Zod schema to validate the child workflow's result. If omitted, result is passed through as-is. */
-  resultSchema?: TResult;
-  /** Optional static context passed to the subagent on every invocation */
-  context?: Record<string, unknown>;
-  /** Allow the parent agent to pass a threadId for this subagent to continue (default: false) */
-  allowThreadContinuation?: boolean;
-  /** Per-subagent lifecycle hooks */
-  hooks?: SubagentHooks;
-}
-/**
- * Per-subagent lifecycle hooks - defined on a SubagentConfig.
- * Runs in addition to global hooks (global pre → subagent pre → execute → subagent post → global post).
- */
-export interface SubagentHooks<TArgs = unknown, TResult = unknown> {
-  /** Called before this subagent executes - can skip or modify args */
-  onPreExecution?: (ctx: {
-    args: TArgs;
-    threadId: string;
-    turn: number;
-  }) => PreToolUseHookResult | Promise<PreToolUseHookResult>;
-  /** Called after this subagent executes successfully */
-  onPostExecution?: (ctx: {
-    args: TArgs;
-    result: TResult;
-    threadId: string;
-    turn: number;
-    durationMs: number;
-  }) => void | Promise<void>;
-  /** Called when this subagent execution fails */
-  onExecutionFailure?: (ctx: {
-    args: TArgs;
-    error: Error;
-    threadId: string;
-    turn: number;
-  }) => PostToolUseFailureHookResult | Promise<PostToolUseFailureHookResult>;
-}
-/**
- * Input passed to child workflows when spawned as subagents
- */
-export interface SubagentInput {
-  /** The prompt/task from the parent agent */
-  prompt: string;
-  /** Optional context parameters passed from the parent agent */
-  context?: Record<string, unknown>;
-  /** When set, the subagent should continue this thread instead of starting a new one */
-  threadId?: string;
-}
 // ============================================================================
 // Workflow Tasks
 // ============================================================================
@@ -300,7 +142,7 @@ export interface WorkflowTask {
 }
 // ============================================================================
-// Session Lifecycle Hooks
+// Session exit
 // ============================================================================
 /**
@@ -313,225 +155,6 @@ export type SessionExitReason =
   | "failed"
   | "cancelled";
-/**
- * Context for PreToolUse hook - called before tool execution
- */
-export interface PreToolUseHookContext<T extends ToolMap> {
-  /** The tool call about to be executed */
-  toolCall: ParsedToolCallUnion<T>;
-  /** Thread identifier */
-  threadId: string;
-  /** Current turn number */
-  turn: number;
-}
-/**
- * Result from PreToolUse hook - can block or modify execution
- */
-export interface PreToolUseHookResult {
-  /** Skip this tool call entirely */
-  skip?: boolean;
-  /** Modified args to use instead (must match schema) */
-  modifiedArgs?: unknown;
-}
-/**
- * PreToolUse hook - called before tool execution, can block or modify
- */
-export type PreToolUseHook<T extends ToolMap> = (
-  ctx: PreToolUseHookContext<T>
-) => PreToolUseHookResult | Promise<PreToolUseHookResult>;
-/**
- * Context for PostToolUse hook - called after successful tool execution
- */
-export interface PostToolUseHookContext<T extends ToolMap, TResult = unknown> {
-  /** The tool call that was executed */
-  toolCall: ParsedToolCallUnion<T>;
-  /** The result from the tool handler */
-  result: TResult;
-  /** Thread identifier */
-  threadId: string;
-  /** Current turn number */
-  turn: number;
-  /** Execution duration in milliseconds */
-  durationMs: number;
-}
-/**
- * PostToolUse hook - called after successful tool execution
- */
-export type PostToolUseHook<T extends ToolMap, TResult = unknown> = (
-  ctx: PostToolUseHookContext<T, TResult>
-) => void | Promise<void>;
-/**
- * Context for PostToolUseFailure hook - called when tool execution fails
- */
-export interface PostToolUseFailureHookContext<T extends ToolMap> {
-  /** The tool call that failed */
-  toolCall: ParsedToolCallUnion<T>;
-  /** The error that occurred */
-  error: Error;
-  /** Thread identifier */
-  threadId: string;
-  /** Current turn number */
-  turn: number;
-}
-/**
- * Result from PostToolUseFailure hook - can recover from errors
- */
-export interface PostToolUseFailureHookResult {
-  /** Provide a fallback result instead of throwing */
-  fallbackContent?: ToolMessageContent;
-  /** Whether to suppress the error (still logs, but continues) */
-  suppress?: boolean;
-}
-/**
- * PostToolUseFailure hook - called when tool execution fails
- */
-export type PostToolUseFailureHook<T extends ToolMap> = (
-  ctx: PostToolUseFailureHookContext<T>
-) => PostToolUseFailureHookResult | Promise<PostToolUseFailureHookResult>;
-/**
- * Context for SessionStart hook - called when session begins
- */
-export interface SessionStartHookContext {
-  /** Thread identifier */
-  threadId: string;
-  /** Name of the agent */
-  agentName: string;
-  /** Session metadata */
-  metadata: Record<string, unknown>;
-}
-/**
- * SessionStart hook - called when session begins
- */
-export type SessionStartHook = (
-  ctx: SessionStartHookContext
-) => void | Promise<void>;
-/**
- * Context for PreHumanMessageAppend hook - called before each human message is appended to the thread
- */
-export interface PreHumanMessageAppendHookContext {
-  /** The message about to be appended */
-  message: MessageContent;
-  /** Thread identifier */
-  threadId: string;
-}
-/**
- * PreHumanMessageAppend hook - called before each human message is appended to the thread
- */
-export type PreHumanMessageAppendHook = (
-  ctx: PreHumanMessageAppendHookContext
-) => void | Promise<void>;
-/**
- * PostHumanMessageAppend hook - called after each human message is appended to the thread
- */
-export type PostHumanMessageAppendHook = (
-  ctx: PostHumanMessageAppendHookContext
-) => void | Promise<void>;
-/**
- * Context for PostHumanMessageAppend hook - called after each human message is appended to the thread
- */
-export interface PostHumanMessageAppendHookContext {
-  /** The message that was appended */
-  message: MessageContent;
-  /** Thread identifier */
-  threadId: string;
-}
-/**
- * Context for SessionEnd hook - called when session ends
- */
-export interface SessionEndHookContext {
-  /** Thread identifier */
-  threadId: string;
-  /** Name of the agent */
-  agentName: string;
-  /** Reason the session ended */
-  exitReason: SessionExitReason;
-  /** Total turns executed */
-  turns: number;
-  /** Session metadata */
-  metadata: Record<string, unknown>;
-}
-/**
- * SessionEnd hook - called when session ends
- */
-export type SessionEndHook = (
-  ctx: SessionEndHookContext
-) => void | Promise<void>;
-/**
- * Per-tool lifecycle hooks - defined directly on a tool definition.
- * Runs in addition to global hooks (global pre → tool pre → execute → tool post → global post).
- */
-export interface ToolHooks<TArgs = unknown, TResult = unknown> {
-  /** Called before this tool executes - can skip or modify args */
-  onPreToolUse?: (ctx: {
-    args: TArgs;
-    threadId: string;
-    turn: number;
-  }) => PreToolUseHookResult | Promise<PreToolUseHookResult>;
-  /** Called after this tool executes successfully */
-  onPostToolUse?: (ctx: {
-    args: TArgs;
-    result: TResult;
-    threadId: string;
-    turn: number;
-    durationMs: number;
-  }) => void | Promise<void>;
-  /** Called when this tool execution fails */
-  onPostToolUseFailure?: (ctx: {
-    args: TArgs;
-    error: Error;
-    threadId: string;
-    turn: number;
-  }) => PostToolUseFailureHookResult | Promise<PostToolUseFailureHookResult>;
-}
-/**
- * Combined hooks interface for session lifecycle
- */
-export interface Hooks<T extends ToolMap, TResult = unknown> {
-  /** Called before each human message is appended to the thread */
-  onPreHumanMessageAppend?: PreHumanMessageAppendHook;
-  /** Called after each human message is appended to the thread */
-  onPostHumanMessageAppend?: PostHumanMessageAppendHook;
-  /** Called before each tool execution - can block or modify */
-  onPreToolUse?: PreToolUseHook<T>;
-  /** Called after each successful tool execution */
-  onPostToolUse?: PostToolUseHook<T, TResult>;
-  /** Called when tool execution fails */
-  onPostToolUseFailure?: PostToolUseFailureHook<T>;
-  /** Called when session starts */
-  onSessionStart?: SessionStartHook;
-  /** Called when session ends */
-  onSessionEnd?: SessionEndHook;
-}
-// ============================================================================
-// Agent Query/Update Name Helpers
-// ============================================================================
-/** Derives the query name for an agent's state (usable in both workflow and activity code) */
-export const agentQueryName = (agentName: string) =>
-  `get${agentName}State` as const;
-/** Derives the update name for waiting on an agent's state change */
-export const agentStateChangeUpdateName = (agentName: string) =>
-  `waitFor${agentName}StateChange` as const;
 /**
  * Helper to check if status is terminal
  */

package/src/tools/bash/bash.test.ts CHANGED Viewed

@@ -1,18 +1,35 @@
-import { dirname } from "path";
-import { fileURLToPath } from "url";
-import { describe, expect, it } from "vitest";
-import { createBashHandler } from "./handler";
-import { OverlayFs } from "just-bash";
+import { describe, expect, it, beforeEach } from "vitest";
+import { bashHandler } from "./handler";
+import { withSandbox } from "../../lib/tool-router/with-sandbox";
+import { SandboxManager } from "../../lib/sandbox/manager";
+import { InMemorySandboxProvider } from "../../adapters/sandbox/inmemory/index";
+import type { RouterContext } from "../../lib/tool-router/types";
-const __dirname = dirname(fileURLToPath(import.meta.url));
+describe("bash handler with sandbox", () => {
+  let manager: SandboxManager;
+  let sandboxId: string;
+  let handler: ReturnType<typeof withSandbox<Parameters<typeof bashHandler>[0], Awaited<ReturnType<typeof bashHandler>>["data"]>>;
-describe("bash with default options", () => {
-  const fs = new OverlayFs({ root: __dirname, mountPoint: "/home/user" });
+  beforeEach(async () => {
+    manager = new SandboxManager(new InMemorySandboxProvider());
+    const result = await manager.create({
+      initialFiles: { "/home/user/hello.txt": "world" },
+    });
+    sandboxId = result.sandboxId;
+    handler = withSandbox(manager, bashHandler);
+  });
+  const ctx = (id: string): RouterContext => ({
+    sandboxId: id,
+    threadId: "test-thread",
+    toolCallId: "test-call",
+    toolName: "Bash",
+  });
   it("executes echo and captures stdout", async () => {
-    const { data } = await createBashHandler({fs})(
+    const { data } = await handler(
       { command: "echo 'hello world'" },
-      {}
+      ctx(sandboxId)
     );
     expect(data).not.toBeNull();
     expect(data?.stdout.trim()).toBe("hello world");
@@ -20,85 +37,66 @@ describe("bash with default options", () => {
   });
   it("returns exit code 0 for successful commands", async () => {
-    const { data } = await createBashHandler({fs})({ command: "true" }, {});
+    const { data } = await handler({ command: "true" }, ctx(sandboxId));
     expect(data?.exitCode).toBe(0);
   });
   it("returns non-zero exit code for failed commands", async () => {
-    const { data } = await createBashHandler({fs})({ command: "false" }, {});
+    const { data } = await handler({ command: "false" }, ctx(sandboxId));
     expect(data?.exitCode).toBe(1);
   });
   it("captures stderr output", async () => {
-    const { data } = await createBashHandler({fs})(
+    const { data } = await handler(
       { command: "echo 'error message' >&2" },
-      {}
+      ctx(sandboxId)
     );
     expect(data?.stderr.trim()).toBe("error message");
     expect(data?.stdout.trim()).toBe("");
   });
   it("supports piping between commands", async () => {
-    const { data } = await createBashHandler({fs})(
+    const { data } = await handler(
       { command: "echo 'hello world' | tr 'a-z' 'A-Z'" },
-      {}
+      ctx(sandboxId)
     );
     expect(data?.stdout.trim()).toBe("HELLO WORLD");
   });
   it("supports command chaining with &&", async () => {
-    const { data } = await createBashHandler({fs})(
+    const { data } = await handler(
       { command: "echo 'first' && echo 'second'" },
-      {}
+      ctx(sandboxId)
     );
     expect(data?.stdout).toContain("first");
     expect(data?.stdout).toContain("second");
   });
-  it("handles multi-line output", async () => {
-    const { data } = await createBashHandler({fs})(
-      { command: "printf 'line1\\nline2\\nline3'" },
-      {}
-    );
-    const lines = data?.stdout.split("\n");
-    expect(lines).toHaveLength(3);
-    expect(lines?.[0]).toBe("line1");
-    expect(lines?.[2]).toBe("line3");
-  });
-  it("handles commands with arguments and flags", async () => {
-    const { data } = await createBashHandler({fs})(
-      { command: "echo -n 'no newline'" },
-      {}
-    );
-    expect(data?.stdout).toBe("no newline");
-  });
-  it("supports command substitution", async () => {
-    const { data } = await createBashHandler({fs})(
-      { command: "echo \"count: $(echo 'a b c' | wc -w | tr -d ' ')\"" },
-      {}
-    );
-    expect(data?.stdout.trim()).toBe("count: 3");
-  });
   it("returns toolResponse string with formatted output", async () => {
-    const { toolResponse } = await createBashHandler({fs})(
+    const { toolResponse } = await handler(
       { command: "echo 'test'" },
-      {}
+      ctx(sandboxId)
     );
     expect(toolResponse).toContain("Exit code: 0");
     expect(toolResponse).toContain("stdout:");
     expect(toolResponse).toContain("test");
   });
-});
-describe("bash with overlay filesystem", () => {
-  it("sees files in the current directory", async () => {
-    const fs = new OverlayFs({ root: __dirname, mountPoint: "/home/user" });
-    const { data } = await createBashHandler({fs})({ command: "ls" }, {});
-    expect(data?.stdout).toContain("bash.test.ts");
-    expect(data?.stdout).toContain("handler.ts");
-    expect(data?.stdout).toContain("tool.ts");
+  it("returns error when no sandboxId in context", async () => {
+    const { toolResponse, data } = await handler({ command: "echo hi" }, {
+      threadId: "test-thread",
+      toolCallId: "test-call",
+      toolName: "Bash",
+    });
+    expect(toolResponse).toContain("No sandbox configured");
+    expect(data).toBeNull();
+  });
+  it("can read files from the sandbox filesystem", async () => {
+    const { data } = await handler(
+      { command: "cat /home/user/hello.txt" },
+      ctx(sandboxId)
+    );
+    expect(data?.stdout).toBe("world");
   });
 });

package/src/tools/bash/handler.ts CHANGED Viewed

@@ -1,58 +1,30 @@
 import type { ActivityToolHandler } from "../../lib/tool-router";
+import type { SandboxContext } from "../../lib/tool-router/with-sandbox";
 import type { BashArgs } from "./tool";
-import { Bash, type BashOptions } from "just-bash";
-type BashExecOut = {
-  exitCode: number;
-  stderr: string;
-  stdout: string;
-};
-/** BashOptions with `fs` required */
-type BashToolOptions = Required<Pick<BashOptions, "fs">> & Omit<BashOptions, "fs">;
+import type { ExecResult } from "../../lib/sandbox/types";
 /**
- * Creates a Bash tool handler that executes shell commands in a sandboxed environment.
+ * Bash tool handler — executes shell commands inside a {@link Sandbox}.
  *
- * @param bashOptions - Options including a required `fs` (file system implementation from `just-bash`)
- * @returns Activity tool handler for Bash tool calls
- *
- * @example
- * ```typescript
- * import { createBashHandler } from 'zeitlich';
- *
- * const bashHandlerActivity = createBashHandler({ fs: inMemoryFileSystem });
- * ```
+ * Wrap with {@link withSandbox} at activity registration time to inject the
+ * sandbox automatically.
  */
-export const createBashHandler: (
-    bashOptions: BashToolOptions,
-) => ActivityToolHandler<BashArgs, BashExecOut | null> =
-  (bashOptions: BashToolOptions) => async (args: BashArgs, _context) => {
-    const { command } = args;
-    const mergedOptions: BashOptions = {
-      ...bashOptions,
-      executionLimits: {
-        maxStringLength: 52428800, // 50MB default
-        ...bashOptions.executionLimits,
-      },
+export const bashHandler: ActivityToolHandler<
+  BashArgs,
+  ExecResult | null,
+  SandboxContext
+> = async (args, { sandbox }) => {
+  try {
+    const result = await sandbox.exec(args.command);
+    return {
+      toolResponse: `Exit code: ${result.exitCode}\n\nstdout:\n${result.stdout}\n\nstderr:\n${result.stderr}`,
+      data: result,
     };
-    const bash = new Bash(mergedOptions);
-    try {
-      const { exitCode, stderr, stdout } = await bash.exec(command);
-      const bashExecOut = { exitCode, stderr, stdout };
-      return {
-        toolResponse: `Exit code: ${exitCode}\n\nstdout:\n${stdout}\n\nstderr:\n${stderr}`,
-        data: bashExecOut,
-      };
-    } catch (error) {
-      const err = error instanceof Error ? error : new Error("Unknown error");
-      return {
-        toolResponse: `Error executing bash command: ${err.message}`,
-        data: null,
-      };
-    }
-  };
+  } catch (error) {
+    const err = error instanceof Error ? error : new Error("Unknown error");
+    return {
+      toolResponse: `Error executing bash command: ${err.message}`,
+      data: null,
+    };
+  }
+};