npm - zeitlich - Versions diffs - 0.2.45 → 0.2.47 - Mend

zeitlich 0.2.45 → 0.2.47

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (109) hide show

package/README.md +137 -11
package/dist/{activities-Coafq5zr.d.cts → activities-CPwKoUlD.d.cts} +22 -2
package/dist/{activities-CrN-ghLo.d.ts → activities-DlaBxNID.d.ts} +22 -2
package/dist/adapters/thread/anthropic/index.cjs +276 -71
package/dist/adapters/thread/anthropic/index.cjs.map +1 -1
package/dist/adapters/thread/anthropic/index.d.cts +62 -8
package/dist/adapters/thread/anthropic/index.d.ts +62 -8
package/dist/adapters/thread/anthropic/index.js +275 -72
package/dist/adapters/thread/anthropic/index.js.map +1 -1
package/dist/adapters/thread/anthropic/workflow.cjs +38 -20
package/dist/adapters/thread/anthropic/workflow.cjs.map +1 -1
package/dist/adapters/thread/anthropic/workflow.d.cts +5 -4
package/dist/adapters/thread/anthropic/workflow.d.ts +5 -4
package/dist/adapters/thread/anthropic/workflow.js +38 -20
package/dist/adapters/thread/anthropic/workflow.js.map +1 -1
package/dist/adapters/thread/google-genai/index.cjs +171 -69
package/dist/adapters/thread/google-genai/index.cjs.map +1 -1
package/dist/adapters/thread/google-genai/index.d.cts +6 -4
package/dist/adapters/thread/google-genai/index.d.ts +6 -4
package/dist/adapters/thread/google-genai/index.js +171 -69
package/dist/adapters/thread/google-genai/index.js.map +1 -1
package/dist/adapters/thread/google-genai/workflow.cjs +38 -20
package/dist/adapters/thread/google-genai/workflow.cjs.map +1 -1
package/dist/adapters/thread/google-genai/workflow.d.cts +7 -4
package/dist/adapters/thread/google-genai/workflow.d.ts +7 -4
package/dist/adapters/thread/google-genai/workflow.js +38 -20
package/dist/adapters/thread/google-genai/workflow.js.map +1 -1
package/dist/adapters/thread/langchain/index.cjs +170 -66
package/dist/adapters/thread/langchain/index.cjs.map +1 -1
package/dist/adapters/thread/langchain/index.d.cts +19 -4
package/dist/adapters/thread/langchain/index.d.ts +19 -4
package/dist/adapters/thread/langchain/index.js +170 -66
package/dist/adapters/thread/langchain/index.js.map +1 -1
package/dist/adapters/thread/langchain/workflow.cjs +38 -20
package/dist/adapters/thread/langchain/workflow.cjs.map +1 -1
package/dist/adapters/thread/langchain/workflow.d.cts +5 -4
package/dist/adapters/thread/langchain/workflow.d.ts +5 -4
package/dist/adapters/thread/langchain/workflow.js +38 -20
package/dist/adapters/thread/langchain/workflow.js.map +1 -1
package/dist/cold-store-BDgJpwLI.d.ts +114 -0
package/dist/cold-store-Z2wvK2cV.d.cts +114 -0
package/dist/index.cjs +440 -67
package/dist/index.cjs.map +1 -1
package/dist/index.d.cts +150 -8
package/dist/index.d.ts +150 -8
package/dist/index.js +432 -68
package/dist/index.js.map +1 -1
package/dist/proxy-CDh3Rsa7.d.cts +40 -0
package/dist/proxy-Du8ggERu.d.ts +40 -0
package/dist/{thread-manager-wRVVBFgj.d.cts → thread-manager-BjoYYXgd.d.cts} +8 -2
package/dist/{thread-manager-BsLO3Fgc.d.cts → thread-manager-D8zKNFZ9.d.cts} +8 -2
package/dist/{thread-manager-Bi1XlbpJ.d.ts → thread-manager-DtHYws2F.d.ts} +8 -2
package/dist/{thread-manager-BhkOyQ1I.d.ts → thread-manager-Dw96FKH1.d.ts} +8 -2
package/dist/{types-C66-BVBr.d.cts → types-BMJrsHo0.d.cts} +17 -1
package/dist/{types-BkX4HLzi.d.ts → types-CtdOquo3.d.ts} +17 -1
package/dist/{types-CdALEF3z.d.cts → types-DNEl5uxQ.d.cts} +38 -0
package/dist/{types-ChAy_jSP.d.ts → types-qQVZfhoT.d.ts} +38 -0
package/dist/{workflow-DMmiaw6w.d.cts → workflow-BH9ImDGq.d.cts} +48 -2
package/dist/{workflow-BwT5EybR.d.ts → workflow-Cdw3-RNB.d.ts} +48 -2
package/dist/workflow.cjs +47 -4
package/dist/workflow.cjs.map +1 -1
package/dist/workflow.d.cts +2 -2
package/dist/workflow.d.ts +2 -2
package/dist/workflow.js +47 -5
package/dist/workflow.js.map +1 -1
package/package.json +14 -3
package/src/adapters/thread/anthropic/activities.ts +82 -39
package/src/adapters/thread/anthropic/index.ts +8 -0
package/src/adapters/thread/anthropic/model-invoker.test.ts +110 -0
package/src/adapters/thread/anthropic/model-invoker.ts +26 -5
package/src/adapters/thread/anthropic/prompt-cache.test.ts +134 -0
package/src/adapters/thread/anthropic/prompt-cache.ts +163 -0
package/src/adapters/thread/anthropic/proxy.ts +1 -0
package/src/adapters/thread/anthropic/thread-manager.ts +9 -1
package/src/adapters/thread/google-genai/activities.ts +64 -40
package/src/adapters/thread/google-genai/proxy.ts +1 -0
package/src/adapters/thread/google-genai/thread-manager.ts +9 -1
package/src/adapters/thread/langchain/activities.ts +63 -36
package/src/adapters/thread/langchain/proxy.ts +1 -0
package/src/adapters/thread/langchain/thread-manager.ts +9 -1
package/src/index.ts +21 -2
package/src/lib/session/session-edge-cases.integration.test.ts +12 -0
package/src/lib/session/session.integration.test.ts +138 -0
package/src/lib/session/session.ts +29 -0
package/src/lib/session/types.ts +22 -0
package/src/lib/subagent/define.ts +1 -0
package/src/lib/subagent/handler.ts +11 -2
package/src/lib/subagent/subagent.integration.test.ts +139 -0
package/src/lib/subagent/types.ts +16 -0
package/src/lib/thread/cold-store.test.ts +221 -0
package/src/lib/thread/cold-store.ts +269 -0
package/src/lib/thread/index.ts +32 -0
package/src/lib/thread/keys.ts +20 -0
package/src/lib/thread/manager.ts +16 -27
package/src/lib/thread/proxy.ts +79 -27
package/src/lib/thread/snapshot.test.ts +443 -0
package/src/lib/thread/snapshot.ts +163 -0
package/src/lib/thread/test-utils.ts +228 -0
package/src/lib/thread/tiered.test.ts +281 -0
package/src/lib/thread/tiered.ts +135 -0
package/src/lib/thread/types.ts +16 -0
package/src/tools/edit/handler.test.ts +177 -0
package/src/tools/edit/handler.ts +249 -47
package/src/tools/edit/tool.ts +40 -0
package/src/tools/task-create/handler.ts +1 -1
package/src/tools/task-update/handler.ts +1 -1
package/src/workflow.ts +2 -2
package/dist/proxy-Bf7uI-Hw.d.cts +0 -24
package/dist/proxy-COqA95FW.d.ts +0 -24

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "zeitlich",
-  "version": "0.2.45",
+  "version": "0.2.47",
   "description": "[EXPERIMENTAL] An opinionated AI agent implementation for Temporal",
   "main": "./dist/index.js",
   "module": "./dist/index.js",
@@ -181,7 +181,8 @@
     "release:pr:dry": "release-please release-pr --repo-url=bead-ai/zeitlich --token=$GITHUB_TOKEN --dry-run",
     "release:github": "release-please github-release --repo-url=bead-ai/zeitlich --token=$GITHUB_TOKEN",
     "release:npm": "npm publish --access public",
-    "release:publish": "npm run release:github && npm run release:npm"
+    "release:publish": "npm run release:github && npm run release:npm",
+    "eval:edit": "node scripts/run-edit-tool-evals.mjs"
   },
   "keywords": [
     "ai",
@@ -200,7 +201,9 @@
     "node": ">=18"
   },
   "devDependencies": {
-    "@anthropic-ai/sdk": "^0.93.0",
+    "@anthropic-ai/sdk": "^0.98.0",
+    "@aws-sdk/client-s3": "^3.1000.0",
+    "@aws-sdk/lib-storage": "^3.1000.0",
     "@daytonaio/sdk": "^0.171.0",
     "@e2b/code-interpreter": "^2.3.3",
     "@eslint/js": "^10.0.1",
@@ -223,6 +226,8 @@
   },
   "peerDependencies": {
     "@anthropic-ai/sdk": ">=0.50.0",
+    "@aws-sdk/client-s3": ">=3.700.0",
+    "@aws-sdk/lib-storage": ">=3.700.0",
     "@daytonaio/sdk": ">=0.153.0",
     "@e2b/code-interpreter": "^2.3.3",
     "@google/genai": "^1.43.0",
@@ -241,6 +246,12 @@
     "@anthropic-ai/sdk": {
       "optional": true
     },
+    "@aws-sdk/client-s3": {
+      "optional": true
+    },
+    "@aws-sdk/lib-storage": {
+      "optional": true
+    },
     "@google/genai": {
       "optional": true
     },

package/src/adapters/thread/anthropic/activities.ts CHANGED Viewed

@@ -13,16 +13,21 @@ import type {
   ScopedPrefix,
 } from "../../../lib/session/types";
 import type { ModelInvoker } from "../../../lib/model";
+import { createTieredThreadManager } from "../../../lib/thread/tiered";
+import type { ColdThreadStore } from "../../../lib/thread/cold-store";
 import {
   createAnthropicThreadManager,
+  storedMessageId,
   type AnthropicContent,
   type AnthropicSystemContent,
   type AnthropicThreadManagerHooks,
+  type StoredMessage,
 } from "./thread-manager";
 import {
   createAnthropicModelInvoker,
   type AnthropicModelInvokerConfig,
 } from "./model-invoker";
+import type { AnthropicPromptCacheConfig } from "./prompt-cache";
 import { ADAPTER_ID } from "./adapter-id";
 export type AnthropicThreadOps<TScope extends string = ""> = PrefixedThreadOps<
@@ -37,7 +42,26 @@ export interface AnthropicAdapterConfig {
   model?: string;
   /** Maximum tokens to generate. Defaults to 16384. */
   maxTokens?: number;
+  /**
+   * Controls Anthropic/Bedrock-compatible prompt caching. Defaults to enabled
+   * with an explicit 5 minute TTL. Set to `false` to disable.
+   */
+  promptCache?: AnthropicPromptCacheConfig;
   hooks?: AnthropicThreadManagerHooks;
+  /**
+   * Optional durable cold tier (e.g. S3, R2, GCS). When provided,
+   * the session will hydrate the thread from cold storage on entry
+   * (`continue`/`fork` modes) and flush it back on every exit path.
+   * When omitted, the adapter is Redis-only and `hydrateThread`/
+   * `flushThread` activities are no-ops.
+   */
+  coldStore?: ColdThreadStore;
+  /**
+   * Override the default Redis TTL (90 days) for thread keys. When
+   * pairing the adapter with a `coldStore`, a shorter TTL (hours)
+   * is typically more appropriate.
+   */
+  ttlSeconds?: number;
 }
 /**
@@ -58,7 +82,8 @@ export interface AnthropicAdapter {
   /** Create an invoker for a specific model name (for multi-model setups) */
   createModelInvoker(
     model: string,
-    maxTokens?: number
+    maxTokens?: number,
+    promptCache?: AnthropicPromptCacheConfig
   ): ModelInvoker<Anthropic.Messages.Message>;
   /**
    * Create prefixed thread activities for registration on the worker.
@@ -135,16 +160,41 @@ export function createAnthropicAdapter(
 ): AnthropicAdapter {
   const { redis, client } = config;
+  /**
+   * Common per-call config plumbed into both the provider thread
+   * manager (for message I/O) and the tiered base manager (for
+   * hot↔cold lifecycle ops). Keeping them in lockstep means a single
+   * `coldStore` / `ttlSeconds` configuration controls every Redis
+   * write the adapter does.
+   */
+  const baseExtras = {
+    ...(config.ttlSeconds !== undefined && { ttlSeconds: config.ttlSeconds }),
+  };
+  const makeProviderThread = (threadId: string, threadKey?: string) =>
+    createAnthropicThreadManager({
+      redis,
+      threadId,
+      key: threadKey,
+      ...baseExtras,
+    });
+  const makeTieredBase = (threadId: string, threadKey?: string) =>
+    createTieredThreadManager<StoredMessage>({
+      redis,
+      threadId,
+      key: threadKey,
+      idOf: storedMessageId,
+      ...baseExtras,
+      ...(config.coldStore && { coldStore: config.coldStore }),
+    });
   const threadOps: ThreadOps<AnthropicContent> = {
     async initializeThread(
       threadId: string,
       threadKey?: string
     ): Promise<void> {
-      const thread = createAnthropicThreadManager({
-        redis,
-        threadId,
-        key: threadKey,
-      });
+      const thread = makeProviderThread(threadId, threadKey);
       await thread.initialize();
     },
@@ -154,11 +204,7 @@ export function createAnthropicAdapter(
       content: AnthropicContent,
       threadKey?: string
     ): Promise<void> {
-      const thread = createAnthropicThreadManager({
-        redis,
-        threadId,
-        key: threadKey,
-      });
+      const thread = makeProviderThread(threadId, threadKey);
       await thread.appendUserMessage(id, content);
     },
@@ -168,21 +214,13 @@ export function createAnthropicAdapter(
       content: AnthropicSystemContent,
       threadKey?: string
     ): Promise<void> {
-      const thread = createAnthropicThreadManager({
-        redis,
-        threadId,
-        key: threadKey,
-      });
+      const thread = makeProviderThread(threadId, threadKey);
       await thread.appendSystemMessage(id, content);
     },
     async appendToolResult(id: string, cfg: ToolResultConfig): Promise<void> {
       const { threadId, threadKey, toolCallId, toolName, content } = cfg;
-      const thread = createAnthropicThreadManager({
-        redis,
-        threadId,
-        key: threadKey,
-      });
+      const thread = makeProviderThread(threadId, threadKey);
       await thread.appendToolResult(id, toolCallId, toolName, content);
     },
@@ -192,11 +230,7 @@ export function createAnthropicAdapter(
       message: Anthropic.Messages.Message,
       threadKey?: string
     ): Promise<void> {
-      const thread = createAnthropicThreadManager({
-        redis,
-        threadId,
-        key: threadKey,
-      });
+      const thread = makeProviderThread(threadId, threadKey);
       await thread.appendAssistantMessage(id, message.content);
     },
@@ -210,6 +244,7 @@ export function createAnthropicAdapter(
         threadId: sourceThreadId,
         key: threadKey,
         hooks: config.hooks,
+        ...baseExtras,
       });
       await thread.fork(targetThreadId);
     },
@@ -217,9 +252,9 @@ export function createAnthropicAdapter(
     async truncateThread(
       threadId: string,
       messageId: string,
-      threadKey?: string,
+      threadKey?: string
     ): Promise<void> {
-      const thread = createAnthropicThreadManager({ redis, threadId, key: threadKey });
+      const thread = makeProviderThread(threadId, threadKey);
       await thread.truncateFromId(messageId);
     },
@@ -227,11 +262,7 @@ export function createAnthropicAdapter(
       threadId: string,
       threadKey?: string
     ): Promise<PersistedThreadState | null> {
-      const thread = createAnthropicThreadManager({
-        redis,
-        threadId,
-        key: threadKey,
-      });
+      const thread = makeProviderThread(threadId, threadKey);
       return thread.loadState();
     },
@@ -240,13 +271,19 @@ export function createAnthropicAdapter(
       state: PersistedThreadState,
       threadKey?: string
     ): Promise<void> {
-      const thread = createAnthropicThreadManager({
-        redis,
-        threadId,
-        key: threadKey,
-      });
+      const thread = makeProviderThread(threadId, threadKey);
       await thread.saveState(state);
     },
+    async hydrateThread(threadId: string, threadKey?: string): Promise<void> {
+      if (!config.coldStore) return;
+      await makeTieredBase(threadId, threadKey).hydrate();
+    },
+    async flushThread(threadId: string, threadKey?: string): Promise<void> {
+      if (!config.coldStore) return;
+      await makeTieredBase(threadId, threadKey).flush();
+    },
   };
   function createActivities<S extends string = "">(
@@ -263,7 +300,8 @@ export function createAnthropicAdapter(
   const makeInvoker = (
     model: string,
-    maxTokens?: number
+    maxTokens?: number,
+    promptCache?: AnthropicPromptCacheConfig
   ): ModelInvoker<Anthropic.Messages.Message> => {
     const invokerConfig: AnthropicModelInvokerConfig = {
       redis,
@@ -273,6 +311,11 @@ export function createAnthropicAdapter(
       ...(config.maxTokens !== undefined && maxTokens === undefined
         ? { maxTokens: config.maxTokens }
         : {}),
+      ...(promptCache !== undefined
+        ? { promptCache }
+        : config.promptCache !== undefined
+          ? { promptCache: config.promptCache }
+          : {}),
       hooks: config.hooks,
     };
     return createAnthropicModelInvoker(invokerConfig);

package/src/adapters/thread/anthropic/index.ts CHANGED Viewed

@@ -45,3 +45,11 @@ export {
   invokeAnthropicModel,
   type AnthropicModelInvokerConfig,
 } from "./model-invoker";
+// Prompt caching helpers
+export {
+  addPromptCacheControl,
+  resolvePromptCacheOptions,
+  type AnthropicPromptCacheConfig,
+  type AnthropicPromptCacheOptions,
+} from "./prompt-cache";

package/src/adapters/thread/anthropic/model-invoker.test.ts ADDED Viewed

@@ -0,0 +1,110 @@
+import { describe, expect, it, vi } from "vitest";
+import type Anthropic from "@anthropic-ai/sdk";
+import { createAnthropicModelInvoker } from "./model-invoker";
+import type { StoredMessage } from "./thread-manager";
+function createMockRedis(stored: StoredMessage[]) {
+  return {
+    exists: vi.fn().mockResolvedValue(1),
+    lrange: vi.fn().mockResolvedValue(stored.map((m) => JSON.stringify(m))),
+    ltrim: vi.fn().mockResolvedValue("OK"),
+    del: vi.fn().mockResolvedValue(1),
+    set: vi.fn().mockResolvedValue("OK"),
+    rpush: vi.fn().mockResolvedValue(1),
+    expire: vi.fn().mockResolvedValue(1),
+    eval: vi.fn().mockResolvedValue(1),
+  };
+}
+function createMockClient() {
+  const finalMessage: Anthropic.Messages.Message = {
+    id: "msg-response",
+    type: "message",
+    role: "assistant",
+    container: null,
+    model: "claude-test",
+    content: [{ type: "text", text: "ok", citations: null }],
+    stop_details: null,
+    stop_reason: "end_turn",
+    stop_sequence: null,
+    usage: {
+      cache_creation: null,
+      cache_creation_input_tokens: null,
+      cache_read_input_tokens: null,
+      inference_geo: null,
+      input_tokens: 1,
+      output_tokens: 1,
+      server_tool_use: null,
+      service_tier: null,
+    },
+  };
+  const stream = {
+    async *[Symbol.asyncIterator]() {},
+    finalMessage: vi.fn().mockResolvedValue(finalMessage),
+  };
+  const client = {
+    messages: {
+      stream: vi.fn().mockReturnValue(stream),
+    },
+  };
+  return { client, stream };
+}
+describe("createAnthropicModelInvoker prompt caching", () => {
+  it("sends explicit block-level cache_control by default", async () => {
+    const redis = createMockRedis([
+      { id: "msg-1", message: { role: "user", content: "hello" } },
+    ]);
+    const { client } = createMockClient();
+    const invoker = createAnthropicModelInvoker({
+      redis: redis as never,
+      client: client as never,
+      model: "claude-test",
+    });
+    await invoker({
+      threadId: "thread-1",
+      assistantMessageId: "assistant-1",
+      state: { tools: [] } as never,
+      agentName: "Agent",
+    });
+    const params = client.messages.stream.mock.calls[0]?.[0] as
+      | Anthropic.MessageCreateParams
+      | undefined;
+    expect(params).toBeDefined();
+    expect(params).not.toHaveProperty("cache_control");
+    expect(params?.messages[0]?.content).toEqual([
+      {
+        type: "text",
+        text: "hello",
+        cache_control: { type: "ephemeral", ttl: "5m" },
+      },
+    ]);
+  });
+  it("can disable prompt caching", async () => {
+    const redis = createMockRedis([
+      { id: "msg-1", message: { role: "user", content: "hello" } },
+    ]);
+    const { client } = createMockClient();
+    const invoker = createAnthropicModelInvoker({
+      redis: redis as never,
+      client: client as never,
+      model: "claude-test",
+      promptCache: false,
+    });
+    await invoker({
+      threadId: "thread-1",
+      assistantMessageId: "assistant-1",
+      state: { tools: [] } as never,
+      agentName: "Agent",
+    });
+    const params = client.messages.stream.mock.calls[0]?.[0] as
+      | Anthropic.MessageCreateParams
+      | undefined;
+    expect(params?.messages[0]?.content).toBe("hello");
+  });
+});

package/src/adapters/thread/anthropic/model-invoker.ts CHANGED Viewed

@@ -6,6 +6,11 @@ import {
   createAnthropicThreadManager,
   type AnthropicThreadManagerHooks,
 } from "./thread-manager";
+import {
+  addPromptCacheControl,
+  resolvePromptCacheOptions,
+  type AnthropicPromptCacheConfig,
+} from "./prompt-cache";
 import { getActivityContext } from "../../../lib/activity";
 export interface AnthropicModelInvokerConfig {
@@ -14,6 +19,11 @@ export interface AnthropicModelInvokerConfig {
   model: string;
   /** Maximum tokens to generate. Defaults to 16384. */
   maxTokens?: number;
+  /**
+   * Controls Anthropic/Bedrock-compatible prompt caching. Defaults to enabled
+   * with an explicit 5 minute TTL. Set to `false` to disable.
+   */
+  promptCache?: AnthropicPromptCacheConfig;
   hooks?: AnthropicThreadManagerHooks;
 }
@@ -56,6 +66,7 @@ export function createAnthropicModelInvoker({
   client,
   model,
   maxTokens = 16384,
+  promptCache,
   hooks,
 }: AnthropicModelInvokerConfig) {
   return async function invokeAnthropicModel(
@@ -76,17 +87,24 @@ export function createAnthropicModelInvoker({
     // attempt's assistant + tool results so the LLM sees the same
     // pre-call state that it saw originally.
     await thread.truncateFromId(assistantMessageId);
-    const { messages, system } = await thread.prepareForInvocation();
+    const prepared = await thread.prepareForInvocation();
     const anthropicTools = toAnthropicTools(state.tools);
-    const tools = anthropicTools.length > 0 ? anthropicTools : undefined;
+    const preparedPayload = {
+      ...prepared,
+      ...(anthropicTools.length > 0 ? { tools: anthropicTools } : {}),
+    };
+    const cacheOptions = resolvePromptCacheOptions(promptCache);
+    const payload = cacheOptions
+      ? addPromptCacheControl(preparedPayload, cacheOptions)
+      : preparedPayload;
     const params: Anthropic.MessageCreateParams = {
       model,
       max_tokens: maxTokens,
-      messages,
-      ...(system ? { system } : {}),
-      ...(tools ? { tools } : {}),
+      messages: payload.messages,
+      ...(payload.system ? { system: payload.system } : {}),
+      ...(payload.tools ? { tools: payload.tools } : {}),
     };
     const stream = client.messages.stream(params, { signal });
@@ -130,6 +148,7 @@ export async function invokeAnthropicModel({
   client,
   model,
   maxTokens,
+  promptCache,
   hooks,
   config,
 }: {
@@ -137,6 +156,7 @@ export async function invokeAnthropicModel({
   client: Anthropic;
   model: string;
   maxTokens?: number;
+  promptCache?: AnthropicPromptCacheConfig;
   hooks?: AnthropicThreadManagerHooks;
   config: ModelInvokerConfig;
 }): Promise<AgentResponse<Anthropic.Messages.Message>> {
@@ -145,6 +165,7 @@ export async function invokeAnthropicModel({
     client,
     model,
     maxTokens,
+    promptCache,
     hooks,
   });
   return invoker(config);

package/src/adapters/thread/anthropic/prompt-cache.test.ts ADDED Viewed

@@ -0,0 +1,134 @@
+import { describe, expect, it } from "vitest";
+import type Anthropic from "@anthropic-ai/sdk";
+import {
+  addPromptCacheControl,
+  resolvePromptCacheOptions,
+} from "./prompt-cache";
+function firstContentBlock(
+  message: Anthropic.Messages.MessageParam
+): Record<string, unknown> {
+  if (!Array.isArray(message.content)) {
+    throw new Error("Expected array content");
+  }
+  const block = message.content[0];
+  if (!block || typeof block !== "object") {
+    throw new Error("Expected content block");
+  }
+  return block as unknown as Record<string, unknown>;
+}
+function messageAt(
+  messages: Anthropic.Messages.MessageParam[],
+  index: number
+): Anthropic.Messages.MessageParam {
+  const message = messages[index];
+  if (!message) throw new Error(`Expected message at index ${String(index)}`);
+  return message;
+}
+describe("Anthropic prompt cache helpers", () => {
+  it("enables prompt caching by default", () => {
+    expect(resolvePromptCacheOptions()).toEqual({});
+  });
+  it("can be disabled", () => {
+    expect(resolvePromptCacheOptions(false)).toBeUndefined();
+  });
+  it("adds Bedrock-compatible block-level cache_control to the last message", () => {
+    const payload = {
+      messages: [{ role: "user" as const, content: "hello" }],
+    };
+    const result = addPromptCacheControl(payload);
+    const block = firstContentBlock(messageAt(result.messages, 0));
+    expect(block).toEqual({
+      type: "text",
+      text: "hello",
+      cache_control: { type: "ephemeral", ttl: "5m" },
+    });
+    expect("cache_control" in result).toBe(false);
+  });
+  it("supports a 1h TTL", () => {
+    const result = addPromptCacheControl(
+      {
+        messages: [
+          {
+            role: "user" as const,
+            content: [{ type: "text" as const, text: "hello" }],
+          },
+        ],
+      },
+      { ttl: "1h" }
+    );
+    expect(
+      firstContentBlock(messageAt(result.messages, 0)).cache_control
+    ).toEqual({
+      type: "ephemeral",
+      ttl: "1h",
+    });
+  });
+  it("does not add a fifth cache breakpoint", () => {
+    const cacheControl = { type: "ephemeral" as const };
+    const result = addPromptCacheControl({
+      system: [
+        { type: "text" as const, text: "system", cache_control: cacheControl },
+      ],
+      tools: [
+        {
+          name: "tool",
+          description: "A test tool",
+          input_schema: { type: "object", properties: {} },
+          cache_control: cacheControl,
+        },
+      ],
+      messages: [
+        {
+          role: "user" as const,
+          content: [
+            { type: "text" as const, text: "1", cache_control: cacheControl },
+            { type: "text" as const, text: "2", cache_control: cacheControl },
+            { type: "text" as const, text: "latest" },
+          ],
+        },
+      ],
+    });
+    const latest = (
+      messageAt(result.messages, 0).content as unknown as Array<
+        Record<string, unknown>
+      >
+    )[2];
+    expect(latest?.cache_control).toBeUndefined();
+  });
+  it("preserves an existing cache marker on the last cacheable block", () => {
+    const cacheControl = { type: "ephemeral" as const, ttl: "1h" as const };
+    const payload = {
+      messages: [
+        {
+          role: "user" as const,
+          content: [
+            {
+              type: "text" as const,
+              text: "hello",
+              cache_control: cacheControl,
+            },
+          ],
+        },
+      ],
+    };
+    const result = addPromptCacheControl(payload, { ttl: "5m" });
+    expect(result).toBe(payload);
+    expect(
+      firstContentBlock(messageAt(result.messages, 0)).cache_control
+    ).toEqual(cacheControl);
+  });
+});