npm - zeitlich - Versions diffs - 0.2.50 → 0.2.53 - Mend

zeitlich 0.2.50 → 0.2.53

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (74) hide show

package/dist/adapters/thread/anthropic/index.cjs +15 -13
package/dist/adapters/thread/anthropic/index.cjs.map +1 -1
package/dist/adapters/thread/anthropic/index.d.cts +15 -10
package/dist/adapters/thread/anthropic/index.d.ts +15 -10
package/dist/adapters/thread/anthropic/index.js +15 -13
package/dist/adapters/thread/anthropic/index.js.map +1 -1
package/dist/adapters/thread/anthropic/workflow.d.cts +5 -5
package/dist/adapters/thread/anthropic/workflow.d.ts +5 -5
package/dist/adapters/thread/google-genai/index.cjs +18 -12
package/dist/adapters/thread/google-genai/index.cjs.map +1 -1
package/dist/adapters/thread/google-genai/index.d.cts +181 -11
package/dist/adapters/thread/google-genai/index.d.ts +181 -11
package/dist/adapters/thread/google-genai/index.js +18 -12
package/dist/adapters/thread/google-genai/index.js.map +1 -1
package/dist/adapters/thread/google-genai/workflow.d.cts +6 -6
package/dist/adapters/thread/google-genai/workflow.d.ts +6 -6
package/dist/adapters/thread/langchain/index.cjs +22 -13
package/dist/adapters/thread/langchain/index.cjs.map +1 -1
package/dist/adapters/thread/langchain/index.d.cts +15 -10
package/dist/adapters/thread/langchain/index.d.ts +15 -10
package/dist/adapters/thread/langchain/index.js +22 -13
package/dist/adapters/thread/langchain/index.js.map +1 -1
package/dist/adapters/thread/langchain/workflow.d.cts +5 -5
package/dist/adapters/thread/langchain/workflow.d.ts +5 -5
package/dist/{cold-store-CCnZYWjx.d.ts → cold-store-BbvJLhXJ.d.ts} +1 -1
package/dist/{cold-store-C0uvYTSi.d.cts → cold-store-Ki_U0jyd.d.cts} +1 -1
package/dist/index.cjs +38 -3
package/dist/index.cjs.map +1 -1
package/dist/index.d.cts +8 -8
package/dist/index.d.ts +8 -8
package/dist/index.js +38 -3
package/dist/index.js.map +1 -1
package/dist/{proxy-C4J1pNUk.d.ts → proxy-CwniAm8W.d.ts} +1 -1
package/dist/{proxy-BVznA2_p.d.cts → proxy-wsNrEh2u.d.cts} +1 -1
package/dist/{thread-manager-BqjzWsP7.d.ts → thread-manager-D1zfZnxi.d.ts} +4 -5
package/dist/{thread-manager-SkSWRPRc.d.ts → thread-manager-DCXkMqHH.d.ts} +4 -5
package/dist/{thread-manager-CzIs47uG.d.cts → thread-manager-DW7FqMdN.d.cts} +4 -5
package/dist/{thread-manager-Dzl1fHhV.d.cts → thread-manager-DhvA5oDL.d.cts} +4 -5
package/dist/{types-YNesmGKV.d.ts → types-DQQKF5FQ.d.ts} +24 -2
package/dist/{types-DZnUqCAP.d.cts → types-DpHBKA8c.d.cts} +24 -2
package/dist/{types-d2RvEP6v.d.cts → types-tJ9Or7u_.d.cts} +1 -1
package/dist/{types-CbPnU4RM.d.ts → types-ziu6HZPh.d.ts} +1 -1
package/dist/{workflow-Bkzg0cjB.d.ts → workflow-BeMiPEq4.d.ts} +2 -1
package/dist/{workflow-B3oTe2_D.d.cts → workflow-CNTNwEnj.d.cts} +2 -1
package/dist/workflow.cjs +38 -3
package/dist/workflow.cjs.map +1 -1
package/dist/workflow.d.cts +2 -2
package/dist/workflow.d.ts +2 -2
package/dist/workflow.js +38 -3
package/dist/workflow.js.map +1 -1
package/package.json +2 -2
package/src/adapters/thread/anthropic/activities.test.ts +115 -0
package/src/adapters/thread/anthropic/activities.ts +10 -18
package/src/adapters/thread/anthropic/model-invoker.test.ts +50 -0
package/src/adapters/thread/anthropic/model-invoker.ts +10 -0
package/src/adapters/thread/anthropic/thread-manager.ts +2 -3
package/src/adapters/thread/google-genai/activities.test.ts +162 -0
package/src/adapters/thread/google-genai/activities.ts +37 -14
package/src/adapters/thread/google-genai/model-invoker.test.ts +53 -4
package/src/adapters/thread/google-genai/model-invoker.ts +11 -0
package/src/adapters/thread/google-genai/thread-manager.ts +2 -3
package/src/adapters/thread/langchain/activities.test.ts +88 -0
package/src/adapters/thread/langchain/activities.ts +14 -11
package/src/adapters/thread/langchain/model-invoker.test.ts +74 -0
package/src/adapters/thread/langchain/model-invoker.ts +15 -2
package/src/adapters/thread/langchain/thread-manager.ts +2 -3
package/src/lib/hooks/index.ts +2 -0
package/src/lib/hooks/types.ts +26 -1
package/src/lib/observability/hooks.ts +17 -2
package/src/lib/session/session.ts +31 -3
package/src/lib/state/types.ts +9 -11
package/src/workflow.ts +2 -0
package/dist/activities-IuOIvPHO.d.ts +0 -162
package/dist/activities-cIlq1y1y.d.cts +0 -162

package/src/adapters/thread/google-genai/model-invoker.test.ts CHANGED Viewed

@@ -8,6 +8,7 @@ import {
 import { createGoogleGenAIModelInvoker } from "./model-invoker";
 import type { StoredContent } from "./thread-manager";
 import type { AgentResponse } from "../../../lib/model";
+import { THREAD_TTL_SECONDS } from "../../../lib/thread/keys";
 const textReply: Part[] = [{ text: "ok" }];
@@ -17,7 +18,8 @@ function createMockRedis(
 ) {
   return {
     exists: vi.fn().mockResolvedValue(1),
-    lrange: vi.fn().mockResolvedValue(stored.map((m) => JSON.stringify(m))),
+    lRange: vi.fn().mockResolvedValue(stored.map((m) => JSON.stringify(m))),
+    lTrim: vi.fn().mockResolvedValue("OK"),
     get: vi
       .fn()
       .mockImplementation((key: string) =>
@@ -25,7 +27,7 @@ function createMockRedis(
       ),
     del: vi.fn().mockResolvedValue(1),
     set: vi.fn().mockResolvedValue("OK"),
-    rpush: vi.fn().mockResolvedValue(1),
+    rPush: vi.fn().mockResolvedValue(1),
     expire: vi.fn().mockResolvedValue(1),
     eval: vi.fn().mockResolvedValue(1),
   };
@@ -311,8 +313,7 @@ describe("Google GenAI model invoker — context caching", () => {
     );
     expect(setCall).toBeDefined();
     expect(setCall?.[1]).toBe("cached-content-ref");
-    expect(setCall?.[2]).toBe("EX");
-    expect(setCall?.[3]).toBe(595);
+    expect(setCall?.[2]).toEqual({ EX: 595 });
   });
   it("reports cachedWriteTokens from cache creation", async () => {
@@ -335,3 +336,51 @@ describe("Google GenAI model invoker — context caching", () => {
     expect(result.usage?.cachedWriteTokens).toBe(4200);
   });
 });
+describe("Google GenAI model invoker — thread TTL", () => {
+  // A thread whose tail is a prior attempt's assistant message stored
+  // under `assistant-1`, so the invoker's `truncateFromId(assistant-1)`
+  // trims it and re-stamps the surviving list key's TTL.
+  const retriedThread: StoredContent[] = [
+    { id: "msg-1", content: { role: "user", parts: [{ text: "hi" }] } },
+    {
+      id: "assistant-1",
+      content: { role: "model", parts: [{ text: "prior attempt" }] },
+    },
+  ];
+  const listKey = "messages:thread:thread-1";
+  it("re-stamps trimmed hot keys at the configured ttlSeconds", async () => {
+    const redis = createMockRedis(retriedThread);
+    const client = createMockClient();
+    const invoker = createGoogleGenAIModelInvoker({
+      redis: redis as never,
+      client: client as never,
+      model: "gemini-2.5-flash",
+      ttlSeconds: 3600,
+    });
+    await invoker(invokerConfig);
+    expect(redis.lTrim).toHaveBeenCalledWith(listKey, 0, 0);
+    expect(redis.expire).toHaveBeenCalledWith(listKey, 3600);
+    expect(redis.expire).not.toHaveBeenCalledWith(listKey, THREAD_TTL_SECONDS);
+  });
+  it("defaults to THREAD_TTL_SECONDS when ttlSeconds is omitted", async () => {
+    const redis = createMockRedis(retriedThread);
+    const client = createMockClient();
+    const invoker = createGoogleGenAIModelInvoker({
+      redis: redis as never,
+      client: client as never,
+      model: "gemini-2.5-flash",
+    });
+    await invoker(invokerConfig);
+    expect(redis.lTrim).toHaveBeenCalledWith(listKey, 0, 0);
+    expect(redis.expire).toHaveBeenCalledWith(listKey, THREAD_TTL_SECONDS);
+  });
+});

package/src/adapters/thread/google-genai/model-invoker.ts CHANGED Viewed

@@ -21,6 +21,12 @@ export interface GoogleGenAIModelInvokerConfig {
   client: GoogleGenAI;
   model: string;
   hooks?: GoogleGenAIThreadManagerHooks;
+  /**
+   * Redis TTL for the thread's keys; defaults to 90 days. Use a shorter
+   * value (hours) with a cold tier. Distinct from `cache.ttlSeconds`
+   * (server-side context caching).
+   */
+  ttlSeconds?: number;
   /** Passed through to `generateContentStream().config`.
    *  `systemInstruction`, `tools`, and `abortSignal` are managed by the
    *  invoker and will override any values set here. */
@@ -69,6 +75,7 @@ export function createGoogleGenAIModelInvoker({
   client,
   model,
   hooks,
+  ttlSeconds,
   config: generationConfig,
   cache: cacheConfig,
 }: GoogleGenAIModelInvokerConfig) {
@@ -83,6 +90,7 @@ export function createGoogleGenAIModelInvoker({
       threadId,
       key: threadKey,
       hooks,
+      ...(ttlSeconds !== undefined && { ttlSeconds }),
     });
     // Truncate the thread starting at the id the assistant message
     // will be stored under. No-op on the first attempt; on rewind
@@ -214,6 +222,7 @@ export async function invokeGoogleGenAIModel({
   client,
   model,
   hooks,
+  ttlSeconds,
   config,
   generationConfig,
   cache,
@@ -222,6 +231,7 @@ export async function invokeGoogleGenAIModel({
   client: GoogleGenAI;
   model: string;
   hooks?: GoogleGenAIThreadManagerHooks;
+  ttlSeconds?: number;
   config: ModelInvokerConfig;
   generationConfig?: GenerateContentConfig;
   cache?: GoogleGenAIModelInvokerConfig["cache"];
@@ -231,6 +241,7 @@ export async function invokeGoogleGenAIModel({
     client,
     model,
     hooks,
+    ...(ttlSeconds !== undefined && { ttlSeconds }),
     config: generationConfig,
     cache,
   });

package/src/adapters/thread/google-genai/thread-manager.ts CHANGED Viewed

@@ -32,9 +32,8 @@ export interface GoogleGenAIThreadManagerConfig {
   key?: string;
   hooks?: GoogleGenAIThreadManagerHooks;
   /**
-   * Override the default thread TTL (90 days). When pairing the
-   * adapter with a durable cold tier, a shorter TTL (hours) is
-   * typically more appropriate.
+   * Redis TTL for the thread's keys; defaults to 90 days. Use a shorter
+   * value (hours) with a cold tier.
    */
   ttlSeconds?: number;
 }

package/src/adapters/thread/langchain/activities.test.ts ADDED Viewed

@@ -0,0 +1,88 @@
+import { describe, expect, it, vi } from "vitest";
+import { AIMessage, HumanMessage } from "@langchain/core/messages";
+import { createLangChainAdapter } from "./activities";
+import { THREAD_TTL_SECONDS } from "../../../lib/thread/keys";
+function createMockRedis(stored: unknown[]) {
+  return {
+    exists: vi.fn().mockResolvedValue(1),
+    lRange: vi.fn().mockResolvedValue(stored.map((m) => JSON.stringify(m))),
+    lTrim: vi.fn().mockResolvedValue("OK"),
+    del: vi.fn().mockResolvedValue(1),
+    set: vi.fn().mockResolvedValue("OK"),
+    rPush: vi.fn().mockResolvedValue(1),
+    expire: vi.fn().mockResolvedValue(1),
+    eval: vi.fn().mockResolvedValue(1),
+  };
+}
+function createMockModel() {
+  const response = {
+    tool_calls: [],
+    response_metadata: {},
+    usage_metadata: { input_tokens: 1, output_tokens: 1 },
+    toDict: () => ({ type: "ai", data: { content: "ok" } }),
+  };
+  return { invoke: vi.fn().mockResolvedValue(response) };
+}
+// Tail stored under the `assistantMessageId`, so the invoker's
+// `truncateFromId` trims it and re-stamps the surviving list key's TTL.
+const retriedThread = [
+  new HumanMessage({ id: "msg-1", content: "hi" }).toDict(),
+  new AIMessage({ id: "assistant-1", content: "prior" }).toDict(),
+];
+const listKey = "messages:thread:thread-1";
+const metaKey = "messages:meta:thread:thread-1";
+const invokerCall = {
+  threadId: "thread-1",
+  assistantMessageId: "assistant-1",
+  state: { tools: [] } as never,
+  agentName: "TestAgent",
+};
+describe("createLangChainAdapter — TTL propagation", () => {
+  it("forwards adapter ttlSeconds to a created invoker's writes", async () => {
+    const redis = createMockRedis(retriedThread);
+    const model = createMockModel();
+    const adapter = createLangChainAdapter({
+      redis: redis as never,
+      ttlSeconds: 3600,
+    });
+    await adapter.createModelInvoker(model as never)(invokerCall);
+    expect(redis.expire).toHaveBeenCalledWith(listKey, 3600);
+    expect(redis.expire).not.toHaveBeenCalledWith(listKey, THREAD_TTL_SECONDS);
+  });
+  it("forwards adapter ttlSeconds to thread-op writes", async () => {
+    const redis = createMockRedis([]);
+    const adapter = createLangChainAdapter({
+      redis: redis as never,
+      ttlSeconds: 3600,
+    });
+    const acts = adapter.createActivities() as unknown as Record<
+      string,
+      (threadId: string, threadKey?: string) => Promise<void>
+    >;
+    const initialize = Object.entries(acts).find(([k]) =>
+      k.endsWith("InitializeThread")
+    )?.[1];
+    if (!initialize) throw new Error("initializeThread activity not found");
+    await initialize("thread-1");
+    expect(redis.set).toHaveBeenCalledWith(metaKey, "1", { EX: 3600 });
+  });
+  it("defaults to THREAD_TTL_SECONDS when adapter ttlSeconds is omitted", async () => {
+    const redis = createMockRedis(retriedThread);
+    const model = createMockModel();
+    const adapter = createLangChainAdapter({ redis: redis as never });
+    await adapter.createModelInvoker(model as never)(invokerCall);
+    expect(redis.expire).toHaveBeenCalledWith(listKey, THREAD_TTL_SECONDS);
+  });
+});

package/src/adapters/thread/langchain/activities.ts CHANGED Viewed

@@ -46,9 +46,8 @@ export interface LangChainAdapterConfig {
    */
   coldStore?: ColdThreadStore;
   /**
-   * Override the default Redis TTL (90 days). When pairing the
-   * adapter with a `coldStore`, a shorter TTL (hours) is typically
-   * more appropriate.
+   * Redis TTL for the thread's keys; defaults to 90 days. Use a shorter
+   * value (hours) with a cold tier.
    */
   ttlSeconds?: number;
 }
@@ -133,25 +132,26 @@ export function createLangChainAdapter(
 ): LangChainAdapter {
   const { redis } = config;
-  const baseExtras = {
+  // Single source for the adapter's `redis` handle and configured TTL, spread
+  // into every internal thread manager so all of them share one configuration.
+  const base = {
+    redis,
     ...(config.ttlSeconds !== undefined && { ttlSeconds: config.ttlSeconds }),
   };
   const makeProviderThread = (threadId: string, threadKey?: string) =>
     createLangChainThreadManager({
-      redis,
+      ...base,
       threadId,
       key: threadKey,
-      ...baseExtras,
     });
   const makeTieredBase = (threadId: string, threadKey?: string) =>
     createTieredThreadManager<StoredMessage>({
-      redis,
+      ...base,
       threadId,
       key: threadKey,
       idOf: storedMessageId,
-      ...baseExtras,
       ...(config.coldStore && { coldStore: config.coldStore }),
     });
@@ -207,11 +207,10 @@ export function createLangChainAdapter(
       threadKey?: string
     ): Promise<void> {
       const thread = createLangChainThreadManager({
-        redis,
+        ...base,
         threadId: sourceThreadId,
         key: threadKey,
         hooks: config.hooks,
-        ...baseExtras,
       });
       await thread.fork(targetThreadId);
     },
@@ -275,7 +274,11 @@ export function createLangChainAdapter(
     // eslint-disable-next-line @typescript-eslint/no-explicit-any
     model: BaseChatModel<any>
   ): ModelInvoker<StoredMessage> =>
-    createLangChainModelInvoker({ redis, model, hooks: config.hooks });
+    createLangChainModelInvoker({
+      ...base,
+      model,
+      hooks: config.hooks,
+    });
   const invoker: ModelInvoker<StoredMessage> = config.model
     ? makeInvoker(config.model)

package/src/adapters/thread/langchain/model-invoker.test.ts ADDED Viewed

@@ -0,0 +1,74 @@
+import { describe, expect, it, vi } from "vitest";
+import { AIMessage, HumanMessage } from "@langchain/core/messages";
+import { createLangChainModelInvoker } from "./model-invoker";
+import { THREAD_TTL_SECONDS } from "../../../lib/thread/keys";
+function createMockRedis(stored: unknown[]) {
+  return {
+    exists: vi.fn().mockResolvedValue(1),
+    lRange: vi.fn().mockResolvedValue(stored.map((m) => JSON.stringify(m))),
+    lTrim: vi.fn().mockResolvedValue("OK"),
+    del: vi.fn().mockResolvedValue(1),
+    set: vi.fn().mockResolvedValue("OK"),
+    rPush: vi.fn().mockResolvedValue(1),
+    expire: vi.fn().mockResolvedValue(1),
+    eval: vi.fn().mockResolvedValue(1),
+  };
+}
+function createMockModel() {
+  const response = {
+    tool_calls: [],
+    response_metadata: {},
+    usage_metadata: { input_tokens: 1, output_tokens: 1 },
+    toDict: () => ({ type: "ai", data: { content: "ok" } }),
+  };
+  return { invoke: vi.fn().mockResolvedValue(response) };
+}
+describe("createLangChainModelInvoker thread TTL", () => {
+  // The tail message is stored under `assistant-1`, so the invoker's
+  // `truncateFromId(assistant-1)` trims it and re-stamps the surviving
+  // list key's TTL.
+  const retriedThread = [
+    new HumanMessage({ id: "msg-1", content: "hi" }).toDict(),
+    new AIMessage({ id: "assistant-1", content: "prior" }).toDict(),
+  ];
+  const listKey = "messages:thread:thread-1";
+  const invokerConfig = {
+    threadId: "thread-1",
+    assistantMessageId: "assistant-1",
+    state: { tools: [] } as never,
+    agentName: "Agent",
+  };
+  it("re-stamps trimmed hot keys at the configured ttlSeconds", async () => {
+    const redis = createMockRedis(retriedThread);
+    const model = createMockModel();
+    const invoker = createLangChainModelInvoker({
+      redis: redis as never,
+      model: model as never,
+      ttlSeconds: 3600,
+    });
+    await invoker(invokerConfig);
+    expect(redis.lTrim).toHaveBeenCalledWith(listKey, 0, 0);
+    expect(redis.expire).toHaveBeenCalledWith(listKey, 3600);
+    expect(redis.expire).not.toHaveBeenCalledWith(listKey, THREAD_TTL_SECONDS);
+  });
+  it("defaults to THREAD_TTL_SECONDS when ttlSeconds is omitted", async () => {
+    const redis = createMockRedis(retriedThread);
+    const model = createMockModel();
+    const invoker = createLangChainModelInvoker({
+      redis: redis as never,
+      model: model as never,
+    });
+    await invoker(invokerConfig);
+    expect(redis.lTrim).toHaveBeenCalledWith(listKey, 0, 0);
+    expect(redis.expire).toHaveBeenCalledWith(listKey, THREAD_TTL_SECONDS);
+  });
+});

package/src/adapters/thread/langchain/model-invoker.ts CHANGED Viewed

@@ -16,6 +16,11 @@ export interface LangChainModelInvokerConfig<
   redis: Redis;
   model: TModel;
   hooks?: LangChainThreadManagerHooks;
+  /**
+   * Redis TTL for the thread's keys; defaults to 90 days. Use a shorter
+   * value (hours) with a cold tier.
+   */
+  ttlSeconds?: number;
 }
 /**
@@ -43,7 +48,7 @@ export interface LangChainModelInvokerConfig<
 export function createLangChainModelInvoker<
   TModel extends BaseChatModel<any> = BaseChatModel<any>,
->({ redis, model, hooks }: LangChainModelInvokerConfig<TModel>) {
+>({ redis, model, hooks, ttlSeconds }: LangChainModelInvokerConfig<TModel>) {
   return async function invokeLangChainModel(
     config: ModelInvokerConfig
   ): Promise<AgentResponse<StoredMessage>> {
@@ -56,6 +61,7 @@ export function createLangChainModelInvoker<
       threadId,
       key: threadKey,
       hooks,
+      ...(ttlSeconds !== undefined && { ttlSeconds }),
     });
     const runId = uuidv4();
@@ -122,13 +128,20 @@ export async function invokeLangChainModel<
   redis,
   model,
   hooks,
+  ttlSeconds,
   config,
 }: {
   redis: Redis;
   config: ModelInvokerConfig;
   model: TModel;
   hooks?: LangChainThreadManagerHooks;
+  ttlSeconds?: number;
 }): Promise<AgentResponse<StoredMessage>> {
-  const invoker = createLangChainModelInvoker({ redis, model, hooks });
+  const invoker = createLangChainModelInvoker({
+    redis,
+    model,
+    hooks,
+    ...(ttlSeconds !== undefined && { ttlSeconds }),
+  });
   return invoker(config);
 }

package/src/adapters/thread/langchain/thread-manager.ts CHANGED Viewed

@@ -35,9 +35,8 @@ export interface LangChainThreadManagerConfig {
   key?: string;
   hooks?: LangChainThreadManagerHooks;
   /**
-   * Override the default thread TTL (90 days). When pairing the
-   * adapter with a durable cold tier, a shorter TTL (hours) is
-   * typically more appropriate.
+   * Redis TTL for the thread's keys; defaults to 90 days. Use a shorter
+   * value (hours) with a cold tier.
    */
   ttlSeconds?: number;
 }

package/src/lib/hooks/index.ts CHANGED Viewed

@@ -3,6 +3,8 @@ export type {
   SessionStartHook,
   SessionEndHookContext,
   SessionEndHook,
+  TurnCompleteHookContext,
+  TurnCompleteHook,
   PreHumanMessageAppendHookContext,
   PreHumanMessageAppendHook,
   PostHumanMessageAppendHookContext,

package/src/lib/hooks/types.ts CHANGED Viewed

@@ -1,4 +1,4 @@
-import type { SessionExitReason } from "../types";
+import type { SessionExitReason, TokenUsage } from "../types";
 import type { ToolMap, ToolRouterHooks } from "../tool-router/types";
 // ============================================================================
@@ -29,6 +29,7 @@ export interface SessionEndHookContext {
   agentName: string;
   exitReason: SessionExitReason;
   turns: number;
+  usage: TokenUsage;
   metadata: Record<string, unknown>;
 }
@@ -39,6 +40,28 @@ export type SessionEndHook = (
   ctx: SessionEndHookContext
 ) => void | Promise<void>;
+/**
+ * Context for TurnComplete hook - called after each agent turn commits
+ * (i.e. once per model invocation, excluding rewound turns)
+ */
+export interface TurnCompleteHookContext {
+  threadId: string;
+  agentName: string;
+  /** 1-based turn number that just completed */
+  turn: number;
+  /** Number of tool calls the model requested this turn */
+  toolCallCount: number;
+  /** Token usage reported by the model for this turn, if available */
+  usage?: TokenUsage;
+}
+/**
+ * TurnComplete hook - called after each agent turn commits
+ */
+export type TurnCompleteHook = (
+  ctx: TurnCompleteHookContext
+) => void | Promise<void>;
 // ============================================================================
 // Message Lifecycle Hooks
 // ============================================================================
@@ -95,4 +118,6 @@ export interface Hooks<
   onSessionStart?: SessionStartHook;
   /** Called when session ends */
   onSessionEnd?: SessionEndHook;
+  /** Called after each agent turn commits (excludes rewound turns) */
+  onTurnComplete?: TurnCompleteHook;
 }

package/src/lib/observability/hooks.ts CHANGED Viewed

@@ -1,6 +1,10 @@
 import { proxySinks } from "@temporalio/workflow";
 import type { ZeitlichObservabilitySinks } from "./sinks";
-import type { SessionStartHook, SessionEndHook } from "../hooks/types";
+import type {
+  SessionStartHook,
+  SessionEndHook,
+  TurnCompleteHook,
+} from "../hooks/types";
 import type {
   PostToolUseHook,
   PostToolUseFailureHook,
@@ -9,6 +13,7 @@ import type {
 export interface ObservabilityHooks {
   onSessionStart: SessionStartHook;
   onSessionEnd: SessionEndHook;
+  onTurnComplete: TurnCompleteHook;
   // eslint-disable-next-line @typescript-eslint/no-explicit-any
   onPostToolUse: PostToolUseHook<any, any>;
   // eslint-disable-next-line @typescript-eslint/no-explicit-any
@@ -58,11 +63,21 @@ export function createObservabilityHooks(
         threadId: ctx.threadId,
         exitReason: ctx.exitReason,
         turns: ctx.turns,
-        usage: {},
+        usage: ctx.usage,
         durationMs: Date.now() - sessionStartMs,
       });
     },
+    onTurnComplete: (ctx) => {
+      zeitlichMetrics.turnCompleted({
+        agentName,
+        threadId: ctx.threadId,
+        turn: ctx.turn,
+        toolCallCount: ctx.toolCallCount,
+        ...(ctx.usage && { usage: ctx.usage }),
+      });
+    },
     onPostToolUse: (ctx) => {
       zeitlichMetrics.toolExecuted({
         agentName,

package/src/lib/session/session.ts CHANGED Viewed

@@ -4,7 +4,7 @@ import {
   ApplicationFailure,
   log,
 } from "@temporalio/workflow";
-import type { SessionExitReason } from "../types";
+import type { SessionExitReason, TokenUsage } from "../types";
 import type { SessionConfig, ZeitlichSession } from "./types";
 import { resolveSessionLifecycle } from "./types";
 import type {
@@ -232,7 +232,8 @@ export async function createSession<
   const callSessionEnd = async (
     exitReason: SessionExitReason,
-    turns: number
+    turns: number,
+    usage: TokenUsage
   ): Promise<void> => {
     if (hooks.onSessionEnd) {
       await hooks.onSessionEnd({
@@ -240,6 +241,7 @@ export async function createSession<
         agentName,
         exitReason,
         turns,
+        usage,
         metadata,
       });
     }
@@ -554,6 +556,15 @@ export async function createSession<
           });
           if (!toolRouter.hasTools() || rawToolCalls.length === 0) {
+            if (hooks.onTurnComplete) {
+              await hooks.onTurnComplete({
+                threadId,
+                agentName,
+                turn: currentTurn,
+                toolCallCount: rawToolCalls.length,
+                ...(usage && { usage }),
+              });
+            }
             stateManager.complete();
             exitReason = "completed";
             finalMessage = message;
@@ -638,6 +649,16 @@ export async function createSession<
           // Turn committed: fresh id for the next turn.
           assistantId = undefined;
+          if (hooks.onTurnComplete) {
+            await hooks.onTurnComplete({
+              threadId,
+              agentName,
+              turn: currentTurn,
+              toolCallCount: rawToolCalls.length,
+              ...(usage && { usage }),
+            });
+          }
         }
         if (stateManager.getTurns() >= maxTurns && stateManager.isRunning()) {
@@ -707,7 +728,14 @@ export async function createSession<
           });
         }
-        await callSessionEnd(exitReason, stateManager.getTurns());
+        const totals = stateManager.getTotalUsage();
+        await callSessionEnd(exitReason, totals.turns, {
+          inputTokens: totals.totalInputTokens,
+          outputTokens: totals.totalOutputTokens,
+          cachedWriteTokens: totals.totalCachedWriteTokens,
+          cachedReadTokens: totals.totalCachedReadTokens,
+          reasonTokens: totals.totalReasonTokens,
+        });
         if (sandboxOwned && sandboxId && sandboxOps) {
           switch (resolvedShutdown) {

package/src/lib/state/types.ts CHANGED Viewed

@@ -29,19 +29,17 @@ export type JsonValue =
  * Rejects: functions, symbols, undefined, class instances with methods
  */
 export type JsonSerializable<T> = {
-  [K in keyof T]: T[K] extends JsonValue
-    ? T[K]
-    : T[K] extends JsonPrimitive
-      ? T[K]
-      : T[K] extends (infer U)[]
-        ? U extends JsonValue
-          ? T[K]
-          : JsonSerializable<U>[]
-        : T[K] extends object
-          ? JsonSerializable<T[K]>
-          : never;
+  [K in keyof T]: JsonSerializableValue<T[K]>;
 };
+type JsonSerializableValue<V> = V extends JsonValue
+  ? V
+  : V extends (infer U)[]
+    ? JsonSerializableValue<U>[]
+    : V extends object
+      ? JsonSerializable<V>
+      : never;
 /**
  * Full state type combining base state with custom state
  */

package/src/workflow.ts CHANGED Viewed

@@ -116,6 +116,8 @@ export type {
   SessionStartHookContext,
   SessionEndHook,
   SessionEndHookContext,
+  TurnCompleteHook,
+  TurnCompleteHookContext,
   PreHumanMessageAppendHook,
   PreHumanMessageAppendHookContext,
   PostHumanMessageAppendHook,