npm - zeitlich - Versions diffs - 0.2.49 → 0.2.51 - Mend

zeitlich 0.2.49 → 0.2.51

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (127) hide show

package/README.md +26 -23
package/dist/adapters/sandbox/daytona/index.cjs.map +1 -1
package/dist/adapters/sandbox/daytona/index.d.cts +3 -3
package/dist/adapters/sandbox/daytona/index.d.ts +3 -3
package/dist/adapters/sandbox/daytona/index.js.map +1 -1
package/dist/adapters/sandbox/daytona/workflow.d.cts +2 -2
package/dist/adapters/sandbox/daytona/workflow.d.ts +2 -2
package/dist/adapters/sandbox/e2b/index.cjs.map +1 -1
package/dist/adapters/sandbox/e2b/index.d.cts +1 -1
package/dist/adapters/sandbox/e2b/index.d.ts +1 -1
package/dist/adapters/sandbox/e2b/index.js.map +1 -1
package/dist/adapters/sandbox/e2b/workflow.d.cts +1 -1
package/dist/adapters/sandbox/e2b/workflow.d.ts +1 -1
package/dist/adapters/thread/anthropic/index.cjs +60 -55
package/dist/adapters/thread/anthropic/index.cjs.map +1 -1
package/dist/adapters/thread/anthropic/index.d.cts +20 -15
package/dist/adapters/thread/anthropic/index.d.ts +20 -15
package/dist/adapters/thread/anthropic/index.js +60 -55
package/dist/adapters/thread/anthropic/index.js.map +1 -1
package/dist/adapters/thread/anthropic/workflow.d.cts +7 -7
package/dist/adapters/thread/anthropic/workflow.d.ts +7 -7
package/dist/adapters/thread/google-genai/index.cjs +135 -66
package/dist/adapters/thread/google-genai/index.cjs.map +1 -1
package/dist/adapters/thread/google-genai/index.d.cts +200 -26
package/dist/adapters/thread/google-genai/index.d.ts +200 -26
package/dist/adapters/thread/google-genai/index.js +135 -66
package/dist/adapters/thread/google-genai/index.js.map +1 -1
package/dist/adapters/thread/google-genai/workflow.d.cts +8 -8
package/dist/adapters/thread/google-genai/workflow.d.ts +8 -8
package/dist/adapters/thread/langchain/index.cjs +67 -55
package/dist/adapters/thread/langchain/index.cjs.map +1 -1
package/dist/adapters/thread/langchain/index.d.cts +20 -15
package/dist/adapters/thread/langchain/index.d.ts +20 -15
package/dist/adapters/thread/langchain/index.js +67 -55
package/dist/adapters/thread/langchain/index.js.map +1 -1
package/dist/adapters/thread/langchain/workflow.d.cts +7 -7
package/dist/adapters/thread/langchain/workflow.d.ts +7 -7
package/dist/{cold-store-DKMAO1Dd.d.ts → cold-store-DyHodfAB.d.ts} +1 -1
package/dist/{cold-store-CkWoNtMh.d.cts → cold-store-YOx9nmgR.d.cts} +1 -1
package/dist/index.cjs +15050 -420
package/dist/index.cjs.map +1 -1
package/dist/index.d.cts +79 -83
package/dist/index.d.ts +79 -83
package/dist/index.js +15051 -417
package/dist/index.js.map +1 -1
package/dist/{proxy-B7CWEV-T.d.cts → proxy-2htgGQrc.d.cts} +1 -1
package/dist/{proxy-ByFHMVRX.d.ts → proxy-CmiTP4pp.d.ts} +1 -1
package/dist/{thread-manager-nK-WcFzM.d.ts → thread-manager-BJ5pz5Cx.d.cts} +6 -7
package/dist/{thread-manager-7AW4rhfu.d.ts → thread-manager-BQAbrYXH.d.cts} +6 -7
package/dist/{thread-manager-Cibe0X5m.d.cts → thread-manager-CcvltOuq.d.ts} +6 -7
package/dist/{thread-manager-B9rtMEVn.d.cts → thread-manager-DHAbncHX.d.ts} +6 -7
package/dist/{types-gVa5XCWD.d.ts → types-BQvXWcft.d.ts} +1 -1
package/dist/{types-XUUFvrJ9.d.cts → types-BjdqxKYp.d.cts} +709 -709
package/dist/{types-CJ7tCdl6.d.ts → types-D8W5TnSa.d.cts} +3 -3
package/dist/{types-CJ7tCdl6.d.cts → types-D8W5TnSa.d.ts} +3 -3
package/dist/{types-DO4Tkwxo.d.ts → types-DEbkLA06.d.ts} +3 -3
package/dist/{types-DeVNWqlb.d.ts → types-DiI7mZhI.d.ts} +709 -709
package/dist/{types-BR-k7h0e.d.cts → types-N_LTWe4b.d.cts} +3 -3
package/dist/{types-CjY93AWZ.d.cts → types-OEN1xrFg.d.cts} +1 -1
package/dist/{workflow-uhOIj9D-.d.ts → workflow-CcgD6EUB.d.cts} +34 -3
package/dist/{workflow-KbGsxpfh.d.cts → workflow-DBjPOKBr.d.ts} +34 -3
package/dist/workflow.cjs +15008 -377
package/dist/workflow.cjs.map +1 -1
package/dist/workflow.d.cts +3 -3
package/dist/workflow.d.ts +3 -3
package/dist/workflow.js +15009 -374
package/dist/workflow.js.map +1 -1
package/package.json +10 -37
package/src/adapters/thread/anthropic/activities.test.ts +115 -0
package/src/adapters/thread/anthropic/activities.ts +11 -19
package/src/adapters/thread/anthropic/fork-transform.test.ts +17 -11
package/src/adapters/thread/anthropic/model-invoker.test.ts +54 -3
package/src/adapters/thread/anthropic/model-invoker.ts +11 -1
package/src/adapters/thread/anthropic/thread-manager.test.ts +2 -2
package/src/adapters/thread/anthropic/thread-manager.ts +3 -4
package/src/adapters/thread/google-genai/activities.test.ts +162 -0
package/src/adapters/thread/google-genai/activities.ts +38 -15
package/src/adapters/thread/google-genai/fork-transform.test.ts +17 -11
package/src/adapters/thread/google-genai/model-invoker.test.ts +386 -0
package/src/adapters/thread/google-genai/model-invoker.ts +118 -23
package/src/adapters/thread/google-genai/thread-manager.test.ts +2 -2
package/src/adapters/thread/google-genai/thread-manager.ts +3 -4
package/src/adapters/thread/langchain/activities.test.ts +88 -0
package/src/adapters/thread/langchain/activities.ts +15 -12
package/src/adapters/thread/langchain/fork-transform.test.ts +17 -11
package/src/adapters/thread/langchain/model-invoker.test.ts +74 -0
package/src/adapters/thread/langchain/model-invoker.ts +16 -3
package/src/adapters/thread/langchain/thread-manager.test.ts +2 -2
package/src/adapters/thread/langchain/thread-manager.ts +3 -4
package/src/index.ts +2 -2
package/src/lib/sandbox/capability-types.test.ts +2 -2
package/src/lib/sandbox/manager.ts +2 -6
package/src/lib/sandbox/sandbox.test.ts +1 -1
package/src/lib/sandbox/types.ts +2 -2
package/src/lib/session/session.integration.test.ts +92 -0
package/src/lib/session/session.ts +23 -11
package/src/lib/thread/keys.test.ts +9 -9
package/src/lib/thread/keys.ts +1 -1
package/src/lib/thread/manager.test.ts +24 -14
package/src/lib/thread/manager.ts +19 -23
package/src/lib/thread/snapshot.test.ts +51 -43
package/src/lib/thread/snapshot.ts +54 -32
package/src/lib/thread/test-utils.ts +106 -59
package/src/lib/thread/tiered.test.ts +1 -1
package/src/lib/thread/types.ts +2 -2
package/src/lib/tool-router/router.integration.test.ts +44 -0
package/src/lib/tool-router/router.ts +140 -32
package/src/lib/workflow.ts +49 -0
package/src/{adapters/sandbox/inmemory/proxy.ts → test-utils/in-memory-sandbox-proxy.ts} +5 -16
package/src/{adapters/sandbox/inmemory/index.ts → test-utils/in-memory-sandbox.ts} +11 -3
package/src/tools/bash/bash.test.ts +1 -1
package/src/tools/edit/handler.test.ts +1 -1
package/tsup.config.ts +2 -4
package/dist/activities-7OcT_vdR.d.cts +0 -162
package/dist/activities-zG_FBoY2.d.ts +0 -162
package/dist/adapters/sandbox/inmemory/index.cjs +0 -214
package/dist/adapters/sandbox/inmemory/index.cjs.map +0 -1
package/dist/adapters/sandbox/inmemory/index.d.cts +0 -40
package/dist/adapters/sandbox/inmemory/index.d.ts +0 -40
package/dist/adapters/sandbox/inmemory/index.js +0 -211
package/dist/adapters/sandbox/inmemory/index.js.map +0 -1
package/dist/adapters/sandbox/inmemory/workflow.cjs +0 -36
package/dist/adapters/sandbox/inmemory/workflow.cjs.map +0 -1
package/dist/adapters/sandbox/inmemory/workflow.d.cts +0 -27
package/dist/adapters/sandbox/inmemory/workflow.d.ts +0 -27
package/dist/adapters/sandbox/inmemory/workflow.js +0 -34
package/dist/adapters/sandbox/inmemory/workflow.js.map +0 -1

package/src/adapters/thread/google-genai/model-invoker.test.ts ADDED Viewed

@@ -0,0 +1,386 @@
+import { describe, expect, it, vi } from "vitest";
+import {
+  FunctionCallingConfigMode,
+  type Content,
+  type GenerateContentResponse,
+  type Part,
+} from "@google/genai";
+import { createGoogleGenAIModelInvoker } from "./model-invoker";
+import type { StoredContent } from "./thread-manager";
+import type { AgentResponse } from "../../../lib/model";
+import { THREAD_TTL_SECONDS } from "../../../lib/thread/keys";
+const textReply: Part[] = [{ text: "ok" }];
+function createMockRedis(
+  stored: StoredContent[],
+  extra?: Record<string, string>
+) {
+  return {
+    exists: vi.fn().mockResolvedValue(1),
+    lRange: vi.fn().mockResolvedValue(stored.map((m) => JSON.stringify(m))),
+    lTrim: vi.fn().mockResolvedValue("OK"),
+    get: vi
+      .fn()
+      .mockImplementation((key: string) =>
+        Promise.resolve(extra?.[key] ?? null)
+      ),
+    del: vi.fn().mockResolvedValue(1),
+    set: vi.fn().mockResolvedValue("OK"),
+    rPush: vi.fn().mockResolvedValue(1),
+    expire: vi.fn().mockResolvedValue(1),
+    eval: vi.fn().mockResolvedValue(1),
+  };
+}
+function createMockClient(parts: Part[] = textReply) {
+  const chunk: Partial<GenerateContentResponse> = {
+    candidates: [{ content: { role: "model", parts } }],
+    usageMetadata: { promptTokenCount: 10, candidatesTokenCount: 5 },
+  };
+  return {
+    models: {
+      generateContentStream: vi.fn().mockResolvedValue({
+        async *[Symbol.asyncIterator]() {
+          yield chunk;
+        },
+      }),
+    },
+    caches: {
+      create: vi.fn().mockResolvedValue({ name: "cached-content-ref" }),
+    },
+  };
+}
+const defaultStored: StoredContent[] = [
+  {
+    id: "msg-1",
+    content: { role: "user", parts: [{ text: "classify these files" }] },
+  },
+];
+const invokerConfig = {
+  threadId: "thread-1",
+  assistantMessageId: "assistant-1",
+  state: { tools: [] } as never,
+  agentName: "TestAgent",
+};
+function invoke(parts: Part[]): Promise<AgentResponse<Content>> {
+  const redis = createMockRedis(defaultStored);
+  const client = createMockClient(parts);
+  const invoker = createGoogleGenAIModelInvoker({
+    redis: redis as never,
+    client: client as never,
+    model: "gemini-2.5-flash",
+  });
+  return invoker(invokerConfig);
+}
+describe("Google GenAI model invoker — function call IDs", () => {
+  it("assigns synthetic IDs when Gemini omits them", async () => {
+    const result = await invoke([
+      { functionCall: { name: "classifyFile", args: { index: 0 } } },
+      { functionCall: { name: "classifyFile", args: { index: 1 } } },
+    ]);
+    expect(result.rawToolCalls).toHaveLength(2);
+    for (const tc of result.rawToolCalls) {
+      expect(tc.id).toBeDefined();
+      expect(tc.id).not.toBe("");
+    }
+  });
+  it("preserves existing IDs from Gemini when present", async () => {
+    const result = await invoke([
+      {
+        functionCall: {
+          id: "gemini-abc123",
+          name: "lookupFile",
+          args: { path: "/a" },
+        },
+      },
+    ]);
+    expect(result.rawToolCalls[0]?.id).toBe("gemini-abc123");
+  });
+  it("generates unique IDs across multiple function calls", async () => {
+    const parts: Part[] = Array.from({ length: 5 }, (_, i) => ({
+      functionCall: { name: "inspect", args: { index: i } },
+    }));
+    const result = await invoke(parts);
+    const ids = result.rawToolCalls.map((tc) => tc.id);
+    expect(new Set(ids).size).toBe(5);
+  });
+  it("matches IDs between message parts and rawToolCalls", async () => {
+    const result = await invoke([
+      { functionCall: { name: "toolA", args: {} } },
+      { functionCall: { name: "toolB", args: {} } },
+    ]);
+    const partIds = result.message.parts
+      ?.filter((p) => p.functionCall)
+      .map((p) => p.functionCall?.id);
+    const rawIds = result.rawToolCalls.map((tc) => tc.id);
+    expect(partIds).toEqual(rawIds);
+  });
+  it("handles a mix of parts with and without existing IDs", async () => {
+    const result = await invoke([
+      { functionCall: { id: "existing-id", name: "toolA", args: {} } },
+      { functionCall: { name: "toolB", args: {} } },
+      { text: "some reasoning text" },
+    ]);
+    expect(result.rawToolCalls).toHaveLength(2);
+    expect(result.rawToolCalls[0]?.id).toBe("existing-id");
+    expect(result.rawToolCalls[1]?.id).toBeDefined();
+    expect(result.rawToolCalls[1]?.id).not.toBe("");
+    expect(result.rawToolCalls[1]?.id).not.toBe("existing-id");
+  });
+});
+describe("Google GenAI model invoker — context caching", () => {
+  const multiMessageThread: StoredContent[] = [
+    {
+      id: "msg-1",
+      content: {
+        role: "user",
+        parts: [{ inlineData: { data: "base64img", mimeType: "image/png" } }],
+      },
+    },
+    {
+      id: "msg-2",
+      content: { role: "model", parts: [{ text: "I see the image" }] },
+    },
+    {
+      id: "msg-3",
+      content: { role: "user", parts: [{ text: "classify it" }] },
+    },
+  ];
+  it("creates a cache and sends only live contents when contents exceed splitIndex", async () => {
+    const redis = createMockRedis(multiMessageThread);
+    const client = createMockClient();
+    const invoker = createGoogleGenAIModelInvoker({
+      redis: redis as never,
+      client: client as never,
+      model: "gemini-2.5-flash",
+      cache: { splitIndex: 1 },
+    });
+    await invoker(invokerConfig);
+    expect(client.caches.create).toHaveBeenCalledOnce();
+    const cacheCall = client.caches.create.mock.calls[0]?.[0];
+    expect(cacheCall.model).toBe("gemini-2.5-flash");
+    expect(cacheCall.config.contents).toHaveLength(1);
+    expect(cacheCall.config.ttl).toBe("300s");
+    const streamCall = client.models.generateContentStream.mock.calls[0]?.[0];
+    expect(streamCall.contents).toHaveLength(2);
+    expect(streamCall.config.cachedContent).toBe("cached-content-ref");
+    expect(streamCall.config.systemInstruction).toBeUndefined();
+    expect(streamCall.config.tools).toBeUndefined();
+  });
+  it("skips caching when contents.length <= splitIndex", async () => {
+    const redis = createMockRedis(defaultStored);
+    const client = createMockClient();
+    const invoker = createGoogleGenAIModelInvoker({
+      redis: redis as never,
+      client: client as never,
+      model: "gemini-2.5-flash",
+      cache: { splitIndex: 1 },
+    });
+    await invoker(invokerConfig);
+    expect(client.caches.create).not.toHaveBeenCalled();
+    const streamCall = client.models.generateContentStream.mock.calls[0]?.[0];
+    expect(streamCall.contents).toHaveLength(1);
+    expect(streamCall.config.cachedContent).toBeUndefined();
+  });
+  it("uses custom TTL", async () => {
+    const redis = createMockRedis(multiMessageThread);
+    const client = createMockClient();
+    const invoker = createGoogleGenAIModelInvoker({
+      redis: redis as never,
+      client: client as never,
+      model: "gemini-2.5-flash",
+      cache: { splitIndex: 1, ttlSeconds: 600 },
+    });
+    await invoker(invokerConfig);
+    const cacheCall = client.caches.create.mock.calls[0]?.[0];
+    expect(cacheCall.config.ttl).toBe("600s");
+  });
+  it("moves toolConfig into cache and clears it from live request", async () => {
+    const redis = createMockRedis(multiMessageThread);
+    const client = createMockClient();
+    const toolConfig = {
+      functionCallingConfig: { mode: FunctionCallingConfigMode.ANY },
+    };
+    const invoker = createGoogleGenAIModelInvoker({
+      redis: redis as never,
+      client: client as never,
+      model: "gemini-2.5-flash",
+      cache: { splitIndex: 1 },
+      config: { toolConfig },
+    });
+    await invoker(invokerConfig);
+    const cacheCall = client.caches.create.mock.calls[0]?.[0];
+    expect(cacheCall.config.toolConfig).toEqual(toolConfig);
+    const streamCall = client.models.generateContentStream.mock.calls[0]?.[0];
+    expect(streamCall.config.toolConfig).toBeUndefined();
+  });
+  it("skips caching when splitIndex is 0", async () => {
+    const redis = createMockRedis(multiMessageThread);
+    const client = createMockClient();
+    const invoker = createGoogleGenAIModelInvoker({
+      redis: redis as never,
+      client: client as never,
+      model: "gemini-2.5-flash",
+      cache: { splitIndex: 0 },
+    });
+    await invoker(invokerConfig);
+    expect(client.caches.create).not.toHaveBeenCalled();
+    const streamCall = client.models.generateContentStream.mock.calls[0]?.[0];
+    expect(streamCall.config.cachedContent).toBeUndefined();
+  });
+  it("reuses cached content name from Redis instead of creating a new cache", async () => {
+    const redis = createMockRedis(multiMessageThread, {
+      "messages:gemini-cache:gemini-2.5-flash:1:thread:thread-1":
+        "cachedContents/existing",
+    });
+    const client = createMockClient();
+    const invoker = createGoogleGenAIModelInvoker({
+      redis: redis as never,
+      client: client as never,
+      model: "gemini-2.5-flash",
+      cache: { splitIndex: 1 },
+    });
+    await invoker(invokerConfig);
+    expect(client.caches.create).not.toHaveBeenCalled();
+    const streamCall = client.models.generateContentStream.mock.calls[0]?.[0];
+    expect(streamCall.config.cachedContent).toBe("cachedContents/existing");
+    expect(streamCall.contents).toHaveLength(2);
+  });
+  it("stores cache name in Redis after creation", async () => {
+    const redis = createMockRedis(multiMessageThread);
+    const client = createMockClient();
+    const invoker = createGoogleGenAIModelInvoker({
+      redis: redis as never,
+      client: client as never,
+      model: "gemini-2.5-flash",
+      cache: { splitIndex: 1, ttlSeconds: 600 },
+    });
+    await invoker(invokerConfig);
+    expect(client.caches.create).toHaveBeenCalledOnce();
+    const setCall = redis.set.mock.calls.find(
+      (c: string[]) =>
+        c[0] === "messages:gemini-cache:gemini-2.5-flash:1:thread:thread-1"
+    );
+    expect(setCall).toBeDefined();
+    expect(setCall?.[1]).toBe("cached-content-ref");
+    expect(setCall?.[2]).toEqual({ EX: 595 });
+  });
+  it("reports cachedWriteTokens from cache creation", async () => {
+    const redis = createMockRedis(multiMessageThread);
+    const client = createMockClient();
+    client.caches.create.mockResolvedValue({
+      name: "cached-content-ref",
+      usageMetadata: { totalTokenCount: 4200 },
+    });
+    const invoker = createGoogleGenAIModelInvoker({
+      redis: redis as never,
+      client: client as never,
+      model: "gemini-2.5-flash",
+      cache: { splitIndex: 1 },
+    });
+    const result = await invoker(invokerConfig);
+    expect(result.usage?.cachedWriteTokens).toBe(4200);
+  });
+});
+describe("Google GenAI model invoker — thread TTL", () => {
+  // A thread whose tail is a prior attempt's assistant message stored
+  // under `assistant-1`, so the invoker's `truncateFromId(assistant-1)`
+  // trims it and re-stamps the surviving list key's TTL.
+  const retriedThread: StoredContent[] = [
+    { id: "msg-1", content: { role: "user", parts: [{ text: "hi" }] } },
+    {
+      id: "assistant-1",
+      content: { role: "model", parts: [{ text: "prior attempt" }] },
+    },
+  ];
+  const listKey = "messages:thread:thread-1";
+  it("re-stamps trimmed hot keys at the configured ttlSeconds", async () => {
+    const redis = createMockRedis(retriedThread);
+    const client = createMockClient();
+    const invoker = createGoogleGenAIModelInvoker({
+      redis: redis as never,
+      client: client as never,
+      model: "gemini-2.5-flash",
+      ttlSeconds: 3600,
+    });
+    await invoker(invokerConfig);
+    expect(redis.lTrim).toHaveBeenCalledWith(listKey, 0, 0);
+    expect(redis.expire).toHaveBeenCalledWith(listKey, 3600);
+    expect(redis.expire).not.toHaveBeenCalledWith(listKey, THREAD_TTL_SECONDS);
+  });
+  it("defaults to THREAD_TTL_SECONDS when ttlSeconds is omitted", async () => {
+    const redis = createMockRedis(retriedThread);
+    const client = createMockClient();
+    const invoker = createGoogleGenAIModelInvoker({
+      redis: redis as never,
+      client: client as never,
+      model: "gemini-2.5-flash",
+    });
+    await invoker(invokerConfig);
+    expect(redis.lTrim).toHaveBeenCalledWith(listKey, 0, 0);
+    expect(redis.expire).toHaveBeenCalledWith(listKey, THREAD_TTL_SECONDS);
+  });
+});

package/src/adapters/thread/google-genai/model-invoker.ts CHANGED Viewed

@@ -1,8 +1,10 @@
-import type Redis from "ioredis";
+import type { RedisClientType as Redis } from "redis";
+import { randomBytes } from "node:crypto";
 import type {
   GoogleGenAI,
   Content,
   FunctionDeclaration,
+  GenerateContentConfig,
   Part,
   GenerateContentResponse,
 } from "@google/genai";
@@ -19,6 +21,24 @@ export interface GoogleGenAIModelInvokerConfig {
   client: GoogleGenAI;
   model: string;
   hooks?: GoogleGenAIThreadManagerHooks;
+  /**
+   * Redis TTL for the thread's keys; defaults to 90 days. Use a shorter
+   * value (hours) with a cold tier. Distinct from `cache.ttlSeconds`
+   * (server-side context caching).
+   */
+  ttlSeconds?: number;
+  /** Passed through to `generateContentStream().config`.
+   *  `systemInstruction`, `tools`, and `abortSignal` are managed by the
+   *  invoker and will override any values set here. */
+  config?: GenerateContentConfig;
+  /** Caches the first `splitIndex` messages server-side (with
+   *  `systemInstruction`, `tools`, and `toolConfig`). Skipped when
+   *  `contents.length <= splitIndex`. */
+  cache?: {
+    splitIndex: number;
+    /** Default: 300. */
+    ttlSeconds?: number;
+  };
 }
 function toFunctionDeclarations(
@@ -32,12 +52,7 @@ function toFunctionDeclarations(
 }
 /**
- * Creates a Google GenAI model invoker that satisfies the generic
- * `ModelInvoker<Content>` contract.
- *
- * Internally streams the response and emits Temporal heartbeats on each
- * chunk so that long-running LLM calls remain visible to the scheduler.
- * The caller is responsible for appending the response to the thread.
+ * The caller is responsible for appending the returned response to the thread.
  *
  * @example
  * ```typescript
@@ -60,6 +75,9 @@ export function createGoogleGenAIModelInvoker({
   client,
   model,
   hooks,
+  ttlSeconds,
+  config: generationConfig,
+  cache: cacheConfig,
 }: GoogleGenAIModelInvokerConfig) {
   return async function invokeGoogleGenAIModel(
     config: ModelInvokerConfig
@@ -72,25 +90,84 @@ export function createGoogleGenAIModelInvoker({
       threadId,
       key: threadKey,
       hooks,
+      ...(ttlSeconds !== undefined && { ttlSeconds }),
     });
     // Truncate the thread starting at the id the assistant message
     // will be stored under. No-op on the first attempt; on rewind
     // retry / Temporal reset it wipes the prior attempt's assistant
     // + tool results so the LLM sees the original pre-call state.
     await thread.truncateFromId(assistantMessageId);
-    const { contents, systemInstruction } =
-      await thread.prepareForInvocation();
+    const { contents, systemInstruction } = await thread.prepareForInvocation();
     const functionDeclarations = toFunctionDeclarations(state.tools);
     const tools =
       functionDeclarations.length > 0 ? [{ functionDeclarations }] : undefined;
+    const {
+      systemInstruction: _si,
+      tools: _t,
+      abortSignal: _as,
+      cachedContent: callerCachedContent,
+      toolConfig: callerToolConfig,
+      ...callerConfig
+    } = generationConfig ?? {};
+    let liveContents = contents;
+    let cachedContentName: string | undefined;
+    let cachedWriteTokens: number | undefined;
+    if (
+      cacheConfig &&
+      cacheConfig.splitIndex > 0 &&
+      contents.length > cacheConfig.splitIndex
+    ) {
+      liveContents = contents.slice(cacheConfig.splitIndex);
+      const ttl = cacheConfig.ttlSeconds ?? 300;
+      const cacheRedisKey = `${threadKey ?? "messages"}:gemini-cache:${model}:${cacheConfig.splitIndex}:thread:${threadId}`;
+      cachedContentName = (await redis.get(cacheRedisKey)) ?? undefined;
+      if (!cachedContentName) {
+        const cacheInstance = await client.caches.create({
+          model,
+          config: {
+            contents: contents.slice(0, cacheConfig.splitIndex),
+            ...(systemInstruction ? { systemInstruction } : {}),
+            ...(tools ? { tools } : {}),
+            ...(callerToolConfig ? { toolConfig: callerToolConfig } : {}),
+            ttl: `${ttl}s`,
+            abortSignal: signal,
+          },
+        });
+        if (!cacheInstance?.name) {
+          throw new Error("Gemini cache creation did not return a cache name");
+        }
+        cachedContentName = cacheInstance.name;
+        cachedWriteTokens =
+          cacheInstance.usageMetadata?.totalTokenCount ?? undefined;
+        const redisTtl = ttl - 5;
+        if (redisTtl > 0) {
+          await redis.set(cacheRedisKey, cachedContentName, { EX: redisTtl });
+        }
+      }
+    }
     const stream = await client.models.generateContentStream({
       model,
-      contents,
+      contents: liveContents,
       config: {
-        ...(systemInstruction ? { systemInstruction } : {}),
-        ...(tools ? { tools } : {}),
+        ...callerConfig,
+        ...(cachedContentName
+          ? { cachedContent: cachedContentName }
+          : {
+              ...(callerCachedContent
+                ? { cachedContent: callerCachedContent }
+                : {
+                    ...(systemInstruction ? { systemInstruction } : {}),
+                    ...(tools ? { tools } : {}),
+                  }),
+              ...(callerToolConfig ? { toolConfig: callerToolConfig } : {}),
+            }),
         abortSignal: signal,
       },
     });
@@ -107,48 +184,66 @@ export function createGoogleGenAIModelInvoker({
       throw new Error("Google GenAI stream ended without producing any chunks");
     }
+    for (const part of allParts) {
+      if (part.functionCall && !part.functionCall.id) {
+        part.functionCall.id = randomBytes(8).toString("hex");
+      }
+    }
     const modelContent: Content = { role: "model", parts: allParts };
-    const functionCalls = lastChunk.functionCalls ?? [];
     return {
       message: modelContent,
-      rawToolCalls: functionCalls.map((fc) => ({
-        id: fc.id,
-        name: fc.name ?? "",
-        args: fc.args ?? {},
-      })),
+      rawToolCalls: allParts
+        .filter(
+          (
+            p
+          ): p is Part & { functionCall: NonNullable<Part["functionCall"]> } =>
+            !!p.functionCall
+        )
+        .map((p) => ({
+          id: p.functionCall.id,
+          name: p.functionCall.name ?? "",
+          args: p.functionCall.args ?? {},
+        })),
       usage: {
         inputTokens: lastChunk.usageMetadata?.promptTokenCount,
         outputTokens: lastChunk.usageMetadata?.candidatesTokenCount,
+        cachedWriteTokens,
         cachedReadTokens: lastChunk.usageMetadata?.cachedContentTokenCount,
+        reasonTokens: lastChunk.usageMetadata?.thoughtsTokenCount,
       },
     };
   };
 }
-/**
- * Standalone function for one-shot Google GenAI model invocation.
- * Convenience wrapper around createGoogleGenAIModelInvoker for cases
- * where you don't need to reuse the invoker.
- */
 export async function invokeGoogleGenAIModel({
   redis,
   client,
   model,
   hooks,
+  ttlSeconds,
   config,
+  generationConfig,
+  cache,
 }: {
   redis: Redis;
   client: GoogleGenAI;
   model: string;
   hooks?: GoogleGenAIThreadManagerHooks;
+  ttlSeconds?: number;
   config: ModelInvokerConfig;
+  generationConfig?: GenerateContentConfig;
+  cache?: GoogleGenAIModelInvokerConfig["cache"];
 }): Promise<AgentResponse<Content>> {
   const invoker = createGoogleGenAIModelInvoker({
     redis,
     client,
     model,
     hooks,
+    ...(ttlSeconds !== undefined && { ttlSeconds }),
+    config: generationConfig,
+    cache,
   });
   return invoker(config);
 }

package/src/adapters/thread/google-genai/thread-manager.test.ts CHANGED Viewed

@@ -6,10 +6,10 @@ import { createGoogleGenAIThreadManager } from "./thread-manager";
 function createMockRedis(stored: StoredContent[]) {
   return {
     exists: vi.fn().mockResolvedValue(1),
-    lrange: vi.fn().mockResolvedValue(stored.map((m) => JSON.stringify(m))),
+    lRange: vi.fn().mockResolvedValue(stored.map((m) => JSON.stringify(m))),
     del: vi.fn().mockResolvedValue(1),
     set: vi.fn().mockResolvedValue("OK"),
-    rpush: vi.fn().mockResolvedValue(1),
+    rPush: vi.fn().mockResolvedValue(1),
     expire: vi.fn().mockResolvedValue(1),
     eval: vi.fn().mockResolvedValue(1),
   };

package/src/adapters/thread/google-genai/thread-manager.ts CHANGED Viewed

@@ -1,4 +1,4 @@
-import type Redis from "ioredis";
+import type { RedisClientType as Redis } from "redis";
 import type { Content, Part } from "@google/genai";
 import { createThreadManager } from "../../../lib/thread/manager";
 import type {
@@ -32,9 +32,8 @@ export interface GoogleGenAIThreadManagerConfig {
   key?: string;
   hooks?: GoogleGenAIThreadManagerHooks;
   /**
-   * Override the default thread TTL (90 days). When pairing the
-   * adapter with a durable cold tier, a shorter TTL (hours) is
-   * typically more appropriate.
+   * Redis TTL for the thread's keys; defaults to 90 days. Use a shorter
+   * value (hours) with a cold tier.
    */
   ttlSeconds?: number;
 }