npm - @gammatech/aijsx - Versions diffs - 0.15.3-dev.2024-10-21 → 0.16.0-dev.2024-10-28 - Mend

@gammatech/aijsx 0.15.3-dev.2024-10-21 → 0.16.0-dev.2024-10-28

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (11) hide show

package/dist/index.d.mts +20 -15
package/dist/index.d.ts +20 -15
package/dist/index.js +268 -154
package/dist/index.mjs +264 -148
package/dist/{jsx-dev-runtime-lYsmphqH.d.mts → jsx-dev-runtime-yLtSq2UV.d.mts} +13 -6
package/dist/{jsx-dev-runtime-lYsmphqH.d.ts → jsx-dev-runtime-yLtSq2UV.d.ts} +13 -6
package/dist/jsx-dev-runtime.d.mts +1 -1
package/dist/jsx-dev-runtime.d.ts +1 -1
package/dist/jsx-runtime.d.mts +1 -1
package/dist/jsx-runtime.d.ts +1 -1
package/package.json +4 -6

package/dist/index.mjs CHANGED Viewed

@@ -175,7 +175,7 @@ var UserChatMessageBuilder = class {
     this.content.push(props);
     return this;
   }
-  async build() {
+  async build(opts) {
     const promises = this.content.map(
       async (part) => {
         if (typeof part === "string") {
@@ -196,7 +196,8 @@ var UserChatMessageBuilder = class {
     );
     return {
       role: "user",
-      content: await Promise.all(promises)
+      content: await Promise.all(promises),
+      cachePrompt: opts.cachePrompt
     };
   }
 };
@@ -214,21 +215,16 @@ var UserMessage = (props) => {
 var AssistantMessage = (props) => {
   return props.children;
 };
-// src/chat/tokenizer.ts
-var computeUsage = (messages, tokenizer2) => {
-  const promptMessages = [...messages];
-  let assistantMessage;
-  if (promptMessages[promptMessages.length - 1].role === "assistant") {
-    assistantMessage = promptMessages.pop();
-  }
-  const prompt = promptMessages.reduce((acc, m) => acc + tokenizer2(m), 0);
-  const completion = assistantMessage ? tokenizer2(assistantMessage) : 0;
-  return {
-    prompt,
-    completion,
-    total: prompt + completion
-  };
+var ChatMessageXmlAttributes = {
+  AssistantMessage: {
+    cachePrompt: true
+  },
+  UserMessage: {
+    cachePrompt: true
+  },
+  SystemMessage: {
+    cachePrompt: true
+  }
 };
 // src/EventEmitter.ts
@@ -1941,56 +1937,14 @@ var errorToChatCompletionError = (error, requestData) => {
   );
 };
-// src/lib/openai/tokenizer.ts
-import { getEncoding } from "js-tiktoken";
-var cl100kTokenizer = getEncoding("cl100k_base");
-var tokenizer = {
-  encode: (text) => cl100kTokenizer.encode(text),
-  decode: (tokens) => cl100kTokenizer.decode(tokens)
-};
-var TOKENS_PER_MESSAGE = 3;
-var textCost = (content) => {
-  return TOKENS_PER_MESSAGE + tokenizer.encode(content).length;
-};
-var COST_PER_LOW = 85;
-var COST_PER_512x512 = 170;
-var imageCost = (w, h) => {
-  const area = w * h;
-  return Math.ceil(area / (512 * 512)) * COST_PER_512x512 + COST_PER_LOW;
-};
-var openaiTokenizer = (message) => {
-  switch (message.role) {
-    case "assistant":
-    case "system":
-      return textCost(message.content || "");
-    case "user":
-      if (typeof message.content === "string") {
-        return textCost(message.content);
-      }
-      return message.content.reduce((acc, part) => {
-        if (part.type === "text") {
-          return acc + textCost(part.text);
-        } else {
-          if (part.image.detail === "low") {
-            return acc + 85;
-          }
-          if (part.image.dimensions) {
-            return acc + imageCost(
-              part.image.dimensions.width,
-              part.image.dimensions.height
-            );
-          }
-          return acc + imageCost(1024, 1024);
-        }
-      }, 0);
-  }
-};
 // src/chat/buildMessages.ts
 async function toXml(ctx, children) {
   const childrenXml = await ctx.render(children, {
     preserveTags: true,
-    renderedProps: IMAGE_RENDERED_PROPS
+    renderedProps: {
+      ...IMAGE_RENDERED_PROPS,
+      ...ChatMessageXmlAttributes
+    }
   });
   const topLevelTags = ["UserMessage", "AssistantMessage", "SystemMessage"];
   const chatMessageTags = [...topLevelTags, "ImagePart"];
@@ -2030,25 +1984,35 @@ async function buildChatMessages(ctx, children, opts) {
         throw new Error("Invalid User ChildNode, expecting Text or ImagePart");
       }
     }
-    return builder.build();
+    return builder.build({
+      cachePrompt: node.attributes.cachePrompt === true
+    });
   };
   return iterateChatMessageXml(nodes, async (node) => {
-    switch (node.nodeName) {
-      case "UserMessage":
-        return handleUserMessage(node);
-      case "SystemMessage":
-        return {
-          role: "system",
-          content: node.textContent
-        };
-      case "AssistantMessage":
-        return {
-          role: "assistant",
-          content: node.textContent
-        };
-      default:
-        throw new Error("Invalid top level chat message tags");
-    }
+    const cachePrompt = node.attributes.cachePrompt === true;
+    const getMessageWithoutCachePrompt = () => {
+      switch (node.nodeName) {
+        case "UserMessage":
+          return handleUserMessage(node);
+        case "SystemMessage":
+          return {
+            role: "system",
+            content: node.textContent
+          };
+        case "AssistantMessage":
+          return {
+            role: "assistant",
+            content: node.textContent
+          };
+        default:
+          throw new Error("Invalid top level chat message tags");
+      }
+    };
+    const message = await getMessageWithoutCachePrompt();
+    return cachePrompt ? {
+      ...message,
+      cachePrompt: true
+    } : message;
   });
 }
@@ -2148,6 +2112,9 @@ async function* OpenAIChatCompletionInner(props, ctx) {
   const chatCompletionRequest = {
     model: props.model,
     max_tokens: props.maxTokens,
+    stream_options: {
+      include_usage: true
+    },
     temperature: props.temperature,
     stop: props.stop,
     messages: openAIMessages,
@@ -2185,8 +2152,24 @@ async function* OpenAIChatCompletionInner(props, ctx) {
   }
   let finishReason = void 0;
   let content = "";
+  let tokensUsed = {
+    prompt: 0,
+    completion: 0,
+    total: 0,
+    cachedPromptTokensCreated: 0,
+    cachedPromptTokensRead: 0
+  };
   try {
     for await (const message of chatResponse) {
+      if (message.usage) {
+        tokensUsed = {
+          prompt: message.usage.prompt_tokens,
+          completion: message.usage.completion_tokens,
+          total: message.usage.total_tokens,
+          cachedPromptTokensCreated: 0,
+          cachedPromptTokensRead: message.usage.prompt_tokens_details?.cached_tokens || 0
+        };
+      }
       if (!message.choices || !message.choices[0]) {
         continue;
       }
@@ -2212,10 +2195,6 @@ async function* OpenAIChatCompletionInner(props, ctx) {
     role: "assistant",
     content
   };
-  const tokensUsed = computeUsage(
-    [...chatMessages, outputMessage],
-    openaiTokenizer
-  );
   const cost = costFn?.(props.model, tokensUsed) ?? void 0;
   const responseData = {
     ...logRequestData,
@@ -2273,32 +2252,6 @@ import { OpenAI as OpenAIClient3 } from "openai";
 // src/lib/anthropic/Anthropic.tsx
 import AnthropicClient from "@anthropic-ai/sdk";
-// src/lib/anthropic/tokenizer.ts
-import { countTokens } from "@anthropic-ai/tokenizer";
-var DEFAULT_IMAGE_TOKEN_COST = 1334;
-var imageTokens = (w, h) => {
-  return Math.ceil(w * h / 750);
-};
-var anthropicTokenizer = (message) => {
-  if (message.role === "system") {
-    return countTokens(message.content);
-  }
-  if (message.role === "assistant") {
-    return countTokens(message.content);
-  }
-  return message.content.reduce((carry, item) => {
-    let tokens = 0;
-    if (item.type === "text") {
-      tokens = countTokens(item.text);
-    } else {
-      tokens = item.image.dimensions ? imageTokens(item.image.dimensions.width, item.image.dimensions.height) : DEFAULT_IMAGE_TOKEN_COST;
-    }
-    return carry + tokens;
-  }, 0);
-};
-// src/lib/anthropic/Anthropic.tsx
 var defaultClient2 = null;
 var AnthropicClientContext = createContext(async () => {
   if (defaultClient2) {
@@ -2314,21 +2267,73 @@ var AnthropicClientContext = createContext(async () => {
   return defaultClient2;
 });
 var defaultMaxTokens = 4096;
+var populateCacheControl = (message, cachePrompt) => {
+  if (!cachePrompt) {
+    return message;
+  }
+  const content = message.content;
+  if (typeof content === "string") {
+    return {
+      role: message.role,
+      content: [
+        {
+          type: "text",
+          text: content,
+          // @ts-ignore - AnthropicSDK isn't up to date with this
+          cache_control: {
+            type: "ephemeral"
+          }
+        }
+      ]
+    };
+  }
+  if (content.length === 0) {
+    return message;
+  }
+  const lastcontent = {
+    ...content[content.length - 1],
+    cache_control: {
+      type: "ephemeral"
+    }
+  };
+  return {
+    role: message.role,
+    content: [...content.slice(0, -1), lastcontent]
+  };
+};
 var buildAnthropicMessages = (chatMesssages) => {
   let system = "";
   const messages = [];
-  chatMesssages.forEach(({ role, content }) => {
+  chatMesssages.forEach(({ role, content, cachePrompt }) => {
     if (role === "system") {
-      system = content;
+      if (cachePrompt) {
+        system = [
+          {
+            type: "text",
+            text: content,
+            // @ts-ignore - AnthropicSDK isn't up to date with this
+            cache_control: {
+              type: "ephemeral"
+            }
+          }
+        ];
+      } else {
+        system = content;
+      }
       return;
     }
     if (role === "user") {
       const userContent = content;
       if (userContent.length === 1 && userContent[0].type === "text") {
-        messages.push({
-          role,
-          content: userContent[0].text
-        });
+        messages.push(
+          populateCacheControl(
+            {
+              role,
+              content: userContent[0].text
+            },
+            cachePrompt
+          )
+        );
         return;
       }
       const c = userContent.map((part) => {
@@ -2353,17 +2358,27 @@ var buildAnthropicMessages = (chatMesssages) => {
           a.type === "image" || a.type === "text" && a.text.trim().length > 0
         )
       );
-      messages.push({
-        role,
-        content: c
-      });
+      messages.push(
+        populateCacheControl(
+          {
+            role,
+            content: c
+          },
+          cachePrompt
+        )
+      );
       return;
     }
     if (role === "assistant") {
-      messages.push({
-        role,
-        content
-      });
+      messages.push(
+        populateCacheControl(
+          {
+            role,
+            content
+          },
+          cachePrompt
+        )
+      );
       return;
     }
     throw new Error(`Invalid role: ${role}`);
@@ -2416,6 +2431,9 @@ function AnthropicChatCompletion(props, ctx) {
     }
   );
 }
+var ANTHROPIC_DEFAULT_HEADERS = {
+  "anthropic-beta": "prompt-caching-2024-07-31"
+};
 async function* AnthropicChatCompletionInner(props, ctx) {
   const startTime = performance.now();
   const { logger, tracer, getContext } = ctx;
@@ -2453,9 +2471,12 @@ async function* AnthropicChatCompletionInner(props, ctx) {
     stop_sequences: stopSequences,
     model: props.model
   };
-  const requestOptions = props.extraHeaders ? {
-    headers: props.extraHeaders
-  } : void 0;
+  const requestOptions = {
+    headers: {
+      ...ANTHROPIC_DEFAULT_HEADERS,
+      ...props.extraHeaders
+    }
+  };
   const chatCompletionRequestToLog = cleanChatCompletionRequest2(
     anthropicCompletionRequest
   );
@@ -2501,13 +2522,27 @@ async function* AnthropicChatCompletionInner(props, ctx) {
     throw err;
   }
   let content = "";
-  let outputUsage;
-  let inputUsage;
   let finishReason = null;
+  const tokensUsed = {
+    prompt: 0,
+    completion: 0,
+    total: 0,
+    cachedPromptTokensCreated: 0,
+    cachedPromptTokensRead: 0
+  };
   try {
     for await (const event of response) {
       if (event.type === "message_start") {
-        inputUsage = event.message.usage?.input_tokens || 0;
+        const inputUsage = event.message.usage;
+        if (inputUsage) {
+          const cacheCreated = inputUsage.cache_creation_input_tokens || 0;
+          const cacheRead = inputUsage.cache_read_input_tokens || 0;
+          const promptTokens = inputUsage.input_tokens + cacheCreated + cacheRead;
+          logger.info(`inputUsage: ${JSON.stringify(inputUsage, null, 2)}`);
+          tokensUsed.prompt = promptTokens;
+          tokensUsed.cachedPromptTokensCreated = cacheCreated;
+          tokensUsed.cachedPromptTokensRead = cacheRead;
+        }
       }
       if (event.type === "content_block_delta" && event.delta.type === "text_delta") {
         const chunk = event.delta.text;
@@ -2516,7 +2551,8 @@ async function* AnthropicChatCompletionInner(props, ctx) {
       }
       if (event.type === "message_delta") {
         finishReason = event.delta.stop_reason;
-        outputUsage = event.usage?.output_tokens;
+        tokensUsed.completion = event.usage?.output_tokens || 0;
+        tokensUsed.total = tokensUsed.prompt + tokensUsed.completion;
         span.setAttributes({
           finishReason
         });
@@ -2534,11 +2570,6 @@ async function* AnthropicChatCompletionInner(props, ctx) {
     role: "assistant",
     content
   };
-  const tokensUsed = inputUsage !== void 0 && outputUsage !== void 0 ? {
-    prompt: inputUsage,
-    completion: outputUsage,
-    total: inputUsage + outputUsage
-  } : computeUsage([...chatMessages, outputMessage], anthropicTokenizer);
   const cost = costFn?.(props.model, tokensUsed) ?? void 0;
   const responseData = {
     ...logRequestData,
@@ -2596,6 +2627,92 @@ function cleanChatCompletionRequest2(chatCompletionRequest) {
 // src/lib/anthropic/index.ts
 import AnthropicClient2 from "@anthropic-ai/sdk";
+// src/lib/anthropic/AnthropicPromptCacheDebugger.tsx
+import crypto from "crypto";
+var renderAttrs = (attrs) => {
+  if (!attrs || Object.keys(attrs).length === 0)
+    return "";
+  return Object.entries(attrs).map(([key, value]) => ` ${key}="${value}"`).join("");
+};
+var indentOver = (str, indent) => {
+  const lines = str.split("\n");
+  return lines.map((l) => "  ".repeat(indent) + l).join("\n");
+};
+var renderTag = (tag2, indent, slice = null) => {
+  if (Array.isArray(tag2)) {
+    return tag2.map((t) => renderTag(t, indent, slice)).join("\n");
+  }
+  if (typeof tag2.children === "string") {
+    const sliced = slice == null ? tag2.children : tag2.children.slice(0, slice);
+    return indentOver(sliced, indent);
+  }
+  if (Array.isArray(tag2.children)) {
+    const children = tag2.children.map((c) => {
+      return renderTag(c, indent + 1, slice);
+    }).join("\n");
+    const res = `<${tag2.type}${renderAttrs(tag2.attrs)}>
+${children}
+</${tag2.type}>`;
+    return indentOver(res, indent);
+  }
+};
+var tag = (type, attrs, children) => {
+  let c;
+  if (typeof children === "string") {
+    c = children;
+  } else if (!Array.isArray(children)) {
+    c = [children];
+  } else {
+    c = children;
+  }
+  return {
+    type,
+    attrs,
+    children: c
+  };
+};
+var AnthropicPromptCacheDebugger = async (props, ctx) => {
+  const chatMessages = await buildChatMessages(ctx, props.children, {
+    useBase64Images: true
+  });
+  const breakpointIndices = chatMessages.map((m, i) => {
+    if (m.cachePrompt) {
+      return i;
+    }
+    return void 0;
+  }).filter((a) => a !== void 0);
+  const messagesToTags = (messages) => {
+    return messages.map((m) => {
+      const role = m.role;
+      const co = m.content;
+      let inner = "";
+      if (typeof co === "string") {
+        inner = co;
+      } else if (Array.isArray(co)) {
+        inner = co.map((c) => {
+          if (c.type === "text") {
+            return tag(c.type, {}, c.text);
+          } else if (c.type === "image") {
+            return tag(c.type, {}, c.image.data?.slice(0, 22) || "image data");
+          }
+          throw new Error("Invalid content");
+        });
+      }
+      return tag(role, {}, inner);
+    });
+  };
+  const final = breakpointIndices.map((acc, i) => {
+    const lastIndex = breakpointIndices[i - 1];
+    const thisIndex = breakpointIndices[i];
+    const toHash = messagesToTags(chatMessages.slice(0, thisIndex + 1));
+    const content = chatMessages.slice(lastIndex + 1, thisIndex + 1);
+    const hash = crypto.createHash("sha256").update(renderTag(toHash, 0)).digest("hex").slice(0, 8);
+    return tag("breakpoint", { index: i, hash }, messagesToTags(content));
+  });
+  const res = final.map((t) => renderTag(t, 0)).join("\n");
+  return res;
+};
 // src/lib/google/Google.tsx
 import {
   HarmBlockThreshold,
@@ -2800,8 +2917,13 @@ async function* GoogleChatCompletionInner(props, ctx) {
     throw errorToChatCompletionError2(err, logRequestData);
   }
   let content = "";
-  let outputUsage = 0;
-  let inputUsage = 0;
+  const tokensUsed = {
+    prompt: 0,
+    completion: 0,
+    total: 0,
+    cachedPromptTokensCreated: 0,
+    cachedPromptTokensRead: 0
+  };
   let finishReason = null;
   try {
     for await (const event of response.stream) {
@@ -2814,10 +2936,10 @@ async function* GoogleChatCompletionInner(props, ctx) {
         }
         if (event.usageMetadata) {
           if (event.usageMetadata.promptTokenCount) {
-            inputUsage = event.usageMetadata.promptTokenCount;
+            tokensUsed.prompt = event.usageMetadata.promptTokenCount;
           }
           if (event.usageMetadata.candidatesTokenCount) {
-            outputUsage = event.usageMetadata.candidatesTokenCount;
+            tokensUsed.completion = event.usageMetadata.candidatesTokenCount;
           }
         }
         const chunk = event.candidates[0].content;
@@ -2855,11 +2977,7 @@ async function* GoogleChatCompletionInner(props, ctx) {
     role: "assistant",
     content
   };
-  const tokensUsed = {
-    prompt: inputUsage,
-    completion: outputUsage,
-    total: inputUsage + outputUsage
-  };
+  tokensUsed.total = tokensUsed.prompt + tokensUsed.completion;
   const cost = costFn?.(props.model, tokensUsed) ?? void 0;
   const responseData = {
     ...logRequestData,
@@ -2944,16 +3062,14 @@ export {
   Trace,
   UserMessage,
   VertexAI2 as VertexAI,
-  anthropicTokenizer,
   attachedContextSymbol,
-  computeUsage,
   createAIElement,
   createContext,
   createPrompt,
   createRenderContext,
   evaluatePrompt,
+  AnthropicPromptCacheDebugger as experimental__AnthropicPromptCacheDebugger,
   isPromptParsed2 as isPromptParsed,
-  openaiTokenizer,
   toDebugMessage,
   tracing
 };

package/dist/{jsx-dev-runtime-lYsmphqH.d.mts → jsx-dev-runtime-yLtSq2UV.d.mts} RENAMED Viewed

@@ -44,13 +44,16 @@ type UserTextPart = {
 type UserChatMessage = {
     role: 'user';
     content: (UserTextPart | UserImagePart)[];
+    cachePrompt?: boolean;
 };
 type ChatMessage = {
     role: 'system';
     content: string;
+    cachePrompt?: boolean;
 } | {
     role: 'assistant';
     content: string;
+    cachePrompt?: boolean;
 } | UserChatMessage;
 type DebugMessage = {
     role: ChatRole;
@@ -58,6 +61,14 @@ type DebugMessage = {
 };
 declare const toDebugMessage: (message: ChatMessage) => DebugMessage;
+type ChatCompletionUsage = {
+    prompt: number;
+    completion: number;
+    total: number;
+    cachedPromptTokensCreated: number;
+    cachedPromptTokensRead: number;
+};
 type Literal = string | number | null | undefined | boolean;
 interface RenderResult extends AsyncGenerator<string, void> {
     then(onFulfilled: (value: string) => string | PromiseLike<string>, onRejected?: (reason: any) => string | PromiseLike<string>): PromiseLike<string>;
@@ -260,11 +271,7 @@ interface LogChatCompletionResponse<R extends Record<string, any> = ChatCompleti
     latency: number;
     outputMessage: ChatMessage;
     finishReason: string | null;
-    tokensUsed: {
-        prompt: number;
-        completion: number;
-        total: number;
-    };
+    tokensUsed: ChatCompletionUsage;
 }
 type LogLevel = 'error' | 'warn' | 'info' | 'debug';
 type Loggable = string | number | boolean | undefined | null | object;
@@ -355,4 +362,4 @@ declare const jsxs: typeof jsx;
 /** @hidden */
 declare const Fragment: typeof AIFragment;
-export { type AINode as A, BoundLogger as B, type ChatMessage as C, type DebugMessage as D, type EvaluatorResult as E, type PropsOfAIComponent as F, type SpanContext as G, type SpanStatus as H, ImagePart as I, JSX as J, type Span as K, type LogChatCompletionRequest as L, type SpanEvent as M, NoopLogImplementation as N, type TracingContextKey as O, type Prompt as P, type TracingContext as Q, type RenderContext as R, type SpanProcessor as S, type Tracer as T, type TracingContextManager as U, type OutputParser as V, jsx as W, jsxDEV as X, jsxs as Y, Fragment as Z, LogImplementation as a, type ContextValues as b, type Context as c, type ReadableSpan as d, type SpanAttributes as e, type SpanExporter as f, type AIComponent as g, type ChatCompletionRequestPayloads as h, type EvaluatorFn as i, type PromptParsed as j, createAIElement as k, AIFragment as l, createContext as m, type ChatRole as n, type ImagePartProps as o, type LogChatCompletionResponse as p, type LogLevel as q, type Logger as r, ConsoleLogger as s, toDebugMessage as t, CombinedLogger as u, type Literal as v, type RenderResult as w, attachedContextSymbol as x, type AIElement as y, type Renderable as z };
+export { type AINode as A, BoundLogger as B, type ContextValues as C, type DebugMessage as D, type EvaluatorResult as E, type Renderable as F, type PropsOfAIComponent as G, type SpanContext as H, ImagePart as I, JSX as J, type SpanStatus as K, type LogChatCompletionRequest as L, type Span as M, NoopLogImplementation as N, type SpanEvent as O, type Prompt as P, type TracingContextKey as Q, type RenderContext as R, type SpanProcessor as S, type Tracer as T, type TracingContext as U, type TracingContextManager as V, type OutputParser as W, jsx as X, jsxDEV as Y, jsxs as Z, Fragment as _, LogImplementation as a, type Context as b, type ReadableSpan as c, type SpanAttributes as d, type SpanExporter as e, type AIComponent as f, type ChatCompletionRequestPayloads as g, type EvaluatorFn as h, type PromptParsed as i, createAIElement as j, AIFragment as k, createContext as l, type ChatMessage as m, type ChatRole as n, type ImagePartProps as o, type ChatCompletionUsage as p, type LogChatCompletionResponse as q, type LogLevel as r, type Logger as s, toDebugMessage as t, ConsoleLogger as u, CombinedLogger as v, type Literal as w, type RenderResult as x, attachedContextSymbol as y, type AIElement as z };

package/dist/{jsx-dev-runtime-lYsmphqH.d.ts → jsx-dev-runtime-yLtSq2UV.d.ts} RENAMED Viewed

@@ -44,13 +44,16 @@ type UserTextPart = {
 type UserChatMessage = {
     role: 'user';
     content: (UserTextPart | UserImagePart)[];
+    cachePrompt?: boolean;
 };
 type ChatMessage = {
     role: 'system';
     content: string;
+    cachePrompt?: boolean;
 } | {
     role: 'assistant';
     content: string;
+    cachePrompt?: boolean;
 } | UserChatMessage;
 type DebugMessage = {
     role: ChatRole;
@@ -58,6 +61,14 @@ type DebugMessage = {
 };
 declare const toDebugMessage: (message: ChatMessage) => DebugMessage;
+type ChatCompletionUsage = {
+    prompt: number;
+    completion: number;
+    total: number;
+    cachedPromptTokensCreated: number;
+    cachedPromptTokensRead: number;
+};
 type Literal = string | number | null | undefined | boolean;
 interface RenderResult extends AsyncGenerator<string, void> {
     then(onFulfilled: (value: string) => string | PromiseLike<string>, onRejected?: (reason: any) => string | PromiseLike<string>): PromiseLike<string>;
@@ -260,11 +271,7 @@ interface LogChatCompletionResponse<R extends Record<string, any> = ChatCompleti
     latency: number;
     outputMessage: ChatMessage;
     finishReason: string | null;
-    tokensUsed: {
-        prompt: number;
-        completion: number;
-        total: number;
-    };
+    tokensUsed: ChatCompletionUsage;
 }
 type LogLevel = 'error' | 'warn' | 'info' | 'debug';
 type Loggable = string | number | boolean | undefined | null | object;
@@ -355,4 +362,4 @@ declare const jsxs: typeof jsx;
 /** @hidden */
 declare const Fragment: typeof AIFragment;
-export { type AINode as A, BoundLogger as B, type ChatMessage as C, type DebugMessage as D, type EvaluatorResult as E, type PropsOfAIComponent as F, type SpanContext as G, type SpanStatus as H, ImagePart as I, JSX as J, type Span as K, type LogChatCompletionRequest as L, type SpanEvent as M, NoopLogImplementation as N, type TracingContextKey as O, type Prompt as P, type TracingContext as Q, type RenderContext as R, type SpanProcessor as S, type Tracer as T, type TracingContextManager as U, type OutputParser as V, jsx as W, jsxDEV as X, jsxs as Y, Fragment as Z, LogImplementation as a, type ContextValues as b, type Context as c, type ReadableSpan as d, type SpanAttributes as e, type SpanExporter as f, type AIComponent as g, type ChatCompletionRequestPayloads as h, type EvaluatorFn as i, type PromptParsed as j, createAIElement as k, AIFragment as l, createContext as m, type ChatRole as n, type ImagePartProps as o, type LogChatCompletionResponse as p, type LogLevel as q, type Logger as r, ConsoleLogger as s, toDebugMessage as t, CombinedLogger as u, type Literal as v, type RenderResult as w, attachedContextSymbol as x, type AIElement as y, type Renderable as z };
+export { type AINode as A, BoundLogger as B, type ContextValues as C, type DebugMessage as D, type EvaluatorResult as E, type Renderable as F, type PropsOfAIComponent as G, type SpanContext as H, ImagePart as I, JSX as J, type SpanStatus as K, type LogChatCompletionRequest as L, type Span as M, NoopLogImplementation as N, type SpanEvent as O, type Prompt as P, type TracingContextKey as Q, type RenderContext as R, type SpanProcessor as S, type Tracer as T, type TracingContext as U, type TracingContextManager as V, type OutputParser as W, jsx as X, jsxDEV as Y, jsxs as Z, Fragment as _, LogImplementation as a, type Context as b, type ReadableSpan as c, type SpanAttributes as d, type SpanExporter as e, type AIComponent as f, type ChatCompletionRequestPayloads as g, type EvaluatorFn as h, type PromptParsed as i, createAIElement as j, AIFragment as k, createContext as l, type ChatMessage as m, type ChatRole as n, type ImagePartProps as o, type ChatCompletionUsage as p, type LogChatCompletionResponse as q, type LogLevel as r, type Logger as s, toDebugMessage as t, ConsoleLogger as u, CombinedLogger as v, type Literal as w, type RenderResult as x, attachedContextSymbol as y, type AIElement as z };