npm - @posthog/ai - Versions diffs - 7.5.4 → 7.6.0 - Mend

@posthog/ai 7.5.4 → 7.6.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (25) hide show

package/dist/anthropic/index.cjs +71 -63
package/dist/anthropic/index.cjs.map +1 -1
package/dist/anthropic/index.mjs +71 -63
package/dist/anthropic/index.mjs.map +1 -1
package/dist/gemini/index.cjs +106 -54
package/dist/gemini/index.cjs.map +1 -1
package/dist/gemini/index.mjs +106 -54
package/dist/gemini/index.mjs.map +1 -1
package/dist/index.cjs +308 -223
package/dist/index.cjs.map +1 -1
package/dist/index.mjs +308 -223
package/dist/index.mjs.map +1 -1
package/dist/langchain/index.cjs +161 -136
package/dist/langchain/index.cjs.map +1 -1
package/dist/langchain/index.mjs +161 -136
package/dist/langchain/index.mjs.map +1 -1
package/dist/openai/index.cjs +163 -133
package/dist/openai/index.cjs.map +1 -1
package/dist/openai/index.mjs +163 -133
package/dist/openai/index.mjs.map +1 -1
package/dist/vercel/index.cjs +82 -57
package/dist/vercel/index.cjs.map +1 -1
package/dist/vercel/index.mjs +82 -57
package/dist/vercel/index.mjs.map +1 -1
package/package.json +6 -6

package/dist/index.cjs CHANGED Viewed

@@ -30,7 +30,7 @@ function _interopNamespace(e) {
 var uuid__namespace = /*#__PURE__*/_interopNamespace(uuid);
 var AnthropicOriginal__default = /*#__PURE__*/_interopDefault(AnthropicOriginal);
-var version = "7.5.4";
+var version = "7.6.0";
 // Type guards for safer type checking
 const isString = value => {
@@ -40,6 +40,215 @@ const isObject = value => {
   return value !== null && typeof value === 'object' && !Array.isArray(value);
 };
+const REDACTED_IMAGE_PLACEHOLDER = '[base64 image redacted]';
+// ============================================
+// Multimodal Feature Toggle
+// ============================================
+const isMultimodalEnabled = () => {
+  const val = process.env._INTERNAL_LLMA_MULTIMODAL || '';
+  return val.toLowerCase() === 'true' || val === '1' || val.toLowerCase() === 'yes';
+};
+// ============================================
+// Base64 Detection Helpers
+// ============================================
+const isBase64DataUrl = str => {
+  return /^data:([^;]+);base64,/.test(str);
+};
+const isValidUrl = str => {
+  try {
+    new URL(str);
+    return true;
+  } catch {
+    // Not an absolute URL, check if it's a relative URL or path
+    return str.startsWith('/') || str.startsWith('./') || str.startsWith('../');
+  }
+};
+const isRawBase64 = str => {
+  // Skip if it's a valid URL or path
+  if (isValidUrl(str)) {
+    return false;
+  }
+  // Check if it's a valid base64 string
+  // Base64 images are typically at least a few hundred chars, but we'll be conservative
+  return str.length > 20 && /^[A-Za-z0-9+/]+=*$/.test(str);
+};
+function redactBase64DataUrl(str) {
+  if (isMultimodalEnabled()) return str;
+  if (!isString(str)) return str;
+  // Check for data URL format
+  if (isBase64DataUrl(str)) {
+    return REDACTED_IMAGE_PLACEHOLDER;
+  }
+  // Check for raw base64 (Vercel sends raw base64 for inline images)
+  if (isRawBase64(str)) {
+    return REDACTED_IMAGE_PLACEHOLDER;
+  }
+  return str;
+}
+const processMessages = (messages, transformContent) => {
+  if (!messages) return messages;
+  const processContent = content => {
+    if (typeof content === 'string') return content;
+    if (!content) return content;
+    if (Array.isArray(content)) {
+      return content.map(transformContent);
+    }
+    // Handle single object content
+    return transformContent(content);
+  };
+  const processMessage = msg => {
+    if (!isObject(msg) || !('content' in msg)) return msg;
+    return {
+      ...msg,
+      content: processContent(msg.content)
+    };
+  };
+  // Handle both arrays and single messages
+  if (Array.isArray(messages)) {
+    return messages.map(processMessage);
+  }
+  return processMessage(messages);
+};
+// ============================================
+// Provider-Specific Image Sanitizers
+// ============================================
+const sanitizeOpenAIImage = item => {
+  if (!isObject(item)) return item;
+  // Handle image_url format
+  if (item.type === 'image_url' && 'image_url' in item && isObject(item.image_url) && 'url' in item.image_url) {
+    return {
+      ...item,
+      image_url: {
+        ...item.image_url,
+        url: redactBase64DataUrl(item.image_url.url)
+      }
+    };
+  }
+  // Handle audio format
+  if (item.type === 'audio' && 'data' in item) {
+    if (isMultimodalEnabled()) return item;
+    return {
+      ...item,
+      data: REDACTED_IMAGE_PLACEHOLDER
+    };
+  }
+  return item;
+};
+const sanitizeOpenAIResponseImage = item => {
+  if (!isObject(item)) return item;
+  // Handle input_image format
+  if (item.type === 'input_image' && 'image_url' in item) {
+    return {
+      ...item,
+      image_url: redactBase64DataUrl(item.image_url)
+    };
+  }
+  return item;
+};
+const sanitizeAnthropicImage = item => {
+  if (isMultimodalEnabled()) return item;
+  if (!isObject(item)) return item;
+  // Handle Anthropic's image and document formats (same structure, different type field)
+  if ((item.type === 'image' || item.type === 'document') && 'source' in item && isObject(item.source) && item.source.type === 'base64' && 'data' in item.source) {
+    return {
+      ...item,
+      source: {
+        ...item.source,
+        data: REDACTED_IMAGE_PLACEHOLDER
+      }
+    };
+  }
+  return item;
+};
+const sanitizeGeminiPart = part => {
+  if (isMultimodalEnabled()) return part;
+  if (!isObject(part)) return part;
+  // Handle Gemini's inline data format (images, audio, PDFs all use inlineData)
+  if ('inlineData' in part && isObject(part.inlineData) && 'data' in part.inlineData) {
+    return {
+      ...part,
+      inlineData: {
+        ...part.inlineData,
+        data: REDACTED_IMAGE_PLACEHOLDER
+      }
+    };
+  }
+  return part;
+};
+const processGeminiItem = item => {
+  if (!isObject(item)) return item;
+  // If it has parts, process them
+  if ('parts' in item && item.parts) {
+    const parts = Array.isArray(item.parts) ? item.parts.map(sanitizeGeminiPart) : sanitizeGeminiPart(item.parts);
+    return {
+      ...item,
+      parts
+    };
+  }
+  return item;
+};
+const sanitizeLangChainImage = item => {
+  if (!isObject(item)) return item;
+  // OpenAI style
+  if (item.type === 'image_url' && 'image_url' in item && isObject(item.image_url) && 'url' in item.image_url) {
+    return {
+      ...item,
+      image_url: {
+        ...item.image_url,
+        url: redactBase64DataUrl(item.image_url.url)
+      }
+    };
+  }
+  // Direct image with data field
+  if (item.type === 'image' && 'data' in item) {
+    return {
+      ...item,
+      data: redactBase64DataUrl(item.data)
+    };
+  }
+  // Anthropic style
+  if (item.type === 'image' && 'source' in item && isObject(item.source) && 'data' in item.source) {
+    if (isMultimodalEnabled()) return item;
+    return {
+      ...item,
+      source: {
+        ...item.source,
+        data: redactBase64DataUrl(item.source.data)
+      }
+    };
+  }
+  // Google style
+  if (item.type === 'media' && 'data' in item) {
+    return {
+      ...item,
+      data: redactBase64DataUrl(item.data)
+    };
+  }
+  return item;
+};
+// Export individual sanitizers for tree-shaking
+const sanitizeOpenAI = data => {
+  return processMessages(data, sanitizeOpenAIImage);
+};
+const sanitizeOpenAIResponse = data => {
+  return processMessages(data, sanitizeOpenAIResponseImage);
+};
+const sanitizeAnthropic = data => {
+  return processMessages(data, sanitizeAnthropicImage);
+};
+const sanitizeGemini = data => {
+  // Gemini has a different structure with 'parts' directly on items instead of 'content'
+  // So we need custom processing instead of using processMessages
+  if (!data) return data;
+  if (Array.isArray(data)) {
+    return data.map(processGeminiItem);
+  }
+  return processGeminiItem(data);
+};
+const sanitizeLangChain = data => {
+  return processMessages(data, sanitizeLangChainImage);
+};
 // limit large outputs by truncating to 200kb (approx 200k bytes)
 const MAX_OUTPUT_SIZE = 200000;
 const STRING_FORMAT = 'utf8';
@@ -233,6 +442,8 @@ const formatResponseGemini = response => {
             if (data instanceof Uint8Array || buffer.Buffer.isBuffer(data)) {
               data = buffer.Buffer.from(data).toString('base64');
             }
+            // Sanitize base64 data for images and other large inline data
+            data = redactBase64DataUrl(data);
             content.push({
               type: 'audio',
               mime_type: mimeType,
@@ -581,6 +792,9 @@ const sendEventToPosthog = async ({
     } : {}),
     ...(usage.webSearchCount ? {
       $ai_web_search_count: usage.webSearchCount
+    } : {}),
+    ...(usage.rawUsage ? {
+      $ai_usage: usage.rawUsage
     } : {})
   };
   const properties = {
@@ -669,201 +883,6 @@ function formatOpenAIResponsesInput(input, instructions) {
   return messages;
 }
-const REDACTED_IMAGE_PLACEHOLDER = '[base64 image redacted]';
-// ============================================
-// Multimodal Feature Toggle
-// ============================================
-const isMultimodalEnabled = () => {
-  const val = process.env._INTERNAL_LLMA_MULTIMODAL || '';
-  return val.toLowerCase() === 'true' || val === '1' || val.toLowerCase() === 'yes';
-};
-// ============================================
-// Base64 Detection Helpers
-// ============================================
-const isBase64DataUrl = str => {
-  return /^data:([^;]+);base64,/.test(str);
-};
-const isValidUrl = str => {
-  try {
-    new URL(str);
-    return true;
-  } catch {
-    // Not an absolute URL, check if it's a relative URL or path
-    return str.startsWith('/') || str.startsWith('./') || str.startsWith('../');
-  }
-};
-const isRawBase64 = str => {
-  // Skip if it's a valid URL or path
-  if (isValidUrl(str)) {
-    return false;
-  }
-  // Check if it's a valid base64 string
-  // Base64 images are typically at least a few hundred chars, but we'll be conservative
-  return str.length > 20 && /^[A-Za-z0-9+/]+=*$/.test(str);
-};
-function redactBase64DataUrl(str) {
-  if (isMultimodalEnabled()) return str;
-  if (!isString(str)) return str;
-  // Check for data URL format
-  if (isBase64DataUrl(str)) {
-    return REDACTED_IMAGE_PLACEHOLDER;
-  }
-  // Check for raw base64 (Vercel sends raw base64 for inline images)
-  if (isRawBase64(str)) {
-    return REDACTED_IMAGE_PLACEHOLDER;
-  }
-  return str;
-}
-const processMessages = (messages, transformContent) => {
-  if (!messages) return messages;
-  const processContent = content => {
-    if (typeof content === 'string') return content;
-    if (!content) return content;
-    if (Array.isArray(content)) {
-      return content.map(transformContent);
-    }
-    // Handle single object content
-    return transformContent(content);
-  };
-  const processMessage = msg => {
-    if (!isObject(msg) || !('content' in msg)) return msg;
-    return {
-      ...msg,
-      content: processContent(msg.content)
-    };
-  };
-  // Handle both arrays and single messages
-  if (Array.isArray(messages)) {
-    return messages.map(processMessage);
-  }
-  return processMessage(messages);
-};
-// ============================================
-// Provider-Specific Image Sanitizers
-// ============================================
-const sanitizeOpenAIImage = item => {
-  if (!isObject(item)) return item;
-  // Handle image_url format
-  if (item.type === 'image_url' && 'image_url' in item && isObject(item.image_url) && 'url' in item.image_url) {
-    return {
-      ...item,
-      image_url: {
-        ...item.image_url,
-        url: redactBase64DataUrl(item.image_url.url)
-      }
-    };
-  }
-  // Handle audio format
-  if (item.type === 'audio' && 'data' in item) {
-    if (isMultimodalEnabled()) return item;
-    return {
-      ...item,
-      data: REDACTED_IMAGE_PLACEHOLDER
-    };
-  }
-  return item;
-};
-const sanitizeAnthropicImage = item => {
-  if (isMultimodalEnabled()) return item;
-  if (!isObject(item)) return item;
-  // Handle Anthropic's image and document formats (same structure, different type field)
-  if ((item.type === 'image' || item.type === 'document') && 'source' in item && isObject(item.source) && item.source.type === 'base64' && 'data' in item.source) {
-    return {
-      ...item,
-      source: {
-        ...item.source,
-        data: REDACTED_IMAGE_PLACEHOLDER
-      }
-    };
-  }
-  return item;
-};
-const sanitizeGeminiPart = part => {
-  if (isMultimodalEnabled()) return part;
-  if (!isObject(part)) return part;
-  // Handle Gemini's inline data format (images, audio, PDFs all use inlineData)
-  if ('inlineData' in part && isObject(part.inlineData) && 'data' in part.inlineData) {
-    return {
-      ...part,
-      inlineData: {
-        ...part.inlineData,
-        data: REDACTED_IMAGE_PLACEHOLDER
-      }
-    };
-  }
-  return part;
-};
-const processGeminiItem = item => {
-  if (!isObject(item)) return item;
-  // If it has parts, process them
-  if ('parts' in item && item.parts) {
-    const parts = Array.isArray(item.parts) ? item.parts.map(sanitizeGeminiPart) : sanitizeGeminiPart(item.parts);
-    return {
-      ...item,
-      parts
-    };
-  }
-  return item;
-};
-const sanitizeLangChainImage = item => {
-  if (!isObject(item)) return item;
-  // OpenAI style
-  if (item.type === 'image_url' && 'image_url' in item && isObject(item.image_url) && 'url' in item.image_url) {
-    return {
-      ...item,
-      image_url: {
-        ...item.image_url,
-        url: redactBase64DataUrl(item.image_url.url)
-      }
-    };
-  }
-  // Direct image with data field
-  if (item.type === 'image' && 'data' in item) {
-    return {
-      ...item,
-      data: redactBase64DataUrl(item.data)
-    };
-  }
-  // Anthropic style
-  if (item.type === 'image' && 'source' in item && isObject(item.source) && 'data' in item.source) {
-    if (isMultimodalEnabled()) return item;
-    return {
-      ...item,
-      source: {
-        ...item.source,
-        data: redactBase64DataUrl(item.source.data)
-      }
-    };
-  }
-  // Google style
-  if (item.type === 'media' && 'data' in item) {
-    return {
-      ...item,
-      data: redactBase64DataUrl(item.data)
-    };
-  }
-  return item;
-};
-// Export individual sanitizers for tree-shaking
-const sanitizeOpenAI = data => {
-  return processMessages(data, sanitizeOpenAIImage);
-};
-const sanitizeAnthropic = data => {
-  return processMessages(data, sanitizeAnthropicImage);
-};
-const sanitizeGemini = data => {
-  // Gemini has a different structure with 'parts' directly on items instead of 'content'
-  // So we need custom processing instead of using processMessages
-  if (!data) return data;
-  if (Array.isArray(data)) {
-    return data.map(processGeminiItem);
-  }
-  return processGeminiItem(data);
-};
-const sanitizeLangChain = data => {
-  return processMessages(data, sanitizeLangChainImage);
-};
 const Chat = openai.OpenAI.Chat;
 const Completions = Chat.Completions;
 const Responses = openai.OpenAI.Responses;
@@ -920,6 +939,7 @@ let WrappedCompletions$1 = class WrappedCompletions extends Completions {
               };
               // Map to track in-progress tool calls
               const toolCallsInProgress = new Map();
+              let rawUsageData;
               for await (const chunk of stream1) {
                 // Extract model from chunk (Chat Completions chunks have model field)
                 if (!modelFromResponse && chunk.model) {
@@ -967,6 +987,7 @@ let WrappedCompletions$1 = class WrappedCompletions extends Completions {
                 }
                 // Handle usage information
                 if (chunk.usage) {
+                  rawUsageData = chunk.usage;
                   usage = {
                     ...usage,
                     inputTokens: chunk.usage.prompt_tokens ?? 0,
@@ -1025,7 +1046,8 @@ let WrappedCompletions$1 = class WrappedCompletions extends Completions {
                   outputTokens: usage.outputTokens,
                   reasoningTokens: usage.reasoningTokens,
                   cacheReadInputTokens: usage.cacheReadInputTokens,
-                  webSearchCount: usage.webSearchCount
+                  webSearchCount: usage.webSearchCount,
+                  rawUsage: rawUsageData
                 },
                 tools: availableTools
               });
@@ -1076,7 +1098,8 @@ let WrappedCompletions$1 = class WrappedCompletions extends Completions {
               outputTokens: result.usage?.completion_tokens ?? 0,
               reasoningTokens: result.usage?.completion_tokens_details?.reasoning_tokens ?? 0,
               cacheReadInputTokens: result.usage?.prompt_tokens_details?.cached_tokens ?? 0,
-              webSearchCount: calculateWebSearchCount(result)
+              webSearchCount: calculateWebSearchCount(result),
+              rawUsage: result.usage
             },
             tools: availableTools
           });
@@ -1134,6 +1157,7 @@ let WrappedResponses$1 = class WrappedResponses extends Responses {
                 outputTokens: 0,
                 webSearchCount: 0
               };
+              let rawUsageData;
               for await (const chunk of stream1) {
                 if ('response' in chunk && chunk.response) {
                   // Extract model from response object in chunk (for stored prompts)
@@ -1149,6 +1173,7 @@ let WrappedResponses$1 = class WrappedResponses extends Responses {
                   finalContent = chunk.response.output;
                 }
                 if ('response' in chunk && chunk.response?.usage) {
+                  rawUsageData = chunk.response.usage;
                   usage = {
                     ...usage,
                     inputTokens: chunk.response.usage.input_tokens ?? 0,
@@ -1165,7 +1190,7 @@ let WrappedResponses$1 = class WrappedResponses extends Responses {
                 ...posthogParams,
                 model: openAIParams.model ?? modelFromResponse,
                 provider: 'openai',
-                input: formatOpenAIResponsesInput(openAIParams.input, openAIParams.instructions),
+                input: formatOpenAIResponsesInput(sanitizeOpenAIResponse(openAIParams.input), openAIParams.instructions),
                 output: finalContent,
                 latency,
                 baseURL: this.baseURL,
@@ -1176,7 +1201,8 @@ let WrappedResponses$1 = class WrappedResponses extends Responses {
                   outputTokens: usage.outputTokens,
                   reasoningTokens: usage.reasoningTokens,
                   cacheReadInputTokens: usage.cacheReadInputTokens,
-                  webSearchCount: usage.webSearchCount
+                  webSearchCount: usage.webSearchCount,
+                  rawUsage: rawUsageData
                 },
                 tools: availableTools
               });
@@ -1186,7 +1212,7 @@ let WrappedResponses$1 = class WrappedResponses extends Responses {
                 ...posthogParams,
                 model: openAIParams.model,
                 provider: 'openai',
-                input: formatOpenAIResponsesInput(openAIParams.input, openAIParams.instructions),
+                input: formatOpenAIResponsesInput(sanitizeOpenAIResponse(openAIParams.input), openAIParams.instructions),
                 output: [],
                 latency: 0,
                 baseURL: this.baseURL,
@@ -1217,7 +1243,7 @@ let WrappedResponses$1 = class WrappedResponses extends Responses {
             ...posthogParams,
             model: openAIParams.model ?? result.model,
             provider: 'openai',
-            input: formatOpenAIResponsesInput(openAIParams.input, openAIParams.instructions),
+            input: formatOpenAIResponsesInput(sanitizeOpenAIResponse(openAIParams.input), openAIParams.instructions),
             output: formattedOutput,
             latency,
             baseURL: this.baseURL,
@@ -1228,7 +1254,8 @@ let WrappedResponses$1 = class WrappedResponses extends Responses {
               outputTokens: result.usage?.output_tokens ?? 0,
               reasoningTokens: result.usage?.output_tokens_details?.reasoning_tokens ?? 0,
               cacheReadInputTokens: result.usage?.input_tokens_details?.cached_tokens ?? 0,
-              webSearchCount: calculateWebSearchCount(result)
+              webSearchCount: calculateWebSearchCount(result),
+              rawUsage: result.usage
             },
             tools: availableTools
           });
@@ -1241,7 +1268,7 @@ let WrappedResponses$1 = class WrappedResponses extends Responses {
           ...posthogParams,
           model: openAIParams.model,
           provider: 'openai',
-          input: formatOpenAIResponsesInput(openAIParams.input, openAIParams.instructions),
+          input: formatOpenAIResponsesInput(sanitizeOpenAIResponse(openAIParams.input), openAIParams.instructions),
           output: [],
           latency: 0,
           baseURL: this.baseURL,
@@ -1277,7 +1304,7 @@ let WrappedResponses$1 = class WrappedResponses extends Responses {
           ...posthogParams,
           model: openAIParams.model ?? result.model,
           provider: 'openai',
-          input: formatOpenAIResponsesInput(openAIParams.input, openAIParams.instructions),
+          input: formatOpenAIResponsesInput(sanitizeOpenAIResponse(openAIParams.input), openAIParams.instructions),
           output: result.output,
           latency,
           baseURL: this.baseURL,
@@ -1287,7 +1314,8 @@ let WrappedResponses$1 = class WrappedResponses extends Responses {
             inputTokens: result.usage?.input_tokens ?? 0,
             outputTokens: result.usage?.output_tokens ?? 0,
             reasoningTokens: result.usage?.output_tokens_details?.reasoning_tokens ?? 0,
-            cacheReadInputTokens: result.usage?.input_tokens_details?.cached_tokens ?? 0
+            cacheReadInputTokens: result.usage?.input_tokens_details?.cached_tokens ?? 0,
+            rawUsage: result.usage
           }
         });
         return result;
@@ -1297,7 +1325,7 @@ let WrappedResponses$1 = class WrappedResponses extends Responses {
           ...posthogParams,
           model: openAIParams.model,
           provider: 'openai',
-          input: formatOpenAIResponsesInput(openAIParams.input, openAIParams.instructions),
+          input: formatOpenAIResponsesInput(sanitizeOpenAIResponse(openAIParams.input), openAIParams.instructions),
           output: [],
           latency: 0,
           baseURL: this.baseURL,
@@ -1346,7 +1374,8 @@ let WrappedEmbeddings$1 = class WrappedEmbeddings extends Embeddings {
         params: body,
         httpStatus: 200,
         usage: {
-          inputTokens: result.usage?.prompt_tokens ?? 0
+          inputTokens: result.usage?.prompt_tokens ?? 0,
+          rawUsage: result.usage
         }
       });
       return result;
@@ -1414,7 +1443,8 @@ class WrappedTranscriptions extends Transcriptions {
                 if ('usage' in chunk && chunk.usage) {
                   usage = {
                     inputTokens: chunk.usage?.type === 'tokens' ? chunk.usage.input_tokens ?? 0 : 0,
-                    outputTokens: chunk.usage?.type === 'tokens' ? chunk.usage.output_tokens ?? 0 : 0
+                    outputTokens: chunk.usage?.type === 'tokens' ? chunk.usage.output_tokens ?? 0 : 0,
+                    rawUsage: chunk.usage
                   };
                 }
               }
@@ -1475,7 +1505,8 @@ class WrappedTranscriptions extends Transcriptions {
             httpStatus: 200,
             usage: {
               inputTokens: result.usage?.type === 'tokens' ? result.usage.input_tokens ?? 0 : 0,
-              outputTokens: result.usage?.type === 'tokens' ? result.usage.output_tokens ?? 0 : 0
+              outputTokens: result.usage?.type === 'tokens' ? result.usage.output_tokens ?? 0 : 0,
+              rawUsage: result.usage
             }
           });
           return result;
@@ -2271,13 +2302,29 @@ const wrapVercelLanguageModel = (model, phClient, options) => {
           const webSearchCount = extractWebSearchCount(providerMetadata, result.usage);
           // V2 usage has simple numbers, V3 has objects with .total - normalize both
           const usageObj = result.usage;
+          // Extract raw response for providers that include detailed usage metadata
+          // For Gemini, candidatesTokensDetails is in result.response.body.usageMetadata
+          const rawUsageData = {
+            usage: result.usage,
+            providerMetadata
+          };
+          // Include response body usageMetadata if it contains detailed token breakdown (e.g., candidatesTokensDetails)
+          if (result.response && typeof result.response === 'object') {
+            const responseBody = result.response.body;
+            if (responseBody && typeof responseBody === 'object' && 'usageMetadata' in responseBody) {
+              rawUsageData.rawResponse = {
+                usageMetadata: responseBody.usageMetadata
+              };
+            }
+          }
           const usage = {
             inputTokens: extractTokenCount(result.usage.inputTokens),
             outputTokens: extractTokenCount(result.usage.outputTokens),
             reasoningTokens: extractReasoningTokens(usageObj),
             cacheReadInputTokens: extractCacheReadTokens(usageObj),
             webSearchCount,
-            ...additionalTokenValues
+            ...additionalTokenValues,
+            rawUsage: rawUsageData
           };
           adjustAnthropicV3CacheTokens(model, provider, usage);
           await sendEventToPosthog({
@@ -2432,10 +2479,14 @@ const wrapVercelLanguageModel = (model, phClient, options) => {
                 content: content.length === 1 && content[0].type === 'text' ? content[0].text : content
               }] : [];
               const webSearchCount = extractWebSearchCount(providerMetadata, usage);
-              // Update usage with web search count
+              // Update usage with web search count and raw metadata
               const finalUsage = {
                 ...usage,
-                webSearchCount
+                webSearchCount,
+                rawUsage: {
+                  usage,
+                  providerMetadata
+                }
               };
               adjustAnthropicV3CacheTokens(model, provider, finalUsage);
               await sendEventToPosthog({
@@ -2528,6 +2579,7 @@ class WrappedMessages extends AnthropicOriginal__default.default.Messages {
           cacheReadInputTokens: 0,
           webSearchCount: 0
         };
+        let lastRawUsage;
         if ('tee' in value) {
           const [stream1, stream2] = value.tee();
           (async () => {
@@ -2600,12 +2652,14 @@ class WrappedMessages extends AnthropicOriginal__default.default.Messages {
                   }
                 }
                 if (chunk.type == 'message_start') {
+                  lastRawUsage = chunk.message.usage;
                   usage.inputTokens = chunk.message.usage.input_tokens ?? 0;
                   usage.cacheCreationInputTokens = chunk.message.usage.cache_creation_input_tokens ?? 0;
                   usage.cacheReadInputTokens = chunk.message.usage.cache_read_input_tokens ?? 0;
                   usage.webSearchCount = chunk.message.usage.server_tool_use?.web_search_requests ?? 0;
                 }
                 if ('usage' in chunk) {
+                  lastRawUsage = chunk.usage;
                   usage.outputTokens = chunk.usage.output_tokens ?? 0;
                   // Update web search count if present in delta
                   if (chunk.usage.server_tool_use?.web_search_requests !== undefined) {
@@ -2613,6 +2667,7 @@ class WrappedMessages extends AnthropicOriginal__default.default.Messages {
                   }
                 }
               }
+              usage.rawUsage = lastRawUsage;
               const latency = (Date.now() - startTime) / 1000;
               const availableTools = extractAvailableToolCalls('anthropic', anthropicParams);
               // Format output to match non-streaming version
@@ -2686,7 +2741,8 @@ class WrappedMessages extends AnthropicOriginal__default.default.Messages {
               outputTokens: result.usage.output_tokens ?? 0,
               cacheCreationInputTokens: result.usage.cache_creation_input_tokens ?? 0,
               cacheReadInputTokens: result.usage.cache_read_input_tokens ?? 0,
-              webSearchCount: result.usage.server_tool_use?.web_search_requests ?? 0
+              webSearchCount: result.usage.server_tool_use?.web_search_requests ?? 0,
+              rawUsage: result.usage
             },
             tools: availableTools
           });
@@ -2760,7 +2816,8 @@ class WrappedModels {
           outputTokens: metadata?.candidatesTokenCount ?? 0,
           reasoningTokens: metadata?.thoughtsTokenCount ?? 0,
           cacheReadInputTokens: metadata?.cachedContentTokenCount ?? 0,
-          webSearchCount: calculateGoogleWebSearchCount(response)
+          webSearchCount: calculateGoogleWebSearchCount(response),
+          rawUsage: metadata
         },
         tools: availableTools
       });
@@ -2796,7 +2853,8 @@ class WrappedModels {
     let usage = {
       inputTokens: 0,
       outputTokens: 0,
-      webSearchCount: 0
+      webSearchCount: 0,
+      rawUsage: undefined
     };
     try {
       const stream = await this.client.models.generateContentStream(geminiParams);
@@ -2854,7 +2912,8 @@ class WrappedModels {
             outputTokens: metadata.candidatesTokenCount ?? 0,
             reasoningTokens: metadata.thoughtsTokenCount ?? 0,
             cacheReadInputTokens: metadata.cachedContentTokenCount ?? 0,
-            webSearchCount: usage.webSearchCount
+            webSearchCount: usage.webSearchCount,
+            rawUsage: metadata
           };
         }
         yield chunk;
@@ -2879,7 +2938,8 @@ class WrappedModels {
         httpStatus: 200,
         usage: {
           ...usage,
-          webSearchCount: usage.webSearchCount
+          webSearchCount: usage.webSearchCount,
+          rawUsage: usage.rawUsage
         },
         tools: availableTools
       });
@@ -3317,6 +3377,20 @@ function isSerializableLike(obj) {
 	return obj !== null && typeof obj === "object" && "lc_serializable" in obj && typeof obj.toJSON === "function";
 }
 /**
+* Create a "not_implemented" serialization result for objects that cannot be serialized.
+*/
+function createNotImplemented(obj) {
+	let id;
+	if (obj !== null && typeof obj === "object") if ("lc_id" in obj && Array.isArray(obj.lc_id)) id = obj.lc_id;
+	else id = [obj.constructor?.name ?? "Object"];
+	else id = [typeof obj];
+	return {
+		lc: 1,
+		type: "not_implemented",
+		id
+	};
+}
+/**
 * Escape a value if it needs escaping (contains `lc` key).
 *
 * This is a simpler version of `serializeValue` that doesn't handle Serializable
@@ -3324,18 +3398,27 @@ function isSerializableLike(obj) {
 * processed by `toJSON()`.
 *
 * @param value - The value to potentially escape.
+* @param pathSet - WeakSet to track ancestor objects in the current path to detect circular references.
+*                  Objects are removed after processing to allow shared references (same object in
+*                  multiple places) while still detecting true circular references (ancestor in descendant).
 * @returns The value with any `lc`-containing objects wrapped in escape markers.
 */
-function escapeIfNeeded(value) {
+function escapeIfNeeded(value, pathSet = /* @__PURE__ */ new WeakSet()) {
 	if (value !== null && typeof value === "object" && !Array.isArray(value)) {
+		if (pathSet.has(value)) return createNotImplemented(value);
 		if (isSerializableLike(value)) return value;
+		pathSet.add(value);
 		const record = value;
-		if (needsEscaping(record)) return escapeObject(record);
+		if (needsEscaping(record)) {
+			pathSet.delete(value);
+			return escapeObject(record);
+		}
 		const result = {};
-		for (const [key, val] of Object.entries(record)) result[key] = escapeIfNeeded(val);
+		for (const [key, val] of Object.entries(record)) result[key] = escapeIfNeeded(val, pathSet);
+		pathSet.delete(value);
 		return result;
 	}
-	if (Array.isArray(value)) return value.map((item) => escapeIfNeeded(item));
+	if (Array.isArray(value)) return value.map((item) => escapeIfNeeded(item, pathSet));
 	return value;
 }
@@ -3461,7 +3544,9 @@ var Serializable = class Serializable {
 			if (last in read && read[last] !== void 0) write[last] = write[last] || read[last];
 		});
 		const escapedKwargs = {};
-		for (const [key, value] of Object.entries(kwargs)) escapedKwargs[key] = escapeIfNeeded(value);
+		const pathSet = /* @__PURE__ */ new WeakSet();
+		pathSet.add(this);
+		for (const [key, value] of Object.entries(kwargs)) escapedKwargs[key] = escapeIfNeeded(value, pathSet);
 		const kwargsWithSecrets = Object.keys(secrets).length ? replaceSecrets(escapedKwargs, secrets) : escapedKwargs;
 		const processedKwargs = mapKeys(kwargsWithSecrets, keyToJson, aliases);
 		return {