npm - @posthog/ai - Versions diffs - 7.3.1 → 7.3.2 - Mend

@posthog/ai 7.3.1 → 7.3.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (18) hide show

package/dist/anthropic/index.cjs +7 -3
package/dist/anthropic/index.cjs.map +1 -1
package/dist/anthropic/index.mjs +1 -1
package/dist/gemini/index.cjs +1 -1
package/dist/gemini/index.mjs +1 -1
package/dist/index.cjs +29 -9
package/dist/index.cjs.map +1 -1
package/dist/index.mjs +21 -5
package/dist/index.mjs.map +1 -1
package/dist/langchain/index.cjs +25 -7
package/dist/langchain/index.cjs.map +1 -1
package/dist/langchain/index.mjs +22 -5
package/dist/langchain/index.mjs.map +1 -1
package/dist/openai/index.cjs +1 -1
package/dist/openai/index.mjs +1 -1
package/dist/vercel/index.cjs +1 -1
package/dist/vercel/index.mjs +1 -1
package/package.json +3 -3

package/dist/index.mjs CHANGED Viewed

@@ -5,7 +5,7 @@ import { v4 } from 'uuid';
 import AnthropicOriginal from '@anthropic-ai/sdk';
 import { GoogleGenAI } from '@google/genai';
-var version = "7.3.1";
+var version = "7.3.2";
 // Type guards for safer type checking
 const isString = value => {
@@ -3818,7 +3818,10 @@ class LangChainCallbackHandler extends BaseCallbackHandler {
       eventProperties['$ai_output_tokens'] = outputTokens;
       // Add additional token data to properties
       if (additionalTokenData.cacheReadInputTokens) {
-        eventProperties['$ai_cache_read_tokens'] = additionalTokenData.cacheReadInputTokens;
+        eventProperties['$ai_cache_read_input_tokens'] = additionalTokenData.cacheReadInputTokens;
+      }
+      if (additionalTokenData.cacheWriteInputTokens) {
+        eventProperties['$ai_cache_creation_input_tokens'] = additionalTokenData.cacheWriteInputTokens;
       }
       if (additionalTokenData.reasoningTokens) {
         eventProperties['$ai_reasoning_tokens'] = additionalTokenData.reasoningTokens;
@@ -3982,6 +3985,14 @@ class LangChainCallbackHandler extends BaseCallbackHandler {
       additionalTokenData.cacheReadInputTokens = usage.input_token_details.cache_read;
     } else if (usage.cachedPromptTokens != null) {
       additionalTokenData.cacheReadInputTokens = usage.cachedPromptTokens;
+    } else if (usage.cache_read_input_tokens != null) {
+      additionalTokenData.cacheReadInputTokens = usage.cache_read_input_tokens;
+    }
+    // Check for cache write/creation tokens in various formats
+    if (usage.cache_creation_input_tokens != null) {
+      additionalTokenData.cacheWriteInputTokens = usage.cache_creation_input_tokens;
+    } else if (usage.input_token_details?.cache_creation != null) {
+      additionalTokenData.cacheWriteInputTokens = usage.input_token_details.cache_creation;
     }
     // Check for reasoning tokens in various formats
     if (usage.completion_tokens_details?.reasoning_tokens != null) {
@@ -4027,8 +4038,10 @@ class LangChainCallbackHandler extends BaseCallbackHandler {
     if (webSearchCount !== undefined) {
       additionalTokenData.webSearchCount = webSearchCount;
     }
-    // For Anthropic providers, LangChain reports input_tokens as the sum of input and cache read tokens.
+    // For Anthropic providers, LangChain reports input_tokens as the sum of all input tokens.
     // Our cost calculation expects them to be separate for Anthropic, so we subtract cache tokens.
+    // Both cache_read and cache_write tokens should be subtracted since Anthropic's raw API
+    // reports input_tokens as tokens NOT read from or used to create a cache.
     // For other providers (OpenAI, etc.), input_tokens already excludes cache tokens as expected.
     // Match logic consistent with plugin-server: exact match on provider OR substring match on model
     let isAnthropic = false;
@@ -4037,8 +4050,11 @@ class LangChainCallbackHandler extends BaseCallbackHandler {
     } else if (model && model.toLowerCase().includes('anthropic')) {
       isAnthropic = true;
     }
-    if (isAnthropic && parsedUsage.input && additionalTokenData.cacheReadInputTokens) {
-      parsedUsage.input = Math.max(parsedUsage.input - additionalTokenData.cacheReadInputTokens, 0);
+    if (isAnthropic && parsedUsage.input) {
+      const cacheTokens = (additionalTokenData.cacheReadInputTokens || 0) + (additionalTokenData.cacheWriteInputTokens || 0);
+      if (cacheTokens > 0) {
+        parsedUsage.input = Math.max(parsedUsage.input - cacheTokens, 0);
+      }
     }
     return [parsedUsage.input, parsedUsage.output, additionalTokenData];
   }