npm - @langchain/google-genai - Versions diffs - 0.2.16 → 0.2.18 - Mend

@langchain/google-genai 0.2.16 → 0.2.18

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (3) hide show

package/dist/chat_models.cjs CHANGED Viewed

@@ -403,7 +403,10 @@ class ChatGoogleGenerativeAI extends chat_models_1.BaseChatModel {
     get _isMultimodalModel() {
         return (this.model.includes("vision") ||
             this.model.startsWith("gemini-1.5") ||
-            this.model.startsWith("gemini-2"));
+            this.model.startsWith("gemini-2") ||
+            (this.model.startsWith("gemma-3-") &&
+                !this.model.startsWith("gemma-3-1b")) // gemma-3 models are multimodal(but gemma-3n-* and gemma-3-1b are not)
+        );
     }
     constructor(fields) {
         super(fields);
@@ -694,30 +697,32 @@ class ChatGoogleGenerativeAI extends chat_models_1.BaseChatModel {
             return stream;
         });
         let usageMetadata;
+        // Keep prior cumulative counts for calculating token deltas while streaming
+        let prevPromptTokenCount = 0;
+        let prevCandidatesTokenCount = 0;
+        let prevTotalTokenCount = 0;
         let index = 0;
         for await (const response of stream) {
             if ("usageMetadata" in response &&
+                response.usageMetadata !== undefined &&
                 this.streamUsage !== false &&
                 options.streamUsage !== false) {
-                const genAIUsageMetadata = response.usageMetadata;
-                if (!usageMetadata) {
-                    usageMetadata = {
-                        input_tokens: genAIUsageMetadata.promptTokenCount ?? 0,
-                        output_tokens: genAIUsageMetadata.candidatesTokenCount ?? 0,
-                        total_tokens: genAIUsageMetadata.totalTokenCount ?? 0,
-                    };
-                }
-                else {
-                    // Under the hood, LangChain combines the prompt tokens. Google returns the updated
-                    // total each time, so we need to find the difference between the tokens.
-                    const outputTokenDiff = (genAIUsageMetadata.candidatesTokenCount ?? 0) -
-                        usageMetadata.output_tokens;
-                    usageMetadata = {
-                        input_tokens: 0,
-                        output_tokens: outputTokenDiff,
-                        total_tokens: outputTokenDiff,
-                    };
-                }
+                usageMetadata = {
+                    input_tokens: response.usageMetadata.promptTokenCount ?? 0,
+                    output_tokens: response.usageMetadata.candidatesTokenCount ?? 0,
+                    total_tokens: response.usageMetadata.totalTokenCount ?? 0,
+                };
+                // Under the hood, LangChain combines the prompt tokens. Google returns the updated
+                // total each time, so we need to find the difference between the tokens.
+                const newPromptTokenCount = response.usageMetadata.promptTokenCount ?? 0;
+                usageMetadata.input_tokens = Math.max(0, newPromptTokenCount - prevPromptTokenCount);
+                prevPromptTokenCount = newPromptTokenCount;
+                const newCandidatesTokenCount = response.usageMetadata.candidatesTokenCount ?? 0;
+                usageMetadata.output_tokens = Math.max(0, newCandidatesTokenCount - prevCandidatesTokenCount);
+                prevCandidatesTokenCount = newCandidatesTokenCount;
+                const newTotalTokenCount = response.usageMetadata.totalTokenCount ?? 0;
+                usageMetadata.total_tokens = Math.max(0, newTotalTokenCount - prevTotalTokenCount);
+                prevTotalTokenCount = newTotalTokenCount;
             }
             const chunk = (0, common_js_1.convertResponseContentToChatGenerationChunk)(response, {
                 usageMetadata,

package/dist/chat_models.js CHANGED Viewed

@@ -400,7 +400,10 @@ export class ChatGoogleGenerativeAI extends BaseChatModel {
     get _isMultimodalModel() {
         return (this.model.includes("vision") ||
             this.model.startsWith("gemini-1.5") ||
-            this.model.startsWith("gemini-2"));
+            this.model.startsWith("gemini-2") ||
+            (this.model.startsWith("gemma-3-") &&
+                !this.model.startsWith("gemma-3-1b")) // gemma-3 models are multimodal(but gemma-3n-* and gemma-3-1b are not)
+        );
     }
     constructor(fields) {
         super(fields);
@@ -691,30 +694,32 @@ export class ChatGoogleGenerativeAI extends BaseChatModel {
             return stream;
         });
         let usageMetadata;
+        // Keep prior cumulative counts for calculating token deltas while streaming
+        let prevPromptTokenCount = 0;
+        let prevCandidatesTokenCount = 0;
+        let prevTotalTokenCount = 0;
         let index = 0;
         for await (const response of stream) {
             if ("usageMetadata" in response &&
+                response.usageMetadata !== undefined &&
                 this.streamUsage !== false &&
                 options.streamUsage !== false) {
-                const genAIUsageMetadata = response.usageMetadata;
-                if (!usageMetadata) {
-                    usageMetadata = {
-                        input_tokens: genAIUsageMetadata.promptTokenCount ?? 0,
-                        output_tokens: genAIUsageMetadata.candidatesTokenCount ?? 0,
-                        total_tokens: genAIUsageMetadata.totalTokenCount ?? 0,
-                    };
-                }
-                else {
-                    // Under the hood, LangChain combines the prompt tokens. Google returns the updated
-                    // total each time, so we need to find the difference between the tokens.
-                    const outputTokenDiff = (genAIUsageMetadata.candidatesTokenCount ?? 0) -
-                        usageMetadata.output_tokens;
-                    usageMetadata = {
-                        input_tokens: 0,
-                        output_tokens: outputTokenDiff,
-                        total_tokens: outputTokenDiff,
-                    };
-                }
+                usageMetadata = {
+                    input_tokens: response.usageMetadata.promptTokenCount ?? 0,
+                    output_tokens: response.usageMetadata.candidatesTokenCount ?? 0,
+                    total_tokens: response.usageMetadata.totalTokenCount ?? 0,
+                };
+                // Under the hood, LangChain combines the prompt tokens. Google returns the updated
+                // total each time, so we need to find the difference between the tokens.
+                const newPromptTokenCount = response.usageMetadata.promptTokenCount ?? 0;
+                usageMetadata.input_tokens = Math.max(0, newPromptTokenCount - prevPromptTokenCount);
+                prevPromptTokenCount = newPromptTokenCount;
+                const newCandidatesTokenCount = response.usageMetadata.candidatesTokenCount ?? 0;
+                usageMetadata.output_tokens = Math.max(0, newCandidatesTokenCount - prevCandidatesTokenCount);
+                prevCandidatesTokenCount = newCandidatesTokenCount;
+                const newTotalTokenCount = response.usageMetadata.totalTokenCount ?? 0;
+                usageMetadata.total_tokens = Math.max(0, newTotalTokenCount - prevTotalTokenCount);
+                prevTotalTokenCount = newTotalTokenCount;
             }
             const chunk = convertResponseContentToChatGenerationChunk(response, {
                 usageMetadata,

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@langchain/google-genai",
-  "version": "0.2.16",
+  "version": "0.2.18",
   "description": "Google Generative AI integration for LangChain.js",
   "type": "module",
   "engines": {