npm - @lobehub/chat - Versions diffs - 1.15.28 → 1.15.29 - Mend

@lobehub/chat 1.15.28 → 1.15.29

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of @lobehub/chat might be problematic. Click here for more details.

Files changed (5) hide show

package/CHANGELOG.md +25 -0
package/package.json +1 -1
package/src/libs/agent-runtime/google/index.test.ts +46 -24
package/src/libs/agent-runtime/google/index.ts +30 -19
package/src/utils/imageToBase64.ts +16 -0

package/CHANGELOG.md CHANGED Viewed

@@ -2,6 +2,31 @@
 # Changelog
+### [Version 1.15.29](https://github.com/lobehub/lobe-chat/compare/v1.15.28...v1.15.29)
+<sup>Released on **2024-09-09**</sup>
+#### 🐛 Bug Fixes
+- **misc**: Gemini cannot input images when server database is enabled.
+<br/>
+<details>
+<summary><kbd>Improvements and Fixes</kbd></summary>
+#### What's fixed
+- **misc**: Gemini cannot input images when server database is enabled, closes [#3370](https://github.com/lobehub/lobe-chat/issues/3370) ([eb552d2](https://github.com/lobehub/lobe-chat/commit/eb552d2))
+</details>
+<div align="right">
+[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)
+</div>
 ### [Version 1.15.28](https://github.com/lobehub/lobe-chat/compare/v1.15.27...v1.15.28)
 <sup>Released on **2024-09-09**</sup>

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@lobehub/chat",
-  "version": "1.15.28",
+  "version": "1.15.29",
   "description": "Lobe Chat - an open-source, high-performance chatbot framework that supports speech synthesis, multimodal, and extensible Function Call plugin system. Supports one-click free deployment of your private ChatGPT/LLM web application.",
   "keywords": [
     "framework",

package/src/libs/agent-runtime/google/index.test.ts CHANGED Viewed

@@ -5,6 +5,7 @@ import OpenAI from 'openai';
 import { afterEach, beforeEach, describe, expect, it, vi } from 'vitest';
 import { OpenAIChatMessage } from '@/libs/agent-runtime';
+import * as imageToBase64Module from '@/utils/imageToBase64';
 import * as debugStreamModule from '../utils/debugStream';
 import { LobeGoogleAI } from './index';
@@ -303,36 +304,57 @@ describe('LobeGoogleAI', () => {
   describe('private method', () => {
     describe('convertContentToGooglePart', () => {
-      it('should throw TypeError when image URL does not contain base64 data', () => {
-        // 提供一个不包含base64数据的图像URL
-        const invalidImageUrl = 'http://example.com/image.png';
+      it('should handle URL type images', async () => {
+        const imageUrl = 'http://example.com/image.png';
+        const mockBase64 = 'mockBase64Data';
-        expect(() =>
+        // Mock the imageUrlToBase64 function
+        vi.spyOn(imageToBase64Module, 'imageUrlToBase64').mockResolvedValueOnce(mockBase64);
+        const result = await instance['convertContentToGooglePart']({
+          type: 'image_url',
+          image_url: { url: imageUrl },
+        });
+        expect(result).toEqual({
+          inlineData: {
+            data: mockBase64,
+            mimeType: 'image/png',
+          },
+        });
+        expect(imageToBase64Module.imageUrlToBase64).toHaveBeenCalledWith(imageUrl);
+      });
+      it('should throw TypeError for unsupported image URL types', async () => {
+        const unsupportedImageUrl = 'unsupported://example.com/image.png';
+        await expect(
           instance['convertContentToGooglePart']({
             type: 'image_url',
-            image_url: { url: invalidImageUrl },
+            image_url: { url: unsupportedImageUrl },
           }),
-        ).toThrow(TypeError);
+        ).rejects.toThrow(TypeError);
       });
     });
     describe('buildGoogleMessages', () => {
-      it('get default result with gemini-pro', () => {
+      it('get default result with gemini-pro', async () => {
         const messages: OpenAIChatMessage[] = [{ content: 'Hello', role: 'user' }];
-        const contents = instance['buildGoogleMessages'](messages, 'gemini-pro');
+        const contents = await instance['buildGoogleMessages'](messages, 'gemini-pro');
         expect(contents).toHaveLength(1);
         expect(contents).toEqual([{ parts: [{ text: 'Hello' }], role: 'user' }]);
       });
-      it('messages should end with user if using gemini-pro', () => {
+      it('messages should end with user if using gemini-pro', async () => {
         const messages: OpenAIChatMessage[] = [
           { content: 'Hello', role: 'user' },
           { content: 'Hi', role: 'assistant' },
         ];
-        const contents = instance['buildGoogleMessages'](messages, 'gemini-pro');
+        const contents = await instance['buildGoogleMessages'](messages, 'gemini-pro');
         expect(contents).toHaveLength(3);
         expect(contents).toEqual([
@@ -342,13 +364,13 @@ describe('LobeGoogleAI', () => {
         ]);
       });
-      it('should include system role if there is a system role prompt', () => {
+      it('should include system role if there is a system role prompt', async () => {
         const messages: OpenAIChatMessage[] = [
           { content: 'you are ChatGPT', role: 'system' },
           { content: 'Who are you', role: 'user' },
         ];
-        const contents = instance['buildGoogleMessages'](messages, 'gemini-pro');
+        const contents = await instance['buildGoogleMessages'](messages, 'gemini-pro');
         expect(contents).toHaveLength(3);
         expect(contents).toEqual([
@@ -358,13 +380,13 @@ describe('LobeGoogleAI', () => {
         ]);
       });
-      it('should not modify the length if model is gemini-1.5-pro', () => {
+      it('should not modify the length if model is gemini-1.5-pro', async () => {
         const messages: OpenAIChatMessage[] = [
           { content: 'Hello', role: 'user' },
           { content: 'Hi', role: 'assistant' },
         ];
-        const contents = instance['buildGoogleMessages'](messages, 'gemini-1.5-pro-latest');
+        const contents = await instance['buildGoogleMessages'](messages, 'gemini-1.5-pro-latest');
         expect(contents).toHaveLength(2);
         expect(contents).toEqual([
@@ -373,7 +395,7 @@ describe('LobeGoogleAI', () => {
         ]);
       });
-      it('should use specified model when images are included in messages', () => {
+      it('should use specified model when images are included in messages', async () => {
         const messages: OpenAIChatMessage[] = [
           {
             content: [
@@ -386,7 +408,7 @@ describe('LobeGoogleAI', () => {
         const model = 'gemini-1.5-flash-latest';
         // 调用 buildGoogleMessages 方法
-        const contents = instance['buildGoogleMessages'](messages, model);
+        const contents = await instance['buildGoogleMessages'](messages, model);
         expect(contents).toHaveLength(1);
         expect(contents).toEqual([
@@ -501,13 +523,13 @@ describe('LobeGoogleAI', () => {
     });
     describe('convertOAIMessagesToGoogleMessage', () => {
-      it('should correctly convert assistant message', () => {
+      it('should correctly convert assistant message', async () => {
         const message: OpenAIChatMessage = {
           role: 'assistant',
           content: 'Hello',
         };
-        const converted = instance['convertOAIMessagesToGoogleMessage'](message);
+        const converted = await instance['convertOAIMessagesToGoogleMessage'](message);
         expect(converted).toEqual({
           role: 'model',
@@ -515,13 +537,13 @@ describe('LobeGoogleAI', () => {
         });
       });
-      it('should correctly convert user message', () => {
+      it('should correctly convert user message', async () => {
         const message: OpenAIChatMessage = {
           role: 'user',
           content: 'Hi',
         };
-        const converted = instance['convertOAIMessagesToGoogleMessage'](message);
+        const converted = await instance['convertOAIMessagesToGoogleMessage'](message);
         expect(converted).toEqual({
           role: 'user',
@@ -529,7 +551,7 @@ describe('LobeGoogleAI', () => {
         });
       });
-      it('should correctly convert message with inline base64 image parts', () => {
+      it('should correctly convert message with inline base64 image parts', async () => {
         const message: OpenAIChatMessage = {
           role: 'user',
           content: [
@@ -538,7 +560,7 @@ describe('LobeGoogleAI', () => {
           ],
         };
-        const converted = instance['convertOAIMessagesToGoogleMessage'](message);
+        const converted = await instance['convertOAIMessagesToGoogleMessage'](message);
         expect(converted).toEqual({
           role: 'user',
@@ -548,7 +570,7 @@ describe('LobeGoogleAI', () => {
           ],
         });
       });
-      it.skip('should correctly convert message with image url parts', () => {
+      it.skip('should correctly convert message with image url parts', async () => {
         const message: OpenAIChatMessage = {
           role: 'user',
           content: [
@@ -557,7 +579,7 @@ describe('LobeGoogleAI', () => {
           ],
         };
-        const converted = instance['convertOAIMessagesToGoogleMessage'](message);
+        const converted = await instance['convertOAIMessagesToGoogleMessage'](message);
         expect(converted).toEqual({
           role: 'user',

package/src/libs/agent-runtime/google/index.ts CHANGED Viewed

@@ -10,6 +10,8 @@ import {
 import { JSONSchema7 } from 'json-schema';
 import { transform } from 'lodash-es';
+import { imageUrlToBase64 } from '@/utils/imageToBase64';
 import { LobeRuntimeAI } from '../BaseAI';
 import { AgentRuntimeErrorType, ILobeAgentRuntimeErrorType } from '../error';
 import {
@@ -52,7 +54,7 @@ export class LobeGoogleAI implements LobeRuntimeAI {
     try {
       const model = payload.model;
-      const contents = this.buildGoogleMessages(payload.messages, model);
+      const contents = await this.buildGoogleMessages(payload.messages, model);
       const geminiStreamResult = await this.client
         .getGenerativeModel(
@@ -109,7 +111,7 @@ export class LobeGoogleAI implements LobeRuntimeAI {
     }
   }
-  private convertContentToGooglePart = (content: UserMessageContentPart): Part => {
+  private convertContentToGooglePart = async (content: UserMessageContentPart): Promise<Part> => {
     switch (content.type) {
       case 'text': {
         return { text: content.text };
@@ -130,51 +132,60 @@ export class LobeGoogleAI implements LobeRuntimeAI {
           };
         }
-        // if (type === 'url') {
-        //   return {
-        //     fileData: {
-        //       fileUri: content.image_url.url,
-        //       mimeType: mimeType || 'image/png',
-        //     },
-        //   };
-        // }
+        if (type === 'url') {
+          const base64Image = await imageUrlToBase64(content.image_url.url);
+          return {
+            inlineData: {
+              data: base64Image,
+              mimeType: mimeType || 'image/png',
+            },
+          };
+        }
         throw new TypeError(`currently we don't support image url: ${content.image_url.url}`);
       }
     }
   };
-  private convertOAIMessagesToGoogleMessage = (message: OpenAIChatMessage): Content => {
+  private convertOAIMessagesToGoogleMessage = async (
+    message: OpenAIChatMessage,
+  ): Promise<Content> => {
     const content = message.content as string | UserMessageContentPart[];
     return {
       parts:
         typeof content === 'string'
           ? [{ text: content }]
-          : content.map((c) => this.convertContentToGooglePart(c)),
+          : await Promise.all(content.map(async (c) => await this.convertContentToGooglePart(c))),
       role: message.role === 'assistant' ? 'model' : 'user',
     };
   };
   // convert messages from the Vercel AI SDK Format to the format
   // that is expected by the Google GenAI SDK
-  private buildGoogleMessages = (messages: OpenAIChatMessage[], model: string): Content[] => {
+  private buildGoogleMessages = async (
+    messages: OpenAIChatMessage[],
+    model: string,
+  ): Promise<Content[]> => {
     // if the model is gemini-1.5-pro-latest, we don't need any special handling
     if (model === 'gemini-1.5-pro-latest') {
-      return messages
+      const pools = messages
         .filter((message) => message.role !== 'function')
-        .map((msg) => this.convertOAIMessagesToGoogleMessage(msg));
+        .map(async (msg) => await this.convertOAIMessagesToGoogleMessage(msg));
+      return Promise.all(pools);
     }
     const contents: Content[] = [];
     let lastRole = 'model';
-    messages.forEach((message) => {
+    for (const message of messages) {
       // current to filter function message
       if (message.role === 'function') {
-        return;
+        continue;
       }
-      const googleMessage = this.convertOAIMessagesToGoogleMessage(message);
+      const googleMessage = await this.convertOAIMessagesToGoogleMessage(message);
       // if the last message is a model message and the current message is a model message
       // then we need to add a user message to separate them
@@ -187,7 +198,7 @@ export class LobeGoogleAI implements LobeRuntimeAI {
       // update the last role
       lastRole = googleMessage.role;
-    });
+    }
     // if the last message is a user message, then we need to add a model message to separate them
     if (lastRole === 'model') {

package/src/utils/imageToBase64.ts CHANGED Viewed

@@ -35,3 +35,19 @@ export const imageToBase64 = ({
   return canvas.toDataURL(type);
 };
+export const imageUrlToBase64 = async (imageUrl: string): Promise<string> => {
+  try {
+    const res = await fetch(imageUrl);
+    const arrayBuffer = await res.arrayBuffer();
+    return typeof btoa === 'function'
+      ? btoa(
+          new Uint8Array(arrayBuffer).reduce((data, byte) => data + String.fromCharCode(byte), ''),
+        )
+      : Buffer.from(arrayBuffer).toString('base64');
+  } catch (error) {
+    console.error('Error converting image to base64:', error);
+    throw error;
+  }
+};