npm - @lobehub/chat - Versions diffs - 1.71.1 → 1.71.3 - Mend

@lobehub/chat 1.71.1 → 1.71.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (14) hide show

package/CHANGELOG.md +50 -0
package/changelog/v1.json +18 -0
package/package.json +1 -1
package/src/const/settings/agent.ts +3 -4
package/src/database/server/models/__tests__/chunk.test.ts +4 -4
package/src/database/server/models/chunk.ts +2 -1
package/src/libs/agent-runtime/anthropic/index.test.ts +3 -3
package/src/libs/agent-runtime/anthropic/index.ts +13 -2
package/src/libs/agent-runtime/google/index.test.ts +3 -1
package/src/libs/agent-runtime/google/index.ts +56 -10
package/src/libs/agent-runtime/runtimeMap.ts +47 -48
package/src/server/routers/lambda/agent.ts +10 -7
package/src/server/routers/lambda/chunk.ts +65 -49
package/src/store/chat/slices/aiChat/actions/rag.ts +18 -12

package/CHANGELOG.md CHANGED Viewed

@@ -2,6 +2,56 @@
 # Changelog
+### [Version 1.71.3](https://github.com/lobehub/lobe-chat/compare/v1.71.2...v1.71.3)
+<sup>Released on **2025-03-15**</sup>
+#### 🐛 Bug Fixes
+- **misc**: Fix claude 3.5+ models context max output.
+<br/>
+<details>
+<summary><kbd>Improvements and Fixes</kbd></summary>
+#### What's fixed
+- **misc**: Fix claude 3.5+ models context max output, closes [#6984](https://github.com/lobehub/lobe-chat/issues/6984) ([da342dd](https://github.com/lobehub/lobe-chat/commit/da342dd))
+</details>
+<div align="right">
+[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)
+</div>
+### [Version 1.71.2](https://github.com/lobehub/lobe-chat/compare/v1.71.1...v1.71.2)
+<sup>Released on **2025-03-15**</sup>
+#### 🐛 Bug Fixes
+- **misc**: Fix knowledge base issue.
+<br/>
+<details>
+<summary><kbd>Improvements and Fixes</kbd></summary>
+#### What's fixed
+- **misc**: Fix knowledge base issue, closes [#6973](https://github.com/lobehub/lobe-chat/issues/6973) ([15f39ef](https://github.com/lobehub/lobe-chat/commit/15f39ef))
+</details>
+<div align="right">
+[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)
+</div>
 ### [Version 1.71.1](https://github.com/lobehub/lobe-chat/compare/v1.71.0...v1.71.1)
 <sup>Released on **2025-03-15**</sup>

package/changelog/v1.json CHANGED Viewed

@@ -1,4 +1,22 @@
 [
+  {
+    "children": {
+      "fixes": [
+        "Fix claude 3.5+ models context max output."
+      ]
+    },
+    "date": "2025-03-15",
+    "version": "1.71.3"
+  },
+  {
+    "children": {
+      "fixes": [
+        "Fix knowledge base issue."
+      ]
+    },
+    "date": "2025-03-15",
+    "version": "1.71.2"
+  },
   {
     "children": {
       "fixes": [

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@lobehub/chat",
-  "version": "1.71.1",
+  "version": "1.71.3",
   "description": "Lobe Chat - an open-source, high-performance chatbot framework that supports speech synthesis, multimodal, and extensible Function Call plugin system. Supports one-click free deployment of your private ChatGPT/LLM web application.",
   "keywords": [
     "framework",

package/src/const/settings/agent.ts CHANGED Viewed

@@ -1,6 +1,5 @@
 import { DEFAULT_AGENT_META } from '@/const/meta';
-import { DEFAULT_MODEL } from '@/const/settings/llm';
-import { ModelProvider } from '@/libs/agent-runtime';
+import { DEFAULT_MODEL, DEFAULT_PROVIDER } from '@/const/settings/llm';
 import { LobeAgentChatConfig, LobeAgentConfig, LobeAgentTTSConfig } from '@/types/agent';
 import { UserDefaultAgent } from '@/types/user/settings';
@@ -15,7 +14,7 @@ export const DEFAUTT_AGENT_TTS_CONFIG: LobeAgentTTSConfig = {
 export const DEFAULT_AGENT_SEARCH_FC_MODEL = {
   model: DEFAULT_MODEL,
-  provider: ModelProvider.OpenAI,
+  provider: DEFAULT_PROVIDER,
 };
 export const DEFAULT_AGENT_CHAT_CONFIG: LobeAgentChatConfig = {
@@ -41,7 +40,7 @@ export const DEFAULT_AGENT_CONFIG: LobeAgentConfig = {
     top_p: 1,
   },
   plugins: [],
-  provider: ModelProvider.OpenAI,
+  provider: DEFAULT_PROVIDER,
   systemRole: '',
   tts: DEFAUTT_AGENT_TTS_CONFIG,
 };

package/src/database/server/models/__tests__/chunk.test.ts CHANGED Viewed

@@ -495,13 +495,13 @@ content in Table html is below:
     });
     // 测试结果限制
-    it('should limit results to 5 items', async () => {
+    it('should limit results to 15 items', async () => {
       const fileId = '1';
-      // Create 6 chunks
+      // Create 24 chunks
       const chunkResult = await serverDB
         .insert(chunks)
         .values(
-          Array(6)
+          Array(24)
             .fill(0)
             .map((_, i) => ({ text: `Test Chunk ${i}`, userId })),
         )
@@ -528,7 +528,7 @@ content in Table html is below:
         query: 'test',
       });
-      expect(result).toHaveLength(5);
+      expect(result).toHaveLength(15);
     });
   });
 });

package/src/database/server/models/chunk.ts CHANGED Viewed

@@ -207,7 +207,8 @@ export class ChunkModel {
       .leftJoin(files, eq(files.id, fileChunks.fileId))
       .where(inArray(fileChunks.fileId, fileIds))
       .orderBy((t) => desc(t.similarity))
-      .limit(5);
+      // 先放宽到 15
+      .limit(15);
     return result.map((item) => {
       return {

package/src/libs/agent-runtime/anthropic/index.test.ts CHANGED Viewed

@@ -123,21 +123,21 @@ describe('LobeAnthropicAI', () => {
           { content: 'You are an awesome greeter', role: 'system' },
           { content: 'Hello', role: 'user' },
         ],
-        model: 'claude-3-haiku-20240307',
+        model: 'claude-3-7-sonnet-20250219',
         temperature: 0,
       });
       // Assert
       expect(instance['client'].messages.create).toHaveBeenCalledWith(
         {
-          max_tokens: 4096,
+          max_tokens: 8192,
           messages: [
             {
               content: [{ cache_control: { type: 'ephemeral' }, text: 'Hello', type: 'text' }],
               role: 'user',
             },
           ],
-          model: 'claude-3-haiku-20240307',
+          model: 'claude-3-7-sonnet-20250219',
           stream: true,
           system: [
             {

package/src/libs/agent-runtime/anthropic/index.ts CHANGED Viewed

@@ -25,6 +25,8 @@ export interface AnthropicModelCard {
   id: string;
 }
+const modelsWithSmallContextWindow = new Set(['claude-3-opus-20240229', 'claude-3-haiku-20240307']);
 const DEFAULT_BASE_URL = 'https://api.anthropic.com';
 interface AnthropicAIParams extends ClientOptions {
@@ -38,6 +40,10 @@ export class LobeAnthropicAI implements LobeRuntimeAI {
   apiKey?: string;
   private id: string;
+  private isDebug() {
+    return process.env.DEBUG_ANTHROPIC_CHAT_COMPLETION === '1';
+  }
   constructor({ apiKey, baseURL = DEFAULT_BASE_URL, id, ...res }: AnthropicAIParams = {}) {
     if (!apiKey) throw AgentRuntimeError.createError(AgentRuntimeErrorType.InvalidProviderAPIKey);
@@ -51,6 +57,11 @@ export class LobeAnthropicAI implements LobeRuntimeAI {
     try {
       const anthropicPayload = await this.buildAnthropicPayload(payload);
+      if (this.isDebug()) {
+        console.log('[requestPayload]');
+        console.log(JSON.stringify(anthropicPayload), '\n');
+      }
       const response = await this.client.messages.create(
         { ...anthropicPayload, stream: true },
         {
@@ -60,7 +71,7 @@ export class LobeAnthropicAI implements LobeRuntimeAI {
       const [prod, debug] = response.tee();
-      if (process.env.DEBUG_ANTHROPIC_CHAT_COMPLETION === '1') {
+      if (this.isDebug()) {
         debugStream(debug.toReadableStream()).catch(console.error);
       }
@@ -123,7 +134,7 @@ export class LobeAnthropicAI implements LobeRuntimeAI {
     return {
       // claude 3 series model hax max output token of 4096, 3.x series has 8192
       // https://docs.anthropic.com/en/docs/about-claude/models/all-models#:~:text=200K-,Max%20output,-Normal%3A
-      max_tokens: max_tokens ?? (model.startsWith('claude-3-') ? 4096 : 8192),
+      max_tokens: max_tokens ?? (modelsWithSmallContextWindow.has(model) ? 4096 : 8192),
       messages: postMessages,
       model,
       system: systemPrompts,

package/src/libs/agent-runtime/google/index.test.ts CHANGED Viewed

@@ -340,7 +340,9 @@ describe('LobeGoogleAI', () => {
           expect(e).toEqual({
             errorType: bizErrorType,
             error: {
-              message: `[GoogleGenerativeAI Error]: Error fetching from https://generativelanguage.googleapis.com/v1/models/gemini-pro:streamGenerateContent?alt=sse: [400 Bad Request] API key not valid. Please pass a valid API key. [{"@type":"type.googleapis.com/google.rpc.ErrorInfo","reason":"Error","domain":"googleapis.com","metadata":{"service":"generativelanguage.googleapis.com}}]`,
+              message: `API key not valid. Please pass a valid API key. [{"@type":"type.googleapis.com/google.rpc.ErrorInfo","reason":"Error","domain":"googleapis.com","metadata":{"service":"generativelanguage.googleapis.com}}]`,
+              statusCode: 400,
+              statusCodeText: '[400 Bad Request]',
             },
             provider,
           });

package/src/libs/agent-runtime/google/index.ts CHANGED Viewed

@@ -23,7 +23,6 @@ import {
   OpenAIChatMessage,
   UserMessageContentPart,
 } from '../types';
-import { ModelProvider } from '../types/type';
 import { AgentRuntimeError } from '../utils/createError';
 import { debugStream } from '../utils/debugStream';
 import { StreamingResponse } from '../utils/response';
@@ -77,6 +76,7 @@ interface LobeGoogleAIParams {
   apiKey?: string;
   baseURL?: string;
   client?: GoogleGenerativeAI | VertexAI;
+  id?: string;
   isVertexAi?: boolean;
 }
@@ -85,8 +85,9 @@ export class LobeGoogleAI implements LobeRuntimeAI {
   private isVertexAi: boolean;
   baseURL?: string;
   apiKey?: string;
+  provider: string;
-  constructor({ apiKey, baseURL, client, isVertexAi }: LobeGoogleAIParams = {}) {
+  constructor({ apiKey, baseURL, client, isVertexAi, id }: LobeGoogleAIParams = {}) {
     if (!apiKey) throw AgentRuntimeError.createError(AgentRuntimeErrorType.InvalidProviderAPIKey);
     this.client = new GoogleGenerativeAI(apiKey);
@@ -94,6 +95,8 @@ export class LobeGoogleAI implements LobeRuntimeAI {
     this.client = client ? (client as GoogleGenerativeAI) : new GoogleGenerativeAI(apiKey);
     this.baseURL = client ? undefined : baseURL || DEFAULT_BASE_URL;
     this.isVertexAi = isVertexAi || false;
+    this.provider = id || (isVertexAi ? 'vertexai' : 'google');
   }
   async chat(rawPayload: ChatStreamPayload, options?: ChatCompetitionOptions) {
@@ -168,7 +171,7 @@ export class LobeGoogleAI implements LobeRuntimeAI {
       console.log(err);
       const { errorType, error } = this.parseErrorMessage(err.message);
-      throw AgentRuntimeError.chat({ error, errorType, provider: ModelProvider.Google });
+      throw AgentRuntimeError.chat({ error, errorType, provider: this.provider });
     }
   }
@@ -322,12 +325,12 @@ export class LobeGoogleAI implements LobeRuntimeAI {
     if (message.includes('location is not supported'))
       return { error: { message }, errorType: AgentRuntimeErrorType.LocationNotSupportError };
-    try {
-      const startIndex = message.lastIndexOf('[');
-      if (startIndex === -1) {
-        return defaultError;
-      }
+    const startIndex = message.lastIndexOf('[');
+    if (startIndex === -1) {
+      return defaultError;
+    }
+    try {
       // 从开始位置截取字符串到最后
       const jsonString = message.slice(startIndex);
@@ -346,9 +349,18 @@ export class LobeGoogleAI implements LobeRuntimeAI {
         }
       }
     } catch {
-      // 如果解析失败，则返回原始错误消息
-      return defaultError;
+      //
+    }
+    const errorObj = this.extractErrorObjectFromError(message);
+    const { errorDetails } = errorObj;
+    if (errorDetails) {
+      return { error: errorDetails, errorType: AgentRuntimeErrorType.ProviderBizError };
     }
+    return defaultError;
   }
   private buildGoogleTools(
@@ -389,6 +401,40 @@ export class LobeGoogleAI implements LobeRuntimeAI {
       },
     };
   };
+  private extractErrorObjectFromError(message: string) {
+    // 使用正则表达式匹配状态码部分 [数字 描述文本]
+    const regex = /^(.*?)(\[\d+ [^\]]+])(.*)$/;
+    const match = message.match(regex);
+    if (match) {
+      const prefix = match[1].trim();
+      const statusCodeWithBrackets = match[2].trim();
+      const message = match[3].trim();
+      // 提取状态码数字
+      const statusCodeMatch = statusCodeWithBrackets.match(/\[(\d+)/);
+      const statusCode = statusCodeMatch ? parseInt(statusCodeMatch[1]) : null;
+      // 创建包含状态码和消息的JSON
+      const resultJson = {
+        message: message,
+        statusCode: statusCode,
+        statusCodeText: statusCodeWithBrackets,
+      };
+      return {
+        errorDetails: resultJson,
+        prefix: prefix,
+      };
+    }
+    // 如果无法匹配，返回原始消息
+    return {
+      errorDetails: null,
+      prefix: message,
+    };
+  }
 }
 export default LobeGoogleAI;

package/src/libs/agent-runtime/runtimeMap.ts CHANGED Viewed

@@ -37,7 +37,6 @@ import { LobeStepfunAI } from './stepfun';
 import { LobeTaichuAI } from './taichu';
 import { LobeTencentCloudAI } from './tencentcloud';
 import { LobeTogetherAI } from './togetherai';
-import { ModelProvider } from './types';
 import { LobeUpstageAI } from './upstage';
 import { LobeVLLMAI } from './vllm';
 import { LobeVolcengineAI } from './volcengine';
@@ -47,51 +46,51 @@ import { LobeZeroOneAI } from './zeroone';
 import { LobeZhipuAI } from './zhipu';
 export const providerRuntimeMap = {
-  [ModelProvider.OpenAI]: LobeOpenAI,
-  [ModelProvider.Azure]: LobeAzureOpenAI,
-  [ModelProvider.AzureAI]: LobeAzureAI,
-  [ModelProvider.ZhiPu]: LobeZhipuAI,
-  [ModelProvider.Google]: LobeGoogleAI,
-  [ModelProvider.Moonshot]: LobeMoonshotAI,
-  [ModelProvider.Bedrock]: LobeBedrockAI,
-  [ModelProvider.LMStudio]: LobeLMStudioAI,
-  [ModelProvider.Ollama]: LobeOllamaAI,
-  [ModelProvider.VLLM]: LobeVLLMAI,
-  [ModelProvider.Perplexity]: LobePerplexityAI,
-  [ModelProvider.Anthropic]: LobeAnthropicAI,
-  [ModelProvider.DeepSeek]: LobeDeepSeekAI,
-  [ModelProvider.HuggingFace]: LobeHuggingFaceAI,
-  [ModelProvider.Minimax]: LobeMinimaxAI,
-  [ModelProvider.Mistral]: LobeMistralAI,
-  [ModelProvider.Groq]: LobeGroq,
-  [ModelProvider.Github]: LobeGithubAI,
-  [ModelProvider.OpenRouter]: LobeOpenRouterAI,
-  [ModelProvider.TogetherAI]: LobeTogetherAI,
-  [ModelProvider.FireworksAI]: LobeFireworksAI,
-  [ModelProvider.ZeroOne]: LobeZeroOneAI,
-  [ModelProvider.Stepfun]: LobeStepfunAI,
-  [ModelProvider.Qwen]: LobeQwenAI,
-  [ModelProvider.Novita]: LobeNovitaAI,
-  [ModelProvider.Nvidia]: LobeNvidiaAI,
-  [ModelProvider.Taichu]: LobeTaichuAI,
-  [ModelProvider.Baichuan]: LobeBaichuanAI,
-  [ModelProvider.Ai360]: LobeAi360AI,
-  [ModelProvider.SiliconCloud]: LobeSiliconCloudAI,
-  [ModelProvider.GiteeAI]: LobeGiteeAI,
-  [ModelProvider.Upstage]: LobeUpstageAI,
-  [ModelProvider.Spark]: LobeSparkAI,
-  [ModelProvider.Ai21]: LobeAi21AI,
-  [ModelProvider.Hunyuan]: LobeHunyuanAI,
-  [ModelProvider.SenseNova]: LobeSenseNovaAI,
-  [ModelProvider.XAI]: LobeXAI,
-  [ModelProvider.Jina]: LobeJinaAI,
-  [ModelProvider.SambaNova]: LobeSambaNovaAI,
-  [ModelProvider.Cloudflare]: LobeCloudflareAI,
-  [ModelProvider.InternLM]: LobeInternLMAI,
-  [ModelProvider.Higress]: LobeHigressAI,
-  [ModelProvider.TencentCloud]: LobeTencentCloudAI,
-  [ModelProvider.Volcengine]: LobeVolcengineAI,
-  [ModelProvider.PPIO]: LobePPIOAI,
-  [ModelProvider.Doubao]: LobeVolcengineAI,
-  [ModelProvider.Wenxin]: LobeWenxinAI,
+  ai21: LobeAi21AI,
+  ai360: LobeAi360AI,
+  anthropic: LobeAnthropicAI,
+  azure: LobeAzureOpenAI,
+  azureai: LobeAzureAI,
+  baichuan: LobeBaichuanAI,
+  bedrock: LobeBedrockAI,
+  cloudflare: LobeCloudflareAI,
+  deepseek: LobeDeepSeekAI,
+  doubao: LobeVolcengineAI,
+  fireworksai: LobeFireworksAI,
+  giteeai: LobeGiteeAI,
+  github: LobeGithubAI,
+  google: LobeGoogleAI,
+  groq: LobeGroq,
+  higress: LobeHigressAI,
+  huggingface: LobeHuggingFaceAI,
+  hunyuan: LobeHunyuanAI,
+  internlm: LobeInternLMAI,
+  jina: LobeJinaAI,
+  lmstudio: LobeLMStudioAI,
+  minimax: LobeMinimaxAI,
+  mistral: LobeMistralAI,
+  moonshot: LobeMoonshotAI,
+  novita: LobeNovitaAI,
+  nvidia: LobeNvidiaAI,
+  ollama: LobeOllamaAI,
+  openai: LobeOpenAI,
+  openrouter: LobeOpenRouterAI,
+  perplexity: LobePerplexityAI,
+  ppio: LobePPIOAI,
+  qwen: LobeQwenAI,
+  sambanova: LobeSambaNovaAI,
+  sensenova: LobeSenseNovaAI,
+  siliconcloud: LobeSiliconCloudAI,
+  spark: LobeSparkAI,
+  stepfun: LobeStepfunAI,
+  taichu: LobeTaichuAI,
+  tencentcloud: LobeTencentCloudAI,
+  togetherai: LobeTogetherAI,
+  upstage: LobeUpstageAI,
+  vllm: LobeVLLMAI,
+  volcengine: LobeVolcengineAI,
+  wenxin: LobeWenxinAI,
+  xai: LobeXAI,
+  zeroone: LobeZeroOneAI,
+  zhipu: LobeZhipuAI,
 };

package/src/server/routers/lambda/agent.ts CHANGED Viewed

@@ -122,13 +122,16 @@ export const agentRouter = router({
       const knowledge = await ctx.agentModel.getAgentAssignedKnowledge(input.agentId);
       return [
-        ...files.map((file) => ({
-          enabled: knowledge.files.some((item) => item.id === file.id),
-          fileType: file.fileType,
-          id: file.id,
-          name: file.name,
-          type: KnowledgeType.File,
-        })),
+        ...files
+          // 过滤掉所有图片
+          .filter((file) => !file.fileType.startsWith('image'))
+          .map((file) => ({
+            enabled: knowledge.files.some((item) => item.id === file.id),
+            fileType: file.fileType,
+            id: file.id,
+            name: file.name,
+            type: KnowledgeType.File,
+          })),
         ...knowledgeBases.map((knowledgeBase) => ({
           avatar: knowledgeBase.avatar,
           description: knowledgeBase.description,

package/src/server/routers/lambda/chunk.ts CHANGED Viewed

@@ -1,3 +1,4 @@
+import { TRPCError } from '@trpc/server';
 import { inArray } from 'drizzle-orm/expressions';
 import { z } from 'zod';
@@ -126,60 +127,75 @@ export const chunkRouter = router({
   semanticSearchForChat: chunkProcedure
     .input(SemanticSearchSchema)
     .mutation(async ({ ctx, input }) => {
-      const item = await ctx.messageModel.findMessageQueriesById(input.messageId);
-      const { model, provider } =
-        getServerDefaultFilesConfig().embeddingModel || DEFAULT_FILE_EMBEDDING_MODEL_ITEM;
-      let embedding: number[];
-      let ragQueryId: string;
-      // if there is no message rag or it's embeddings, then we need to create one
-      if (!item || !item.embeddings) {
-        // TODO: need to support customize
-        const agentRuntime = await initAgentRuntimeWithUserPayload(provider, ctx.jwtPayload);
-        const embeddings = await agentRuntime.embeddings({
-          dimensions: 1024,
-          input: input.rewriteQuery,
-          model,
-        });
-        embedding = embeddings![0];
-        const embeddingsId = await ctx.embeddingModel.create({
-          embeddings: embedding,
-          model,
+      try {
+        const item = await ctx.messageModel.findMessageQueriesById(input.messageId);
+        const { model, provider } =
+          getServerDefaultFilesConfig().embeddingModel || DEFAULT_FILE_EMBEDDING_MODEL_ITEM;
+        let embedding: number[];
+        let ragQueryId: string;
+        // if there is no message rag or it's embeddings, then we need to create one
+        if (!item || !item.embeddings) {
+          // TODO: need to support customize
+          const agentRuntime = await initAgentRuntimeWithUserPayload(provider, ctx.jwtPayload);
+          // slice content to make sure in the context window limit
+          const query =
+            input.rewriteQuery.length > 8000
+              ? input.rewriteQuery.slice(0, 8000)
+              : input.rewriteQuery;
+          const embeddings = await agentRuntime.embeddings({
+            dimensions: 1024,
+            input: query,
+            model,
+          });
+          embedding = embeddings![0];
+          const embeddingsId = await ctx.embeddingModel.create({
+            embeddings: embedding,
+            model,
+          });
+          const result = await ctx.messageModel.createMessageQuery({
+            embeddingsId,
+            messageId: input.messageId,
+            rewriteQuery: input.rewriteQuery,
+            userQuery: input.userQuery,
+          });
+          ragQueryId = result.id;
+        } else {
+          embedding = item.embeddings;
+          ragQueryId = item.id;
+        }
+        let finalFileIds = input.fileIds ?? [];
+        if (input.knowledgeIds && input.knowledgeIds.length > 0) {
+          const knowledgeFiles = await serverDB.query.knowledgeBaseFiles.findMany({
+            where: inArray(knowledgeBaseFiles.knowledgeBaseId, input.knowledgeIds),
+          });
+          finalFileIds = knowledgeFiles.map((f) => f.fileId).concat(finalFileIds);
+        }
+        const chunks = await ctx.chunkModel.semanticSearchForChat({
+          embedding,
+          fileIds: finalFileIds,
+          query: input.rewriteQuery,
         });
-        const result = await ctx.messageModel.createMessageQuery({
-          embeddingsId,
-          messageId: input.messageId,
-          rewriteQuery: input.rewriteQuery,
-          userQuery: input.userQuery,
-        });
+        // TODO: need to rerank the chunks
-        ragQueryId = result.id;
-      } else {
-        embedding = item.embeddings;
-        ragQueryId = item.id;
-      }
+        return { chunks, queryId: ragQueryId };
+      } catch (e) {
+        console.error(e);
-      console.time('semanticSearch');
-      let finalFileIds = input.fileIds ?? [];
-      if (input.knowledgeIds && input.knowledgeIds.length > 0) {
-        const knowledgeFiles = await serverDB.query.knowledgeBaseFiles.findMany({
-          where: inArray(knowledgeBaseFiles.knowledgeBaseId, input.knowledgeIds),
+        throw new TRPCError({
+          code: 'INTERNAL_SERVER_ERROR',
+          message: (e as any).errorType || JSON.stringify(e),
         });
-        finalFileIds = knowledgeFiles.map((f) => f.fileId).concat(finalFileIds);
       }
-      const chunks = await ctx.chunkModel.semanticSearchForChat({
-        embedding,
-        fileIds: finalFileIds,
-        query: input.rewriteQuery,
-      });
-      // TODO: need to rerank the chunks
-      console.timeEnd('semanticSearch');
-      return { chunks, queryId: ragQueryId };
     }),
 });

package/src/store/chat/slices/aiChat/actions/rag.ts CHANGED Viewed

@@ -21,7 +21,7 @@ export interface ChatRAGAction {
     id: string,
     userQuery: string,
     messages: string[],
-  ) => Promise<{ chunks: ChatSemanticSearchChunk[]; queryId: string; rewriteQuery?: string }>;
+  ) => Promise<{ chunks: ChatSemanticSearchChunk[]; queryId?: string; rewriteQuery?: string }>;
   /**
    * Rewrite user content to better RAG query
    */
@@ -74,17 +74,23 @@ export const chatRag: StateCreator<ChatStore, [['zustand/devtools', never]], [],
     // 2. retrieve chunks from semantic search
     const files = chatSelectors.currentUserFiles(get()).map((f) => f.id);
-    const { chunks, queryId } = await ragService.semanticSearchForChat({
-      fileIds: knowledgeIds().fileIds.concat(files),
-      knowledgeIds: knowledgeIds().knowledgeBaseIds,
-      messageId: id,
-      rewriteQuery: rewriteQuery || userQuery,
-      userQuery,
-    });
-    get().internal_toggleMessageRAGLoading(false, id);
-    return { chunks, queryId, rewriteQuery };
+    try {
+      const { chunks, queryId } = await ragService.semanticSearchForChat({
+        fileIds: knowledgeIds().fileIds.concat(files),
+        knowledgeIds: knowledgeIds().knowledgeBaseIds,
+        messageId: id,
+        rewriteQuery: rewriteQuery || userQuery,
+        userQuery,
+      });
+      get().internal_toggleMessageRAGLoading(false, id);
+      return { chunks, queryId, rewriteQuery };
+    } catch {
+      get().internal_toggleMessageRAGLoading(false, id);
+      return { chunks: [] };
+    }
   },
   internal_rewriteQuery: async (id, content, messages) => {
     let rewriteQuery = content;