npm - @lobehub/chat - Versions diffs - 1.45.17 → 1.46.1 - Mend

@lobehub/chat 1.45.17 → 1.46.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (51) hide show

package/.env.example +4 -1
package/CHANGELOG.md +51 -0
package/README.ja-JP.md +3 -3
package/README.md +3 -3
package/README.zh-CN.md +3 -3
package/changelog/v1.json +18 -0
package/docs/self-hosting/advanced/knowledge-base.mdx +9 -0
package/docs/self-hosting/advanced/knowledge-base.zh-CN.mdx +9 -0
package/locales/ar/providers.json +3 -0
package/locales/bg-BG/providers.json +3 -0
package/locales/de-DE/providers.json +3 -0
package/locales/en-US/providers.json +3 -0
package/locales/es-ES/providers.json +3 -0
package/locales/fa-IR/providers.json +3 -0
package/locales/fr-FR/providers.json +3 -0
package/locales/it-IT/providers.json +3 -0
package/locales/ja-JP/providers.json +3 -0
package/locales/ko-KR/providers.json +3 -0
package/locales/nl-NL/providers.json +3 -0
package/locales/pl-PL/providers.json +3 -0
package/locales/pt-BR/providers.json +3 -0
package/locales/ru-RU/providers.json +3 -0
package/locales/tr-TR/providers.json +3 -0
package/locales/vi-VN/providers.json +3 -0
package/locales/zh-CN/providers.json +3 -0
package/locales/zh-TW/providers.json +3 -0
package/package.json +2 -2
package/scripts/serverLauncher/startServer.js +8 -5
package/src/app/(main)/settings/provider/(detail)/[id]/index.tsx +0 -1
package/src/config/aiModels/index.ts +3 -0
package/src/config/aiModels/lmstudio.ts +27 -0
package/src/config/knowledge.ts +2 -0
package/src/config/modelProviders/index.ts +6 -3
package/src/config/modelProviders/lmstudio.ts +25 -0
package/src/const/settings/knowledge.ts +25 -0
package/src/const/settings/llm.ts +9 -0
package/src/database/schemas/ragEvals.ts +2 -2
package/src/libs/agent-runtime/AgentRuntime.ts +7 -0
package/src/libs/agent-runtime/bedrock/index.ts +64 -3
package/src/libs/agent-runtime/lmstudio/index.test.ts +255 -0
package/src/libs/agent-runtime/lmstudio/index.ts +11 -0
package/src/libs/agent-runtime/ollama/index.ts +37 -1
package/src/libs/agent-runtime/types/type.ts +1 -0
package/src/server/globalConfig/index.ts +6 -0
package/src/server/globalConfig/parseFilesConfig.test.ts +17 -0
package/src/server/globalConfig/parseFilesConfig.ts +57 -0
package/src/server/routers/async/file.ts +8 -8
package/src/server/routers/lambda/chunk.ts +12 -16
package/src/types/knowledgeBase/index.ts +8 -0
package/src/types/user/settings/filesConfig.ts +9 -0
package/src/types/user/settings/keyVaults.ts +1 -0

package/src/server/routers/async/file.ts CHANGED Viewed

@@ -5,15 +5,15 @@ import { z } from 'zod';
 import { serverDBEnv } from '@/config/db';
 import { fileEnv } from '@/config/file';
-import { DEFAULT_EMBEDDING_MODEL } from '@/const/settings';
+import { DEFAULT_FILE_EMBEDDING_MODEL_ITEM } from '@/const/settings/knowledge';
 import { NewChunkItem, NewEmbeddingsItem } from '@/database/schemas';
 import { serverDB } from '@/database/server';
 import { ASYNC_TASK_TIMEOUT, AsyncTaskModel } from '@/database/server/models/asyncTask';
 import { ChunkModel } from '@/database/server/models/chunk';
 import { EmbeddingModel } from '@/database/server/models/embedding';
 import { FileModel } from '@/database/server/models/file';
-import { ModelProvider } from '@/libs/agent-runtime';
 import { asyncAuthedProcedure, asyncRouter as router } from '@/libs/trpc/async';
+import { getServerDefaultFilesConfig } from '@/server/globalConfig';
 import { initAgentRuntimeWithUserPayload } from '@/server/modules/AgentRuntime';
 import { S3 } from '@/server/modules/S3';
 import { ChunkService } from '@/server/services/chunk';
@@ -44,7 +44,6 @@ export const fileRouter = router({
     .input(
       z.object({
         fileId: z.string(),
-        model: z.string().default(DEFAULT_EMBEDDING_MODEL),
         taskId: z.string(),
       }),
     )
@@ -57,6 +56,9 @@ export const fileRouter = router({
       const asyncTask = await ctx.asyncTaskModel.findById(input.taskId);
+      const { model, provider } =
+        getServerDefaultFilesConfig().embeddingModel || DEFAULT_FILE_EMBEDDING_MODEL_ITEM;
       if (!asyncTask) throw new TRPCError({ code: 'BAD_REQUEST', message: 'Async Task not found' });
       try {
@@ -84,13 +86,12 @@ export const fileRouter = router({
           const chunks = await ctx.chunkModel.getChunksTextByFileId(input.fileId);
           const requestArray = chunk(chunks, CHUNK_SIZE);
           try {
             await pMap(
               requestArray,
               async (chunks, index) => {
                 const agentRuntime = await initAgentRuntimeWithUserPayload(
-                  ModelProvider.OpenAI,
+                  provider,
                   ctx.jwtPayload,
                 );
@@ -98,11 +99,10 @@ export const fileRouter = router({
                 console.log(`执行第 ${number} 个任务`);
                 console.time(`任务[${number}]: embeddings`);
                 const embeddings = await agentRuntime.embeddings({
                   dimensions: 1024,
                   input: chunks.map((c) => c.text),
-                  model: input.model,
+                  model,
                 });
                 console.timeEnd(`任务[${number}]: embeddings`);
@@ -111,7 +111,7 @@ export const fileRouter = router({
                     chunkId: chunks[idx].id,
                     embeddings: e,
                     fileId: input.fileId,
-                    model: input.model,
+                    model,
                   })) || [];
                 console.time(`任务[${number}]: insert db`);

package/src/server/routers/lambda/chunk.ts CHANGED Viewed

@@ -1,7 +1,7 @@
 import { inArray } from 'drizzle-orm/expressions';
 import { z } from 'zod';
-import { DEFAULT_EMBEDDING_MODEL } from '@/const/settings';
+import { DEFAULT_FILE_EMBEDDING_MODEL_ITEM } from '@/const/settings/knowledge';
 import { knowledgeBaseFiles } from '@/database/schemas';
 import { serverDB } from '@/database/server';
 import { AsyncTaskModel } from '@/database/server/models/asyncTask';
@@ -9,9 +9,9 @@ import { ChunkModel } from '@/database/server/models/chunk';
 import { EmbeddingModel } from '@/database/server/models/embedding';
 import { FileModel } from '@/database/server/models/file';
 import { MessageModel } from '@/database/server/models/message';
-import { ModelProvider } from '@/libs/agent-runtime';
 import { authedProcedure, router } from '@/libs/trpc';
 import { keyVaults } from '@/libs/trpc/middleware/keyVaults';
+import { getServerDefaultFilesConfig } from '@/server/globalConfig';
 import { initAgentRuntimeWithUserPayload } from '@/server/modules/AgentRuntime';
 import { ChunkService } from '@/server/services/chunk';
 import { SemanticSearchSchema } from '@/types/rag';
@@ -101,21 +101,18 @@ export const chunkRouter = router({
     .input(
       z.object({
         fileIds: z.array(z.string()).optional(),
-        model: z.string().default(DEFAULT_EMBEDDING_MODEL),
         query: z.string(),
       }),
     )
     .mutation(async ({ ctx, input }) => {
-      console.time('embedding');
-      const agentRuntime = await initAgentRuntimeWithUserPayload(
-        ModelProvider.OpenAI,
-        ctx.jwtPayload,
-      );
+      const { model, provider } =
+        getServerDefaultFilesConfig().embeddingModel || DEFAULT_FILE_EMBEDDING_MODEL_ITEM;
+      const agentRuntime = await initAgentRuntimeWithUserPayload(provider, ctx.jwtPayload);
       const embeddings = await agentRuntime.embeddings({
         dimensions: 1024,
         input: input.query,
-        model: input.model,
+        model,
       });
       console.timeEnd('embedding');
@@ -130,27 +127,25 @@ export const chunkRouter = router({
     .input(SemanticSearchSchema)
     .mutation(async ({ ctx, input }) => {
       const item = await ctx.messageModel.findMessageQueriesById(input.messageId);
+      const { model, provider } =
+        getServerDefaultFilesConfig().embeddingModel || DEFAULT_FILE_EMBEDDING_MODEL_ITEM;
       let embedding: number[];
       let ragQueryId: string;
       // if there is no message rag or it's embeddings, then we need to create one
       if (!item || !item.embeddings) {
         // TODO: need to support customize
-        const agentRuntime = await initAgentRuntimeWithUserPayload(
-          ModelProvider.OpenAI,
-          ctx.jwtPayload,
-        );
+        const agentRuntime = await initAgentRuntimeWithUserPayload(provider, ctx.jwtPayload);
         const embeddings = await agentRuntime.embeddings({
           dimensions: 1024,
           input: input.rewriteQuery,
-          model: input.model || DEFAULT_EMBEDDING_MODEL,
+          model,
         });
         embedding = embeddings![0];
         const embeddingsId = await ctx.embeddingModel.create({
           embeddings: embedding,
-          model: input.model,
+          model,
         });
         const result = await ctx.messageModel.createMessageQuery({
@@ -182,6 +177,7 @@ export const chunkRouter = router({
         fileIds: finalFileIds,
         query: input.rewriteQuery,
       });
+      // TODO: need to rerank the chunks
       console.timeEnd('semanticSearch');
       return { chunks, queryId: ragQueryId };

package/src/types/knowledgeBase/index.ts CHANGED Viewed

@@ -1,3 +1,5 @@
+import { FilesConfigItem } from '../user/settings/filesConfig';
 export enum KnowledgeBaseTabs {
   Files = 'files',
   Settings = 'Settings',
@@ -43,3 +45,9 @@ export interface KnowledgeItem {
   name: string;
   type: KnowledgeType;
 }
+export interface SystemEmbeddingConfig {
+  embeddingModel: FilesConfigItem;
+  queryModel: string;
+  rerankerModel: FilesConfigItem;
+}

package/src/types/user/settings/filesConfig.ts ADDED Viewed

@@ -0,0 +1,9 @@
+export interface FilesConfigItem {
+  model: string;
+  provider: string;
+}
+export interface FilesConfig {
+  embeddingModel: FilesConfigItem;
+  queryModel: string;
+  rerankerModel: FilesConfigItem;
+}

package/src/types/user/settings/keyVaults.ts CHANGED Viewed

@@ -44,6 +44,7 @@ export interface UserKeyVaults {
   huggingface?: OpenAICompatibleKeyVault;
   hunyuan?: OpenAICompatibleKeyVault;
   internlm?: OpenAICompatibleKeyVault;
+  lmstudio?: OpenAICompatibleKeyVault;
   lobehub?: any;
   minimax?: OpenAICompatibleKeyVault;
   mistral?: OpenAICompatibleKeyVault;