npm - @librechat/agents - Versions diffs - 2.4.321 → 3.0.0-rc1 - Mend

@librechat/agents 2.4.321 → 3.0.0-rc1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (266) hide show

package/dist/cjs/agents/AgentContext.cjs +218 -0
package/dist/cjs/agents/AgentContext.cjs.map +1 -0
package/dist/cjs/common/enum.cjs +14 -5
package/dist/cjs/common/enum.cjs.map +1 -1
package/dist/cjs/events.cjs +10 -6
package/dist/cjs/events.cjs.map +1 -1
package/dist/cjs/graphs/Graph.cjs +309 -212
package/dist/cjs/graphs/Graph.cjs.map +1 -1
package/dist/cjs/graphs/MultiAgentGraph.cjs +322 -0
package/dist/cjs/graphs/MultiAgentGraph.cjs.map +1 -0
package/dist/cjs/llm/anthropic/index.cjs +54 -9
package/dist/cjs/llm/anthropic/index.cjs.map +1 -1
package/dist/cjs/llm/anthropic/types.cjs.map +1 -1
package/dist/cjs/llm/anthropic/utils/message_inputs.cjs +52 -6
package/dist/cjs/llm/anthropic/utils/message_inputs.cjs.map +1 -1
package/dist/cjs/llm/anthropic/utils/message_outputs.cjs +22 -2
package/dist/cjs/llm/anthropic/utils/message_outputs.cjs.map +1 -1
package/dist/cjs/llm/anthropic/utils/tools.cjs +29 -0
package/dist/cjs/llm/anthropic/utils/tools.cjs.map +1 -0
package/dist/cjs/llm/google/index.cjs +144 -0
package/dist/cjs/llm/google/index.cjs.map +1 -0
package/dist/cjs/llm/google/utils/common.cjs +477 -0
package/dist/cjs/llm/google/utils/common.cjs.map +1 -0
package/dist/cjs/llm/ollama/index.cjs +67 -0
package/dist/cjs/llm/ollama/index.cjs.map +1 -0
package/dist/cjs/llm/ollama/utils.cjs +158 -0
package/dist/cjs/llm/ollama/utils.cjs.map +1 -0
package/dist/cjs/llm/openai/index.cjs +389 -3
package/dist/cjs/llm/openai/index.cjs.map +1 -1
package/dist/cjs/llm/openai/utils/index.cjs +672 -0
package/dist/cjs/llm/openai/utils/index.cjs.map +1 -0
package/dist/cjs/llm/providers.cjs +15 -15
package/dist/cjs/llm/providers.cjs.map +1 -1
package/dist/cjs/llm/text.cjs +14 -3
package/dist/cjs/llm/text.cjs.map +1 -1
package/dist/cjs/llm/vertexai/index.cjs +330 -0
package/dist/cjs/llm/vertexai/index.cjs.map +1 -0
package/dist/cjs/main.cjs +11 -0
package/dist/cjs/main.cjs.map +1 -1
package/dist/cjs/run.cjs +120 -81
package/dist/cjs/run.cjs.map +1 -1
package/dist/cjs/stream.cjs +85 -51
package/dist/cjs/stream.cjs.map +1 -1
package/dist/cjs/tools/ToolNode.cjs +10 -4
package/dist/cjs/tools/ToolNode.cjs.map +1 -1
package/dist/cjs/tools/handlers.cjs +119 -13
package/dist/cjs/tools/handlers.cjs.map +1 -1
package/dist/cjs/tools/search/anthropic.cjs +40 -0
package/dist/cjs/tools/search/anthropic.cjs.map +1 -0
package/dist/cjs/tools/search/firecrawl.cjs +61 -13
package/dist/cjs/tools/search/firecrawl.cjs.map +1 -1
package/dist/cjs/tools/search/format.cjs +9 -3
package/dist/cjs/tools/search/format.cjs.map +1 -1
package/dist/cjs/tools/search/rerankers.cjs +35 -50
package/dist/cjs/tools/search/rerankers.cjs.map +1 -1
package/dist/cjs/tools/search/schema.cjs +70 -0
package/dist/cjs/tools/search/schema.cjs.map +1 -0
package/dist/cjs/tools/search/search.cjs +145 -38
package/dist/cjs/tools/search/search.cjs.map +1 -1
package/dist/cjs/tools/search/tool.cjs +165 -48
package/dist/cjs/tools/search/tool.cjs.map +1 -1
package/dist/cjs/tools/search/utils.cjs +34 -5
package/dist/cjs/tools/search/utils.cjs.map +1 -1
package/dist/cjs/utils/events.cjs +31 -0
package/dist/cjs/utils/events.cjs.map +1 -0
package/dist/cjs/utils/title.cjs +57 -21
package/dist/cjs/utils/title.cjs.map +1 -1
package/dist/cjs/utils/tokens.cjs +54 -7
package/dist/cjs/utils/tokens.cjs.map +1 -1
package/dist/esm/agents/AgentContext.mjs +216 -0
package/dist/esm/agents/AgentContext.mjs.map +1 -0
package/dist/esm/common/enum.mjs +15 -6
package/dist/esm/common/enum.mjs.map +1 -1
package/dist/esm/events.mjs +10 -6
package/dist/esm/events.mjs.map +1 -1
package/dist/esm/graphs/Graph.mjs +311 -214
package/dist/esm/graphs/Graph.mjs.map +1 -1
package/dist/esm/graphs/MultiAgentGraph.mjs +320 -0
package/dist/esm/graphs/MultiAgentGraph.mjs.map +1 -0
package/dist/esm/llm/anthropic/index.mjs +54 -9
package/dist/esm/llm/anthropic/index.mjs.map +1 -1
package/dist/esm/llm/anthropic/types.mjs.map +1 -1
package/dist/esm/llm/anthropic/utils/message_inputs.mjs +52 -6
package/dist/esm/llm/anthropic/utils/message_inputs.mjs.map +1 -1
package/dist/esm/llm/anthropic/utils/message_outputs.mjs +22 -2
package/dist/esm/llm/anthropic/utils/message_outputs.mjs.map +1 -1
package/dist/esm/llm/anthropic/utils/tools.mjs +27 -0
package/dist/esm/llm/anthropic/utils/tools.mjs.map +1 -0
package/dist/esm/llm/google/index.mjs +142 -0
package/dist/esm/llm/google/index.mjs.map +1 -0
package/dist/esm/llm/google/utils/common.mjs +471 -0
package/dist/esm/llm/google/utils/common.mjs.map +1 -0
package/dist/esm/llm/ollama/index.mjs +65 -0
package/dist/esm/llm/ollama/index.mjs.map +1 -0
package/dist/esm/llm/ollama/utils.mjs +155 -0
package/dist/esm/llm/ollama/utils.mjs.map +1 -0
package/dist/esm/llm/openai/index.mjs +388 -4
package/dist/esm/llm/openai/index.mjs.map +1 -1
package/dist/esm/llm/openai/utils/index.mjs +666 -0
package/dist/esm/llm/openai/utils/index.mjs.map +1 -0
package/dist/esm/llm/providers.mjs +5 -5
package/dist/esm/llm/providers.mjs.map +1 -1
package/dist/esm/llm/text.mjs +14 -3
package/dist/esm/llm/text.mjs.map +1 -1
package/dist/esm/llm/vertexai/index.mjs +328 -0
package/dist/esm/llm/vertexai/index.mjs.map +1 -0
package/dist/esm/main.mjs +6 -5
package/dist/esm/main.mjs.map +1 -1
package/dist/esm/run.mjs +121 -83
package/dist/esm/run.mjs.map +1 -1
package/dist/esm/stream.mjs +87 -54
package/dist/esm/stream.mjs.map +1 -1
package/dist/esm/tools/ToolNode.mjs +10 -4
package/dist/esm/tools/ToolNode.mjs.map +1 -1
package/dist/esm/tools/handlers.mjs +119 -15
package/dist/esm/tools/handlers.mjs.map +1 -1
package/dist/esm/tools/search/anthropic.mjs +37 -0
package/dist/esm/tools/search/anthropic.mjs.map +1 -0
package/dist/esm/tools/search/firecrawl.mjs +61 -13
package/dist/esm/tools/search/firecrawl.mjs.map +1 -1
package/dist/esm/tools/search/format.mjs +10 -4
package/dist/esm/tools/search/format.mjs.map +1 -1
package/dist/esm/tools/search/rerankers.mjs +35 -50
package/dist/esm/tools/search/rerankers.mjs.map +1 -1
package/dist/esm/tools/search/schema.mjs +61 -0
package/dist/esm/tools/search/schema.mjs.map +1 -0
package/dist/esm/tools/search/search.mjs +146 -39
package/dist/esm/tools/search/search.mjs.map +1 -1
package/dist/esm/tools/search/tool.mjs +164 -47
package/dist/esm/tools/search/tool.mjs.map +1 -1
package/dist/esm/tools/search/utils.mjs +33 -6
package/dist/esm/tools/search/utils.mjs.map +1 -1
package/dist/esm/utils/events.mjs +29 -0
package/dist/esm/utils/events.mjs.map +1 -0
package/dist/esm/utils/title.mjs +57 -22
package/dist/esm/utils/title.mjs.map +1 -1
package/dist/esm/utils/tokens.mjs +54 -8
package/dist/esm/utils/tokens.mjs.map +1 -1
package/dist/types/agents/AgentContext.d.ts +91 -0
package/dist/types/common/enum.d.ts +15 -6
package/dist/types/events.d.ts +5 -4
package/dist/types/graphs/Graph.d.ts +64 -67
package/dist/types/graphs/MultiAgentGraph.d.ts +37 -0
package/dist/types/graphs/index.d.ts +1 -0
package/dist/types/llm/anthropic/index.d.ts +11 -0
package/dist/types/llm/anthropic/types.d.ts +9 -3
package/dist/types/llm/anthropic/utils/message_inputs.d.ts +1 -1
package/dist/types/llm/anthropic/utils/output_parsers.d.ts +4 -4
package/dist/types/llm/anthropic/utils/tools.d.ts +3 -0
package/dist/types/llm/google/index.d.ts +13 -0
package/dist/types/llm/google/types.d.ts +32 -0
package/dist/types/llm/google/utils/common.d.ts +19 -0
package/dist/types/llm/google/utils/tools.d.ts +10 -0
package/dist/types/llm/google/utils/zod_to_genai_parameters.d.ts +14 -0
package/dist/types/llm/ollama/index.d.ts +7 -0
package/dist/types/llm/ollama/utils.d.ts +7 -0
package/dist/types/llm/openai/index.d.ts +72 -3
package/dist/types/llm/openai/types.d.ts +10 -0
package/dist/types/llm/openai/utils/index.d.ts +20 -0
package/dist/types/llm/text.d.ts +1 -1
package/dist/types/llm/vertexai/index.d.ts +293 -0
package/dist/types/messages/reducer.d.ts +9 -0
package/dist/types/run.d.ts +19 -12
package/dist/types/scripts/ant_web_search.d.ts +1 -0
package/dist/types/scripts/args.d.ts +2 -1
package/dist/types/scripts/handoff-test.d.ts +1 -0
package/dist/types/scripts/multi-agent-conditional.d.ts +1 -0
package/dist/types/scripts/multi-agent-parallel.d.ts +1 -0
package/dist/types/scripts/multi-agent-sequence.d.ts +1 -0
package/dist/types/scripts/multi-agent-test.d.ts +1 -0
package/dist/types/stream.d.ts +10 -3
package/dist/types/tools/CodeExecutor.d.ts +2 -2
package/dist/types/tools/ToolNode.d.ts +1 -1
package/dist/types/tools/handlers.d.ts +17 -4
package/dist/types/tools/search/anthropic.d.ts +16 -0
package/dist/types/tools/search/firecrawl.d.ts +16 -0
package/dist/types/tools/search/rerankers.d.ts +8 -5
package/dist/types/tools/search/schema.d.ts +16 -0
package/dist/types/tools/search/tool.d.ts +13 -0
package/dist/types/tools/search/types.d.ts +64 -9
package/dist/types/tools/search/utils.d.ts +9 -2
package/dist/types/types/graph.d.ts +95 -15
package/dist/types/types/llm.d.ts +24 -10
package/dist/types/types/run.d.ts +46 -8
package/dist/types/types/stream.d.ts +16 -2
package/dist/types/types/tools.d.ts +1 -1
package/dist/types/utils/events.d.ts +6 -0
package/dist/types/utils/title.d.ts +2 -1
package/dist/types/utils/tokens.d.ts +24 -0
package/package.json +35 -18
package/src/agents/AgentContext.ts +315 -0
package/src/common/enum.ts +14 -5
package/src/events.ts +24 -13
package/src/graphs/Graph.ts +495 -312
package/src/graphs/MultiAgentGraph.ts +381 -0
package/src/graphs/index.ts +2 -1
package/src/llm/anthropic/Jacob_Lee_Resume_2023.pdf +0 -0
package/src/llm/anthropic/index.ts +78 -13
package/src/llm/anthropic/llm.spec.ts +491 -115
package/src/llm/anthropic/types.ts +39 -3
package/src/llm/anthropic/utils/message_inputs.ts +67 -11
package/src/llm/anthropic/utils/message_outputs.ts +21 -2
package/src/llm/anthropic/utils/output_parsers.ts +25 -6
package/src/llm/anthropic/utils/tools.ts +29 -0
package/src/llm/google/index.ts +218 -0
package/src/llm/google/types.ts +43 -0
package/src/llm/google/utils/common.ts +646 -0
package/src/llm/google/utils/tools.ts +160 -0
package/src/llm/google/utils/zod_to_genai_parameters.ts +86 -0
package/src/llm/ollama/index.ts +89 -0
package/src/llm/ollama/utils.ts +193 -0
package/src/llm/openai/index.ts +600 -14
package/src/llm/openai/types.ts +24 -0
package/src/llm/openai/utils/index.ts +912 -0
package/src/llm/openai/utils/isReasoningModel.test.ts +90 -0
package/src/llm/providers.ts +10 -9
package/src/llm/text.ts +26 -7
package/src/llm/vertexai/index.ts +360 -0
package/src/messages/reducer.ts +80 -0
package/src/run.ts +181 -112
package/src/scripts/ant_web_search.ts +158 -0
package/src/scripts/args.ts +12 -8
package/src/scripts/cli4.ts +29 -21
package/src/scripts/cli5.ts +29 -21
package/src/scripts/code_exec.ts +54 -23
package/src/scripts/code_exec_files.ts +48 -17
package/src/scripts/code_exec_simple.ts +46 -27
package/src/scripts/handoff-test.ts +135 -0
package/src/scripts/image.ts +52 -20
package/src/scripts/multi-agent-conditional.ts +220 -0
package/src/scripts/multi-agent-example-output.md +110 -0
package/src/scripts/multi-agent-parallel.ts +337 -0
package/src/scripts/multi-agent-sequence.ts +212 -0
package/src/scripts/multi-agent-test.ts +186 -0
package/src/scripts/search.ts +4 -12
package/src/scripts/simple.ts +25 -10
package/src/scripts/tools.ts +48 -18
package/src/specs/anthropic.simple.test.ts +150 -34
package/src/specs/azure.simple.test.ts +325 -0
package/src/specs/openai.simple.test.ts +140 -33
package/src/specs/openrouter.simple.test.ts +107 -0
package/src/specs/prune.test.ts +4 -9
package/src/specs/reasoning.test.ts +80 -44
package/src/specs/token-memoization.test.ts +39 -0
package/src/stream.test.ts +94 -0
package/src/stream.ts +139 -60
package/src/tools/ToolNode.ts +21 -7
package/src/tools/handlers.ts +192 -18
package/src/tools/search/anthropic.ts +51 -0
package/src/tools/search/firecrawl.ts +78 -24
package/src/tools/search/format.ts +10 -5
package/src/tools/search/rerankers.ts +50 -62
package/src/tools/search/schema.ts +63 -0
package/src/tools/search/search.ts +167 -34
package/src/tools/search/tool.ts +222 -46
package/src/tools/search/types.ts +65 -10
package/src/tools/search/utils.ts +37 -5
package/src/types/graph.ts +272 -103
package/src/types/llm.ts +25 -12
package/src/types/run.ts +51 -13
package/src/types/stream.ts +22 -1
package/src/types/tools.ts +16 -10
package/src/utils/events.ts +32 -0
package/src/utils/llmConfig.ts +20 -8
package/src/utils/title.ts +104 -30
package/src/utils/tokens.ts +69 -10

package/src/types/tools.ts CHANGED Viewed

@@ -1,6 +1,6 @@
 // src/types/tools.ts
-import type { RunnableToolLike } from '@langchain/core/runnables';
 import type { StructuredToolInterface } from '@langchain/core/tools';
+import type { RunnableToolLike } from '@langchain/core/runnables';
 import type { ToolCall } from '@langchain/core/messages/tool';
 import type { ToolErrorData } from './stream';
 import { EnvVar } from '@/common';
@@ -13,9 +13,10 @@ export type CustomToolCall = {
   id?: string;
   type?: 'tool_call';
   output?: string;
-}
+};
 export type GenericTool = StructuredToolInterface | RunnableToolLike;
 export type ToolMap = Map<string, GenericTool>;
 export type ToolRefs = {
   tools: GenericTool[];
@@ -30,7 +31,10 @@ export type ToolNodeOptions = {
   handleToolErrors?: boolean;
   loadRuntimeTools?: ToolRefGenerator;
   toolCallStepIds?: Map<string, string>;
-  errorHandler?: (data: ToolErrorData, metadata?: Record<string, unknown>) => void
+  errorHandler?: (
+    data: ToolErrorData,
+    metadata?: Record<string, unknown>
+  ) => void;
 };
 export type ToolNodeConstructorParams = ToolRefs & ToolNodeOptions;
@@ -50,13 +54,15 @@ export type CodeEnvFile = {
   session_id: string;
 };
-export type CodeExecutionToolParams = undefined | {
-  session_id?: string;
-  user_id?: string;
-  apiKey?: string;
-  files?: CodeEnvFile[];
-  [EnvVar.CODE_API_KEY]?: string;
-}
+export type CodeExecutionToolParams =
+  | undefined
+  | {
+      session_id?: string;
+      user_id?: string;
+      apiKey?: string;
+      files?: CodeEnvFile[];
+      [EnvVar.CODE_API_KEY]?: string;
+    };
 export type FileRef = {
   id: string;

package/src/utils/events.ts ADDED Viewed

@@ -0,0 +1,32 @@
+/* eslint-disable no-console */
+// src/utils/events.ts
+import { dispatchCustomEvent } from '@langchain/core/callbacks/dispatch';
+import type { RunnableConfig } from '@langchain/core/runnables';
+/**
+ * Safely dispatches a custom event and properly awaits it to avoid
+ * race conditions where events are dispatched after run cleanup.
+ */
+export async function safeDispatchCustomEvent(
+  event: string,
+  payload: unknown,
+  config?: RunnableConfig
+): Promise<void> {
+  try {
+    await dispatchCustomEvent(event, payload, config);
+  } catch (e) {
+    // Check if this is the known EventStreamCallbackHandler error
+    if (
+      e instanceof Error &&
+      e.message.includes('handleCustomEvent: Run ID') &&
+      e.message.includes('not found in run map')
+    ) {
+      // Suppress this specific error - it's expected during parallel execution
+      // when EventStreamCallbackHandler loses track of run IDs
+      // console.debug('Suppressed error dispatching custom event:', e);
+      return;
+    }
+    // Log other errors
+    console.error('Error dispatching custom event:', e);
+  }
+}

package/src/utils/llmConfig.ts CHANGED Viewed

@@ -6,8 +6,8 @@ import type * as t from '@/types';
 export const llmConfigs: Record<string, t.LLMConfig | undefined> = {
   [Providers.OPENAI]: {
     provider: Providers.OPENAI,
-    model: 'gpt-4o-mini',
-    temperature: 0.7,
+    model: 'gpt-4.1',
+    // temperature: 0.7,
     streaming: true,
     streamUsage: true,
     // disableStreaming: true,
@@ -32,7 +32,7 @@ export const llmConfigs: Record<string, t.LLMConfig | undefined> = {
     provider: Providers.OPENROUTER,
     streaming: true,
     streamUsage: true,
-    model: 'deepseek/deepseek-r1',
+    model: 'openai/gpt-4.1',
     openAIApiKey: process.env.OPENROUTER_API_KEY,
     configuration: {
       baseURL: process.env.OPENROUTER_BASE_URL,
@@ -56,10 +56,19 @@ export const llmConfigs: Record<string, t.LLMConfig | undefined> = {
   },
   [Providers.OLLAMA]: {
     provider: Providers.OLLAMA,
-    model: 'llama3.2',
+    model: 'gpt-oss:20b',
     streaming: true,
     streamUsage: true,
-    baseUrl: 'http://host.docker.internal:11434',
+    baseUrl: 'http://localhost:11434',
+  },
+  lmstudio: {
+    provider: Providers.OPENAI,
+    model: 'gpt-oss-20b',
+    streaming: true,
+    streamUsage: true,
+    configuration: {
+      baseURL: 'http://192.168.254.183:1233/v1',
+    },
   },
   [Providers.DEEPSEEK]: {
     provider: Providers.DEEPSEEK,
@@ -93,21 +102,24 @@ export const llmConfigs: Record<string, t.LLMConfig | undefined> = {
   },
   [Providers.VERTEXAI]: {
     provider: Providers.VERTEXAI,
-    modelName: 'gemini-2.0-flash-001',
+    model: 'gemini-2.5-flash',
     streaming: true,
     streamUsage: true,
     keyFile: process.env.VERTEXAI_KEY_FILE,
   } as t.VertexAIClientOptions & t.LLMConfig,
   [Providers.GOOGLE]: {
     provider: Providers.GOOGLE,
-    model: 'gemini-2.5-pro-exp-03-25',
+    model: 'gemini-2.5-flash',
     streaming: true,
     streamUsage: true,
   },
   [Providers.BEDROCK]: {
     provider: Providers.BEDROCK,
     // model: 'anthropic.claude-3-sonnet-20240229-v1:0',
-    model: 'us.anthropic.claude-3-5-sonnet-20241022-v2:0',
+    // model: 'us.anthropic.claude-3-5-sonnet-20241022-v2:0',
+    // model: 'us.amazon.nova-pro-v1:0',
+    model: 'us.anthropic.claude-sonnet-4-20250514-v1:0',
+    // additionalModelRequestFields: { thinking: { type: 'enabled', budget_tokens: 2000 } },
     region: process.env.BEDROCK_AWS_REGION,
     credentials: {
       accessKeyId: process.env.BEDROCK_AWS_ACCESS_KEY_ID!,

package/src/utils/title.ts CHANGED Viewed

@@ -1,51 +1,125 @@
 import { z } from 'zod';
-import { ChatPromptTemplate } from '@langchain/core/prompts';
 import { RunnableLambda } from '@langchain/core/runnables';
-import type { Runnable } from '@langchain/core/runnables';
-import * as t from '@/types';
-const defaultTitlePrompt = `Write a concise title for this conversation in the detected language. Title in 5 Words or Less. No Punctuation or Quotation.
-{convo}`;
+import { ChatPromptTemplate } from '@langchain/core/prompts';
+import type { Runnable, RunnableConfig } from '@langchain/core/runnables';
+import type * as t from '@/types';
+import { ContentTypes } from '@/common';
-const languageInstructions = 'Detect the language used in the following text. Note: words may be misspelled or cut off; use context clues to identify the language:\n{text}';
+const defaultTitlePrompt = `Analyze this conversation and provide:
+1. The detected language of the conversation
+2. A concise title in the detected language (5 words or less, no punctuation or quotation)
-const languagePrompt = ChatPromptTemplate.fromTemplate(languageInstructions);
+{convo}`;
-const languageSchema = z.object({
-  language: z.string().describe('The detected language of the conversation')
+const titleSchema = z.object({
+  title: z
+    .string()
+    .describe(
+      'A concise title for the conversation in 5 words or less, without punctuation or quotation'
+    ),
 });
-const titleSchema = z.object({
-  title: z.string().describe('A concise title for the conversation in 5 words or less, without punctuation or quotation'),
+const combinedSchema = z.object({
+  language: z.string().describe('The detected language of the conversation'),
+  title: z
+    .string()
+    .describe(
+      'A concise title for the conversation in 5 words or less, without punctuation or quotation'
+    ),
 });
-export const createTitleRunnable = async (model: t.ChatModelInstance, _titlePrompt?: string): Promise<Runnable> => {
+export const createTitleRunnable = async (
+  model: t.ChatModelInstance,
+  _titlePrompt?: string
+): Promise<Runnable> => {
   // Disabled since this works fine
   // eslint-disable-next-line @typescript-eslint/ban-ts-comment
   /* @ts-ignore */
-  const languageLLM = model.withStructuredOutput(languageSchema);
+  const titleLLM = model.withStructuredOutput(titleSchema);
   // eslint-disable-next-line @typescript-eslint/ban-ts-comment
   /* @ts-ignore */
-  const titleLLM = model.withStructuredOutput(titleSchema);
+  const combinedLLM = model.withStructuredOutput(combinedSchema);
-  const languageChain = languagePrompt.pipe(languageLLM);
-  const titlePrompt = ChatPromptTemplate.fromTemplate(_titlePrompt ?? defaultTitlePrompt);
+  const titlePrompt = ChatPromptTemplate.fromTemplate(
+    _titlePrompt ?? defaultTitlePrompt
+  );
   return new RunnableLambda({
-    func: async (input: { convo: string, inputText: string, skipLanguage: boolean }): Promise<{ language: string; title: string } | { title: string }> => {
+    func: async (
+      input: {
+        convo: string;
+        inputText: string;
+        skipLanguage: boolean;
+      },
+      config?: Partial<RunnableConfig>
+    ): Promise<{ language: string; title: string } | { title: string }> => {
       if (input.skipLanguage) {
-        return await titlePrompt.pipe(titleLLM).invoke({
-          convo: input.convo
-        }) as { title: string };
+        return (await titlePrompt.pipe(titleLLM).invoke(
+          {
+            convo: input.convo,
+          },
+          config
+        )) as { title: string };
+      }
+      const result = (await titlePrompt.pipe(combinedLLM).invoke(
+        {
+          convo: input.convo,
+        },
+        config
+      )) as { language: string; title: string } | undefined;
+      return {
+        language: result?.language ?? 'English',
+        title: result?.title ?? '',
+      };
+    },
+  });
+};
+const defaultCompletionPrompt = `Provide a concise, 5-word-or-less title for the conversation, using title case conventions. Only return the title itself.
+Conversation:
+{convo}`;
+export const createCompletionTitleRunnable = async (
+  model: t.ChatModelInstance,
+  titlePrompt?: string
+): Promise<Runnable> => {
+  const completionPrompt = ChatPromptTemplate.fromTemplate(
+    titlePrompt ?? defaultCompletionPrompt
+  );
+  return new RunnableLambda({
+    func: async (
+      input: {
+        convo: string;
+        inputText: string;
+        skipLanguage: boolean;
+      },
+      config?: Partial<RunnableConfig>
+    ): Promise<{ title: string }> => {
+      const promptOutput = await completionPrompt.invoke({
+        convo: input.convo,
+      });
+      const response = await model.invoke(promptOutput, config);
+      let content = '';
+      if (typeof response.content === 'string') {
+        content = response.content;
+      } else if (Array.isArray(response.content)) {
+        content = response.content
+          .filter(
+            (part): part is { type: ContentTypes.TEXT; text: string } =>
+              part.type === ContentTypes.TEXT
+          )
+          .map((part) => part.text)
+          .join('');
       }
-      const languageResult = await languageChain.invoke({ text: input.inputText }) as { language: string } | undefined;
-      const language = languageResult?.language ?? 'English';
-      const titleResult = await titlePrompt.pipe(titleLLM).invoke({
-        language,
-        convo: input.convo
-      }) as { title: string } | undefined;
-      return { language, title: titleResult?.title ?? '' };
+      const title = content.trim();
+      return {
+        title,
+      };
     },
   });
-};
+};

package/src/utils/tokens.ts CHANGED Viewed

@@ -2,7 +2,10 @@ import { Tiktoken } from 'js-tiktoken/lite';
 import type { BaseMessage } from '@langchain/core/messages';
 import { ContentTypes } from '@/common/enum';
-export function getTokenCountForMessage(message: BaseMessage, getTokenCount: (text: string) => number): number {
+export function getTokenCountForMessage(
+  message: BaseMessage,
+  getTokenCount: (text: string) => number
+): number {
   const tokensPerMessage = 3;
   const processValue = (value: unknown): void => {
@@ -57,14 +60,70 @@ export function getTokenCountForMessage(message: BaseMessage, getTokenCount: (te
   return numTokens;
 }
-export const createTokenCounter = async () => {
-  const res = await fetch('https://tiktoken.pages.dev/js/o200k_base.json');
-  const o200k_base = await res.json();
+let encoderPromise: Promise<Tiktoken> | undefined;
+let tokenCounterPromise: Promise<(message: BaseMessage) => number> | undefined;
-  const countTokens = (text: string): number => {
-    const enc = new Tiktoken(o200k_base);
-    return enc.encode(text).length;
-  };
+async function getSharedEncoder(): Promise<Tiktoken> {
+  if (encoderPromise) {
+    return encoderPromise;
+  }
+  encoderPromise = (async (): Promise<Tiktoken> => {
+    const res = await fetch('https://tiktoken.pages.dev/js/o200k_base.json');
+    const o200k_base = await res.json();
+    return new Tiktoken(o200k_base);
+  })();
+  return encoderPromise;
+}
+/**
+ * Creates a singleton token counter function that reuses the same encoder instance.
+ * This avoids creating multiple function closures and prevents potential memory issues.
+ */
+export const createTokenCounter = async (): Promise<
+  (message: BaseMessage) => number
+> => {
+  if (tokenCounterPromise) {
+    return tokenCounterPromise;
+  }
+  tokenCounterPromise = (async (): Promise<
+    (message: BaseMessage) => number
+  > => {
+    const enc = await getSharedEncoder();
+    const countTokens = (text: string): number => enc.encode(text).length;
+    return (message: BaseMessage): number =>
+      getTokenCountForMessage(message, countTokens);
+  })();
+  return tokenCounterPromise;
+};
+/**
+ * Utility to manage the token encoder lifecycle explicitly.
+ * Useful for applications that need fine-grained control over resource management.
+ */
+export const TokenEncoderManager = {
+  /**
+   * Pre-initializes the encoder. This can be called during app startup
+   * to avoid lazy loading delays later.
+   */
+  async initialize(): Promise<void> {
+    await getSharedEncoder();
+  },
+  /**
+   * Clears the cached encoder and token counter.
+   * Useful for testing or when you need to force a fresh reload.
+   */
+  reset(): void {
+    encoderPromise = undefined;
+    tokenCounterPromise = undefined;
+  },
-  return (message: BaseMessage): number => getTokenCountForMessage(message, countTokens);
-};
+  /**
+   * Checks if the encoder has been initialized.
+   */
+  isInitialized(): boolean {
+    return encoderPromise !== undefined;
+  },
+};