npm - @xalia/agent - Versions diffs - 0.6.8 → 0.6.10 - Mend

@xalia/agent 0.6.8 → 0.6.10

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (152) hide show

package/.env.development +6 -0
package/.env.test +7 -0
package/README.md +11 -0
package/context_system.md +498 -0
package/dist/agent/src/agent/agent.js +169 -87
package/dist/agent/src/agent/agentUtils.js +24 -18
package/dist/agent/src/agent/compressingContextManager.js +10 -14
package/dist/agent/src/agent/context.js +101 -127
package/dist/agent/src/agent/contextWithWorkspace.js +133 -0
package/dist/agent/src/agent/documentSummarizer.js +126 -0
package/dist/agent/src/agent/dummyLLM.js +25 -22
package/dist/agent/src/agent/imageGenLLM.js +22 -25
package/dist/agent/src/agent/imageGenerator.js +2 -10
package/dist/agent/src/agent/llm.js +1 -1
package/dist/agent/src/agent/openAILLM.js +15 -12
package/dist/agent/src/agent/openAILLMStreaming.js +73 -39
package/dist/agent/src/agent/repeatLLM.js +16 -7
package/dist/agent/src/agent/sudoMcpServerManager.js +21 -9
package/dist/agent/src/agent/tokenCounter.js +390 -0
package/dist/agent/src/agent/tokenCounter.test.js +206 -0
package/dist/agent/src/agent/toolSettings.js +17 -0
package/dist/agent/src/agent/tools/calculatorTool.js +45 -0
package/dist/agent/src/agent/tools/contentExtractors/pdfToText.js +55 -0
package/dist/agent/src/agent/tools/datetimeTool.js +38 -0
package/dist/agent/src/agent/tools/fileManager/fileManagerTool.js +156 -0
package/dist/agent/src/agent/tools/fileManager/index.js +31 -0
package/dist/agent/src/agent/tools/fileManager/memoryFileManager.js +102 -0
package/dist/agent/src/{chat/data → agent/tools/fileManager}/mimeTypes.js +3 -1
package/dist/agent/src/agent/tools/fileManager/prompt.js +33 -0
package/dist/agent/src/{chat/data/dbSessionFileModels.js → agent/tools/fileManager/types.js} +7 -0
package/dist/agent/src/agent/tools/index.js +64 -0
package/dist/agent/src/agent/tools/openUrlTool.js +57 -0
package/dist/agent/src/agent/tools/renderTool.js +89 -0
package/dist/agent/src/agent/tools/utils.js +61 -0
package/dist/agent/src/{chat/utils/search.js → agent/tools/webSearch.js} +1 -2
package/dist/agent/src/agent/tools/webSearchTool.js +40 -0
package/dist/agent/src/chat/client/chatClient.js +63 -2
package/dist/agent/src/chat/client/connection.js +6 -1
package/dist/agent/src/chat/client/index.js +4 -1
package/dist/agent/src/chat/client/sessionClient.js +28 -9
package/dist/agent/src/chat/constants.js +8 -0
package/dist/agent/src/chat/data/dbSessionFiles.js +11 -6
package/dist/agent/src/chat/data/dbSessionMessages.js +11 -0
package/dist/agent/src/chat/protocol/messages.js +9 -0
package/dist/agent/src/chat/server/chatContextManager.js +186 -156
package/dist/agent/src/chat/server/conversation.js +3 -0
package/dist/agent/src/chat/server/imageGeneratorTools.js +39 -16
package/dist/agent/src/chat/server/openAIRouterLLM.js +111 -0
package/dist/agent/src/chat/server/openSession.js +253 -91
package/dist/agent/src/chat/server/promptRefiner.js +86 -0
package/dist/agent/src/chat/server/server.js +10 -2
package/dist/agent/src/chat/server/sessionFileManager.js +22 -221
package/dist/agent/src/chat/server/sessionRegistry.js +152 -6
package/dist/agent/src/chat/server/sessionRegistry.test.js +1 -1
package/dist/agent/src/chat/server/titleGenerator.js +112 -0
package/dist/agent/src/chat/server/titleGenerator.test.js +113 -0
package/dist/agent/src/chat/server/tools.js +64 -253
package/dist/agent/src/chat/utils/approvalManager.js +6 -3
package/dist/agent/src/chat/utils/multiAsyncQueue.js +3 -0
package/dist/agent/src/test/agent.test.js +16 -17
package/dist/agent/src/test/chatContextManager.test.js +44 -30
package/dist/agent/src/test/clientServerConnection.test.js +1 -2
package/dist/agent/src/test/compressingContextManager.test.js +22 -36
package/dist/agent/src/test/context.test.js +55 -17
package/dist/agent/src/test/contextTestTools.js +87 -0
package/dist/agent/src/test/dbMcpServerConfigs.test.js +4 -4
package/dist/agent/src/test/dbSessionFiles.test.js +17 -17
package/dist/agent/src/test/testTools.js +6 -1
package/dist/agent/src/test/tools.test.js +27 -9
package/dist/agent/src/tool/agentChat.js +5 -2
package/dist/agent/src/tool/chatMain.js +56 -15
package/dist/agent/src/tool/commandPrompt.js +2 -2
package/dist/agent/src/tool/files.js +7 -8
package/package.json +4 -1
package/scripts/test_chat +195 -173
package/src/agent/agent.ts +257 -137
package/src/agent/agentUtils.ts +32 -20
package/src/agent/compressingContextManager.ts +13 -44
package/src/agent/context.ts +165 -159
package/src/agent/contextWithWorkspace.ts +162 -0
package/src/agent/documentSummarizer.ts +157 -0
package/src/agent/dummyLLM.ts +27 -23
package/src/agent/imageGenLLM.ts +28 -32
package/src/agent/imageGenerator.ts +3 -18
package/src/agent/llm.ts +2 -2
package/src/agent/openAILLM.ts +17 -13
package/src/agent/openAILLMStreaming.ts +99 -43
package/src/agent/repeatLLM.ts +19 -7
package/src/agent/sudoMcpServerManager.ts +41 -20
package/src/agent/test_data/harrypotter.txt +6065 -0
package/src/agent/tokenCounter.test.ts +243 -0
package/src/agent/tokenCounter.ts +483 -0
package/src/agent/toolSettings.ts +24 -0
package/src/agent/tools/calculatorTool.ts +50 -0
package/src/agent/tools/contentExtractors/pdfToText.ts +60 -0
package/src/agent/tools/datetimeTool.ts +41 -0
package/src/agent/tools/fileManager/fileManagerTool.ts +199 -0
package/src/agent/tools/fileManager/index.ts +50 -0
package/src/agent/tools/fileManager/memoryFileManager.ts +120 -0
package/src/{chat/data → agent/tools/fileManager}/mimeTypes.ts +3 -1
package/src/agent/tools/fileManager/prompt.ts +38 -0
package/src/{chat/data/dbSessionFileModels.ts → agent/tools/fileManager/types.ts} +76 -0
package/src/agent/tools/index.ts +49 -0
package/src/agent/tools/openUrlTool.ts +62 -0
package/src/agent/tools/renderTool.ts +92 -0
package/src/agent/tools/utils.ts +74 -0
package/src/{chat/utils/search.ts → agent/tools/webSearch.ts} +0 -1
package/src/agent/tools/webSearchTool.ts +44 -0
package/src/chat/client/chatClient.ts +92 -3
package/src/chat/client/connection.ts +11 -1
package/src/chat/client/index.ts +3 -0
package/src/chat/client/sessionClient.ts +40 -11
package/src/chat/client/sessionFiles.ts +1 -1
package/src/chat/constants.ts +6 -0
package/src/chat/data/dataModels.ts +12 -0
package/src/chat/data/dbSessionFiles.ts +12 -4
package/src/chat/data/dbSessionMessages.ts +34 -0
package/src/chat/protocol/messages.ts +94 -14
package/src/chat/server/chatContextManager.ts +255 -221
package/src/chat/server/connectionManager.ts +1 -1
package/src/chat/server/conversation.ts +3 -0
package/src/chat/server/imageGeneratorTools.ts +62 -30
package/src/chat/server/openAIRouterLLM.ts +168 -0
package/src/chat/server/openSession.ts +381 -138
package/src/chat/server/promptRefiner.ts +106 -0
package/src/chat/server/server.ts +9 -2
package/src/chat/server/sessionFileManager.ts +35 -306
package/src/chat/server/sessionRegistry.test.ts +0 -1
package/src/chat/server/sessionRegistry.ts +228 -4
package/src/chat/server/titleGenerator.test.ts +103 -0
package/src/chat/server/titleGenerator.ts +143 -0
package/src/chat/server/tools.ts +92 -281
package/src/chat/utils/approvalManager.ts +9 -3
package/src/chat/utils/multiAsyncQueue.ts +4 -0
package/src/test/agent.test.ts +25 -30
package/src/test/chatContextManager.test.ts +68 -38
package/src/test/clientServerConnection.test.ts +0 -2
package/src/test/compressingContextManager.test.ts +29 -34
package/src/test/context.test.ts +59 -15
package/src/test/contextTestTools.ts +95 -0
package/src/test/dbMcpServerConfigs.test.ts +4 -4
package/src/test/dbSessionFiles.test.ts +16 -16
package/src/test/testTools.ts +8 -3
package/src/test/tools.test.ts +30 -5
package/src/tool/agentChat.ts +12 -3
package/src/tool/chatMain.ts +59 -18
package/src/tool/commandPrompt.ts +2 -2
package/src/tool/files.ts +1 -3
package/dist/agent/src/agent/tools.js +0 -44
package/src/agent/tools.ts +0 -57
/package/dist/agent/src/{chat/utils → agent/tools/contentExtractors}/htmlToText.js +0 -0
/package/src/{chat/utils → agent/tools/contentExtractors}/htmlToText.ts +0 -0

package/src/agent/documentSummarizer.ts ADDED Viewed

@@ -0,0 +1,157 @@
+import { getOpenAIClient } from "../chat/server/openAIRouterLLM";
+import { getLogger } from "@xalia/xmcp/sdk";
+const logger = getLogger();
+const SUMMARY_MODEL = "google/gemini-2.5-flash";
+const SUMMARY_MAX_TOKENS = 500;
+const SUMMARY_TEMPERATURE = 0.3;
+const SUMMARY_TIMEOUT_MS = 30000;
+const MAX_CONTENT_LENGTH = 100000;
+/**
+ * System prompt for document summarization, optimized for recall.
+ */
+const SUMMARY_SYSTEM_PROMPT =
+  `You are a document summarizer optimizing for RECALL. Create a summary ` +
+  `(3-10 sentences) that captures:
+- Main topic and purpose of the document
+- Key entities (names, organizations, places, dates, numbers)
+- Important concepts, terms, and topics mentioned
+- Any conclusions, results, or key findings
+Include specific details that would help locate this document later.
+Use keywords and phrases from the original text.
+Do NOT include meta-commentary about the document format.
+Output ONLY the summary text.`;
+export interface IDocumentSummarizer {
+  summarize(content: string): Promise<string>;
+}
+export class LLMDocumentSummarizer implements IDocumentSummarizer {
+  private model: string;
+  constructor(model: string = SUMMARY_MODEL) {
+    this.model = model;
+  }
+  async summarize(content: string): Promise<string> {
+    if (!content || content.trim().length === 0) {
+      return "Empty document";
+    }
+    try {
+      const summary = await this.summarizeWithTimeout(content);
+      return this.sanitizeSummary(summary);
+    } catch (error) {
+      const errorMsg = error instanceof Error ? error.message : String(error);
+      logger.warn(
+        `[DocumentSummarizer] LLM summarization failed: ${errorMsg}, ` +
+          `using fallback`
+      );
+      return this.fallbackSummary(content);
+    }
+  }
+  private async summarizeWithTimeout(content: string): Promise<string> {
+    const timeoutPromise = new Promise<never>((_, reject) => {
+      setTimeout(() => {
+        reject(new Error("Summary generation timeout"));
+      }, SUMMARY_TIMEOUT_MS);
+    });
+    const summaryPromise = this.callLLM(content);
+    return Promise.race([summaryPromise, timeoutPromise]);
+  }
+  private async callLLM(content: string): Promise<string> {
+    const client = getOpenAIClient(this.model);
+    const truncatedContent =
+      content.length > MAX_CONTENT_LENGTH
+        ? content.slice(0, MAX_CONTENT_LENGTH) + "\n\n[Content truncated...]"
+        : content;
+    const response = await client.chat.completions.create({
+      model: this.model,
+      messages: [
+        {
+          role: "system",
+          content: SUMMARY_SYSTEM_PROMPT,
+        },
+        {
+          role: "user",
+          content: `Please summarize this document:\n\n${truncatedContent}`,
+        },
+      ],
+      max_tokens: SUMMARY_MAX_TOKENS,
+      temperature: SUMMARY_TEMPERATURE,
+    });
+    const summary = response.choices[0]?.message?.content?.trim();
+    if (!summary) {
+      throw new Error("Empty response from LLM");
+    }
+    return summary;
+  }
+  private sanitizeSummary(summary: string): string {
+    return summary.replace(/\s+/g, " ").trim();
+  }
+  private fallbackSummary(content: string): string {
+    const cleaned = content.trim();
+    if (cleaned.length === 0) {
+      return "Empty document";
+    }
+    const firstParagraph = cleaned.split(/\n\n/)[0];
+    const maxLength = 500;
+    if (firstParagraph.length <= maxLength) {
+      return firstParagraph;
+    }
+    return cleaned.slice(0, maxLength).trim() + "...";
+  }
+}
+class FallbackDocumentSummarizer implements IDocumentSummarizer {
+  // eslint-disable-next-line @typescript-eslint/require-await
+  async summarize(content: string): Promise<string> {
+    const cleaned = content.trim();
+    if (cleaned.length === 0) {
+      return "Empty document";
+    }
+    const firstParagraph = cleaned.split(/\n\n/)[0];
+    const maxLength = 500;
+    if (firstParagraph.length <= maxLength) {
+      return firstParagraph;
+    }
+    return cleaned.slice(0, maxLength).trim() + "...";
+  }
+}
+export function createDocumentSummarizer(model?: string): IDocumentSummarizer {
+  if (process.env.DISABLE_LLM_SUMMARIES === "true") {
+    return new FallbackDocumentSummarizer();
+  }
+  return new LLMDocumentSummarizer(model);
+}
+/**
+ * Convenience function for one-off summarization.
+ */
+export async function summarizeDocument(content: string): Promise<string> {
+  const summarizer = createDocumentSummarizer();
+  return summarizer.summarize(content);
+}

package/src/agent/dummyLLM.ts CHANGED Viewed

@@ -81,39 +81,43 @@ export class DummyLLM implements ILLM {
     _tools?: ToolDescriptor[],
     onMessage?: (msg: string, msgEnd: boolean) => Promise<void>,
     onReasoning?: (reasoning: string) => Promise<void>
-  ): Promise<Completion> {
+  ): Promise<{ stop: (msg: string) => void; completion: Promise<Completion> }> {
     await new Promise((r) => setTimeout(r, 0));
-    assert(this.idx < this.responses.length);
     this.lastRequest = messages;
-    for (;;) {
-      const response = this.responses[this.idx++];
+    const completion: Promise<Completion> = (async () => {
+      for (;;) {
+        const idx = this.idx++;
+        const response = this.responses[idx % this.responses.length];
-      if (response.finish_reason === "error") {
-        throw new Error(response.message);
-      }
+        if (response.finish_reason === "error") {
+          throw new Error(response.message);
+        }
-      if (response.finish_reason === "reasoning") {
-        if (onReasoning) {
-          await onReasoning(response.message);
+        if (response.finish_reason === "reasoning") {
+          if (onReasoning) {
+            await onReasoning(response.message);
+          }
+          continue;
         }
-        continue;
-      }
-      if (onMessage) {
-        const message = response.message;
-        void onMessage(message.content || "", true);
+        if (onMessage) {
+          const message = response.message;
+          void onMessage(message.content || "", true);
+        }
+        return {
+          id: String(idx),
+          choices: [response],
+          created: Date.now(),
+          model: "dummyLlmModel",
+          object: "chat.completion",
+        };
       }
+    })();
-      return {
-        id: String(this.idx),
-        choices: [response],
-        created: Date.now(),
-        model: "dummyLlmModel",
-        object: "chat.completion",
-      };
-    }
+    return { stop: () => {}, completion };
   }
   public setModel(_model: string): void {

package/src/agent/imageGenLLM.ts CHANGED Viewed

@@ -1,6 +1,5 @@
 import { OpenAI } from "openai";
 import { strict as assert } from "assert";
-import { writeFileSync } from "fs";
 import { getLogger } from "@xalia/xmcp/sdk";
@@ -54,11 +53,11 @@ export class ImageGenLLM implements ILLM {
     return this.openai.baseURL;
   }
-  public async getConversationResponse(
+  public getConversationResponse(
     messages: MessageParam[],
     tools?: ToolDescriptor[],
     onMessage?: (msg: string, end: boolean) => Promise<void>
-  ): Promise<Completion> {
+  ): Promise<{ stop: (msg: string) => void; completion: Promise<Completion> }> {
     assert(!tools || tools.length === 0, "tools not supported in ImageGenLLM");
     // Designed for image generation using openrouter, which tweaks the Create
@@ -71,35 +70,32 @@ export class ImageGenLLM implements ILLM {
     logger.info(`[ImageGenLLM] params; ${JSON.stringify(params)}`);
-    const completion = (await this.openai.chat.completions.create(
-      params as OpenAI.Chat.Completions.ChatCompletionCreateParamsNonStreaming
-    )) as Completion;
-    // const completion = {} as unknown as ChatCompletion;
-    const filePath: string = "./completion.json";
-    logger.info(`[ImageGenLLM] writing ${filePath}`);
-    writeFileSync(filePath, JSON.stringify(completion), "utf-8");
-    logger.info(`[ImageGenLLM] written`);
-    // logger.debug(
-    //   `[ImageGenLLM.getConversationResponse] completion:
-    //   ${JSON.stringify(completion)}`
-    // );
-    if (onMessage) {
-      const message = completion.choices[0].message;
-      if (message.content) {
-        await onMessage(message.content, true);
-      }
-      if (message.images) {
-        message.images.forEach((image, index) => {
-          const imageUrl = image.image_url.url; // Base64 data URL
-          const truncated = imageUrl.substring(0, 50);
-          logger.info(`[ImageGenLLM] ${String(index + 1)}: ${truncated}...`);
-        });
+    const completion = (async () => {
+      const completion = (await this.openai.chat.completions.create(
+        params as OpenAI.Chat.Completions.ChatCompletionCreateParamsNonStreaming
+      )) as Completion;
+      // logger.debug(
+      //   `[ImageGenLLM.getConversationResponse] completion:
+      //   ${JSON.stringify(completion)}`
+      // );
+      if (onMessage) {
+        const message = completion.choices[0].message;
+        if (message.content) {
+          await onMessage(message.content, true);
+        }
+        if (message.images) {
+          message.images.forEach((image, index) => {
+            const imageUrl = image.image_url.url; // Base64 data URL
+            const truncated = imageUrl.substring(0, 50);
+            logger.info(`[ImageGenLLM] ${String(index + 1)}: ${truncated}...`);
+          });
+        }
       }
-    }
-    return completion;
+      return completion;
+    })();
+    return Promise.resolve({ stop: () => {}, completion });
   }
 }

package/src/agent/imageGenerator.ts CHANGED Viewed

@@ -1,10 +1,7 @@
 import { Agent, createUserMessage } from "./agent";
-import { createLLM } from "./agentUtils";
 import { ContextManager } from "./context";
 import { NULL_AGENT_EVENT_HANDLER } from "./nullAgentEventHandler";
-import { NULL_PLATFORM } from "./nullPlatform";
-import { NODE_PLATFORM } from "../tool/nodePlatform";
-import { DEFAULT_IMAGE_GEN_MODEL } from "./imageGenLLM";
+import { ILLM } from "./llm";
 const IMAGE_GEN_SYSTEM_PROMPT = "You are an image generator";
@@ -17,19 +14,7 @@ export class ImageGenerator {
     this.contextManager = contextManager;
   }
-  public static async init(
-    llmUrl: string,
-    llmApiKey: string,
-    model?: string
-  ): Promise<ImageGenerator> {
-    const development = !!process.env.DEVELOPMENT;
-    const llm = await createLLM(
-      llmUrl,
-      llmApiKey,
-      model || DEFAULT_IMAGE_GEN_MODEL,
-      false /* stream */,
-      development ? NODE_PLATFORM : NULL_PLATFORM // allow file loading
-    );
+  public static init(llm: ILLM): ImageGenerator {
     const contextManager = new ContextManager(IMAGE_GEN_SYSTEM_PROMPT, []);
     const agent = Agent.initializeWithLLM(
       NULL_AGENT_EVENT_HANDLER,
@@ -53,7 +38,7 @@ export class ImageGenerator {
     }
     // Clear the context
-    while (this.contextManager.popMessage());
+    this.contextManager.clear();
     return agentResponse.images[0].image_url.url;
   }

package/src/agent/llm.ts CHANGED Viewed

@@ -2,7 +2,7 @@ import * as openai from "./openAI";
 import { OpenAI } from "openai";
 export const XALIA_APP_HEADER = {
-  "HTTP-Referer": "xalia.ai",
+  "HTTP-Referer": "https://xalia.ai",
   "X-Title": "Xalia",
 };
@@ -68,7 +68,7 @@ export interface ILLM {
     tools?: ToolDescriptor[],
     onMessage?: (msg: string, end: boolean) => Promise<void>,
     onReasoning?: (reasoning: string) => Promise<void>
-  ): Promise<Completion>;
+  ): Promise<{ stop: (msg: string) => void; completion: Promise<Completion> }>;
   setModel(model: string): void;
 }

package/src/agent/openAILLM.ts CHANGED Viewed

@@ -73,23 +73,27 @@ export class OpenAILLM implements ILLM {
     return this.openai.baseURL;
   }
-  public async getConversationResponse(
+  public getConversationResponse(
     messages: MessageParam[],
     tools?: ToolDescriptor[],
     onMessage?: (msg: string, end: boolean) => Promise<void>
-  ): Promise<Completion> {
-    const completion = await this.openai.chat.completions.create({
-      model: this.model,
-      messages,
-      tools,
-    });
-    if (onMessage) {
-      const message = completion.choices[0].message;
-      if (message.content) {
-        await onMessage(message.content, true);
+  ): Promise<{ stop: (msg: string) => void; completion: Promise<Completion> }> {
+    const completion: Promise<Completion> = (async () => {
+      const completion = await this.openai.chat.completions.create({
+        model: this.model,
+        messages,
+        tools,
+      });
+      if (onMessage) {
+        const message = completion.choices[0].message;
+        if (message.content) {
+          await onMessage(message.content, true);
+        }
       }
-    }
-    return completionFromOpenAI(completion);
+      return completionFromOpenAI(completion);
+    })();
+    return Promise.resolve({ stop: () => {}, completion });
   }
 }

package/src/agent/openAILLMStreaming.ts CHANGED Viewed

@@ -13,7 +13,6 @@ import {
   MessageParam,
   ToolDescriptor,
 } from "./llm";
 import {
   Reasoning,
   ChatCompletionChunkChoiceDeltaWithReasoning,
@@ -516,13 +515,31 @@ export class OpenAILLMStreaming implements ILLM {
     tools?: ToolDescriptor[],
     onMessage?: (msg: string, end: boolean) => Promise<void>,
     onReasoning?: (reasoning: string) => Promise<void>
-  ): Promise<Completion> {
+  ): Promise<{ stop: (msg: string) => void; completion: Promise<Completion> }> {
+    return OpenAILLMStreaming.makeRequest(
+      this.openai,
+      this.model,
+      messages,
+      tools,
+      onMessage,
+      onReasoning
+    );
+  }
+  public static async makeRequest(
+    openai: OpenAI,
+    model: string,
+    messages: MessageParam[],
+    tools?: ToolDescriptor[],
+    onMessage?: (msg: string, end: boolean) => Promise<void>,
+    onReasoning?: (reasoning: string) => Promise<void>
+  ): Promise<{ stop: (msg: string) => void; completion: Promise<Completion> }> {
     const reasoning: Reasoning = {
       effort: "medium",
       enabled: true,
     };
-    const chunks = await this.openai.chat.completions.create({
-      model: this.model,
+    const chunks = await openai.chat.completions.create({
+      model: model,
       messages,
       tools,
       stream: true,
@@ -537,56 +554,95 @@ export class OpenAILLMStreaming implements ILLM {
       throw new Error("not a stream");
     }
-    let aggregatedMessage: Completion | undefined;
+    let stopMsg: string | undefined = undefined;
-    for await (const chunk of chunks) {
-      logger.debug(`[stream] chunk: ${JSON.stringify(chunk)}`);
+    const stop = (msg: string) => {
+      stopMsg = msg;
+    };
-      // eslint-disable-next-line @typescript-eslint/no-unnecessary-condition
-      if (chunk.object !== "chat.completion.chunk") {
-        // logger.warn("[stream]: unexpected message");
-        continue;
-      }
+    const completion: Promise<Completion> = (async () => {
+      // Completion built up over successive calls to processChunk.
+      let aggregatedMessage: Completion | undefined;
-      if (!aggregatedMessage) {
-        logger.debug(`[stream] first}`);
-        const { initMessage } = initializeCompletion(chunk);
-        aggregatedMessage = initMessage;
-      } else {
-        updateCompletion(aggregatedMessage, chunk);
-      }
+      const processChunk = async (
+        chunk: OpenAI.Chat.Completions.ChatCompletionChunk
+      ) => {
+        // eslint-disable-next-line @typescript-eslint/no-unnecessary-condition
+        if (chunk.object !== "chat.completion.chunk") {
+          // logger.warn("[stream]: unexpected message");
+          return;
+        }
-      if (onMessage) {
-        // Inform the call of a message fragment if it contains any text.
-        // Note: chunks may have zero choices (e.g., usage-only chunks), so
-        // we safely access the first choice.
+        if (!aggregatedMessage) {
+          logger.debug(`[stream] first}`);
+          const { initMessage } = initializeCompletion(chunk);
+          aggregatedMessage = initMessage;
+        } else {
+          updateCompletion(aggregatedMessage, chunk);
+        }
-        const delta = chunk.choices[0]?.delta;
-        // eslint-disable-next-line @typescript-eslint/no-unnecessary-condition
-        if (delta?.content) {
-          await onMessage(delta.content, false);
+        if (onMessage) {
+          // Inform the call of a message fragment if it contains any text.
+          // Note: chunks may have zero choices (e.g., usage-only chunks), so
+          // we safely access the first choice.
+          const delta = chunk.choices[0]?.delta;
+          // eslint-disable-next-line
+          if (delta?.content) {
+            await onMessage(delta.content, false);
+          }
         }
-      }
-      if (onReasoning) {
-        const delta = chunk.choices[0]
-          ?.delta as ChatCompletionChunkChoiceDeltaWithReasoning;
-        const reasoning = choiceDeltaExtractReasoning(delta);
-        if (reasoning) {
-          await onReasoning(reasoning);
+        if (onReasoning) {
+          const delta = chunk.choices[0]
+            ?.delta as ChatCompletionChunkChoiceDeltaWithReasoning;
+          const reasoning = choiceDeltaExtractReasoning(delta);
+          if (reasoning) {
+            await onReasoning(reasoning);
+          }
         }
+      };
+      // Process each chunk, checking for a stop signal.
+      for await (const chunk of chunks) {
+        logger.debug(`[stream] chunk: ${JSON.stringify(chunk)}`);
+        await processChunk(chunk);
+        /* eslint-disable @typescript-eslint/no-unnecessary-condition */
+        if (stopMsg) {
+          const choice: OpenAI.Chat.Completions.ChatCompletionChunk.Choice = {
+            delta: { content: stopMsg },
+            finish_reason:
+              aggregatedMessage && aggregatedMessage.choices[0].finish_reason
+                ? null
+                : "stop",
+            index: 0,
+          };
+          await processChunk({
+            id: aggregatedMessage?.id || "user_stop_chunk",
+            created: aggregatedMessage?.created || Date.now(),
+            model: aggregatedMessage?.model || model,
+            object: "chat.completion.chunk",
+            choices: [choice],
+          });
+          break;
+        }
+        /* eslint-enable @typescript-eslint/no-unnecessary-condition */
       }
-    }
-    if (onMessage) {
-      await onMessage("", true);
-    }
+      if (onMessage) {
+        await onMessage("", true);
+      }
-    logger.debug(
-      `[stream] final message: ${JSON.stringify(aggregatedMessage)}`
-    );
+      logger.debug(
+        `[stream] final message: ${JSON.stringify(aggregatedMessage)}`
+      );
+      assert(aggregatedMessage);
+      return aggregatedMessage;
+    })();
-    assert(aggregatedMessage);
-    return aggregatedMessage;
+    return { stop, completion };
   }
 }

package/src/agent/repeatLLM.ts CHANGED Viewed

@@ -2,8 +2,17 @@ import { Choice, Completion, ILLM, MessageParam, ToolDescriptor } from "./llm";
 import { strict as assert } from "assert";
 export class RepeatLLM implements ILLM {
+  private prefix: string;
   private idx: number = 0;
+  constructor(prefix?: string) {
+    if (prefix && prefix.length > 0) {
+      this.prefix = prefix;
+    } else {
+      this.prefix = "Message number";
+    }
+  }
   public getModel(): string {
     return "repeat";
   }
@@ -16,10 +25,10 @@ export class RepeatLLM implements ILLM {
     _messages: MessageParam[],
     _tools?: ToolDescriptor[],
     onMessage?: (msg: string, msgEnd: boolean) => Promise<void>
-  ): Promise<Completion> {
+  ): Promise<{ stop: () => void; completion: Promise<Completion> }> {
     await new Promise((r) => setTimeout(r, 1000));
-    const content = `Message number ${String(this.idx++)}`;
+    const content = `${this.prefix} ${String(this.idx++)}`;
     const response: Choice = {
       finish_reason: "stop",
       index: 0,
@@ -36,11 +45,14 @@ export class RepeatLLM implements ILLM {
     }
     return {
-      id: String(this.idx),
-      choices: [response],
-      created: Date.now(),
-      model: "dummyLlmModel",
-      object: "chat.completion",
+      stop: () => {},
+      completion: Promise.resolve({
+        id: String(this.idx),
+        choices: [response],
+        created: Date.now(),
+        model: "dummyLlmModel",
+        object: "chat.completion",
+      }),
     };
   }