npm - @xalia/agent - Versions diffs - 0.6.7 → 0.6.9 - Mend

@xalia/agent 0.6.7 → 0.6.9

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (65) hide show

package/.env.development +1 -0
package/dist/agent/src/agent/agent.js +100 -77
package/dist/agent/src/agent/agentUtils.js +21 -16
package/dist/agent/src/agent/compressingContextManager.js +10 -14
package/dist/agent/src/agent/context.js +101 -127
package/dist/agent/src/agent/contextWithWorkspace.js +133 -0
package/dist/agent/src/agent/imageGenLLM.js +0 -6
package/dist/agent/src/agent/imageGenerator.js +2 -10
package/dist/agent/src/agent/openAILLMStreaming.js +5 -2
package/dist/agent/src/agent/sudoMcpServerManager.js +21 -9
package/dist/agent/src/chat/client/chatClient.js +35 -2
package/dist/agent/src/chat/client/connection.js +6 -1
package/dist/agent/src/chat/client/sessionClient.js +0 -7
package/dist/agent/src/chat/data/dbSessionMessages.js +11 -0
package/dist/agent/src/chat/protocol/messages.js +4 -0
package/dist/agent/src/chat/server/chatContextManager.js +149 -139
package/dist/agent/src/chat/server/imageGeneratorTools.js +19 -8
package/dist/agent/src/chat/server/openAIRouterLLM.js +114 -0
package/dist/agent/src/chat/server/openSession.js +57 -58
package/dist/agent/src/chat/server/server.js +6 -2
package/dist/agent/src/chat/server/sessionRegistry.js +65 -6
package/dist/agent/src/chat/server/sessionRegistry.test.js +1 -1
package/dist/agent/src/chat/server/tools.js +52 -17
package/dist/agent/src/test/chatContextManager.test.js +31 -29
package/dist/agent/src/test/clientServerConnection.test.js +1 -2
package/dist/agent/src/test/compressingContextManager.test.js +22 -36
package/dist/agent/src/test/context.test.js +55 -17
package/dist/agent/src/test/contextTestTools.js +87 -0
package/dist/agent/src/tool/chatMain.js +22 -8
package/package.json +1 -1
package/scripts/test_chat +3 -0
package/src/agent/agent.ts +170 -125
package/src/agent/agentUtils.ts +31 -20
package/src/agent/compressingContextManager.ts +13 -44
package/src/agent/context.ts +165 -159
package/src/agent/contextWithWorkspace.ts +162 -0
package/src/agent/imageGenLLM.ts +0 -8
package/src/agent/imageGenerator.ts +3 -18
package/src/agent/openAILLMStreaming.ts +20 -3
package/src/agent/sudoMcpServerManager.ts +41 -20
package/src/chat/client/chatClient.ts +47 -3
package/src/chat/client/connection.ts +11 -1
package/src/chat/client/sessionClient.ts +0 -8
package/src/chat/data/dataModels.ts +6 -0
package/src/chat/data/dbSessionMessages.ts +34 -0
package/src/chat/protocol/messages.ts +35 -8
package/src/chat/server/chatContextManager.ts +210 -197
package/src/chat/server/connectionManager.ts +1 -1
package/src/chat/server/imageGeneratorTools.ts +31 -18
package/src/chat/server/openAIRouterLLM.ts +171 -0
package/src/chat/server/openSession.ts +87 -100
package/src/chat/server/server.ts +6 -2
package/src/chat/server/sessionFileManager.ts +5 -5
package/src/chat/server/sessionRegistry.test.ts +0 -1
package/src/chat/server/sessionRegistry.ts +100 -4
package/src/chat/server/tools.ts +73 -35
package/src/test/agent.test.ts +8 -7
package/src/test/chatContextManager.test.ts +42 -37
package/src/test/clientServerConnection.test.ts +0 -2
package/src/test/compressingContextManager.test.ts +29 -34
package/src/test/context.test.ts +59 -15
package/src/test/contextTestTools.ts +95 -0
package/src/tool/chatMain.ts +26 -12
package/test_data/dummyllm_script_image_gen.json +13 -23
package/test_data/dummyllm_script_image_gen_fe.json +29 -0

package/.env.development ADDED Viewed

	@@ -0,0 +1 @@
1	+ LLM_API_KEY_MAP={"openrouter":"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","together":"5928479bc38fd315acc8359ba42587f8efc804e01b06eb02eb5ee97e044afaa1","openai":"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"}

package/dist/agent/src/agent/agent.js CHANGED Viewed

@@ -1,6 +1,6 @@
 "use strict";
 Object.defineProperty(exports, "__esModule", { value: true });
-exports.Agent = exports.DEFAULT_LLM_URL = exports.AgentProfile = void 0;
+exports.Agent = exports.AgentEx = exports.DEFAULT_LLM_URL = exports.AgentProfile = void 0;
 exports.createUserMessage = createUserMessage;
 exports.createUserMessageEnsure = createUserMessageEnsure;
 exports.completionToAssistantMessageParam = completionToAssistantMessageParam;
@@ -12,49 +12,25 @@ const mcpServerManager_1 = require("./mcpServerManager");
 exports.DEFAULT_LLM_URL = "http://localhost:5001/v1";
 const MAX_TOOL_CALL_RESPONSE_LENGTH = 4000;
 const logger = (0, sdk_2.getLogger)();
-class Agent {
-    constructor(eventHandler, mcpServerManager, llm, contextManager) {
+class AgentEx {
+    constructor(mcpServerManager, llm) {
         /// The full list of tools, ready to pass to the LLM
         this.tools = [];
         /// Handlers for "agent" (or "built-in") tools.  These do not require
         /// approval from the user.
         this.agentTools = new Map();
-        this.eventHandler = eventHandler;
         this.mcpServerManager = mcpServerManager;
         this.llm = llm;
-        this.contextManager = contextManager;
-    }
-    static initializeWithLLM(eventHandler, llm, contextManager, mcpServerManager) {
-        return new Agent(eventHandler, mcpServerManager ?? new mcpServerManager_1.McpServerManager(), llm, contextManager);
     }
     async shutdown() {
         return this.mcpServerManager.shutdown();
     }
-    getAgentProfile() {
-        return new sdk_2.AgentProfile(this.llm.getModel(), this.getSystemPrompt(), this.mcpServerManager.getMcpServerSettings());
-    }
-    getConversation() {
-        const llmMessages = this.contextManager.getLLMContext();
-        (0, assert_1.strict)(llmMessages[0].role === "system", "first message must have system role");
-        return [...llmMessages.slice(1)];
-    }
     getMcpServerManager() {
         return this.mcpServerManager;
     }
-    /**
-     * Like `userMessage`, but can be awaited, and accepts the user name.
-     */
-    async userMessageEx(msg, imageB64, name) {
-        const userMessage = createUserMessage(msg, imageB64, name);
-        if (!userMessage) {
-            return undefined;
-        }
-        return this.userMessageRaw(userMessage);
-    }
-    async userMessageRaw(userMessage) {
-        return this.userMessagesRaw([userMessage]);
-    }
-    async userMessagesRaw(userMessages) {
+    // TODO: rename
+    async userMessagesRaw(contextTx, eventHandler) {
+        // New user messages have already been added to the `contextTx`.
         // Image and audio handling
         //
         // `ChatCompletions` (responses from the LLM) can contain `audio` and
@@ -63,17 +39,12 @@ class Agent {
         //
         // As such, our current approach is to extract all assistant-generated
         // media and return it separately.
-        // Note: `getLLMContext` returns a copy to we can mutate this array
-        const context = this.contextManager.getLLMContext();
-        const newMessagesIdx = context.length;
-        // Add the new user messages
-        context.push(...userMessages);
         const images = [];
         // We convert the `ChatCompletionsMessage` into a
         // `ChatCompletionAssistantMessageParam` and extract image data.
-        let completion = await this.chatCompletion(context);
-        let message = this.processCompletion(completion, images);
-        context.push(message);
+        let completion = await this.chatCompletion(contextTx.getLLMContext(), eventHandler);
+        let message = this.processCompletion(completion, images, eventHandler);
+        contextTx.addMessage(message);
         // While there are tool calls to make, invoke them and loop
         while (message.tool_calls && message.tool_calls.length > 0) {
             // TODO: Execute all tool calls in parallel
@@ -83,8 +54,7 @@ class Agent {
                 // Execute the tool call, add the result to the context as an LLM
                 // mesage, and record the index of the message alongside the result in
                 // `toolCallResults`.
-                const result = await this.doToolCall(toolCall);
-                toolCallResults.push([context.length, result]);
+                const result = await this.doToolCall(toolCall, eventHandler);
                 const toolResult = {
                     role: "tool",
                     tool_call_id: toolCall.id,
@@ -94,7 +64,8 @@ class Agent {
                         ? { structuredContent: result.structuredContent }
                         : {}),
                 };
-                context.push(toolResult);
+                const toolResultHandle = contextTx.addMessage(toolResult);
+                toolCallResults.push([toolResultHandle, result]);
                 // If the tool call requested that its args be redacted, this can be
                 // done now - before the next LLM invocation.
                 if (result.overwriteArgs) {
@@ -105,16 +76,16 @@ class Agent {
             }
             // Now that any args have been overwritten, signal the event handler of
             // the prevoius completion.
-            this.eventHandler.onCompletion(message);
+            eventHandler.onCompletion(message);
             // Get a new completion using the untouched tool call results.  Note
             // that, since we are deferring the `onToolCallResult` calls (so they
             // can be redacted), we must take care that the errors in
             // `chatCompletion` do not disrupt this, so the caller has a consistent
             // view of the conversation state.
             try {
-                completion = await this.chatCompletion(context); // CAN THROW
-                message = this.processCompletion(completion, images);
-                context.push(message);
+                completion = await this.chatCompletion(contextTx.getLLMContext(), eventHandler);
+                message = this.processCompletion(completion, images, eventHandler);
+                contextTx.addMessage(message);
             }
             finally {
                 // Now that the tool call results have been passed to the LLM, perform
@@ -122,44 +93,23 @@ class Agent {
                 // messages to the event handler - note, we want to do this even if an
                 // error occured, so that the caller has an up-to-date picture of the
                 // context state when the error occured.
-                toolCallResults.forEach(([indexInContext, tcr]) => {
-                    const ctxMsg = context[indexInContext];
+                toolCallResults.forEach(([handle, tcr]) => {
+                    const ctxMsg = contextTx.getMessage(handle);
                     if (tcr.overwriteResponse) {
                         ctxMsg.content = tcr.overwriteResponse;
                     }
                     (0, assert_1.strict)(ctxMsg.role === "tool");
-                    this.eventHandler.onToolCallResult(ctxMsg);
+                    eventHandler.onToolCallResult(ctxMsg);
                 });
                 // Note, if an error DID occur, the ContextManager does not see any of
                 // the new context.
             }
         }
         // Signal the event handler of the final completion.
-        this.eventHandler.onCompletion(message);
-        // Add all new new messages to the context
-        this.contextManager.addMessages(context.slice(newMessagesIdx));
+        eventHandler.onCompletion(message);
         return { message, images: images.length === 0 ? undefined : images };
     }
-    userMessage(msg, imageB64) {
-        void this.userMessageEx(msg, imageB64);
-    }
-    getModel() {
-        return this.llm.getModel();
-    }
-    setModel(model) {
-        logger.debug(`Set model ${model}`);
-        this.llm.setModel(model);
-    }
-    getSystemPrompt() {
-        return this.contextManager.getAgentPrompt();
-    }
-    /**
-     * Set the system prompt
-     */
-    setSystemPrompt(systemMsg) {
-        this.contextManager.setAgentPrompt(systemMsg);
-    }
-    async chatCompletion(context) {
+    async chatCompletion(context, eventHandler) {
         // Compute the full list of available tools
         let tools;
         const mcpTools = this.mcpServerManager.getOpenAITools();
@@ -169,7 +119,7 @@ class Agent {
             tools = enabledTools;
         }
         logger.debug(`[chatCompletion] tools: ${JSON.stringify(tools)}`);
-        const completion = await this.llm.getConversationResponse(context, tools, this.eventHandler.onAgentMessage.bind(this.eventHandler), this.eventHandler.onReasoning.bind(this.eventHandler));
+        const completion = await this.llm.getConversationResponse(context, tools, eventHandler.onAgentMessage.bind(eventHandler), eventHandler.onReasoning.bind(eventHandler));
         logger.debug(`Received chat completion ${JSON.stringify(completion)}`);
         return completion;
     }
@@ -210,7 +160,7 @@ class Agent {
      * handler, informing the IAgentEventHandler of the result, and returns the
      * ChatCompletionToolMessageParam to be used in the conversation.
      */
-    async doToolCall(toolCall) {
+    async doToolCall(toolCall, eventHandler) {
         // If the tool is and "agent" (internal) tool, we can just execute it.
         // Otherwise, call the event handler to get permission and invoke the
         // external tool handler.
@@ -221,7 +171,7 @@ class Agent {
             const isAgentTool = !!agentTool;
             if (isAgentTool) {
                 // Internal (agent) tool
-                if (!(await this.eventHandler.onToolCall(toolCall, true))) {
+                if (!(await eventHandler.onToolCall(toolCall, true))) {
                     result = { response: "User denied tool request." };
                 }
                 else {
@@ -234,7 +184,7 @@ class Agent {
                 // tool call data, get approval, and then invoke.
                 const args = JSON.parse(toolCall.function.arguments || "{}");
                 const tc = this.mcpServerManager.verifyToolCall(toolName, args);
-                if (!(await this.eventHandler.onToolCall(toolCall, false))) {
+                if (!(await eventHandler.onToolCall(toolCall, false))) {
                     result = { response: "User denied tool request." };
                 }
                 else {
@@ -269,18 +219,91 @@ class Agent {
         }
         return result;
     }
-    processCompletion(completion, images) {
+    processCompletion(completion, images, eventHandler) {
         // Add any images into the list, and call the event handler
         const compMessage = completion.choices[0].message;
         if (compMessage.images) {
             for (const image of compMessage.images) {
-                this.eventHandler.onImage(image);
+                eventHandler.onImage(image);
                 images.push(image);
             }
         }
         return completionToAssistantMessageParam(compMessage);
     }
 }
+exports.AgentEx = AgentEx;
+/**
+ * Higher-level abstraction over AgentEx, which abstracts out the transactions
+ * to the context manager.
+ */
+class Agent {
+    constructor(eventHandler, mcpServerManager, llm, contextManager) {
+        this.eventHandler = eventHandler;
+        this.contextManager = contextManager;
+        this.agentEx = new AgentEx(mcpServerManager, llm);
+    }
+    static initializeWithLLM(eventHandler, llm, contextManager, mcpServerManager) {
+        return new Agent(eventHandler, mcpServerManager ?? new mcpServerManager_1.McpServerManager(), llm, contextManager);
+    }
+    async shutdown() {
+        return this.agentEx.shutdown();
+    }
+    getAgentProfile() {
+        return new sdk_2.AgentProfile(this.agentEx.llm.getModel(), this.getSystemPrompt(), this.agentEx.mcpServerManager.getMcpServerSettings());
+    }
+    getConversation() {
+        const llmMessages = this.contextManager.getLLMContext();
+        (0, assert_1.strict)(llmMessages[0].role === "system", "first message must have system role");
+        return [...llmMessages.slice(1)];
+    }
+    getMcpServerManager() {
+        return this.agentEx.mcpServerManager;
+    }
+    /**
+     * Like `userMessage`, but can be awaited, and accepts the user name.
+     */
+    async userMessageEx(msg, imageB64, name) {
+        const userMessage = createUserMessage(msg, imageB64, name);
+        if (!userMessage) {
+            return undefined;
+        }
+        return this.userMessageRaw(userMessage);
+    }
+    async userMessageRaw(userMessage) {
+        return this.userMessagesRaw([userMessage]);
+    }
+    async userMessagesRaw(userMessages) {
+        const tx = await this.contextManager.startTx(userMessages);
+        const result = await this.agentEx.userMessagesRaw(tx, this.eventHandler);
+        await this.contextManager.commit(tx);
+        return result;
+    }
+    userMessage(msg, imageB64) {
+        void this.userMessageEx(msg, imageB64);
+    }
+    getModel() {
+        return this.agentEx.llm.getModel();
+    }
+    setModel(model) {
+        logger.debug(`Set model ${model}`);
+        this.agentEx.llm.setModel(model);
+    }
+    getSystemPrompt() {
+        return this.contextManager.getAgentPrompt();
+    }
+    /**
+     * Set the system prompt
+     */
+    setSystemPrompt(systemMsg) {
+        this.contextManager.setAgentPrompt(systemMsg);
+    }
+    addAgentToolProvider(toolProvider) {
+        return this.agentEx.addAgentToolProvider(toolProvider);
+    }
+    addAgentTool(tool, handler) {
+        this.agentEx.addAgentTool(tool, handler);
+    }
+}
 exports.Agent = Agent;
 /**
  * Returns the ChatCompletionMessageParam constructed from (optional) text and

package/dist/agent/src/agent/agentUtils.js CHANGED Viewed

@@ -3,6 +3,7 @@ Object.defineProperty(exports, "__esModule", { value: true });
 exports.createAgentWithoutSkills = createAgentWithoutSkills;
 exports.createAgentWithSkills = createAgentWithSkills;
 exports.createAgentFromSkillManager = createAgentFromSkillManager;
+exports.createSpecializedLLM = createSpecializedLLM;
 exports.createLLM = createLLM;
 exports.createNonInteractiveAgent = createNonInteractiveAgent;
 exports.runOneShot = runOneShot;
@@ -15,7 +16,6 @@ const dummyLLM_1 = require("./dummyLLM");
 const assert_1 = require("assert");
 const repeatLLM_1 = require("./repeatLLM");
 const context_1 = require("./context");
-const imageGenLLM_1 = require("./imageGenLLM");
 const logger = (0, sdk_1.getLogger)();
 async function createAgentWithoutSkills(llmUrl, model, eventHandler, platform, contextManager, llmApiKey, sudomcpConfig, authorizedUrl, stream = false) {
     // Init SudoMcpServerManager
@@ -46,7 +46,11 @@ async function createAgentFromSkillManager(llmUrl, model, eventHandler, platform
     logger.debug("[createAgentFromSkillManager] done");
     return agent;
 }
-async function createLLM(llmUrl, llmApiKey, model, stream = false, platform) {
+/**
+ * Interpret the `model` string to create a specialized agent (dummy, repeat,
+ * etc) or return undefined if a specialized agent has not been requested.
+ */
+async function createSpecializedLLM(model, platform) {
     let llm;
     if (model && model.startsWith("dummy:")) {
         llm = await dummyLLM_1.DummyLLM.initFromModelUrl(model, platform);
@@ -54,22 +58,23 @@ async function createLLM(llmUrl, llmApiKey, model, stream = false, platform) {
     else if (model === "repeat") {
         llm = new repeatLLM_1.RepeatLLM();
     }
-    else if (model == imageGenLLM_1.DEFAULT_IMAGE_GEN_MODEL) {
-        logger.info("ImageGenLLM");
-        llm = new imageGenLLM_1.ImageGenLLM(llmApiKey, llmUrl, model);
+    return llm;
+}
+async function createLLM(llmUrl, llmApiKey, model, stream = false, platform) {
+    let llm = await createSpecializedLLM(model, platform);
+    if (llm) {
+        return llm;
+    }
+    // Regular Agent
+    if (!llmApiKey) {
+        throw new Error("Missing OpenAI API Key");
+    }
+    logger.debug(`Initializing Agent: ${llmUrl ?? "unknown"} - ${model}`);
+    if (stream) {
+        llm = new openAILLMStreaming_1.OpenAILLMStreaming(llmApiKey, llmUrl, model);
     }
     else {
-        // Regular Agent
-        if (!llmApiKey) {
-            throw new Error("Missing OpenAI API Key");
-        }
-        logger.debug(`Initializing Agent: ${llmUrl ?? "unknown"} - ${model}`);
-        if (stream) {
-            llm = new openAILLMStreaming_1.OpenAILLMStreaming(llmApiKey, llmUrl, model);
-        }
-        else {
-            llm = new openAILLM_1.OpenAILLM(llmApiKey, llmUrl, model);
-        }
+        llm = new openAILLM_1.OpenAILLM(llmApiKey, llmUrl, model);
     }
     (0, assert_1.strict)(llm);
     return llm;

package/dist/agent/src/agent/compressingContextManager.js CHANGED Viewed

@@ -7,10 +7,9 @@ exports.createSummary = createSummary;
 const assert_1 = require("assert");
 const sdk_1 = require("@xalia/xmcp/sdk");
 const agent_1 = require("./agent");
-const nullPlatform_1 = require("./nullPlatform");
-const agentUtils_1 = require("./agentUtils");
 const context_1 = require("./context");
 const nullAgentEventHandler_1 = require("./nullAgentEventHandler");
+const contextWithWorkspace_1 = require("./contextWithWorkspace");
 const logger = (0, sdk_1.getLogger)();
 /**
  * System prompt used to generate a conversation summary.
@@ -30,12 +29,11 @@ function createCheckpointMessage(summary) {
         content: CHECKPOINT_MESSAGE_PREFIX + summary,
     };
 }
-async function createCompressionAgent(compressionAgentUrl, compressionAgentModel, compressionAgentApiKey) {
-    const llm = await (0, agentUtils_1.createLLM)(compressionAgentUrl, compressionAgentApiKey, compressionAgentModel, false /* stream */, nullPlatform_1.NULL_PLATFORM);
+function createCompressionAgent(llm) {
     return agent_1.Agent.initializeWithLLM(nullAgentEventHandler_1.NULL_AGENT_EVENT_HANDLER, llm, new context_1.ContextManager(COMPRESSION_SYSTEM_PROMPT, []));
 }
-async function createSummary(compressionAgentUrl, compressionAgentModel, compressionAgentApiKey, conversation) {
-    const agent = await createCompressionAgent(compressionAgentUrl, compressionAgentModel, compressionAgentApiKey);
+async function createSummary(llm, conversation) {
+    const agent = createCompressionAgent(llm);
     const agentResp = await agent.userMessageEx(JSON.stringify(conversation));
     if (!agentResp) {
         throw new Error("compression agent returned null");
@@ -50,12 +48,10 @@ async function createSummary(compressionAgentUrl, compressionAgentModel, compres
  * the Agent) is responsible for committing the conversation and triggering
  * compression.
  */
-class CompressingContextManager extends context_1.ContextManagerWithCommit {
-    constructor(systemPrompt, messages, compressionAgentUrl, compressionAgentModel, compressionAgentApiKey) {
+class CompressingContextManager extends contextWithWorkspace_1.ContextManagerWithWorkspace {
+    constructor(systemPrompt, messages, getLLM) {
         super(systemPrompt, messages);
-        this.compressionAgentUrl = compressionAgentUrl;
-        this.compressionAgentModel = compressionAgentModel;
-        this.compressionAgentApiKey = compressionAgentApiKey;
+        this.getLLM = getLLM;
         this.compressingMessages = undefined;
         // Sanity check the conversation form.
         //
@@ -77,15 +73,15 @@ class CompressingContextManager extends context_1.ContextManagerWithCommit {
         }
     }
     async compress() {
-        // Only select messages for compression if they have been committed.
-        const numToCompress = this.getCommittedLength();
+        const numToCompress = super.numMessages();
         const messagesToCompress = this.leadingMessages(numToCompress);
         (0, assert_1.strict)(messagesToCompress.length === numToCompress);
         this.compressingMessages = numToCompress;
         (0, assert_1.strict)(this.compressingMessages > 1, "<2 messages commited in the context");
         logger.debug(`[CompressingContextManager] start (${String(this.compressingMessages)})`);
         try {
-            const summary = await createSummary(this.compressionAgentUrl, this.compressionAgentModel, this.compressionAgentApiKey, messagesToCompress);
+            const llm = await this.getLLM();
+            const summary = await createSummary(llm, messagesToCompress);
             logger.debug(`[CompressingContextManager] summary: ${summary}`);
             // Replace the context `messages` and update `lastCommittedMessage`
             // index.