npm - @eko-ai/eko - Versions diffs - 1.3.0 → 1.3.2 - Mend

@eko-ai/eko 1.3.0 → 1.3.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (12) hide show

package/dist/extension/tools/{browser_use.d.ts → browser_action.d.ts} +3 -3
package/dist/extension/tools/index.d.ts +2 -2
package/dist/extension/tools/tool_returns_screenshot.d.ts +3 -3
package/dist/extension.cjs.js +9 -8
package/dist/extension.esm.js +9 -8
package/dist/index.cjs.js +133 -37
package/dist/index.esm.js +133 -37
package/dist/nodejs/tools/browser_use.d.ts +3 -3
package/dist/types/tools.types.d.ts +2 -2
package/dist/utils/sleep.d.ts +1 -0
package/dist/web/tools/browser_use.d.ts +3 -3
package/package.json +1 -1

package/dist/extension/tools/{browser_use.d.ts → browser_action.d.ts} RENAMED Viewed

@@ -1,10 +1,10 @@
-import { BrowserUseParam, BrowserUseResult } from '../../types/tools.types';
+import { BrowserActionParam, BrowserActionResult } from '../../types/tools.types';
 import { InputSchema, ExecutionContext } from '../../types/action.types';
 import { ToolReturnsScreenshot } from './tool_returns_screenshot';
 /**
  * Browser Use for general
  */
-export declare class BrowserUse extends ToolReturnsScreenshot<BrowserUseParam> {
+export declare class BrowserAction extends ToolReturnsScreenshot<BrowserActionParam> {
     name: string;
     description: string;
     input_schema: InputSchema;
@@ -15,6 +15,6 @@ export declare class BrowserUse extends ToolReturnsScreenshot<BrowserUseParam> {
      * @param {*} params { action: 'input_text', index: 1, text: 'string' }
      * @returns > { success: true, image?: { type: 'base64', media_type: 'image/jpeg', data: '/9j...' }, text?: string }
      */
-    realExecute(context: ExecutionContext, params: BrowserUseParam): Promise<BrowserUseResult>;
+    realExecute(context: ExecutionContext, params: BrowserActionParam): Promise<BrowserActionResult>;
     destroy(context: ExecutionContext): void;
 }

package/dist/extension/tools/index.d.ts CHANGED Viewed

@@ -1,4 +1,4 @@
-import { BrowserUse } from './browser_use';
+import { BrowserAction } from './browser_action';
 import { ExportFile } from './export_file';
 import { ExtractContent } from './extract_content';
 import { GetAllTabs } from './get_all_tabs';
@@ -9,4 +9,4 @@ import { WebSearch } from './web_search';
 import { RequestLogin } from './request_login';
 import { SwitchTab } from './switch_tab';
 export * from '../../common/tools';
-export { BrowserUse, ExportFile, ExtractContent, OpenUrl, GetAllTabs, Screenshot, TabManagement, WebSearch, RequestLogin, SwitchTab, };
+export { BrowserAction, ExportFile, ExtractContent, OpenUrl, GetAllTabs, Screenshot, TabManagement, WebSearch, RequestLogin, SwitchTab, };

package/dist/extension/tools/tool_returns_screenshot.d.ts CHANGED Viewed

@@ -1,8 +1,8 @@
-import { BrowserUseResult, ExecutionContext, InputSchema, Tool } from "@/types";
-export declare abstract class ToolReturnsScreenshot<T> implements Tool<T, BrowserUseResult> {
+import { BrowserActionResult, ExecutionContext, InputSchema, Tool } from "@/types";
+export declare abstract class ToolReturnsScreenshot<T> implements Tool<T, BrowserActionResult> {
     abstract name: string;
     abstract description: string;
     abstract input_schema: InputSchema;
     abstract realExecute(context: ExecutionContext, params: T): Promise<any>;
-    execute(context: ExecutionContext, params: T): Promise<BrowserUseResult>;
+    execute(context: ExecutionContext, params: T): Promise<BrowserActionResult>;
 }

package/dist/extension.cjs.js CHANGED Viewed

@@ -694,6 +694,7 @@ async function getTabId(context) {
             tabId = await getCurrentTabId(context.ekoConfig.chromeProxy);
             logger.debug("getCurrentTabId(context.ekoConfig.chromeProxy) #2 returns " + tabId);
         }
+        logger.debug("tabId:", tabId);
         if (!tabId) {
             const fellouTabId = window.__FELLOU_TAB_ID__;
             if (fellouTabId) {
@@ -721,7 +722,7 @@ function getCurrentTabId(chromeProxy, windowId) {
             logger.debug(`get the active tabId on current window`);
             queryInfo = { active: true, currentWindow: true };
         }
-        chrome.tabs.query(queryInfo, (tabs) => {
+        chromeProxy.tabs.query(queryInfo, (tabs) => {
             if (chromeProxy.runtime.lastError) {
                 logger.error(`failed to get: `, chromeProxy.runtime.lastError);
                 reject(chromeProxy.runtime.lastError);
@@ -1405,7 +1406,7 @@ class ToolReturnsScreenshot {
         logger.debug("debug realResult...");
         logger.debug(realResult);
         await sleep(3000); // wait for page loding
-        let instance = new BrowserUse();
+        let instance = new BrowserAction();
         const image = await instance.realExecute(context, { action: "screenshot_extract_element" });
         return image;
     }
@@ -1414,10 +1415,10 @@ class ToolReturnsScreenshot {
 /**
  * Browser Use for general
  */
-class BrowserUse extends ToolReturnsScreenshot {
+class BrowserAction extends ToolReturnsScreenshot {
     constructor() {
         super();
-        this.name = 'browser_use';
+        this.name = 'browser_action';
         this.description = `Use structured commands to interact with the browser, manipulating page elements through screenshots and webpage element extraction.
 * This is a browser GUI interface where you need to analyze webpages by taking screenshots and extracting page element structures, and specify action sequences to complete designated tasks.
 * Before any operation, you must first call the \`screenshot_extract_element\` command, which will return the browser page screenshot and structured element information, both specially processed.
@@ -1481,7 +1482,7 @@ class BrowserUse extends ToolReturnsScreenshot {
      */
     async realExecute(context, params) {
         var _a;
-        logger.debug("debug 'browser_use'...");
+        logger.debug("debug 'browser_action'...");
         logger.debug(params);
         try {
             if (params === null || !params.action) {
@@ -1606,7 +1607,7 @@ class BrowserUse extends ToolReturnsScreenshot {
                 default:
                     throw Error(`Invalid parameters. The "${params.action}" value is not included in the "action" enumeration.`);
             }
-            logger.debug(`execute 'browser_use'...done, result=${result}`);
+            logger.debug(`execute 'browser_action'...done, result=${result}`);
             return result;
         }
         catch (e) {
@@ -2092,7 +2093,7 @@ class WebSearch {
         let searchs = [{ url: url, keyword: query }];
         let searchInfo = await deepSearch(context, taskId, searchs, maxResults || 5, context.ekoConfig.workingWindowId);
         let links = ((_b = searchInfo.result[0]) === null || _b === void 0 ? void 0 : _b.links) || [];
-        return links.filter((s) => s.content);
+        return links.filter((s) => s.content.slice(0, 8000));
     }
 }
 const deepSearchInjects = {
@@ -2755,7 +2756,7 @@ class DocumentAgentTool {
 var tools = /*#__PURE__*/Object.freeze({
     __proto__: null,
-    BrowserUse: BrowserUse,
+    BrowserAction: BrowserAction,
     CancelWorkflow: CancelWorkflow,
     DocumentAgentTool: DocumentAgentTool,
     ExportFile: ExportFile,

package/dist/extension.esm.js CHANGED Viewed

@@ -692,6 +692,7 @@ async function getTabId(context) {
             tabId = await getCurrentTabId(context.ekoConfig.chromeProxy);
             logger.debug("getCurrentTabId(context.ekoConfig.chromeProxy) #2 returns " + tabId);
         }
+        logger.debug("tabId:", tabId);
         if (!tabId) {
             const fellouTabId = window.__FELLOU_TAB_ID__;
             if (fellouTabId) {
@@ -719,7 +720,7 @@ function getCurrentTabId(chromeProxy, windowId) {
             logger.debug(`get the active tabId on current window`);
             queryInfo = { active: true, currentWindow: true };
         }
-        chrome.tabs.query(queryInfo, (tabs) => {
+        chromeProxy.tabs.query(queryInfo, (tabs) => {
             if (chromeProxy.runtime.lastError) {
                 logger.error(`failed to get: `, chromeProxy.runtime.lastError);
                 reject(chromeProxy.runtime.lastError);
@@ -1403,7 +1404,7 @@ class ToolReturnsScreenshot {
         logger.debug("debug realResult...");
         logger.debug(realResult);
         await sleep(3000); // wait for page loding
-        let instance = new BrowserUse();
+        let instance = new BrowserAction();
         const image = await instance.realExecute(context, { action: "screenshot_extract_element" });
         return image;
     }
@@ -1412,10 +1413,10 @@ class ToolReturnsScreenshot {
 /**
  * Browser Use for general
  */
-class BrowserUse extends ToolReturnsScreenshot {
+class BrowserAction extends ToolReturnsScreenshot {
     constructor() {
         super();
-        this.name = 'browser_use';
+        this.name = 'browser_action';
         this.description = `Use structured commands to interact with the browser, manipulating page elements through screenshots and webpage element extraction.
 * This is a browser GUI interface where you need to analyze webpages by taking screenshots and extracting page element structures, and specify action sequences to complete designated tasks.
 * Before any operation, you must first call the \`screenshot_extract_element\` command, which will return the browser page screenshot and structured element information, both specially processed.
@@ -1479,7 +1480,7 @@ class BrowserUse extends ToolReturnsScreenshot {
      */
     async realExecute(context, params) {
         var _a;
-        logger.debug("debug 'browser_use'...");
+        logger.debug("debug 'browser_action'...");
         logger.debug(params);
         try {
             if (params === null || !params.action) {
@@ -1604,7 +1605,7 @@ class BrowserUse extends ToolReturnsScreenshot {
                 default:
                     throw Error(`Invalid parameters. The "${params.action}" value is not included in the "action" enumeration.`);
             }
-            logger.debug(`execute 'browser_use'...done, result=${result}`);
+            logger.debug(`execute 'browser_action'...done, result=${result}`);
             return result;
         }
         catch (e) {
@@ -2090,7 +2091,7 @@ class WebSearch {
         let searchs = [{ url: url, keyword: query }];
         let searchInfo = await deepSearch(context, taskId, searchs, maxResults || 5, context.ekoConfig.workingWindowId);
         let links = ((_b = searchInfo.result[0]) === null || _b === void 0 ? void 0 : _b.links) || [];
-        return links.filter((s) => s.content);
+        return links.filter((s) => s.content.slice(0, 8000));
     }
 }
 const deepSearchInjects = {
@@ -2753,7 +2754,7 @@ class DocumentAgentTool {
 var tools = /*#__PURE__*/Object.freeze({
     __proto__: null,
-    BrowserUse: BrowserUse,
+    BrowserAction: BrowserAction,
     CancelWorkflow: CancelWorkflow,
     DocumentAgentTool: DocumentAgentTool,
     ExportFile: ExportFile,

package/dist/index.cjs.js CHANGED Viewed

@@ -1140,7 +1140,7 @@ let APIClient$1 = class APIClient {
             const maxRetries = options.maxRetries ?? this.maxRetries;
             timeoutMillis = this.calculateDefaultRetryTimeoutMillis(retriesRemaining, maxRetries);
         }
-        await sleep$1(timeoutMillis);
+        await sleep$2(timeoutMillis);
         return this.makeRequest(options, retriesRemaining - 1);
     }
     calculateDefaultRetryTimeoutMillis(retriesRemaining, maxRetries) {
@@ -1411,7 +1411,7 @@ const startsWithSchemeRegexp$1 = /^[a-z][a-z0-9+.-]*:/i;
 const isAbsoluteURL$1 = (url) => {
     return startsWithSchemeRegexp$1.test(url);
 };
-const sleep$1 = (ms) => new Promise((resolve) => setTimeout(resolve, ms));
+const sleep$2 = (ms) => new Promise((resolve) => setTimeout(resolve, ms));
 const validatePositiveInteger$1 = (name, n) => {
     if (typeof n !== 'number' || !Number.isInteger(n)) {
         throw new AnthropicError(`${name} must be an integer`);
@@ -5102,7 +5102,7 @@ class APIClient {
             const maxRetries = options.maxRetries ?? this.maxRetries;
             timeoutMillis = this.calculateDefaultRetryTimeoutMillis(retriesRemaining, maxRetries);
         }
-        await sleep(timeoutMillis);
+        await sleep$1(timeoutMillis);
         return this.makeRequest(options, retriesRemaining - 1);
     }
     calculateDefaultRetryTimeoutMillis(retriesRemaining, maxRetries) {
@@ -5374,7 +5374,7 @@ const startsWithSchemeRegexp = /^[a-z][a-z0-9+.-]*:/i;
 const isAbsoluteURL = (url) => {
     return startsWithSchemeRegexp.test(url);
 };
-const sleep = (ms) => new Promise((resolve) => setTimeout(resolve, ms));
+const sleep$1 = (ms) => new Promise((resolve) => setTimeout(resolve, ms));
 const validatePositiveInteger = (name, n) => {
     if (typeof n !== 'number' || !Number.isInteger(n)) {
         throw new OpenAIError(`${name} must be an integer`);
@@ -8056,7 +8056,7 @@ class Runs extends APIResource {
                             }
                         }
                     }
-                    await sleep(sleepInterval);
+                    await sleep$1(sleepInterval);
                     break;
                 //We return the run in any terminal state.
                 case 'requires_action':
@@ -8285,7 +8285,7 @@ let Files$1 = class Files extends APIResource {
         const start = Date.now();
         let file = await this.retrieve(id);
         while (!file.status || !TERMINAL_STATES.has(file.status)) {
-            await sleep(pollInterval);
+            await sleep$1(pollInterval);
             file = await this.retrieve(id);
             if (Date.now() - start > maxWait) {
                 throw new APIConnectionTimeoutError({
@@ -9052,7 +9052,7 @@ class Files extends APIResource {
                             }
                         }
                     }
-                    await sleep(sleepInterval);
+                    await sleep$1(sleepInterval);
                     break;
                 case 'failed':
                 case 'completed':
@@ -9169,7 +9169,7 @@ class FileBatches extends APIResource {
                             }
                         }
                     }
-                    await sleep(sleepInterval);
+                    await sleep$1(sleepInterval);
                     break;
                 case 'failed':
                 case 'cancelled':
@@ -10238,6 +10238,84 @@ class WriteContextTool {
     }
 }
+class ContextComporessor {
+}
+class NoComporess extends ContextComporessor {
+    comporess(messages) {
+        logger.debug("ContextComporessor = NoComporess");
+        let comporessed = JSON.parse(JSON.stringify(messages));
+        logger.debug("comporessed:", comporessed);
+        return comporessed;
+    }
+}
+class SimpleQAComporess extends ContextComporessor {
+    comporess(messages) {
+        logger.debug("ContextComporessor = SimpleQAComporess");
+        messages = JSON.parse(JSON.stringify(messages));
+        let comporessed = [];
+        const compress = (msg, idx) => {
+            if (msg.role == "system") {
+                return msg;
+            }
+            else if (msg.role == "assistant") {
+                if (idx == messages.length - 2) {
+                    return msg;
+                }
+                else if (typeof msg.content == "string") {
+                    const nextMessage = messages[idx + 1];
+                    if (nextMessage.role == "assistant" && Array.isArray(nextMessage.content)) {
+                        return null;
+                    }
+                    else {
+                        return msg;
+                    }
+                }
+                else {
+                    const task = msg.content[0].input.userSidePrompt;
+                    const details = msg.content[0].input.thinking;
+                    return {
+                        "role": "assistant",
+                        "content": `<task>${task}</task><details>${details}</details>`,
+                    };
+                }
+            }
+            else if (msg.role == "user" || typeof msg.content == "string") {
+                if (idx == messages.length - 1 || idx == 1) {
+                    return msg;
+                }
+                else {
+                    let aiResponseMsg = messages[idx + 1];
+                    if (typeof aiResponseMsg.content == "string") {
+                        aiResponseMsg = messages[idx + 2];
+                    }
+                    const result = aiResponseMsg.content[0].input.observation;
+                    return {
+                        "role": "user",
+                        "content": `<result>${result}</result>`,
+                    };
+                }
+            }
+            else {
+                logger.warn("unknown message type, return null");
+                return null;
+            }
+        };
+        messages.forEach((msg, idx) => {
+            logger.debug({ idx, msg });
+            const compressedMsg = compress(msg, idx);
+            logger.debug(compressedMsg);
+            if (compressedMsg) {
+                comporessed.push(compressedMsg);
+            }
+        });
+        return comporessed;
+    }
+}
+function sleep(time) {
+    return new Promise((resolve) => setTimeout(() => resolve(), time));
+}
 // src/models/action.ts
 function createReturnTool(actionName, outputDescription, outputSchema) {
     return {
@@ -10283,7 +10361,7 @@ class ActionImpl {
         this.tools = tools;
         this.llmProvider = llmProvider;
         this.llmConfig = llmConfig;
-        this.maxRounds = 100; // Default max rounds
+        this.maxRounds = 25; // Default max rounds
         this.toolResults = new Map();
         this.logger = new ExecutionLogger();
         this.tabs = [];
@@ -10300,6 +10378,7 @@ class ActionImpl {
         let roundMessages = [];
         let params_copy = JSON.parse(JSON.stringify(params));
         params_copy.tools = (_a = params_copy.tools) === null || _a === void 0 ? void 0 : _a.map(this.wrapToolInputSchema);
+        let retry_counter = 3;
         while (!((_b = context.signal) === null || _b === void 0 ? void 0 : _b.aborted)) {
             roundMessages = [];
             hasToolUse = false;
@@ -10499,11 +10578,43 @@ class ActionImpl {
                 throw new Error('LLM provider not set');
             }
             try {
-                await this.llmProvider.generateStream(messages, params_copy, handler);
+                let compressedMessages;
+                try {
+                    const comporessor = new SimpleQAComporess();
+                    logger.debug("uncompressed messages:", messages);
+                    compressedMessages = comporessor.comporess(messages);
+                }
+                catch (e) {
+                    logger.error("an error occurs when comporess context, use NoComporess");
+                    logger.error(e);
+                    const comporessor = new NoComporess();
+                    compressedMessages = comporessor.comporess(messages);
+                }
+                logger.debug("compressed messages:", compressedMessages);
+                await sleep(5000);
+                try {
+                    await this.llmProvider.generateStream(compressedMessages, params_copy, handler);
+                }
+                catch (e) {
+                    logger.warn("LLM API raise an error, try to use NoComporess");
+                    const comporessor = new NoComporess();
+                    compressedMessages = comporessor.comporess(messages);
+                    logger.debug("compressed messages:", compressedMessages);
+                    await sleep(5000);
+                    await this.llmProvider.generateStream(compressedMessages, params_copy, handler);
+                }
             }
             catch (e) {
-                logger.warn("an error occurs when LLM generate response, retry...", e);
-                continue;
+                logger.warn(`an error occurs when LLM generate response, retry(n=${retry_counter})...`, e);
+                await sleep(3000);
+                retry_counter -= 1;
+                if (retry_counter > 0) {
+                    continue;
+                }
+                else {
+                    logger.error("too many errors when calling LLM API in executing");
+                    throw e;
+                }
             }
             // Wait for tool execution to complete if it was started
             if (toolExecutionPromise) {
@@ -10827,22 +10938,9 @@ Navigation Bar or Menu Changes: After logging in, the navigation bar will includ
         definition.input_schema = {
             type: "object",
             properties: {
-                // comment for backup
-                // observation: {
-                //   "type": "string",
-                //   "description": 'Your observation of the previous steps. Should start with "In the previous step, I\'ve ...".',
-                // },
-                evaluate_previous_goal: {
-                    "type": "string",
-                    "description": "Success|Failed|Unknown - Analyze the current elements and the image to check if the previous goals/actions are successful like intended by the task. Mention if something unexpected happened. Shortly state why/why not"
-                },
-                memory: {
+                observation: {
                     "type": "string",
-                    "description": "Description of what has been done and what you need to remember. Be very specific. Count here ALWAYS how many times you have done something and how many remain. E.g. 0 out of 10 websites analyzed. Continue with abc and xyz",
-                },
-                next_goal: {
-                    "type": "string",
-                    "description": "What needs to be done with the next immediate action",
+                    "description": 'Your observation of the previous steps. Should start with "In the previous step, I\'ve ...".',
                 },
                 thinking: {
                     "type": "string",
@@ -10856,12 +10954,9 @@ Navigation Bar or Menu Changes: After logging in, the navigation bar will includ
             },
             required: [
                 // comment for backup
-                // "observation",
+                "observation",
                 "thinking",
                 "userSidePrompt",
-                "memory",
-                "next_goal",
-                "evaluate_previous_goal",
                 "toolCall",
             ],
         };
@@ -10872,15 +10967,15 @@ Navigation Bar or Menu Changes: After logging in, the navigation bar will includ
             observation: toolCall.input.observation,
             thinking: toolCall.input.thinking,
             userSidePrompt: toolCall.input.userSidePrompt,
-            evaluate_previous_goal: toolCall.input.evaluate_previous_goal,
-            memory: toolCall.input.memory,
-            next_goal: toolCall.input.next_goal,
             toolCall: {
                 id: toolCall.id,
                 name: toolCall.name,
                 input: toolCall.input.toolCall,
             },
         };
+        if (!toolCall.input.toolCall) {
+            logger.error("LLM returned a broken function call:", toolCall);
+        }
         return result;
     }
 }
@@ -10991,6 +11086,7 @@ class WorkflowGenerator {
             catch (e) {
                 logger.warn("an error occured when generating workflow:", e);
                 logger.info(`retry...${retry_counter}`);
+                await sleep(3000);
                 retry_counter -= 1;
             }
         }
@@ -11034,7 +11130,7 @@ class WorkflowGenerator {
         // Add nodes to workflow
         if (Array.isArray(data.nodes)) {
             data.nodes.forEach((nodeData) => {
-                const action = ActionImpl.createPromptAction(nodeData.action.name, nodeData.action.description, [this.toolRegistry.getTool('browser_use')], this.llmProvider, { maxTokens: 8192 });
+                const action = ActionImpl.createPromptAction(nodeData.action.name, nodeData.action.description, [this.toolRegistry.getTool('browser_action')], this.llmProvider, { maxTokens: 8192 });
                 const node = {
                     id: nodeData.id,
                     name: nodeData.name || nodeData.id,
@@ -11144,7 +11240,7 @@ class Eko {
         this.llmProvider = LLMProviderFactory.buildLLMProvider(llmConfig);
         this.ekoConfig = this.buildEkoConfig(ekoConfig);
         this.registerTools();
-        logger.info("using Eko@" + "416349eaa1535085d74b14170d4e0741756da46f");
+        logger.info("using Eko@" + "8aef68f294c16840224e6656e0a04a2b87b4ac96");
         logger.debug("caller's ekoConfig:", ekoConfig);
     }
     static getLogger() {
@@ -11237,7 +11333,7 @@ class Eko {
                         'name': prompt,
                         'description': description,
                         'tools': [
-                            'browser_use',
+                            'browser_action',
                             'document_agent',
                             'export_file',
                             'extract_content',

package/dist/index.esm.js CHANGED Viewed

@@ -1136,7 +1136,7 @@ let APIClient$1 = class APIClient {
             const maxRetries = options.maxRetries ?? this.maxRetries;
             timeoutMillis = this.calculateDefaultRetryTimeoutMillis(retriesRemaining, maxRetries);
         }
-        await sleep$1(timeoutMillis);
+        await sleep$2(timeoutMillis);
         return this.makeRequest(options, retriesRemaining - 1);
     }
     calculateDefaultRetryTimeoutMillis(retriesRemaining, maxRetries) {
@@ -1407,7 +1407,7 @@ const startsWithSchemeRegexp$1 = /^[a-z][a-z0-9+.-]*:/i;
 const isAbsoluteURL$1 = (url) => {
     return startsWithSchemeRegexp$1.test(url);
 };
-const sleep$1 = (ms) => new Promise((resolve) => setTimeout(resolve, ms));
+const sleep$2 = (ms) => new Promise((resolve) => setTimeout(resolve, ms));
 const validatePositiveInteger$1 = (name, n) => {
     if (typeof n !== 'number' || !Number.isInteger(n)) {
         throw new AnthropicError(`${name} must be an integer`);
@@ -5098,7 +5098,7 @@ class APIClient {
             const maxRetries = options.maxRetries ?? this.maxRetries;
             timeoutMillis = this.calculateDefaultRetryTimeoutMillis(retriesRemaining, maxRetries);
         }
-        await sleep(timeoutMillis);
+        await sleep$1(timeoutMillis);
         return this.makeRequest(options, retriesRemaining - 1);
     }
     calculateDefaultRetryTimeoutMillis(retriesRemaining, maxRetries) {
@@ -5370,7 +5370,7 @@ const startsWithSchemeRegexp = /^[a-z][a-z0-9+.-]*:/i;
 const isAbsoluteURL = (url) => {
     return startsWithSchemeRegexp.test(url);
 };
-const sleep = (ms) => new Promise((resolve) => setTimeout(resolve, ms));
+const sleep$1 = (ms) => new Promise((resolve) => setTimeout(resolve, ms));
 const validatePositiveInteger = (name, n) => {
     if (typeof n !== 'number' || !Number.isInteger(n)) {
         throw new OpenAIError(`${name} must be an integer`);
@@ -8052,7 +8052,7 @@ class Runs extends APIResource {
                             }
                         }
                     }
-                    await sleep(sleepInterval);
+                    await sleep$1(sleepInterval);
                     break;
                 //We return the run in any terminal state.
                 case 'requires_action':
@@ -8281,7 +8281,7 @@ let Files$1 = class Files extends APIResource {
         const start = Date.now();
         let file = await this.retrieve(id);
         while (!file.status || !TERMINAL_STATES.has(file.status)) {
-            await sleep(pollInterval);
+            await sleep$1(pollInterval);
             file = await this.retrieve(id);
             if (Date.now() - start > maxWait) {
                 throw new APIConnectionTimeoutError({
@@ -9048,7 +9048,7 @@ class Files extends APIResource {
                             }
                         }
                     }
-                    await sleep(sleepInterval);
+                    await sleep$1(sleepInterval);
                     break;
                 case 'failed':
                 case 'completed':
@@ -9165,7 +9165,7 @@ class FileBatches extends APIResource {
                             }
                         }
                     }
-                    await sleep(sleepInterval);
+                    await sleep$1(sleepInterval);
                     break;
                 case 'failed':
                 case 'cancelled':
@@ -10234,6 +10234,84 @@ class WriteContextTool {
     }
 }
+class ContextComporessor {
+}
+class NoComporess extends ContextComporessor {
+    comporess(messages) {
+        logger.debug("ContextComporessor = NoComporess");
+        let comporessed = JSON.parse(JSON.stringify(messages));
+        logger.debug("comporessed:", comporessed);
+        return comporessed;
+    }
+}
+class SimpleQAComporess extends ContextComporessor {
+    comporess(messages) {
+        logger.debug("ContextComporessor = SimpleQAComporess");
+        messages = JSON.parse(JSON.stringify(messages));
+        let comporessed = [];
+        const compress = (msg, idx) => {
+            if (msg.role == "system") {
+                return msg;
+            }
+            else if (msg.role == "assistant") {
+                if (idx == messages.length - 2) {
+                    return msg;
+                }
+                else if (typeof msg.content == "string") {
+                    const nextMessage = messages[idx + 1];
+                    if (nextMessage.role == "assistant" && Array.isArray(nextMessage.content)) {
+                        return null;
+                    }
+                    else {
+                        return msg;
+                    }
+                }
+                else {
+                    const task = msg.content[0].input.userSidePrompt;
+                    const details = msg.content[0].input.thinking;
+                    return {
+                        "role": "assistant",
+                        "content": `<task>${task}</task><details>${details}</details>`,
+                    };
+                }
+            }
+            else if (msg.role == "user" || typeof msg.content == "string") {
+                if (idx == messages.length - 1 || idx == 1) {
+                    return msg;
+                }
+                else {
+                    let aiResponseMsg = messages[idx + 1];
+                    if (typeof aiResponseMsg.content == "string") {
+                        aiResponseMsg = messages[idx + 2];
+                    }
+                    const result = aiResponseMsg.content[0].input.observation;
+                    return {
+                        "role": "user",
+                        "content": `<result>${result}</result>`,
+                    };
+                }
+            }
+            else {
+                logger.warn("unknown message type, return null");
+                return null;
+            }
+        };
+        messages.forEach((msg, idx) => {
+            logger.debug({ idx, msg });
+            const compressedMsg = compress(msg, idx);
+            logger.debug(compressedMsg);
+            if (compressedMsg) {
+                comporessed.push(compressedMsg);
+            }
+        });
+        return comporessed;
+    }
+}
+function sleep(time) {
+    return new Promise((resolve) => setTimeout(() => resolve(), time));
+}
 // src/models/action.ts
 function createReturnTool(actionName, outputDescription, outputSchema) {
     return {
@@ -10279,7 +10357,7 @@ class ActionImpl {
         this.tools = tools;
         this.llmProvider = llmProvider;
         this.llmConfig = llmConfig;
-        this.maxRounds = 100; // Default max rounds
+        this.maxRounds = 25; // Default max rounds
         this.toolResults = new Map();
         this.logger = new ExecutionLogger();
         this.tabs = [];
@@ -10296,6 +10374,7 @@ class ActionImpl {
         let roundMessages = [];
         let params_copy = JSON.parse(JSON.stringify(params));
         params_copy.tools = (_a = params_copy.tools) === null || _a === void 0 ? void 0 : _a.map(this.wrapToolInputSchema);
+        let retry_counter = 3;
         while (!((_b = context.signal) === null || _b === void 0 ? void 0 : _b.aborted)) {
             roundMessages = [];
             hasToolUse = false;
@@ -10495,11 +10574,43 @@ class ActionImpl {
                 throw new Error('LLM provider not set');
             }
             try {
-                await this.llmProvider.generateStream(messages, params_copy, handler);
+                let compressedMessages;
+                try {
+                    const comporessor = new SimpleQAComporess();
+                    logger.debug("uncompressed messages:", messages);
+                    compressedMessages = comporessor.comporess(messages);
+                }
+                catch (e) {
+                    logger.error("an error occurs when comporess context, use NoComporess");
+                    logger.error(e);
+                    const comporessor = new NoComporess();
+                    compressedMessages = comporessor.comporess(messages);
+                }
+                logger.debug("compressed messages:", compressedMessages);
+                await sleep(5000);
+                try {
+                    await this.llmProvider.generateStream(compressedMessages, params_copy, handler);
+                }
+                catch (e) {
+                    logger.warn("LLM API raise an error, try to use NoComporess");
+                    const comporessor = new NoComporess();
+                    compressedMessages = comporessor.comporess(messages);
+                    logger.debug("compressed messages:", compressedMessages);
+                    await sleep(5000);
+                    await this.llmProvider.generateStream(compressedMessages, params_copy, handler);
+                }
             }
             catch (e) {
-                logger.warn("an error occurs when LLM generate response, retry...", e);
-                continue;
+                logger.warn(`an error occurs when LLM generate response, retry(n=${retry_counter})...`, e);
+                await sleep(3000);
+                retry_counter -= 1;
+                if (retry_counter > 0) {
+                    continue;
+                }
+                else {
+                    logger.error("too many errors when calling LLM API in executing");
+                    throw e;
+                }
             }
             // Wait for tool execution to complete if it was started
             if (toolExecutionPromise) {
@@ -10823,22 +10934,9 @@ Navigation Bar or Menu Changes: After logging in, the navigation bar will includ
         definition.input_schema = {
             type: "object",
             properties: {
-                // comment for backup
-                // observation: {
-                //   "type": "string",
-                //   "description": 'Your observation of the previous steps. Should start with "In the previous step, I\'ve ...".',
-                // },
-                evaluate_previous_goal: {
-                    "type": "string",
-                    "description": "Success|Failed|Unknown - Analyze the current elements and the image to check if the previous goals/actions are successful like intended by the task. Mention if something unexpected happened. Shortly state why/why not"
-                },
-                memory: {
+                observation: {
                     "type": "string",
-                    "description": "Description of what has been done and what you need to remember. Be very specific. Count here ALWAYS how many times you have done something and how many remain. E.g. 0 out of 10 websites analyzed. Continue with abc and xyz",
-                },
-                next_goal: {
-                    "type": "string",
-                    "description": "What needs to be done with the next immediate action",
+                    "description": 'Your observation of the previous steps. Should start with "In the previous step, I\'ve ...".',
                 },
                 thinking: {
                     "type": "string",
@@ -10852,12 +10950,9 @@ Navigation Bar or Menu Changes: After logging in, the navigation bar will includ
             },
             required: [
                 // comment for backup
-                // "observation",
+                "observation",
                 "thinking",
                 "userSidePrompt",
-                "memory",
-                "next_goal",
-                "evaluate_previous_goal",
                 "toolCall",
             ],
         };
@@ -10868,15 +10963,15 @@ Navigation Bar or Menu Changes: After logging in, the navigation bar will includ
             observation: toolCall.input.observation,
             thinking: toolCall.input.thinking,
             userSidePrompt: toolCall.input.userSidePrompt,
-            evaluate_previous_goal: toolCall.input.evaluate_previous_goal,
-            memory: toolCall.input.memory,
-            next_goal: toolCall.input.next_goal,
             toolCall: {
                 id: toolCall.id,
                 name: toolCall.name,
                 input: toolCall.input.toolCall,
             },
         };
+        if (!toolCall.input.toolCall) {
+            logger.error("LLM returned a broken function call:", toolCall);
+        }
         return result;
     }
 }
@@ -10987,6 +11082,7 @@ class WorkflowGenerator {
             catch (e) {
                 logger.warn("an error occured when generating workflow:", e);
                 logger.info(`retry...${retry_counter}`);
+                await sleep(3000);
                 retry_counter -= 1;
             }
         }
@@ -11030,7 +11126,7 @@ class WorkflowGenerator {
         // Add nodes to workflow
         if (Array.isArray(data.nodes)) {
             data.nodes.forEach((nodeData) => {
-                const action = ActionImpl.createPromptAction(nodeData.action.name, nodeData.action.description, [this.toolRegistry.getTool('browser_use')], this.llmProvider, { maxTokens: 8192 });
+                const action = ActionImpl.createPromptAction(nodeData.action.name, nodeData.action.description, [this.toolRegistry.getTool('browser_action')], this.llmProvider, { maxTokens: 8192 });
                 const node = {
                     id: nodeData.id,
                     name: nodeData.name || nodeData.id,
@@ -11140,7 +11236,7 @@ class Eko {
         this.llmProvider = LLMProviderFactory.buildLLMProvider(llmConfig);
         this.ekoConfig = this.buildEkoConfig(ekoConfig);
         this.registerTools();
-        logger.info("using Eko@" + "416349eaa1535085d74b14170d4e0741756da46f");
+        logger.info("using Eko@" + "8aef68f294c16840224e6656e0a04a2b87b4ac96");
         logger.debug("caller's ekoConfig:", ekoConfig);
     }
     static getLogger() {
@@ -11233,7 +11329,7 @@ class Eko {
                         'name': prompt,
                         'description': description,
                         'tools': [
-                            'browser_use',
+                            'browser_action',
                             'document_agent',
                             'export_file',
                             'extract_content',

package/dist/nodejs/tools/browser_use.d.ts CHANGED Viewed

@@ -1,9 +1,9 @@
-import { BrowserUseParam, BrowserUseResult } from '../../types/tools.types';
+import { BrowserActionParam, BrowserActionResult } from '../../types/tools.types';
 import { Tool, InputSchema, ExecutionContext } from '../../types/action.types';
 /**
  * Browser Use => `npx playwright install`
  */
-export declare class BrowserUse implements Tool<BrowserUseParam, BrowserUseResult> {
+export declare class BrowserUse implements Tool<BrowserActionParam, BrowserActionResult> {
     name: string;
     description: string;
     input_schema: InputSchema;
@@ -17,7 +17,7 @@ export declare class BrowserUse implements Tool<BrowserUseParam, BrowserUseResul
      * @param {*} params { action: 'input_text', index: 1, text: 'string' }
      * @returns > { success: true, image?: { type: 'base64', media_type: 'image/jpeg', data: '/9j...' }, text?: string }
      */
-    execute(context: ExecutionContext, params: BrowserUseParam): Promise<BrowserUseResult>;
+    execute(context: ExecutionContext, params: BrowserActionParam): Promise<BrowserActionResult>;
     private open_url;
     private injectScript;
     private get_highlight_element;

package/dist/types/tools.types.d.ts CHANGED Viewed

@@ -8,12 +8,12 @@ export interface ComputerUseResult {
     image?: ScreenshotImage;
     [key: string]: any;
 }
-export interface BrowserUseParam {
+export interface BrowserActionParam {
     action: string;
     index?: number;
     text?: string;
 }
-export interface BrowserUseResult {
+export interface BrowserActionResult {
     success: boolean;
     image?: ScreenshotImage;
     text?: string;

package/dist/utils/sleep.d.ts ADDED Viewed

	@@ -0,0 +1 @@
1	+ export declare function sleep(time: number): Promise<void>;

package/dist/web/tools/browser_use.d.ts CHANGED Viewed

@@ -1,9 +1,9 @@
-import { BrowserUseParam, BrowserUseResult } from '../../types/tools.types';
+import { BrowserActionParam, BrowserActionResult } from '../../types/tools.types';
 import { Tool, InputSchema, ExecutionContext } from '../../types/action.types';
 /**
  * Browser Use for general
  */
-export declare class BrowserUse implements Tool<BrowserUseParam, BrowserUseResult> {
+export declare class BrowserUse implements Tool<BrowserActionParam, BrowserActionResult> {
     name: string;
     description: string;
     input_schema: InputSchema;
@@ -14,6 +14,6 @@ export declare class BrowserUse implements Tool<BrowserUseParam, BrowserUseResul
      * @param {*} params { action: 'input_text', index: 1, text: 'string' }
      * @returns > { success: true, image?: { type: 'base64', media_type: 'image/jpeg', data: '/9j...' }, text?: string }
      */
-    execute(context: ExecutionContext, params: BrowserUseParam): Promise<BrowserUseResult>;
+    execute(context: ExecutionContext, params: BrowserActionParam): Promise<BrowserActionResult>;
     destroy(context: ExecutionContext): void;
 }

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@eko-ai/eko",
-  "version": "1.3.0",
+  "version": "1.3.2",
   "description": "Empowering language to transform human words into action.",
   "main": "dist/index.cjs.js",
   "module": "dist/index.esm.js",