npm - @godscene/core - Versions diffs - 1.7.11 - Mend

@godscene/core 1.7.11

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (189) hide show

package/LICENSE +21 -0
package/README.md +9 -0
package/dist/es/agent/agent.mjs +767 -0
package/dist/es/agent/common.mjs +0 -0
package/dist/es/agent/execution-session.mjs +39 -0
package/dist/es/agent/index.mjs +6 -0
package/dist/es/agent/task-builder.mjs +343 -0
package/dist/es/agent/task-cache.mjs +212 -0
package/dist/es/agent/tasks.mjs +428 -0
package/dist/es/agent/ui-utils.mjs +101 -0
package/dist/es/agent/utils.mjs +167 -0
package/dist/es/ai-model/auto-glm/actions.mjs +237 -0
package/dist/es/ai-model/auto-glm/index.mjs +6 -0
package/dist/es/ai-model/auto-glm/parser.mjs +237 -0
package/dist/es/ai-model/auto-glm/planning.mjs +69 -0
package/dist/es/ai-model/auto-glm/prompt.mjs +220 -0
package/dist/es/ai-model/auto-glm/util.mjs +7 -0
package/dist/es/ai-model/connectivity.mjs +136 -0
package/dist/es/ai-model/conversation-history.mjs +193 -0
package/dist/es/ai-model/index.mjs +12 -0
package/dist/es/ai-model/inspect.mjs +395 -0
package/dist/es/ai-model/llm-planning.mjs +231 -0
package/dist/es/ai-model/prompt/common.mjs +5 -0
package/dist/es/ai-model/prompt/describe.mjs +64 -0
package/dist/es/ai-model/prompt/extraction.mjs +129 -0
package/dist/es/ai-model/prompt/llm-locator.mjs +49 -0
package/dist/es/ai-model/prompt/llm-planning.mjs +584 -0
package/dist/es/ai-model/prompt/llm-section-locator.mjs +42 -0
package/dist/es/ai-model/prompt/order-sensitive-judge.mjs +33 -0
package/dist/es/ai-model/prompt/playwright-generator.mjs +115 -0
package/dist/es/ai-model/prompt/ui-tars-planning.mjs +34 -0
package/dist/es/ai-model/prompt/util.mjs +57 -0
package/dist/es/ai-model/prompt/yaml-generator.mjs +201 -0
package/dist/es/ai-model/service-caller/codex-app-server.mjs +573 -0
package/dist/es/ai-model/service-caller/image-detail.mjs +4 -0
package/dist/es/ai-model/service-caller/index.mjs +648 -0
package/dist/es/ai-model/service-caller/request-timeout.mjs +47 -0
package/dist/es/ai-model/ui-tars-planning.mjs +247 -0
package/dist/es/common.mjs +382 -0
package/dist/es/device/device-options.mjs +0 -0
package/dist/es/device/index.mjs +340 -0
package/dist/es/dump/html-utils.mjs +290 -0
package/dist/es/dump/index.mjs +3 -0
package/dist/es/dump/screenshot-restoration.mjs +30 -0
package/dist/es/dump/screenshot-store.mjs +125 -0
package/dist/es/index.mjs +17 -0
package/dist/es/report-cli.mjs +149 -0
package/dist/es/report-generator.mjs +203 -0
package/dist/es/report-markdown.mjs +216 -0
package/dist/es/report.mjs +287 -0
package/dist/es/screenshot-item.mjs +120 -0
package/dist/es/service/index.mjs +272 -0
package/dist/es/service/utils.mjs +13 -0
package/dist/es/skill/index.mjs +35 -0
package/dist/es/task-runner.mjs +261 -0
package/dist/es/task-timing.mjs +10 -0
package/dist/es/tree.mjs +11 -0
package/dist/es/types.mjs +202 -0
package/dist/es/utils.mjs +232 -0
package/dist/es/yaml/builder.mjs +11 -0
package/dist/es/yaml/index.mjs +4 -0
package/dist/es/yaml/player.mjs +425 -0
package/dist/es/yaml/utils.mjs +100 -0
package/dist/es/yaml.mjs +0 -0
package/dist/lib/agent/agent.js +815 -0
package/dist/lib/agent/common.js +5 -0
package/dist/lib/agent/execution-session.js +73 -0
package/dist/lib/agent/index.js +76 -0
package/dist/lib/agent/task-builder.js +380 -0
package/dist/lib/agent/task-cache.js +264 -0
package/dist/lib/agent/tasks.js +471 -0
package/dist/lib/agent/ui-utils.js +153 -0
package/dist/lib/agent/utils.js +238 -0
package/dist/lib/ai-model/auto-glm/actions.js +271 -0
package/dist/lib/ai-model/auto-glm/index.js +64 -0
package/dist/lib/ai-model/auto-glm/parser.js +280 -0
package/dist/lib/ai-model/auto-glm/planning.js +103 -0
package/dist/lib/ai-model/auto-glm/prompt.js +257 -0
package/dist/lib/ai-model/auto-glm/util.js +44 -0
package/dist/lib/ai-model/connectivity.js +180 -0
package/dist/lib/ai-model/conversation-history.js +227 -0
package/dist/lib/ai-model/index.js +127 -0
package/dist/lib/ai-model/inspect.js +441 -0
package/dist/lib/ai-model/llm-planning.js +268 -0
package/dist/lib/ai-model/prompt/common.js +39 -0
package/dist/lib/ai-model/prompt/describe.js +98 -0
package/dist/lib/ai-model/prompt/extraction.js +169 -0
package/dist/lib/ai-model/prompt/llm-locator.js +86 -0
package/dist/lib/ai-model/prompt/llm-planning.js +621 -0
package/dist/lib/ai-model/prompt/llm-section-locator.js +79 -0
package/dist/lib/ai-model/prompt/order-sensitive-judge.js +70 -0
package/dist/lib/ai-model/prompt/playwright-generator.js +176 -0
package/dist/lib/ai-model/prompt/ui-tars-planning.js +71 -0
package/dist/lib/ai-model/prompt/util.js +103 -0
package/dist/lib/ai-model/prompt/yaml-generator.js +262 -0
package/dist/lib/ai-model/service-caller/codex-app-server.js +622 -0
package/dist/lib/ai-model/service-caller/image-detail.js +38 -0
package/dist/lib/ai-model/service-caller/index.js +716 -0
package/dist/lib/ai-model/service-caller/request-timeout.js +93 -0
package/dist/lib/ai-model/ui-tars-planning.js +281 -0
package/dist/lib/common.js +491 -0
package/dist/lib/device/device-options.js +18 -0
package/dist/lib/device/index.js +467 -0
package/dist/lib/dump/html-utils.js +366 -0
package/dist/lib/dump/index.js +58 -0
package/dist/lib/dump/screenshot-restoration.js +64 -0
package/dist/lib/dump/screenshot-store.js +165 -0
package/dist/lib/index.js +184 -0
package/dist/lib/report-cli.js +189 -0
package/dist/lib/report-generator.js +244 -0
package/dist/lib/report-markdown.js +253 -0
package/dist/lib/report.js +333 -0
package/dist/lib/screenshot-item.js +154 -0
package/dist/lib/service/index.js +306 -0
package/dist/lib/service/utils.js +47 -0
package/dist/lib/skill/index.js +69 -0
package/dist/lib/task-runner.js +298 -0
package/dist/lib/task-timing.js +44 -0
package/dist/lib/tree.js +51 -0
package/dist/lib/types.js +298 -0
package/dist/lib/utils.js +314 -0
package/dist/lib/yaml/builder.js +55 -0
package/dist/lib/yaml/index.js +79 -0
package/dist/lib/yaml/player.js +459 -0
package/dist/lib/yaml/utils.js +153 -0
package/dist/lib/yaml.js +18 -0
package/dist/types/agent/agent.d.ts +220 -0
package/dist/types/agent/common.d.ts +0 -0
package/dist/types/agent/execution-session.d.ts +36 -0
package/dist/types/agent/index.d.ts +9 -0
package/dist/types/agent/task-builder.d.ts +34 -0
package/dist/types/agent/task-cache.d.ts +49 -0
package/dist/types/agent/tasks.d.ts +70 -0
package/dist/types/agent/ui-utils.d.ts +14 -0
package/dist/types/agent/utils.d.ts +25 -0
package/dist/types/ai-model/auto-glm/actions.d.ts +78 -0
package/dist/types/ai-model/auto-glm/index.d.ts +6 -0
package/dist/types/ai-model/auto-glm/parser.d.ts +18 -0
package/dist/types/ai-model/auto-glm/planning.d.ts +12 -0
package/dist/types/ai-model/auto-glm/prompt.d.ts +27 -0
package/dist/types/ai-model/auto-glm/util.d.ts +13 -0
package/dist/types/ai-model/connectivity.d.ts +20 -0
package/dist/types/ai-model/conversation-history.d.ts +105 -0
package/dist/types/ai-model/index.d.ts +16 -0
package/dist/types/ai-model/inspect.d.ts +67 -0
package/dist/types/ai-model/llm-planning.d.ts +19 -0
package/dist/types/ai-model/prompt/common.d.ts +2 -0
package/dist/types/ai-model/prompt/describe.d.ts +1 -0
package/dist/types/ai-model/prompt/extraction.d.ts +7 -0
package/dist/types/ai-model/prompt/llm-locator.d.ts +3 -0
package/dist/types/ai-model/prompt/llm-planning.d.ts +10 -0
package/dist/types/ai-model/prompt/llm-section-locator.d.ts +3 -0
package/dist/types/ai-model/prompt/order-sensitive-judge.d.ts +2 -0
package/dist/types/ai-model/prompt/playwright-generator.d.ts +26 -0
package/dist/types/ai-model/prompt/ui-tars-planning.d.ts +2 -0
package/dist/types/ai-model/prompt/util.d.ts +33 -0
package/dist/types/ai-model/prompt/yaml-generator.d.ts +102 -0
package/dist/types/ai-model/service-caller/codex-app-server.d.ts +42 -0
package/dist/types/ai-model/service-caller/image-detail.d.ts +2 -0
package/dist/types/ai-model/service-caller/index.d.ts +60 -0
package/dist/types/ai-model/service-caller/request-timeout.d.ts +32 -0
package/dist/types/ai-model/ui-tars-planning.d.ts +72 -0
package/dist/types/common.d.ts +288 -0
package/dist/types/device/device-options.d.ts +155 -0
package/dist/types/device/index.d.ts +2565 -0
package/dist/types/dump/html-utils.d.ts +75 -0
package/dist/types/dump/index.d.ts +5 -0
package/dist/types/dump/screenshot-restoration.d.ts +8 -0
package/dist/types/dump/screenshot-store.d.ts +49 -0
package/dist/types/index.d.ts +21 -0
package/dist/types/report-cli.d.ts +36 -0
package/dist/types/report-generator.d.ts +88 -0
package/dist/types/report-markdown.d.ts +24 -0
package/dist/types/report.d.ts +52 -0
package/dist/types/screenshot-item.d.ts +67 -0
package/dist/types/service/index.d.ts +24 -0
package/dist/types/service/utils.d.ts +2 -0
package/dist/types/skill/index.d.ts +25 -0
package/dist/types/task-runner.d.ts +50 -0
package/dist/types/task-timing.d.ts +8 -0
package/dist/types/tree.d.ts +4 -0
package/dist/types/types.d.ts +684 -0
package/dist/types/utils.d.ts +45 -0
package/dist/types/yaml/builder.d.ts +2 -0
package/dist/types/yaml/index.d.ts +4 -0
package/dist/types/yaml/player.d.ts +34 -0
package/dist/types/yaml/utils.d.ts +9 -0
package/dist/types/yaml.d.ts +215 -0
package/package.json +130 -0

package/dist/es/agent/tasks.mjs ADDED Viewed

@@ -0,0 +1,428 @@
+import { AIResponseParseError, ConversationHistory, autoGLMPlanning, plan, uiTarsPlanning } from "../ai-model/index.mjs";
+import { isAutoGLM, isUITars } from "../ai-model/auto-glm/util.mjs";
+import { getReadableTimeString } from "../common.mjs";
+import { TaskExecutionError } from "../task-runner.mjs";
+import { ServiceError } from "../types.mjs";
+import { getDebug } from "@godscene/shared/logger";
+import { assert } from "@godscene/shared/utils";
+import { ExecutionSession } from "./execution-session.mjs";
+import { TaskBuilder, locatePlanForLocate } from "./task-builder.mjs";
+import { setTimingFieldOnce } from "../task-timing.mjs";
+import { descriptionOfTree } from "@godscene/shared/extractor";
+import { taskTitleStr } from "./ui-utils.mjs";
+import { parsePrompt } from "./utils.mjs";
+function _define_property(obj, key, value) {
+    if (key in obj) Object.defineProperty(obj, key, {
+        value: value,
+        enumerable: true,
+        configurable: true,
+        writable: true
+    });
+    else obj[key] = value;
+    return obj;
+}
+const debug = getDebug('device-task-executor');
+const warnLog = getDebug('device-task-executor', {
+    console: true
+});
+const maxErrorCountAllowedInOnePlanningLoop = 5;
+class TaskExecutor {
+    get page() {
+        return this.interface;
+    }
+    createExecutionSession(title, options) {
+        return new ExecutionSession(title, ()=>Promise.resolve(this.service.contextRetrieverFn()), {
+            onTaskStart: this.onTaskStartCallback,
+            tasks: options?.tasks,
+            onTaskUpdate: this.hooks?.onTaskUpdate
+        });
+    }
+    getActionSpace() {
+        return this.providedActionSpace;
+    }
+    async getTimeString(format) {
+        if (this.useDeviceTime) if (this.interface.getDeviceLocalTimeString) try {
+            return await this.interface.getDeviceLocalTimeString(format);
+        } catch (error) {
+            warnLog(`Failed to get device time string, falling back to runtime time: ${error}`);
+        }
+        else warnLog('useDeviceTime is enabled but getDeviceLocalTimeString is not implemented, falling back to runtime time.');
+        return getReadableTimeString(format);
+    }
+    async convertPlanToExecutable(plans, modelConfigForPlanning, modelConfigForDefaultIntent, options) {
+        return this.taskBuilder.build(plans, modelConfigForPlanning, modelConfigForDefaultIntent, options);
+    }
+    async loadYamlFlowAsPlanning(userInstruction, yamlString) {
+        const session = this.createExecutionSession(taskTitleStr('Act', userInstruction));
+        const task = {
+            type: 'Planning',
+            subType: 'LoadYaml',
+            param: {
+                userInstruction
+            },
+            executor: async (param, executorContext)=>{
+                const { uiContext } = executorContext;
+                assert(uiContext, 'uiContext is required for Planning task');
+                return {
+                    output: {
+                        actions: [],
+                        shouldContinuePlanning: false,
+                        log: '',
+                        yamlString
+                    },
+                    cache: {
+                        hit: true
+                    },
+                    hitBy: {
+                        from: 'Cache',
+                        context: {
+                            yamlString
+                        }
+                    }
+                };
+            }
+        };
+        const runner = session.getRunner();
+        await session.appendAndRun(task);
+        return {
+            runner
+        };
+    }
+    async runPlans(title, plans, modelConfigForPlanning, modelConfigForDefaultIntent) {
+        const session = this.createExecutionSession(title);
+        const { tasks } = await this.convertPlanToExecutable(plans, modelConfigForPlanning, modelConfigForDefaultIntent);
+        const runner = session.getRunner();
+        const result = await session.appendAndRun(tasks);
+        const { output } = result ?? {};
+        return {
+            output,
+            runner
+        };
+    }
+    async action(userPrompt, modelConfigForPlanning, modelConfigForDefaultIntent, includeBboxInPlanning, aiActContext, cacheable, replanningCycleLimitOverride, imagesIncludeCount, deepThink, fileChooserAccept, deepLocate, abortSignal) {
+        return withFileChooser(this.interface, fileChooserAccept, async ()=>this.runAction(userPrompt, modelConfigForPlanning, modelConfigForDefaultIntent, includeBboxInPlanning, aiActContext, cacheable, replanningCycleLimitOverride, imagesIncludeCount, deepThink, deepLocate, abortSignal));
+    }
+    async runAction(userPrompt, modelConfigForPlanning, modelConfigForDefaultIntent, includeBboxInPlanning, aiActContext, cacheable, replanningCycleLimitOverride, imagesIncludeCount, deepThink, deepLocate, abortSignal) {
+        const conversationHistory = new ConversationHistory();
+        const session = this.createExecutionSession(taskTitleStr('Act', userPrompt));
+        const runner = session.getRunner();
+        let replanCount = 0;
+        const yamlFlow = [];
+        const replanningCycleLimit = replanningCycleLimitOverride ?? this.replanningCycleLimit;
+        assert(void 0 !== replanningCycleLimit, 'replanningCycleLimit is required for TaskExecutor.action');
+        let errorCountInOnePlanningLoop = 0;
+        let outputString;
+        while(true){
+            if (abortSignal?.aborted) return session.appendErrorPlan(`Task aborted: ${abortSignal.reason || 'abort signal received'}`);
+            const subGoalStatus = conversationHistory.subGoalsToText() || void 0;
+            const memoriesStatus = conversationHistory.memoriesToText() || void 0;
+            const result = await session.appendAndRun({
+                type: 'Planning',
+                subType: 'Plan',
+                param: {
+                    userInstruction: userPrompt,
+                    aiActContext,
+                    imagesIncludeCount,
+                    deepThink,
+                    ...subGoalStatus ? {
+                        subGoalStatus
+                    } : {},
+                    ...memoriesStatus ? {
+                        memoriesStatus
+                    } : {}
+                },
+                executor: async (param, executorContext)=>{
+                    const { uiContext } = executorContext;
+                    assert(uiContext, 'uiContext is required for Planning task');
+                    const { modelFamily } = modelConfigForPlanning;
+                    const timing = executorContext.task.timing;
+                    const actionSpace = this.getActionSpace();
+                    debug('actionSpace for this interface is:', actionSpace.map((action)=>action.name).join(', '));
+                    assert(Array.isArray(actionSpace), 'actionSpace must be an array');
+                    if (0 === actionSpace.length) console.warn(`ActionSpace for ${this.interface.interfaceType} is empty. This may lead to unexpected behavior.`);
+                    const planImpl = isUITars(modelFamily) ? uiTarsPlanning : isAutoGLM(modelFamily) ? autoGLMPlanning : plan;
+                    let planResult;
+                    try {
+                        setTimingFieldOnce(timing, 'callAiStart');
+                        planResult = await planImpl(param.userInstruction, {
+                            context: uiContext,
+                            actionContext: param.aiActContext,
+                            interfaceType: this.interface.interfaceType,
+                            actionSpace,
+                            modelConfig: modelConfigForPlanning,
+                            conversationHistory,
+                            includeBbox: includeBboxInPlanning,
+                            imagesIncludeCount,
+                            deepThink,
+                            abortSignal
+                        });
+                    } catch (planError) {
+                        if (planError instanceof AIResponseParseError) {
+                            executorContext.task.usage = planError.usage;
+                            executorContext.task.log = {
+                                ...executorContext.task.log || {},
+                                rawResponse: planError.rawResponse
+                            };
+                        }
+                        throw planError;
+                    } finally{
+                        setTimingFieldOnce(timing, 'callAiEnd');
+                    }
+                    debug('planResult', JSON.stringify(planResult, null, 2));
+                    const { actions, thought, log, memory, error, usage, rawResponse, reasoning_content, finalizeSuccess, finalizeMessage, updateSubGoals, markFinishedIndexes } = planResult;
+                    outputString = finalizeMessage;
+                    executorContext.task.log = {
+                        ...executorContext.task.log || {},
+                        rawResponse
+                    };
+                    executorContext.task.usage = usage;
+                    executorContext.task.reasoning_content = reasoning_content;
+                    executorContext.task.output = {
+                        actions: actions || [],
+                        log,
+                        thought,
+                        memory,
+                        yamlFlow: planResult.yamlFlow,
+                        output: finalizeMessage,
+                        shouldContinuePlanning: planResult.shouldContinuePlanning,
+                        updateSubGoals,
+                        markFinishedIndexes
+                    };
+                    executorContext.uiContext = uiContext;
+                    assert(!error, `Failed to continue: ${error}\n${log || ''}`);
+                    if (false === finalizeSuccess) assert(false, `Task failed: ${finalizeMessage || 'No error message provided'}\n${log || ''}`);
+                    return {
+                        cache: {
+                            hit: false
+                        }
+                    };
+                }
+            }, {
+                allowWhenError: true
+            });
+            const planResult = result?.output;
+            const plans = planResult?.actions || [];
+            yamlFlow.push(...planResult?.yamlFlow || []);
+            let executables;
+            try {
+                executables = await this.convertPlanToExecutable(plans, modelConfigForPlanning, modelConfigForDefaultIntent, {
+                    cacheable,
+                    deepLocate,
+                    abortSignal
+                });
+            } catch (error) {
+                return session.appendErrorPlan(`Error converting plans to executable tasks: ${error}, plans: ${JSON.stringify(plans)}`);
+            }
+            if (conversationHistory.pendingFeedbackMessage) console.warn('unconsumed pending feedback message detected, this may lead to unexpected planning result:', conversationHistory.pendingFeedbackMessage);
+            const initialTimeString = await this.getTimeString();
+            conversationHistory.pendingFeedbackMessage += `Current time: ${initialTimeString}`;
+            try {
+                await session.appendAndRun(executables.tasks);
+            } catch (error) {
+                errorCountInOnePlanningLoop++;
+                const timeString = await this.getTimeString();
+                conversationHistory.pendingFeedbackMessage = `Time: ${timeString}, Error executing running tasks: ${error?.message || String(error)}`;
+                debug('error when executing running tasks, but continue to run if it is not too many errors:', error instanceof Error ? error.message : String(error), 'current error count in one planning loop:', errorCountInOnePlanningLoop);
+            }
+            if (errorCountInOnePlanningLoop > maxErrorCountAllowedInOnePlanningLoop) return session.appendErrorPlan('Too many errors in one planning loop');
+            if (abortSignal?.aborted) return session.appendErrorPlan(`Task aborted: ${abortSignal.reason || 'abort signal received'}`);
+            if (!planResult?.shouldContinuePlanning) break;
+            ++replanCount;
+            if (replanCount > replanningCycleLimit) {
+                const errorMsg = `Replanned ${replanningCycleLimit} times, exceeding the limit. Please configure a larger value for replanningCycleLimit (or use MIDSCENE_REPLANNING_CYCLE_LIMIT) to handle more complex tasks.`;
+                return session.appendErrorPlan(errorMsg);
+            }
+            if (!conversationHistory.pendingFeedbackMessage) {
+                const timeString = await this.getTimeString();
+                conversationHistory.pendingFeedbackMessage = `Time: ${timeString}, I have finished the action previously planned.`;
+            }
+        }
+        return {
+            output: {
+                yamlFlow,
+                output: outputString
+            },
+            runner
+        };
+    }
+    createTypeQueryTask(type, demand, modelConfig, opt, multimodalPrompt) {
+        const queryTask = {
+            type: 'Insight',
+            subType: type,
+            param: {
+                domIncluded: opt?.domIncluded,
+                dataDemand: multimodalPrompt ? {
+                    demand,
+                    multimodalPrompt
+                } : demand
+            },
+            executor: async (param, taskContext)=>{
+                const { task } = taskContext;
+                let queryDump;
+                const applyDump = (dump)=>{
+                    queryDump = dump;
+                    task.log = {
+                        dump,
+                        rawResponse: dump.taskInfo?.rawResponse
+                    };
+                    task.usage = dump.taskInfo?.usage;
+                    if (dump.taskInfo?.reasoning_content) task.reasoning_content = dump.taskInfo.reasoning_content;
+                };
+                const uiContext = taskContext.uiContext;
+                assert(uiContext, 'uiContext is required for Query task');
+                const ifTypeRestricted = 'Query' !== type;
+                let demandInput = demand;
+                let keyOfResult = 'result';
+                if (ifTypeRestricted && ('Assert' === type || 'WaitFor' === type)) {
+                    keyOfResult = 'StatementIsTruthy';
+                    const booleanPrompt = 'Assert' === type ? `Boolean, whether the following statement is true: ${demand}` : `Boolean, the user wants to do some 'wait for' operation, please check whether the following statement is true: ${demand}`;
+                    demandInput = {
+                        [keyOfResult]: booleanPrompt
+                    };
+                } else if (ifTypeRestricted) {
+                    keyOfResult = type;
+                    demandInput = {
+                        [keyOfResult]: `${type}, ${demand}`
+                    };
+                }
+                let extractResult;
+                let extraPageDescription = '';
+                if (opt?.domIncluded && this.interface.getElementsNodeTree) {
+                    debug('appending tree info for page');
+                    const tree = await this.interface.getElementsNodeTree();
+                    extraPageDescription = await descriptionOfTree(tree, 200, false, opt?.domIncluded === 'visible-only');
+                }
+                try {
+                    extractResult = await this.service.extract(demandInput, modelConfig, opt, extraPageDescription, multimodalPrompt, uiContext);
+                } catch (error) {
+                    if (error instanceof ServiceError) applyDump(error.dump);
+                    throw error;
+                }
+                const { data, thought, dump } = extractResult;
+                applyDump(dump);
+                let outputResult = data;
+                if (ifTypeRestricted) if ('string' == typeof data) outputResult = data;
+                else if ('WaitFor' === type) outputResult = null == data ? false : data[keyOfResult];
+                else if (null == data) outputResult = null;
+                else if (data?.[keyOfResult] !== void 0) outputResult = data[keyOfResult];
+                else if (data?.result !== void 0) outputResult = data.result;
+                else assert(false, 'No result in query data');
+                if ('Assert' === type && !outputResult) {
+                    task.thought = thought;
+                    throw new Error(`Assertion failed: ${thought}`);
+                }
+                return {
+                    output: outputResult,
+                    log: queryDump,
+                    thought
+                };
+            }
+        };
+        return queryTask;
+    }
+    async createTypeQueryExecution(type, demand, modelConfig, opt, multimodalPrompt) {
+        const session = this.createExecutionSession(taskTitleStr(type, 'string' == typeof demand ? demand : JSON.stringify(demand)));
+        const queryTask = await this.createTypeQueryTask(type, demand, modelConfig, opt, multimodalPrompt);
+        const runner = session.getRunner();
+        const result = await session.appendAndRun(queryTask);
+        if (!result) throw new Error('result of taskExecutor.flush() is undefined in function createTypeQueryTask');
+        const { output, thought } = result;
+        return {
+            output,
+            thought,
+            runner
+        };
+    }
+    async waitFor(assertion, opt, modelConfig) {
+        const { textPrompt, multimodalPrompt } = parsePrompt(assertion);
+        const description = `waitFor: ${textPrompt}`;
+        const session = this.createExecutionSession(taskTitleStr('WaitFor', description));
+        const runner = session.getRunner();
+        const { timeoutMs, checkIntervalMs, domIncluded, screenshotIncluded, ...restOpt } = opt;
+        const serviceExtractOpt = {
+            domIncluded,
+            screenshotIncluded,
+            ...restOpt
+        };
+        assert(assertion, 'No assertion for waitFor');
+        assert(timeoutMs, 'No timeoutMs for waitFor');
+        assert(checkIntervalMs, 'No checkIntervalMs for waitFor');
+        assert(checkIntervalMs <= timeoutMs, `wrong config for waitFor: checkIntervalMs must be less than timeoutMs, config: {checkIntervalMs: ${checkIntervalMs}, timeoutMs: ${timeoutMs}}`);
+        const overallStartTime = Date.now();
+        let lastCheckStart = overallStartTime;
+        let errorThought = '';
+        while(lastCheckStart - overallStartTime <= timeoutMs){
+            const currentCheckStart = Date.now();
+            lastCheckStart = currentCheckStart;
+            const queryTask = await this.createTypeQueryTask('WaitFor', textPrompt, modelConfig, serviceExtractOpt, multimodalPrompt);
+            const result = await session.appendAndRun(queryTask);
+            if (result?.output) return {
+                output: void 0,
+                runner
+            };
+            errorThought = result?.thought || !result && `No result from assertion: ${textPrompt}` || `unknown error when waiting for assertion: ${textPrompt}`;
+            const now = Date.now();
+            if (now - currentCheckStart < checkIntervalMs) {
+                const elapsed = now - currentCheckStart;
+                const timeRemaining = checkIntervalMs - elapsed;
+                const thought = `Check interval is ${checkIntervalMs}ms, ${elapsed}ms elapsed since last check, sleeping for ${timeRemaining}ms`;
+                const { tasks: sleepTasks } = await this.convertPlanToExecutable([
+                    {
+                        type: 'Sleep',
+                        param: {
+                            timeMs: timeRemaining
+                        },
+                        thought
+                    }
+                ], modelConfig, modelConfig);
+                if (sleepTasks[0]) await session.appendAndRun(sleepTasks[0]);
+            }
+        }
+        return session.appendErrorPlan(`waitFor timeout: ${errorThought}`);
+    }
+    constructor(interfaceInstance, service, opts){
+        _define_property(this, "interface", void 0);
+        _define_property(this, "service", void 0);
+        _define_property(this, "taskCache", void 0);
+        _define_property(this, "providedActionSpace", void 0);
+        _define_property(this, "taskBuilder", void 0);
+        _define_property(this, "onTaskStartCallback", void 0);
+        _define_property(this, "hooks", void 0);
+        _define_property(this, "replanningCycleLimit", void 0);
+        _define_property(this, "waitAfterAction", void 0);
+        _define_property(this, "useDeviceTime", void 0);
+        this.interface = interfaceInstance;
+        this.service = service;
+        this.taskCache = opts.taskCache;
+        this.onTaskStartCallback = opts?.onTaskStart;
+        this.replanningCycleLimit = opts.replanningCycleLimit;
+        this.waitAfterAction = opts.waitAfterAction;
+        this.useDeviceTime = opts.useDeviceTime;
+        this.hooks = opts.hooks;
+        this.providedActionSpace = opts.actionSpace;
+        this.taskBuilder = new TaskBuilder({
+            interfaceInstance,
+            service,
+            taskCache: opts.taskCache,
+            actionSpace: this.getActionSpace(),
+            waitAfterAction: opts.waitAfterAction
+        });
+    }
+}
+async function withFileChooser(interfaceInstance, fileChooserAccept, action) {
+    if (!fileChooserAccept?.length) return action();
+    if (!interfaceInstance.registerFileChooserListener) throw new Error(`File upload is not supported on ${interfaceInstance.interfaceType}`);
+    const handler = async (chooser)=>{
+        await chooser.accept(fileChooserAccept);
+    };
+    const { dispose, getError } = await interfaceInstance.registerFileChooserListener(handler);
+    try {
+        const result = await action();
+        const error = getError();
+        if (error) throw error;
+        return result;
+    } finally{
+        dispose();
+    }
+}
+export { TaskExecutionError, TaskExecutor, locatePlanForLocate, withFileChooser };

package/dist/es/agent/ui-utils.mjs ADDED Viewed

@@ -0,0 +1,101 @@
+function typeStr(task) {
+    return task.subType || task.type;
+}
+function locateParamStr(locate) {
+    if (!locate) return '';
+    if ('string' == typeof locate) return locate;
+    if ('object' == typeof locate) {
+        if ('object' == typeof locate.prompt && null !== locate.prompt && locate.prompt.prompt) {
+            const prompt = locate.prompt.prompt;
+            return prompt;
+        }
+        if ('string' == typeof locate.prompt) return locate.prompt;
+        if ('string' == typeof locate.description) return locate.description;
+    }
+    return '';
+}
+function scrollParamStr(scrollParam) {
+    if (!scrollParam) return '';
+    return `${scrollParam.direction || 'down'}, ${scrollParam.scrollType || 'singleAction'}, ${scrollParam.distance || 'distance-not-set'}`;
+}
+function pullParamStr(pullParam) {
+    if (!pullParam) return '';
+    const parts = [];
+    parts.push(`direction: ${pullParam.direction || 'down'}`);
+    if (pullParam.distance) parts.push(`distance: ${pullParam.distance}`);
+    if (pullParam.duration) parts.push(`duration: ${pullParam.duration}ms`);
+    return parts.join(', ');
+}
+function extractInsightParam(taskParam) {
+    if (!taskParam) return {
+        content: ''
+    };
+    const extractImages = (source)=>source?.multimodalPrompt?.images && Array.isArray(source.multimodalPrompt.images) ? source.multimodalPrompt.images : void 0;
+    const toContent = (value)=>'string' == typeof value ? value : JSON.stringify(value);
+    if (taskParam.demand) return {
+        content: toContent(taskParam.demand),
+        images: extractImages(taskParam)
+    };
+    if (taskParam.assertion) return {
+        content: toContent(taskParam.assertion),
+        images: extractImages(taskParam)
+    };
+    if (taskParam.dataDemand) {
+        const { dataDemand } = taskParam;
+        if ('string' == typeof dataDemand) return {
+            content: dataDemand
+        };
+        if ('object' == typeof dataDemand) return {
+            content: toContent(dataDemand.demand || dataDemand),
+            images: extractImages(dataDemand)
+        };
+    }
+    return {
+        content: ''
+    };
+}
+function taskTitleStr(type, prompt) {
+    if (prompt) return `${type} - ${prompt}`;
+    return type;
+}
+function paramStr(task) {
+    let value;
+    if ('Planning' === task.type) if ('Locate' === task.subType) value = locateParamStr(task?.param);
+    else {
+        const planTask = task;
+        value = planTask.output?.log || planTask.param?.userInstruction;
+    }
+    if ('Insight' === task.type) value = extractInsightParam(task?.param).content;
+    if ('Action Space' === task.type) {
+        const locate = task?.param?.locate;
+        const locateStr = locate ? locateParamStr(locate) : '';
+        value = task.thought || '';
+        if ('number' == typeof task?.param?.timeMs) value = `${task?.param?.timeMs}ms`;
+        else if ('string' == typeof task?.param?.scrollType) value = scrollParamStr(task?.param);
+        else if ('string' == typeof task?.param?.direction && task?.subType === 'PullGesture') value = pullParamStr(task?.param);
+        else if (void 0 !== task?.param?.value) value = task?.param?.value;
+        else if (task?.param && 'object' == typeof task?.param && Object.keys(task?.param || {}).length > 0) value = task?.param;
+        if (locateStr) value = value && 'object' != typeof value ? `${locateStr} - ${value}` : locateStr;
+    }
+    if (void 0 === value) return '';
+    if ('string' == typeof value) return value;
+    if ('object' == typeof value) {
+        const locateStr = locateParamStr(value);
+        if (locateStr) return locateStr;
+        const entries = Object.entries(value);
+        if (0 === entries.length) return '';
+        const formatValue = (v)=>{
+            if ('string' == typeof v) return v;
+            if (null == v) return String(v);
+            if ('object' == typeof v) return JSON.stringify(v);
+            return String(v);
+        };
+        if (1 === entries.length) {
+            const [key, v] = entries[0];
+            return `${key}: ${formatValue(v)}`;
+        }
+        return entries.map(([key, v])=>`${key}: ${formatValue(v)}`).join(', ');
+    }
+    return String(value);
+}
+export { extractInsightParam, locateParamStr, paramStr, pullParamStr, scrollParamStr, taskTitleStr, typeStr };