npm - @midscene/core - Versions diffs - 1.2.1-beta-20260113073450.0 → 1.2.1-beta-20260115021413.0 - Mend

@midscene/core 1.2.1-beta-20260113073450.0 → 1.2.1-beta-20260115021413.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (44) hide show

package/dist/es/agent/agent.mjs +14 -13
package/dist/es/agent/agent.mjs.map +1 -1
package/dist/es/agent/tasks.mjs +29 -15
package/dist/es/agent/tasks.mjs.map +1 -1
package/dist/es/agent/utils.mjs +1 -1
package/dist/es/ai-model/llm-planning.mjs +3 -12
package/dist/es/ai-model/llm-planning.mjs.map +1 -1
package/dist/es/ai-model/prompt/llm-planning.mjs +8 -40
package/dist/es/ai-model/prompt/llm-planning.mjs.map +1 -1
package/dist/es/ai-model/service-caller/index.mjs +8 -0
package/dist/es/ai-model/service-caller/index.mjs.map +1 -1
package/dist/es/ai-model/ui-tars-planning.mjs +1 -1
package/dist/es/ai-model/ui-tars-planning.mjs.map +1 -1
package/dist/es/common.mjs +8 -16
package/dist/es/common.mjs.map +1 -1
package/dist/es/device/index.mjs +3 -28
package/dist/es/device/index.mjs.map +1 -1
package/dist/es/types.mjs.map +1 -1
package/dist/es/utils.mjs +2 -2
package/dist/lib/agent/agent.js +13 -12
package/dist/lib/agent/agent.js.map +1 -1
package/dist/lib/agent/tasks.js +29 -15
package/dist/lib/agent/tasks.js.map +1 -1
package/dist/lib/agent/utils.js +1 -1
package/dist/lib/ai-model/llm-planning.js +2 -11
package/dist/lib/ai-model/llm-planning.js.map +1 -1
package/dist/lib/ai-model/prompt/llm-planning.js +8 -40
package/dist/lib/ai-model/prompt/llm-planning.js.map +1 -1
package/dist/lib/ai-model/service-caller/index.js +8 -0
package/dist/lib/ai-model/service-caller/index.js.map +1 -1
package/dist/lib/ai-model/ui-tars-planning.js +1 -1
package/dist/lib/ai-model/ui-tars-planning.js.map +1 -1
package/dist/lib/common.js +7 -21
package/dist/lib/common.js.map +1 -1
package/dist/lib/device/index.js +15 -52
package/dist/lib/device/index.js.map +1 -1
package/dist/lib/types.js.map +1 -1
package/dist/lib/utils.js +2 -2
package/dist/types/agent/agent.d.ts +15 -4
package/dist/types/agent/tasks.d.ts +4 -4
package/dist/types/common.d.ts +1 -8
package/dist/types/device/index.d.ts +0 -22
package/dist/types/types.d.ts +2 -2
package/package.json +2 -2

package/dist/types/agent/agent.d.ts CHANGED Viewed

@@ -47,7 +47,6 @@ export declare class Agent<InterfaceType extends AbstractInterface = AbstractInt
      */
     private screenshotScalePromise?;
     private executionDumpIndexByRunner;
-    private fullActionSpace;
     get page(): InterfaceType;
     /**
      * Ensures VL model warning is shown once when needed
@@ -108,11 +107,19 @@ export declare class Agent<InterfaceType extends AbstractInterface = AbstractInt
      * @deprecated Use aiScroll(locatePrompt, opt) instead where opt contains the scroll parameters
      */
     aiScroll(scrollParam: ScrollParam, locatePrompt?: TUserPrompt, opt?: LocateOption): Promise<any>;
-    aiAct(taskPrompt: string, opt?: AiActOptions): Promise<string | undefined>;
+    aiAct(taskPrompt: string, opt?: AiActOptions): Promise<{
+        result: Record<string, any>;
+    } | {
+        yamlFlow?: import("../yaml").MidsceneYamlFlowItem[];
+    } | undefined>;
     /**
      * @deprecated Use {@link Agent.aiAct} instead.
      */
-    aiAction(taskPrompt: string, opt?: AiActOptions): Promise<string | undefined>;
+    aiAction(taskPrompt: string, opt?: AiActOptions): Promise<{
+        result: Record<string, any>;
+    } | {
+        yamlFlow?: import("../yaml").MidsceneYamlFlowItem[];
+    } | undefined>;
     aiQuery<ReturnType = any>(demand: ServiceExtractParam, opt?: ServiceExtractOption): Promise<ReturnType>;
     aiBoolean(prompt: TUserPrompt, opt?: ServiceExtractOption): Promise<boolean>;
     aiNumber(prompt: TUserPrompt, opt?: ServiceExtractOption): Promise<number>;
@@ -133,7 +140,11 @@ export declare class Agent<InterfaceType extends AbstractInterface = AbstractInt
         message: string | undefined;
     } | undefined>;
     aiWaitFor(assertion: TUserPrompt, opt?: AgentWaitForOpt): Promise<void>;
-    ai(...args: Parameters<typeof this.aiAct>): Promise<string | undefined>;
+    ai(...args: Parameters<typeof this.aiAct>): Promise<{
+        result: Record<string, any>;
+    } | {
+        yamlFlow?: import("../yaml").MidsceneYamlFlowItem[];
+    } | undefined>;
     runYaml(yamlScriptContent: string): Promise<{
         result: Record<string, any>;
     }>;

package/dist/types/agent/tasks.d.ts CHANGED Viewed

@@ -1,9 +1,9 @@
-import { type TMultimodalPrompt, type TUserPrompt } from '../common';
+import type { TMultimodalPrompt, TUserPrompt } from '../common';
 import type { AbstractInterface } from '../device';
 import type Service from '../service';
 import type { TaskRunner } from '../task-runner';
 import { TaskExecutionError } from '../task-runner';
-import type { DeepThinkOption, DeviceAction, ExecutionTaskApply, ExecutionTaskProgressOptions, MidsceneYamlFlowItem, PlanningAction, PlanningActionParamWaitFor, ServiceExtractOption, ServiceExtractParam } from '../types';
+import type { DeepThinkOption, DeviceAction, ExecutionTaskApply, ExecutionTaskProgressOptions, MidsceneYamlFlowItem, PlanningAction, PlanningActionParamSleep, PlanningActionParamWaitFor, ServiceExtractOption, ServiceExtractParam } from '../types';
 import type { IModelConfig } from '@midscene/shared/env';
 import type { TaskCache } from './task-cache';
 export { locatePlanForLocate } from './task-builder';
@@ -48,12 +48,12 @@ export declare class TaskExecutor {
     runPlans(title: string, plans: PlanningAction[], modelConfigForPlanning: IModelConfig, modelConfigForDefaultIntent: IModelConfig): Promise<ExecutionResult>;
     action(userPrompt: string, modelConfigForPlanning: IModelConfig, modelConfigForDefaultIntent: IModelConfig, includeBboxInPlanning: boolean, aiActContext?: string, cacheable?: boolean, replanningCycleLimitOverride?: number, imagesIncludeCount?: number, deepThink?: DeepThinkOption, fileChooserAccept?: string[]): Promise<ExecutionResult<{
         yamlFlow?: MidsceneYamlFlowItem[];
-        output?: string;
     } | undefined>>;
     private runAction;
     private createTypeQueryTask;
     createTypeQueryExecution<T>(type: 'Query' | 'Boolean' | 'Number' | 'String' | 'Assert', demand: ServiceExtractParam, modelConfig: IModelConfig, opt?: ServiceExtractOption, multimodalPrompt?: TMultimodalPrompt): Promise<ExecutionResult<T>>;
-    taskForSleep(timeMs: number, _modelConfig: IModelConfig): Promise<import("../types").ExecutionTaskActionApply<import("../types").PlanningActionParamSleep>>;
+    private sleepPlan;
+    taskForSleep(timeMs: number, _modelConfig: IModelConfig): Promise<import("../types").ExecutionTaskActionApply<PlanningActionParamSleep>>;
     waitFor(assertion: TUserPrompt, opt: PlanningActionParamWaitFor, modelConfig: IModelConfig): Promise<ExecutionResult<void>>;
 }
 export declare function withFileChooser<T>(interfaceInstance: AbstractInterface, fileChooserAccept: string[] | undefined, action: () => Promise<T>): Promise<T>;

package/dist/types/common.d.ts CHANGED Viewed

@@ -20,7 +20,7 @@ export declare function mergeRects(rects: Rect[]): {
 };
 export declare function expandSearchArea(rect: Rect, screenSize: Size, vlMode: TVlModeTypes | undefined): Rect;
 export declare function markupImageForLLM(screenshotBase64: string, tree: ElementTreeNode<BaseElement>, size: Size): Promise<string>;
-export declare function buildYamlFlowFromPlans(plans: PlanningAction[], actionSpace: DeviceAction<any>[]): MidsceneYamlFlowItem[];
+export declare function buildYamlFlowFromPlans(plans: PlanningAction[], actionSpace: DeviceAction<any>[], sleep?: number): MidsceneYamlFlowItem[];
 export declare const PointSchema: z.ZodObject<{
     left: z.ZodNumber;
     top: z.ZodNumber;
@@ -558,11 +558,4 @@ export declare const loadActionParam: (jsonObject: Record<string, any>, zodSchem
  * so they are intentionally excluded from Zod parsing and use existing validation logic.
  */
 export declare const parseActionParam: (rawParam: Record<string, any> | undefined, zodSchema?: z.ZodType<any>) => Record<string, any> | undefined;
-export declare const finalizeActionName = "Finalize";
-/**
- * Get a readable time string for the current time
- * @param format - Optional format string. Supports: YYYY, MM, DD, HH, mm, ss. Default: 'YYYY-MM-DD HH:mm:ss'
- * @returns A formatted time string with format label
- */
-export declare const getReadableTimeString: (format?: string) => string;
 export {};

package/dist/types/device/index.d.ts CHANGED Viewed

@@ -2177,27 +2177,5 @@ export type ActionAssertParam = {
     result: boolean;
 };
 export declare const defineActionAssert: () => DeviceAction<ActionAssertParam>;
-export declare const ActionSleepParamSchema: z.ZodObject<{
-    millisecond: z.ZodOptional<z.ZodDefault<z.ZodNumber>>;
-}, "strip", z.ZodTypeAny, {
-    millisecond?: number | undefined;
-}, {
-    millisecond?: number | undefined;
-}>;
-export type ActionSleepParam = {
-    millisecond?: number;
-};
-export declare const defineActionSleep: () => DeviceAction<ActionSleepParam>;
-export declare const actionFinalizeParamSchema: z.ZodObject<{
-    message: z.ZodOptional<z.ZodString>;
-}, "strip", z.ZodTypeAny, {
-    message?: string | undefined;
-}, {
-    message?: string | undefined;
-}>;
-export type ActionFinalizeParam = {
-    message?: string;
-};
-export declare const defineActionFinalize: () => DeviceAction<ActionFinalizeParam>;
 export type { DeviceAction } from '../types';
 export type { AndroidDeviceOpt, AndroidDeviceInputOpt, IOSDeviceOpt, IOSDeviceInputOpt, } from './device-options';

package/dist/types/types.d.ts CHANGED Viewed

@@ -176,8 +176,9 @@ export interface PlanningAction<ParamType = any> {
 }
 export interface RawResponsePlanningAIResponse {
     action: PlanningAction;
+    more_actions_needed_by_instruction: boolean;
     log: string;
-    note?: string;
+    sleep?: number;
     error?: string;
 }
 export interface PlanningAIResponse extends Omit<RawResponsePlanningAIResponse, 'action'> {
@@ -188,7 +189,6 @@ export interface PlanningAIResponse extends Omit<RawResponsePlanningAIResponse,
     yamlString?: string;
     error?: string;
     reasoning_content?: string;
-    shouldContinuePlanning: boolean;
 }
 export interface PlanningActionParamSleep {
     timeMs: number;

package/package.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "name": "@midscene/core",
   "description": "Automate browser actions, extract data, and perform assertions using AI. It offers JavaScript SDK, Chrome extension, and support for scripting in YAML. See https://midscenejs.com/ for details.",
-  "version": "1.2.1-beta-20260113073450.0",
+  "version": "1.2.1-beta-20260115021413.0",
   "repository": "https://github.com/web-infra-dev/midscene",
   "homepage": "https://midscenejs.com/",
   "main": "./dist/lib/index.js",
@@ -89,7 +89,7 @@
     "semver": "7.5.2",
     "undici": "^6.0.0",
     "zod": "3.24.3",
-    "@midscene/shared": "1.2.1-beta-20260113073450.0"
+    "@midscene/shared": "1.2.1-beta-20260115021413.0"
   },
   "devDependencies": {
     "@rslib/core": "^0.18.3",