npm - @midscene/core - Versions diffs - 0.30.2-beta-20251003133504.0 → 0.30.2-beta-20251009120232.0 - Mend

@midscene/core 0.30.2-beta-20251003133504.0 → 0.30.2-beta-20251009120232.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (30) hide show

package/dist/es/agent/agent.mjs +62 -12
package/dist/es/agent/agent.mjs.map +1 -1
package/dist/es/agent/task-cache.mjs +10 -4
package/dist/es/agent/task-cache.mjs.map +1 -1
package/dist/es/agent/tasks.mjs +7 -3
package/dist/es/agent/tasks.mjs.map +1 -1
package/dist/es/agent/utils.mjs +2 -11
package/dist/es/agent/utils.mjs.map +1 -1
package/dist/es/ai-model/service-caller/index.mjs +2 -5
package/dist/es/ai-model/service-caller/index.mjs.map +1 -1
package/dist/es/types.mjs.map +1 -1
package/dist/es/utils.mjs +2 -2
package/dist/lib/agent/agent.js +62 -12
package/dist/lib/agent/agent.js.map +1 -1
package/dist/lib/agent/task-cache.js +10 -4
package/dist/lib/agent/task-cache.js.map +1 -1
package/dist/lib/agent/tasks.js +7 -3
package/dist/lib/agent/tasks.js.map +1 -1
package/dist/lib/agent/utils.js +2 -11
package/dist/lib/agent/utils.js.map +1 -1
package/dist/lib/ai-model/service-caller/index.js +1 -4
package/dist/lib/ai-model/service-caller/index.js.map +1 -1
package/dist/lib/types.js.map +1 -1
package/dist/lib/utils.js +2 -2
package/dist/types/agent/agent.d.ts +14 -2
package/dist/types/agent/task-cache.d.ts +5 -1
package/dist/types/agent/tasks.d.ts +2 -2
package/dist/types/types.d.ts +1 -1
package/dist/types/yaml.d.ts +8 -0
package/package.json +3 -3

package/dist/types/agent/agent.d.ts CHANGED Viewed

@@ -29,11 +29,23 @@ export declare class Agent<InterfaceType extends AbstractInterface = AbstractInt
      * Flag to track if VL model warning has been shown
      */
     private hasWarnedNonVLModel;
+    /**
+     * Screenshot scale factor derived from actual screenshot dimensions
+     */
+    private screenshotScale?;
+    /**
+     * Internal promise to deduplicate screenshot scale computation
+     */
+    private screenshotScalePromise?;
     get page(): InterfaceType;
     /**
      * Ensures VL model warning is shown once when needed
      */
     private ensureVLModelWarning;
+    /**
+     * Lazily compute the ratio between the physical screenshot width and the logical page width
+     */
+    private getScreenshotScale;
     constructor(interfaceInstance: InterfaceType, opts?: AgentOpt);
     getActionSpace(): Promise<DeviceAction[]>;
     getUIContext(action?: InsightAction): Promise<UIContext>;
@@ -93,7 +105,7 @@ export declare class Agent<InterfaceType extends AbstractInterface = AbstractInt
     } & LocatorValidatorOption): Promise<AgentDescribeElementAtPointResult>;
     verifyLocator(prompt: string, locateOpt: LocateOption | undefined, expectCenter: [number, number], verifyLocateOption?: LocatorValidatorOption): Promise<LocateValidatorResult>;
     aiLocate(prompt: TUserPrompt, opt?: LocateOption): Promise<Pick<LocateResultElement, "center" | "rect"> & {
-        scale: number;
+        dpr?: number;
     }>;
     aiAssert(assertion: TUserPrompt, msg?: string, opt?: AgentAssertOpt & InsightExtractOption): Promise<{
         pass: boolean;
@@ -130,7 +142,7 @@ export declare class Agent<InterfaceType extends AbstractInterface = AbstractInt
     private processCacheConfig;
     /**
      * Manually flush cache to file
-     * Only meaningful in read-only mode, other modes will throw error
+     * Only supported in read-only mode where writes are deferred by default
      */
     flushCache(): Promise<void>;
 }

package/dist/types/agent/task-cache.d.ts CHANGED Viewed

@@ -30,8 +30,12 @@ export declare class TaskCache {
     isCacheResultUsed: boolean;
     cacheOriginalLength: number;
     readOnlyMode: boolean;
+    writeOnlyMode: boolean;
     private matchedCacheIndices;
-    constructor(cacheId: string, isCacheResultUsed: boolean, cacheFilePath?: string, readOnlyMode?: boolean);
+    constructor(cacheId: string, isCacheResultUsed: boolean, cacheFilePath?: string, options?: {
+        readOnly?: boolean;
+        writeOnly?: boolean;
+    });
     matchCache(prompt: TUserPrompt, type: 'plan' | 'locate'): MatchCacheResult<PlanningCache | LocateCache> | undefined;
     matchPlanCache(prompt: string): MatchCacheResult<PlanningCache> | undefined;
     matchLocateCache(prompt: TUserPrompt): MatchCacheResult<LocateCache> | undefined;

package/dist/types/agent/tasks.d.ts CHANGED Viewed

@@ -23,7 +23,7 @@ export declare class TaskExecutor {
     });
     private recordScreenshot;
     private prependExecutorWithScreenshot;
-    convertPlanToExecutable(plans: PlanningAction[], modelConfig: IModelConfig): Promise<{
+    convertPlanToExecutable(plans: PlanningAction[], modelConfig: IModelConfig, cacheable?: boolean): Promise<{
         tasks: ExecutionTaskApply<any, any, any, any>[];
     }>;
     private setupPlanningContext;
@@ -33,7 +33,7 @@ export declare class TaskExecutor {
     private createPlanningTask;
     runPlans(title: string, plans: PlanningAction[], modelConfig: IModelConfig): Promise<ExecutionResult>;
     private getReplanningCycleLimit;
-    action(userPrompt: string, modelConfig: IModelConfig, actionContext?: string): Promise<ExecutionResult<{
+    action(userPrompt: string, modelConfig: IModelConfig, actionContext?: string, cacheable?: boolean): Promise<ExecutionResult<{
         yamlFlow?: MidsceneYamlFlowItem[];
     } | undefined>>;
     private createTypeQueryTask;

package/dist/types/types.d.ts CHANGED Viewed

@@ -382,7 +382,7 @@ export type WebUIContext = UIContext<WebElementInfo>;
  * Agent
  */
 export type CacheConfig = {
-    strategy?: 'read-only' | 'read-write';
+    strategy?: 'read-only' | 'read-write' | 'write-only';
     id: string;
 };
 export type Cache = false | true | CacheConfig;

package/dist/types/yaml.d.ts CHANGED Viewed

@@ -168,4 +168,12 @@ export interface MidsceneYamlConfigResult {
     report?: string | null;
     error?: string;
     duration?: number;
+    /**
+     * Type of result:
+     * - 'success': All tasks completed successfully
+     * - 'failed': Execution failed (player error)
+     * - 'partialFailed': Some tasks failed but execution continued (continueOnError)
+     * - 'notExecuted': Not executed due to previous failures
+     */
+    resultType?: 'success' | 'failed' | 'partialFailed' | 'notExecuted';
 }

package/package.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "name": "@midscene/core",
   "description": "Automate browser actions, extract data, and perform assertions using AI. It offers JavaScript SDK, Chrome extension, and support for scripting in YAML. See https://midscenejs.com/ for details.",
-  "version": "0.30.2-beta-20251003133504.0",
+  "version": "0.30.2-beta-20251009120232.0",
   "repository": "https://github.com/web-infra-dev/midscene",
   "homepage": "https://midscenejs.com/",
   "main": "./dist/lib/index.js",
@@ -87,8 +87,8 @@
     "zod": "3.24.3",
     "semver": "7.5.2",
     "js-yaml": "4.1.0",
-    "@midscene/recorder": "0.30.2-beta-20251003133504.0",
-    "@midscene/shared": "0.30.2-beta-20251003133504.0"
+    "@midscene/recorder": "0.30.2-beta-20251009120232.0",
+    "@midscene/shared": "0.30.2-beta-20251009120232.0"
   },
   "devDependencies": {
     "@rslib/core": "^0.11.2",