npm - ms-types - Versions diffs - 0.9.1 → 0.9.3 - Mend

ms-types 0.9.1 → 0.9.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (15) hide show

package/package.json +2 -2
package/types/appleocr.d.ts +72 -0
package/types/global.d.ts +19 -0
package/types/index.d.ts +1 -0
package/types/node.d.ts +4 -0
package/types/paddleocr.d.ts +64 -16
package/types/yolo.d.ts +36 -6
package/types/yoloCls.d.ts +103 -0
package/types/zh/PaddleOCR/346/250/241/345/235/227.d.ts +65 -17
package/types/zh/YOLO/345/210/206/347/261/273/346/250/241/345/235/227.d.ts +102 -0
package/types/zh/YOLO/346/250/241/345/235/227.d.ts +36 -6
package/types/zh/index.d.ts +1 -0
package/types/zh//345/205/250/345/261/200/346/250/241/345/235/227.d.ts +19 -0
package/types/zh//350/212/202/347/202/271/346/250/241/345/235/227.d.ts +4 -0
package/types/zh//350/213/271/346/236/234OCR.d.ts +72 -0

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "ms-types",
-  "version": "0.9.1",
+  "version": "0.9.3",
   "type": "module",
   "license": "MIT",
   "publishConfig": {
@@ -18,6 +18,6 @@
   "devDependencies": {
     "vitepress": "^1.6.4",
     "vitepress-theme-teek": "^1.6.0",
-    "wrangler": "^4.92.0"
+    "wrangler": "^4.100.0"
   }
 }

package/types/appleocr.d.ts CHANGED Viewed

@@ -52,6 +52,30 @@ declare namespace appleOcr {
     languages?: string[]
   ): OCRResult[];
+  /**
+   * 执行 OCR 识别，并将结果坐标映射为原图/全屏绝对坐标。
+   * @param input 输入源（imageId、URL字符串、文件路径或"screen"，"screen"表示使用当前屏幕）
+   * @param x 边界框左上角x坐标 默认 0
+   * @param y 边界框左上角y坐标 默认 0
+   * @param ex 边界框右下角x坐标 默认 0
+   * @param ey 边界框右下角y坐标 默认 0
+   * @param languages 识别语言数组，默认为["zh-Hans", "en-US"]
+   * @returns 识别结果数组，坐标为原图/全屏绝对坐标
+   * @example
+   * const results = appleOcr.recognizeAbs("screen", 100, 100, 500, 300)
+   * if (results.length > 0) {
+   *   action.click(results[0].centerX, results[0].centerY)
+   * }
+   */
+  function recognizeAbs(
+    input: string,
+    x?: number,
+    y?: number,
+    ex?: number,
+    ey?: number,
+    languages?: string[]
+  ): OCRResult[];
   /**
    * 执行OCR识别（仅识别数字）0-9.,+-
    * @param input 输入源（imageId、URL字符串、文件路径或"screen"，"screen"表示使用当前屏幕）
@@ -74,6 +98,28 @@ declare namespace appleOcr {
     ey?: number
   ): OCRResult[];
+  /**
+   * 执行数字 OCR 识别，并将结果坐标映射为原图/全屏绝对坐标。
+   * @param input 输入源（imageId、URL字符串、文件路径或"screen"，"screen"表示使用当前屏幕）
+   * @param x 边界框左上角x坐标
+   * @param y 边界框左上角y坐标
+   * @param ex 边界框右下角x坐标
+   * @param ey 边界框右下角y坐标
+   * @returns 识别结果数组，坐标为原图/全屏绝对坐标
+   * @example
+   * const results = appleOcr.recognizeNumbersAbs("screen", 100, 100, 500, 300)
+   * if (results.length > 0) {
+   *   action.click(results[0].centerX, results[0].centerY)
+   * }
+   */
+  function recognizeNumbersAbs(
+    input: string,
+    x?: number,
+    y?: number,
+    ex?: number,
+    ey?: number
+  ): OCRResult[];
   /**
    * 执行OCR识别（查找指定文本）
    * @param input 输入源（imageId、URL字符串、文件路径或"screen"，"screen"表示使用当前屏幕）
@@ -99,4 +145,30 @@ declare namespace appleOcr {
     ey?: number,
     languages?: string[]
   ): OCRResult[];
+  /**
+   * 查找指定文本，并将结果坐标映射为原图/全屏绝对坐标。
+   * @param input 输入源（imageId、URL字符串、文件路径或"screen"，"screen"表示使用当前屏幕）
+   * @param texts 要查找的文本数组
+   * @param x 边界框左上角x坐标
+   * @param y 边界框左上角y坐标
+   * @param ex 边界框右下角x坐标
+   * @param ey 边界框右下角y坐标
+   * @param languages 识别语言数组，默认为["zh-Hans", "en-US"]
+   * @returns 识别结果数组，坐标为原图/全屏绝对坐标
+   * @example
+   * const results = appleOcr.findTextAbs("screen", ["确定"], 100, 100, 500, 400)
+   * if (results.length > 0) {
+   *   action.click(results[0].centerX, results[0].centerY)
+   * }
+   */
+  function findTextAbs(
+    input: string,
+    texts: string[],
+    x?: number,
+    y?: number,
+    ex?: number,
+    ey?: number,
+    languages?: string[]
+  ): OCRResult[];
 }

package/types/global.d.ts CHANGED Viewed

@@ -179,6 +179,25 @@ declare function setCpuAutoThrottle(enabled: boolean): boolean;
  */
 declare function getCpuAutoThrottle(): boolean;
+/**
+ * 设置 CPU 限流单次 sleep 延迟范围（毫秒）
+ * @param minMs 最低延迟，默认 3
+ * @param maxMs 最高延迟，默认 30；小于 minMs 时自动对齐
+ * @returns 实际生效的延迟范围
+ * @description 仅在 CPU 自动限流开启且触发限流时生效
+ * @example
+ * const delay = setCpuThrottleDelay(3, 30);
+ */
+declare function setCpuThrottleDelay(minMs: number, maxMs: number): { minMs: number; maxMs: number };
+/**
+ * 获取 CPU 限流延迟范围（毫秒）
+ * @returns 当前最低与最高延迟
+ * @example
+ * const delay = getCpuThrottleDelay();
+ */
+declare function getCpuThrottleDelay(): { minMs: number; maxMs: number };
 /**
  * 打印调试日志 - 输出调试级别的日志
  * 用于详细的程序执行信息、变量值和状态信息、函数调用跟踪

package/types/index.d.ts CHANGED Viewed

@@ -24,4 +24,5 @@
 /// <reference path="ui.d.ts" />
 /// <reference path="utils.d.ts" />
 /// <reference path="yolo.d.ts" />
+/// <reference path="yoloCls.d.ts" />
 /// <reference path="zh/index.d.ts" />

package/types/node.d.ts CHANGED Viewed

@@ -6,6 +6,10 @@ declare function createNodeSelector(params?: {
    * 代表要获取节点的层级，越少速度越快，默认 50
    */
   maxDepth?: number;
+  /**
+   * 抓取模式：模式 1、模式 2，默认模式 1
+   */
+  mode?: number;
 }): NodeSelector;
 declare interface NodeBoundsInfo {

package/types/paddleocr.d.ts CHANGED Viewed

@@ -36,7 +36,7 @@ declare namespace paddleOcr {
    * 初始化PP-OCRv5模型
    * @param maxSideLen 最大边长，默认640，可不传
    * @param useGpu 是否使用GPU，默认false，可不传
-   * @returns 初始化是否成功
+   * @returns 初始化成功或模型已加载返回true
    * @example
    * const loaded = paddleOcr.loadV5(640, true)
    * if (loaded) {
@@ -47,16 +47,16 @@ declare namespace paddleOcr {
   /**
    * 执行OCR识别
    * @param input 输入源（imageId、URL字符串、文件路径或"screen"，"screen"表示使用当前屏幕）
-   * @param x 边界框左上角x坐标 全屏传0，默认0
-   * @param y 边界框左上角y坐标 全屏传0，默认0
-   * @param ex 边界框右下角x坐标 全屏传0，默认0
-   * @param ey 边界框右下角y坐标 全屏传0，默认0
-   * @param confidenceThreshold 置信度阈值，默认0.6
-   * @returns 识别结果数组
+   * @param x 裁剪区域左上角 x 坐标，全屏传 0，默认 0
+   * @param y 裁剪区域左上角 y 坐标，全屏传 0，默认 0
+   * @param ex 裁剪区域右下角 x 坐标，全屏传 0，默认 0
+   * @param ey 裁剪区域右下角 y 坐标，全屏传 0，默认 0
+   * @param confidenceThreshold 置信度阈值，默认 0.6
+   * @returns 识别结果数组，坐标相对于裁剪区域
    * @example
-   * const results = paddleOcr.recognize("screen", 0, 0, 100, 100)
+   * const results = paddleOcr.recognize("screen", 100, 100, 500, 300)
    * if (results.length > 0) {
-   *   logi("识别到文本")
+   *   logi(`区域坐标: ${results[0].centerX}, ${results[0].centerY}`)
    * }
    */
   function recognize(
@@ -67,18 +67,41 @@ declare namespace paddleOcr {
     ey?: number,
     confidenceThreshold?: number,
   ): OCRResult[];
+  /**
+   * 执行 OCR 识别，并将结果坐标映射为原图/全屏绝对坐标
+   * @param input 输入源（imageId、URL字符串、文件路径或"screen"，"screen"表示使用当前屏幕）
+   * @param x 裁剪区域左上角 x 坐标，全屏传 0，默认 0
+   * @param y 裁剪区域左上角 y 坐标，全屏传 0，默认 0
+   * @param ex 裁剪区域右下角 x 坐标，全屏传 0，默认 0
+   * @param ey 裁剪区域右下角 y 坐标，全屏传 0，默认 0
+   * @param confidenceThreshold 置信度阈值，默认 0.6
+   * @returns 识别结果数组，坐标为原图/全屏绝对坐标
+   * @example
+   * const results = paddleOcr.recognizeAbs("screen", 100, 100, 500, 300)
+   * if (results.length > 0) {
+   *   action.click(results[0].centerX, results[0].centerY)
+   * }
+   */
+  function recognizeAbs(
+    input: string,
+    x?: number,
+    y?: number,
+    ex?: number,
+    ey?: number,
+    confidenceThreshold?: number,
+  ): OCRResult[];
   /**
    * 查找目标文本并返回对应子串坐标
    * @param input 输入源（imageId、URL字符串、文件路径或"screen"，"screen"表示使用当前屏幕）
    * @param targetTexts 目标文本数组，例如 ["你好", "确定"]
-   * @param x 边界框左上角x坐标 全屏传0，默认0
-   * @param y 边界框左上角y坐标 全屏传0，默认0
-   * @param ex 边界框右下角x坐标 全屏传0，默认0
-   * @param ey 边界框右下角y坐标 全屏传0，默认0
-   * @param confidenceThreshold 置信度阈值，默认0.6
-   * @returns 匹配到的子串结果数组（text 为目标文本）
+   * @param x 裁剪区域左上角 x 坐标，全屏传 0，默认 0
+   * @param y 裁剪区域左上角 y 坐标，全屏传 0，默认 0
+   * @param ex 裁剪区域右下角 x 坐标，全屏传 0，默认 0
+   * @param ey 裁剪区域右下角 y 坐标，全屏传 0，默认 0
+   * @param confidenceThreshold 置信度阈值，默认 0.6
+   * @returns 匹配到的子串结果数组，坐标相对于裁剪区域
    * @example
-   * const results = paddleOcr.findText("screen", ["你好"], 0, 0, 0, 0, 0.6)
+   * const results = paddleOcr.findText("screen", ["确定"], 100, 100, 500, 300, 0.6)
    * if (results.length > 0) {
    *   logi(`命中: ${results[0].text}`)
    * }
@@ -92,6 +115,31 @@ declare namespace paddleOcr {
     ey?: number,
     confidenceThreshold?: number,
   ): OCRResult[];
+  /**
+   * 查找目标文本并返回对应子串的原图/全屏绝对坐标
+   * @param input 输入源（imageId、URL字符串、文件路径或"screen"，"screen"表示使用当前屏幕）
+   * @param targetTexts 目标文本数组，例如 ["你好", "确定"]
+   * @param x 裁剪区域左上角 x 坐标，全屏传 0，默认 0
+   * @param y 裁剪区域左上角 y 坐标，全屏传 0，默认 0
+   * @param ex 裁剪区域右下角 x 坐标，全屏传 0，默认 0
+   * @param ey 裁剪区域右下角 y 坐标，全屏传 0，默认 0
+   * @param confidenceThreshold 置信度阈值，默认 0.6
+   * @returns 匹配到的子串结果数组，坐标为原图/全屏绝对坐标
+   * @example
+   * const results = paddleOcr.findTextAbs("screen", ["确定"], 100, 100, 500, 300, 0.6)
+   * if (results.length > 0) {
+   *   action.click(results[0].centerX, results[0].centerY)
+   * }
+   */
+  function findTextAbs(
+    input: string,
+    targetTexts: string[],
+    x?: number,
+    y?: number,
+    ex?: number,
+    ey?: number,
+    confidenceThreshold?: number,
+  ): OCRResult[];
   /**
    * 释放OCR模型资源
    */

package/types/yolo.d.ts CHANGED Viewed

@@ -51,17 +51,17 @@ declare namespace yolo {
    * 加载YOLO模型
    * @param paramPath ncnn模型的param文件的绝对路径
    * @param binPath ncnn模型的bin文件绝对路径
-   * @param nc 模型的标签数量,可在标签集data.yaml中看到
+   * @param nc 模型的标签数量；传 0 或省略时根据模型输出自动推断，显式传入但不匹配时检测返回空数组
    * @param version 模型版本，默认11, 支持 8 11 26
    * @param useGpu 是否使用 GPU 加载
    * @returns 加载成功返回模型ID字符串，失败返回null
    * @example
-   * const modelId = yolo.load("yolov8n.param", "yolov8n.bin", 80)
+   * const modelId = yolo.load("yolov8n.param", "yolov8n.bin", 0)
    */
   function load(
     paramPath: string,
     binPath: string,
-    nc: number,
+    nc?: number,
     version?: number,
     useGpu?: boolean,
   ): string | null;
@@ -69,16 +69,16 @@ declare namespace yolo {
    * 加载YOLOv11模型 （兼容 yolov8 模型）
    * @param paramPath ncnn模型的param文件的绝对路径
    * @param binPath ncnn模型的bin文件绝对路径
-   * @param nc 模型的标签数量,可在标签集data.yaml中看到
+   * @param nc 模型的标签数量；传 0 或省略时根据模型输出自动推断，显式传入但不匹配时检测返回空数组
    * @param useGpu 是否使用 GPU 加载
    * @returns 加载成功返回模型ID字符串，失败返回null
    * @example
-   * const modelId = yolo.loadV11("yolov11n.param", "yolov11n.bin", 80)
+   * const modelId = yolo.loadV11("yolov11n.param", "yolov11n.bin", 0)
    */
   function loadV11(
     paramPath: string,
     binPath: string,
-    nc: number,
+    nc?: number,
     useGpu?: boolean,
   ): string | null;
@@ -101,6 +101,36 @@ declare namespace yolo {
     nmsThreshold?: number,
   ): YoloResult[];
+  /**
+   * 对指定区域执行目标检测，并将结果坐标映射为原图/全屏绝对坐标
+   * @param modelId 模型ID
+   * @param img 图像ID，"screen"用当前屏幕检测，可以填入图像ID或者http图片地址或文件地址
+   * @param x 裁剪区域左上角 x 坐标，默认 0
+   * @param y 裁剪区域左上角 y 坐标，默认 0
+   * @param ex 裁剪区域右下角 x 坐标，默认 0
+   * @param ey 裁剪区域右下角 y 坐标，默认 0
+   * @param targetSize 图像进入后缩放的检测大小，模型训练一般都用640，因此这里的640一般不要改
+   * @param threshold 置信度，默认0.4，小于这个值的会被过滤掉
+   * @param nmsThreshold 重叠阈值，一般是0.5不需要更改
+   * @returns 检测结果数组，坐标为原图/全屏绝对坐标
+   * @example
+   * const results = yolo.detectAbs(modelId, "screen", 100, 100, 500, 400, 640, 0.4, 0.5)
+   * if (results.length > 0) {
+   *   action.click(results[0].centerX, results[0].centerY)
+   * }
+   */
+  function detectAbs(
+    modelId: string,
+    img: string,
+    x?: number,
+    y?: number,
+    ex?: number,
+    ey?: number,
+    targetSize?: number,
+    threshold?: number,
+    nmsThreshold?: number,
+  ): YoloResult[];
   /**
    * 释放指定模型资源
    * @param modelId 模型ID

package/types/yoloCls.d.ts ADDED Viewed

@@ -0,0 +1,103 @@
+/**
+ * YOLO 图像分类模块，提供 NCNN YOLO-cls 分类模型加载、分类和资源释放能力
+ */
+declare namespace yoloCls {
+  /**
+   * Ultralytics Probs 风格分类概率结果
+   */
+  interface YoloClsProbs {
+    /**
+     * 所有类别的概率数组，下标即类别 ID
+     */
+    data: number[];
+    /**
+     * 概率最高的类别 ID；分类失败时为 null
+     */
+    top1: number | null;
+    /**
+     * 概率最高的 5 个类别 ID，按概率从高到低排序
+     */
+    top5: number[];
+    /**
+     * top1 对应的概率；分类失败时为 null
+     */
+    top1conf: number | null;
+    /**
+     * top5 对应的概率，顺序与 top5 一致
+     */
+    top5conf: number[];
+  }
+  /**
+   * 加载 YOLO 分类模型
+   * @param paramPath ncnn 模型 param 文件路径
+   * @param binPath ncnn 模型 bin 文件路径
+   * @param nc 模型类别数量，传 0 或省略时按模型输出自动推断，显式传入但不匹配时分类返回空结果
+   * @param useGpu 是否使用 GPU 加载
+   * @returns 加载成功返回模型 ID 字符串，失败返回 null
+   * @example
+   * const modelId = yoloCls.load("yolo11n_cls.ncnn.param", "yolo11n_cls.ncnn.bin", 1000, false)
+   */
+  function load(
+    paramPath: string,
+    binPath: string,
+    nc?: number,
+    useGpu?: boolean,
+  ): string | null;
+  /**
+   * 图像分类
+   * @param modelId 模型 ID
+   * @param img 图像 ID，"screen" 使用当前屏幕，也可以填入图像 ID、HTTP 图片地址或文件路径
+   * @param targetSize 分类输入大小，默认 224
+   * @returns Ultralytics Probs 风格分类概率结果
+   * @example
+   * const result = yoloCls.classify(modelId, "screen", 224)
+   * if (result.top1 !== null) {
+   *   logi(`${result.top1}: ${result.top1conf}`)
+   * }
+   */
+  function classify(
+    modelId: string,
+    img: string,
+    targetSize?: number,
+  ): YoloClsProbs;
+  /**
+   * 对指定区域执行图像分类
+   * @param modelId 模型 ID
+   * @param img 图像 ID，"screen" 使用当前屏幕，也可以填入图像 ID、HTTP 图片地址或文件路径
+   * @param x 裁剪区域左上角 x 坐标，默认 0
+   * @param y 裁剪区域左上角 y 坐标，默认 0
+   * @param ex 裁剪区域右下角 x 坐标，默认 0
+   * @param ey 裁剪区域右下角 y 坐标，默认 0
+   * @param targetSize 分类输入大小，默认 224
+   * @returns Ultralytics Probs 风格分类概率结果
+   * @example
+   * const result = yoloCls.classifyRegion(modelId, "screen", 100, 100, 500, 400, 224)
+   */
+  function classifyRegion(
+    modelId: string,
+    img: string,
+    x?: number,
+    y?: number,
+    ex?: number,
+    ey?: number,
+    targetSize?: number,
+  ): YoloClsProbs;
+  /**
+   * 释放指定模型资源
+   * @param modelId 模型 ID
+   * @example
+   * yoloCls.free(modelId)
+   */
+  function free(modelId: string): void;
+  /**
+   * 释放所有模型资源
+   * @example
+   * yoloCls.freeAll()
+   */
+  function freeAll(): void;
+}

package/types/zh/PaddleOCR/346/250/241/345/235/227.d.ts CHANGED Viewed

@@ -35,9 +35,9 @@ declare namespace $PaddleOCR {
   /**
    * 初始化PP-OCRv5模型
-   * @param maxSideLen 最大边长，默认640，可不传
+   * @param 最大边长 最大边长，默认640，可不传
    * @param useGpu 是否使用GPU，默认false，可不传
-   * @returns 初始化是否成功
+   * @returns 初始化成功或模型已加载返回true
    * @example
    * const 是否加载成功 = $PaddleOCR.加载V5模型(640, true)
    * if (是否加载成功) {
@@ -48,16 +48,16 @@ declare namespace $PaddleOCR {
   /**
    * 执行OCR识别
    * @param 输入源（imageId、URL字符串、文件路径或"screen"，"screen"表示使用当前屏幕）
-   * @param 图片边界框左上角x坐标 全屏传0，默认0
-   * @param 图片边界框左上角y坐标 全屏传0，默认0
-   * @param 图片边界框右下角x坐标 全屏传0，默认0
-   * @param 图片边界框右下角y坐标 全屏传0，默认0
-   * @param 置信度阈值 置信度阈值，默认0.6
-   * @returns 识别结果数组
+   * @param 图片边界框左上角x坐标 裁剪区域左上角 x，全屏传 0，默认 0
+   * @param 图片边界框左上角y坐标 裁剪区域左上角 y，全屏传 0，默认 0
+   * @param 图片边界框右下角x坐标 裁剪区域右下角 x，全屏传 0，默认 0
+   * @param 图片边界框右下角y坐标 裁剪区域右下角 y，全屏传 0，默认 0
+   * @param 置信度阈值 置信度阈值，默认 0.6
+   * @returns 识别结果数组，坐标相对于裁剪区域
    * @example
-   * const 识别结果数组 = $PaddleOCR.识别("screen", 0, 0, 100, 100)
+   * const 识别结果数组 = $PaddleOCR.识别("screen", 100, 100, 500, 300)
    * if (识别结果数组.length > 0) {
-   *   $打印信息日志("识别到文本")
+   *   $打印信息日志(`区域坐标: ${识别结果数组[0].centerX}, ${识别结果数组[0].centerY}`)
    * }
    */
   function 识别(
@@ -68,18 +68,41 @@ declare namespace $PaddleOCR {
     图片边界框右下角y坐标?: 数字,
     置信度阈值?: 数字,
   ): 数组<OCR识别结果>;
+  /**
+   * 执行 OCR 识别，并将结果坐标映射为原图/全屏绝对坐标
+   * @param 输入源（imageId、URL字符串、文件路径或"screen"，"screen"表示使用当前屏幕）
+   * @param 图片边界框左上角x坐标 裁剪区域左上角 x，全屏传 0，默认 0
+   * @param 图片边界框左上角y坐标 裁剪区域左上角 y，全屏传 0，默认 0
+   * @param 图片边界框右下角x坐标 裁剪区域右下角 x，全屏传 0，默认 0
+   * @param 图片边界框右下角y坐标 裁剪区域右下角 y，全屏传 0，默认 0
+   * @param 置信度阈值 置信度阈值，默认 0.6
+   * @returns 识别结果数组，坐标为原图/全屏绝对坐标
+   * @example
+   * const 识别结果数组 = $PaddleOCR.识别绝对坐标("screen", 100, 100, 500, 300)
+   * if (识别结果数组.length > 0) {
+   *   $动作.点击(识别结果数组[0].centerX, 识别结果数组[0].centerY)
+   * }
+   */
+  function 识别绝对坐标(
+    输入源: 字符串,
+    图片边界框左上角x坐标?: 数字,
+    图片边界框左上角y坐标?: 数字,
+    图片边界框右下角x坐标?: 数字,
+    图片边界框右下角y坐标?: 数字,
+    置信度阈值?: 数字,
+  ): 数组<OCR识别结果>;
   /**
    * 查找目标文本并返回对应子串坐标
    * @param 输入源（imageId、URL字符串、文件路径或"screen"，"screen"表示使用当前屏幕）
    * @param 目标文本数组 例如 ["你好", "确定"]
-   * @param 图片边界框左上角x坐标 全屏传0，默认0
-   * @param 图片边界框左上角y坐标 全屏传0，默认0
-   * @param 图片边界框右下角x坐标 全屏传0，默认0
-   * @param 图片边界框右下角y坐标 全屏传0，默认0
-   * @param 置信度阈值 置信度阈值，默认0.6
-   * @returns 匹配到的子串结果数组（text 为目标文本）
+   * @param 图片边界框左上角x坐标 裁剪区域左上角 x，全屏传 0，默认 0
+   * @param 图片边界框左上角y坐标 裁剪区域左上角 y，全屏传 0，默认 0
+   * @param 图片边界框右下角x坐标 裁剪区域右下角 x，全屏传 0，默认 0
+   * @param 图片边界框右下角y坐标 裁剪区域右下角 y，全屏传 0，默认 0
+   * @param 置信度阈值 置信度阈值，默认 0.6
+   * @returns 匹配到的子串结果数组，坐标相对于裁剪区域
    * @example
-   * const 结果 = $PaddleOCR.查找文本("screen", ["你好"], 0, 0, 0, 0, 0.6)
+   * const 结果 = $PaddleOCR.查找文本("screen", ["确定"], 100, 100, 500, 300, 0.6)
    * if (结果.length > 0) {
    *   $打印信息日志(`命中: ${结果[0].text}`)
    * }
@@ -93,6 +116,31 @@ declare namespace $PaddleOCR {
     图片边界框右下角y坐标?: 数字,
     置信度阈值?: 数字,
   ): 数组<OCR识别结果>;
+  /**
+   * 查找目标文本并返回对应子串的原图/全屏绝对坐标
+   * @param 输入源（imageId、URL字符串、文件路径或"screen"，"screen"表示使用当前屏幕）
+   * @param 目标文本数组 例如 ["你好", "确定"]
+   * @param 图片边界框左上角x坐标 裁剪区域左上角 x，全屏传 0，默认 0
+   * @param 图片边界框左上角y坐标 裁剪区域左上角 y，全屏传 0，默认 0
+   * @param 图片边界框右下角x坐标 裁剪区域右下角 x，全屏传 0，默认 0
+   * @param 图片边界框右下角y坐标 裁剪区域右下角 y，全屏传 0，默认 0
+   * @param 置信度阈值 置信度阈值，默认 0.6
+   * @returns 匹配到的子串结果数组，坐标为原图/全屏绝对坐标
+   * @example
+   * const 结果 = $PaddleOCR.查找文本绝对坐标("screen", ["确定"], 100, 100, 500, 300, 0.6)
+   * if (结果.length > 0) {
+   *   $动作.点击(结果[0].centerX, 结果[0].centerY)
+   * }
+   */
+  function 查找文本绝对坐标(
+    输入源: 字符串,
+    目标文本数组: 数组<字符串>,
+    图片边界框左上角x坐标?: 数字,
+    图片边界框左上角y坐标?: 数字,
+    图片边界框右下角x坐标?: 数字,
+    图片边界框右下角y坐标?: 数字,
+    置信度阈值?: 数字,
+  ): 数组<OCR识别结果>;
   /**
    * 释放OCR模型资源
    */

package/types/zh/YOLO/345/210/206/347/261/273/346/250/241/345/235/227.d.ts ADDED Viewed

@@ -0,0 +1,102 @@
+/// <reference path="全局模块.d.ts" />
+/**
+ * YOLO 图像分类模块，提供 NCNN YOLO-cls 分类模型加载、分类和资源释放能力
+ */
+declare namespace $YOLO分类 {
+  /**
+   * Ultralytics Probs 风格分类概率结果
+   */
+  interface Yolo分类概率结果 {
+    /**
+     * 所有类别的概率数组，下标即类别 ID
+     */
+    data: 数组<数字>;
+    /**
+     * 概率最高的类别 ID；分类失败时为 null
+     */
+    top1: 数字 | null;
+    /**
+     * 概率最高的 5 个类别 ID，按概率从高到低排序
+     */
+    top5: 数组<数字>;
+    /**
+     * top1 对应的概率；分类失败时为 null
+     */
+    top1conf: 数字 | null;
+    /**
+     * top5 对应的概率，顺序与 top5 一致
+     */
+    top5conf: 数组<数字>;
+  }
+  /**
+   * 加载 YOLO 分类模型
+   * @param ncnn模型的param文件路径 ncnn 模型 param 文件路径
+   * @param ncnn模型的bin文件路径 ncnn 模型 bin 文件路径
+   * @param 类别数量 模型类别数量，传 0 或省略时按模型输出自动推断，显式传入但不匹配时分类返回空结果
+   * @param useGpu 是否使用 GPU 加载
+   * @returns 加载成功返回模型 ID 字符串，失败返回 null
+   * @example
+   * const 模型ID = $YOLO分类.加载模型("yolo11n_cls.ncnn.param", "yolo11n_cls.ncnn.bin", 1000, false)
+   */
+  function 加载模型(
+    ncnn模型的param文件路径: 字符串,
+    ncnn模型的bin文件路径: 字符串,
+    类别数量?: 数字,
+    useGpu?: 布尔值,
+  ): 字符串 | null;
+  /**
+   * 图像分类
+   * @param 模型ID 模型 ID
+   * @param 图片ID 图像 ID，"screen" 使用当前屏幕，也可以填入图像 ID、HTTP 图片地址或文件路径
+   * @param 分类输入大小 分类输入大小，默认 224
+   * @returns Ultralytics Probs 风格分类概率结果
+   * @example
+   * const 结果 = $YOLO分类.图像分类(模型ID, "screen", 224)
+   */
+  function 图像分类(
+    模型ID: 字符串,
+    图片ID: 字符串,
+    分类输入大小?: 数字,
+  ): Yolo分类概率结果;
+  /**
+   * 对指定区域执行图像分类
+   * @param 模型ID 模型 ID
+   * @param 图片ID 图像 ID，"screen" 使用当前屏幕，也可以填入图像 ID、HTTP 图片地址或文件路径
+   * @param 裁剪区域左上角x坐标 默认 0
+   * @param 裁剪区域左上角y坐标 默认 0
+   * @param 裁剪区域右下角x坐标 默认 0
+   * @param 裁剪区域右下角y坐标 默认 0
+   * @param 分类输入大小 分类输入大小，默认 224
+   * @returns Ultralytics Probs 风格分类概率结果
+   * @example
+   * const 结果 = $YOLO分类.区域分类(模型ID, "screen", 100, 100, 500, 400, 224)
+   */
+  function 区域分类(
+    模型ID: 字符串,
+    图片ID: 字符串,
+    裁剪区域左上角x坐标?: 数字,
+    裁剪区域左上角y坐标?: 数字,
+    裁剪区域右下角x坐标?: 数字,
+    裁剪区域右下角y坐标?: 数字,
+    分类输入大小?: 数字,
+  ): Yolo分类概率结果;
+  /**
+   * 释放指定模型资源
+   * @param 模型ID 模型 ID
+   * @example
+   * $YOLO分类.释放模型资源(模型ID)
+   */
+  function 释放模型资源(模型ID: 字符串): 无返回值;
+  /**
+   * 释放所有模型资源
+   * @example
+   * $YOLO分类.释放所有模型资源()
+   */
+  function 释放所有模型资源(): 无返回值;
+}

package/types/zh/YOLO/346/250/241/345/235/227.d.ts CHANGED Viewed

@@ -54,17 +54,17 @@ declare namespace $YOLO {
    * 加载YOLO模型
    * @param ncnn模型的param文件路径 ncnn模型的param文件的绝对路径
    * @param ncnn模型的bin文件路径 ncnn模型的bin文件绝对路径
-   * @param 标签数量 模型的标签数量,可在标签集data.yaml中看到
+   * @param 标签数量 模型的标签数量；传 0 或省略时根据模型输出自动推断，显式传入但不匹配时检测返回空数组
    * @param 模型版本 模型版本，默认11, 支持 8 11 26
    * @param useGpu 是否使用 GPU 加载
    * @returns 加载成功返回模型ID字符串，失败返回null
    * @example
-   * const 模型ID = $YOLO.加载模型("yolov8n.param", "yolov8n.bin", 80)
+   * const 模型ID = $YOLO.加载模型("yolov8n.param", "yolov8n.bin", 0)
    */
   function 加载模型(
     ncnn模型的param文件路径: 字符串,
     ncnn模型的bin文件路径: 字符串,
-    标签数量: 数字,
+    标签数量?: 数字,
     模型版本?: 数字,
     useGpu?: 布尔值,
   ): 字符串 | null;
@@ -73,16 +73,16 @@ declare namespace $YOLO {
    * 加载YOLOv11模型 （兼容 yolov8 模型）
    * @param ncnn模型的param文件路径
    * @param ncnn模型的bin文件路径
-   * @param 标签数量 模型的标签数量,可在标签集data.yaml中看到
+   * @param 标签数量 模型的标签数量；传 0 或省略时根据模型输出自动推断，显式传入但不匹配时检测返回空数组
    * @param useGpu 是否使用 GPU 加载
    * @returns 加载成功返回模型ID字符串，失败返回null
    * @example
-   * const 模型ID = $YOLO.加载YOLOv11模型("yolov11n.param", "yolov11n.bin", 80)
+   * const 模型ID = $YOLO.加载YOLOv11模型("yolov11n.param", "yolov11n.bin", 0)
    */
   function 加载YOLOv11模型(
     ncnn模型的param文件路径: 字符串,
     ncnn模型的bin文件路径: 字符串,
-    标签数量: 数字,
+    标签数量?: 数字,
     useGpu?: 布尔值,
   ): 字符串 | null;
@@ -105,6 +105,36 @@ declare namespace $YOLO {
     重叠阈值?: 数字,
   ): 数组<Yolo检测结果>;
+  /**
+   * 对指定区域执行目标检测，并将结果坐标映射为原图/全屏绝对坐标
+   * @param 模型ID
+   * @param 图片ID 图像ID，"screen"用当前屏幕检测，可以填入图像ID或者http图片地址或文件地址
+   * @param 裁剪区域左上角x坐标 默认 0
+   * @param 裁剪区域左上角y坐标 默认 0
+   * @param 裁剪区域右下角x坐标 默认 0
+   * @param 裁剪区域右下角y坐标 默认 0
+   * @param 目标检测输入大小 图像进入后缩放的检测大小，模型训练一般都用640，因此这里的640一般不要改
+   * @param 置信度 置信度，默认0.4，小于这个值的会被过滤掉
+   * @param 重叠阈值 一般是0.5不需要更改
+   * @returns 检测结果数组，坐标为原图/全屏绝对坐标
+   * @example
+   * const 结果数组 = $YOLO.目标检测绝对坐标(模型ID, "screen", 100, 100, 500, 400, 640, 0.4, 0.5)
+   * if (结果数组.length > 0) {
+   *   $点击(结果数组[0].centerX, 结果数组[0].centerY)
+   * }
+   */
+  function 目标检测绝对坐标(
+    模型ID: 字符串,
+    图片ID: 字符串,
+    裁剪区域左上角x坐标?: 数字,
+    裁剪区域左上角y坐标?: 数字,
+    裁剪区域右下角x坐标?: 数字,
+    裁剪区域右下角y坐标?: 数字,
+    目标检测输入大小?: 数字,
+    置信度?: 数字,
+    重叠阈值?: 数字,
+  ): 数组<Yolo检测结果>;
   /**
    * 释放指定模型资源
    * @param 模型ID

package/types/zh/index.d.ts CHANGED Viewed

@@ -22,3 +22,4 @@
 /// <reference path="MySQL模块.d.ts" />
 /// <reference path="PaddleOCR模块.d.ts" />
 /// <reference path="YOLO模块.d.ts" />
+/// <reference path="YOLO分类模块.d.ts" />

package/types/zh//345/205/250/345/261/200/346/250/241/345/235/227.d.ts CHANGED Viewed

@@ -175,6 +175,25 @@ declare function $设置CPU自动限流(是否开启: 布尔值): 布尔值;
  */
 declare function $获取CPU自动限流(): 布尔值;
+/**
+ * 设置 CPU 限流单次 sleep 延迟范围（毫秒）
+ * @param 最小毫秒 最低延迟，默认 3
+ * @param 最大毫秒 最高延迟，默认 30；小于最小毫秒时自动对齐
+ * @returns 实际生效的延迟范围
+ * @description 仅在 CPU 自动限流开启且触发限流时生效
+ * @example
+ * const 延迟 = $设置CPU限流延迟(3, 30);
+ */
+declare function $设置CPU限流延迟(最小毫秒: 数字, 最大毫秒: 数字): { minMs: 数字; maxMs: 数字 };
+/**
+ * 获取 CPU 限流延迟范围（毫秒）
+ * @returns 当前最低与最高延迟
+ * @example
+ * const 延迟 = $获取CPU限流延迟();
+ */
+declare function $获取CPU限流延迟(): { minMs: 数字; maxMs: 数字 };
 /**
  * 打印调试日志 - 输出调试级别的日志
  * 用于详细的程序执行信息、变量值和状态信息、函数调用跟踪

package/types/zh//350/212/202/347/202/271/346/250/241/345/235/227.d.ts CHANGED Viewed

@@ -7,6 +7,10 @@ declare function $创建节点选择器(params?: {
    * 代表要获取节点的层级，越少速度越快，默认 50
    */
   maxDepth?: number;
+  /**
+   * 抓取模式：模式 1、模式 2，默认模式 1
+   */
+  mode?: number;
 }): $节点选择器;
 declare interface $节点位置信息 {

package/types/zh//350/213/271/346/236/234OCR.d.ts CHANGED Viewed

@@ -54,6 +54,30 @@ declare namespace $苹果OCR {
     识别语言数组?: Array<字符串>
   ): 数组<OCR识别结果>;
+  /**
+   * 执行 OCR 识别，并将结果坐标映射为原图/全屏绝对坐标。
+   * @param 输入源 输入源（imageId、URL字符串、文件路径或"screen"，"screen"表示使用当前屏幕）
+   * @param 图片边界框左上角x坐标 默认 0
+   * @param 图片边界框左上角y坐标 默认 0
+   * @param 图片边界框右下角x坐标 默认 0
+   * @param 图片边界框右下角y坐标 默认 0
+   * @param 识别语言数组 识别语言数组，默认为["zh-Hans", "en-US"]
+   * @returns 识别结果数组，坐标为原图/全屏绝对坐标
+   * @example
+   * const 检查结果数组 = $苹果OCR.识别绝对坐标("screen", 100, 100, 500, 300)
+   * if (检查结果数组.length > 0) {
+   *   $点击(检查结果数组[0].centerX, 检查结果数组[0].centerY)
+   * }
+   */
+  function 识别绝对坐标(
+    输入源: 字符串,
+    图片边界框左上角x坐标?: 数字,
+    图片边界框左上角y坐标?: 数字,
+    图片边界框右下角x坐标?: 数字,
+    图片边界框右下角y坐标?: 数字,
+    识别语言数组?: Array<字符串>
+  ): 数组<OCR识别结果>;
   /**
    * 执行OCR识别（仅识别数字）0-9.,+-
    * @param 输入源 输入源（imageId、URL字符串、文件路径或"screen"，"screen"表示使用当前屏幕）
@@ -76,6 +100,28 @@ declare namespace $苹果OCR {
     图片边界框右下角y坐标?: 数字
   ): 数组<OCR识别结果>;
+  /**
+   * 执行数字 OCR 识别，并将结果坐标映射为原图/全屏绝对坐标。
+   * @param 输入源 输入源（imageId、URL字符串、文件路径或"screen"，"screen"表示使用当前屏幕）
+   * @param 图片边界框左上角x坐标 默认 0
+   * @param 图片边界框左上角y坐标 默认 0
+   * @param 图片边界框右下角x坐标 默认 0
+   * @param 图片边界框右下角y坐标 默认 0
+   * @returns 识别结果数组，坐标为原图/全屏绝对坐标
+   * @example
+   * const 检查结果数组 = $苹果OCR.识别数字绝对坐标("screen", 100, 100, 500, 300)
+   * if (检查结果数组.length > 0) {
+   *   $点击(检查结果数组[0].centerX, 检查结果数组[0].centerY)
+   * }
+   */
+  function 识别数字绝对坐标(
+    输入源: 字符串,
+    图片边界框左上角x坐标?: 数字,
+    图片边界框左上角y坐标?: 数字,
+    图片边界框右下角x坐标?: 数字,
+    图片边界框右下角y坐标?: 数字
+  ): 数组<OCR识别结果>;
   /**
    * 执行OCR识别（查找指定文本）
    * @param 输入源 输入源（imageId、URL字符串、文件路径或"screen"，"screen"表示使用当前屏幕）
@@ -101,4 +147,30 @@ declare namespace $苹果OCR {
     图片边界框右下角y坐标?: 数字,
     识别语言数组?: 数组<字符串>
   ): 数组<OCR识别结果>;
+  /**
+   * 查找指定文本，并将结果坐标映射为原图/全屏绝对坐标。
+   * @param 输入源 输入源（imageId、URL字符串、文件路径或"screen"，"screen"表示使用当前屏幕）
+   * @param 要查找的文本数组 要查找的文本数组
+   * @param 图片边界框左上角x坐标 默认 0
+   * @param 图片边界框左上角y坐标 默认 0
+   * @param 图片边界框右下角x坐标 默认 0
+   * @param 图片边界框右下角y坐标 默认 0
+   * @param 识别语言数组 识别语言数组，默认为["zh-Hans", "en-US"]
+   * @returns 识别结果数组，坐标为原图/全屏绝对坐标
+   * @example
+   * const 检查结果数组 = $苹果OCR.查找文本绝对坐标("screen", ["确定"], 100, 100, 500, 400)
+   * if (检查结果数组.length > 0) {
+   *   $点击(检查结果数组[0].centerX, 检查结果数组[0].centerY)
+   * }
+   */
+  function 查找文本绝对坐标(
+    输入源: 字符串,
+    要查找的文本数组: 数组<字符串>,
+    图片边界框左上角x坐标?: 数字,
+    图片边界框左上角y坐标?: 数字,
+    图片边界框右下角x坐标?: 数字,
+    图片边界框右下角y坐标?: 数字,
+    识别语言数组?: 数组<字符串>
+  ): 数组<OCR识别结果>;
 }