npm - ms-types - Versions diffs - 0.0.29 → 0.0.31 - Mend

ms-types 0.0.29 → 0.0.31

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (2) hide show

package/package.json +1 -1
package/types/appleOcr.d.ts +58 -34

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "ms-types",
-  "version": "0.0.29",
+  "version": "0.0.31",
   "type": "module",
   "license": "MIT",
   "publishConfig": {

package/types/appleOcr.d.ts CHANGED Viewed

@@ -2,6 +2,32 @@
  * Apple OCR模块 使用Apple Vision框架进行文本识别
  */
 declare namespace appleOcr {
+  /**
+   * OCR识别结果接口
+   */
+  interface OCRResult {
+    /** 识别的文本内容 */
+    text: string;
+    /** 识别置信度 (0-1) */
+    confidence: number;
+    /** 文本区域左上角 x 坐标 */
+    x: number;
+    /** 文本区域左上角 y 坐标 */
+    y: number;
+    /** 文本区域右下角 x 坐标 */
+    ex: number;
+    /** 文本区域右下角 y 坐标 */
+    ey: number;
+    /** 文本区域宽度 */
+    width: number;
+    /** 文本区域高度 */
+    height: number;
+    /** 文本区域中心点 x 坐标 */
+    centerX: number;
+    /** 文本区域中心点 y 坐标 */
+    centerY: number;
+  }
   /**
    * 执行OCR识别（使用Apple Vision框架）
    * @param input 输入源（imageId、URL字符串、文件路径或"screen"，"screen"表示使用当前屏幕）
@@ -27,52 +53,50 @@ declare namespace appleOcr {
   ): OCRResult[];
   /**
-   * 执行快速OCR识别（仅返回文本内容）
+   * 执行OCR识别（仅识别数字）0-9.,+-
    * @param input 输入源（imageId、URL字符串、文件路径或"screen"，"screen"表示使用当前屏幕）
    * @param x 边界框左上角x坐标
    * @param y 边界框左上角y坐标
    * @param ex 边界框右下角x坐标
    * @param ey 边界框右下角y坐标
-   * @param languages 识别语言数组
-   * @returns 识别到的文本字符串数组
+   * @returns 识别结果数组，包含文本、置信度、坐标等信息
    * @example
-   * const texts = appleOcr.recognizeText("screen", 0, 0, 100, 100)
-   * for (const text of texts) {
-   *   logger.info(text)
-   * }
+   * const results = appleOcr.recognizeNumbers("screen", 0, 0, 100, 100)
+   * results.forEach(result => {
+   *   logger.info(`文本: ${result.text}, 置信度: ${result.confidence}`)
+   * })
    */
-  function recognizeText(
+  function recognizeNumbers(
     input: string,
     x: number,
     y: number,
     ex: number,
-    ey: number,
-    languages?: string[]
-  ): string[];
+    ey: number
+  ): OCRResult[];
   /**
-   * OCR识别结果接口
+   * 执行OCR识别（查找指定文本）
+   * @param input 输入源（imageId、URL字符串、文件路径或"screen"，"screen"表示使用当前屏幕）
+   * @param texts 要查找的文本数组
+   * @param x 边界框左上角x坐标
+   * @param y 边界框左上角y坐标
+   * @param ex 边界框右下角x坐标
+   * @param ey 边界框右下角y坐标
+   * @param languages 识别语言数组，默认为["zh-Hans", "en-US"]
+   * @returns 识别结果数组，包含文本、置信度、坐标等信息
+   * @example
+   * const results = appleOcr.findText("screen", ["123", "456"], 0, 0, 100, 100, ["zh-Hans", "en-US"])
+   * results.forEach(result => {
+   *   logger.info(`文本: ${result.text}, 置信度: ${result.confidence}`)
+   * })
    */
-  interface OCRResult {
-    /** 识别的文本内容 */
-    text: string;
-    /** 识别置信度 (0-1) */
-    confidence: number;
-    /** 文本区域左上角 x 坐标 */
-    x: number;
-    /** 文本区域左上角 y 坐标 */
-    y: number;
-    /** 文本区域右下角 x 坐标 */
-    ex: number;
-    /** 文本区域右下角 y 坐标 */
-    ey: number;
-    /** 文本区域宽度 */
-    width: number;
-    /** 文本区域高度 */
-    height: number;
-    /** 文本区域中心点 x 坐标 */
-    centerX: number;
-    /** 文本区域中心点 y 坐标 */
-    centerY: number;
-  }
+  function findText(
+    input: string,
+    texts: string[],
+    x: number,
+    y: number,
+    ex: number,
+    ey: number,
+    languages?: string[]
+  ): OCRResult[];
 }