npm - rtmlib-ts - Versions diffs - 0.0.2 - Mend

rtmlib-ts 0.0.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (150) hide show

package/.gitattributes +1 -0
package/README.md +202 -0
package/dist/core/base.d.ts +20 -0
package/dist/core/base.d.ts.map +1 -0
package/dist/core/base.js +40 -0
package/dist/core/file.d.ts +11 -0
package/dist/core/file.d.ts.map +1 -0
package/dist/core/file.js +111 -0
package/dist/core/modelCache.d.ts +35 -0
package/dist/core/modelCache.d.ts.map +1 -0
package/dist/core/modelCache.js +161 -0
package/dist/core/posePostprocessing.d.ts +12 -0
package/dist/core/posePostprocessing.d.ts.map +1 -0
package/dist/core/posePostprocessing.js +76 -0
package/dist/core/postprocessing.d.ts +10 -0
package/dist/core/postprocessing.d.ts.map +1 -0
package/dist/core/postprocessing.js +70 -0
package/dist/core/preprocessing.d.ts +14 -0
package/dist/core/preprocessing.d.ts.map +1 -0
package/dist/core/preprocessing.js +79 -0
package/dist/index.d.ts +27 -0
package/dist/index.d.ts.map +1 -0
package/dist/index.js +31 -0
package/dist/models/rtmpose.d.ts +25 -0
package/dist/models/rtmpose.d.ts.map +1 -0
package/dist/models/rtmpose.js +185 -0
package/dist/models/rtmpose3d.d.ts +28 -0
package/dist/models/rtmpose3d.d.ts.map +1 -0
package/dist/models/rtmpose3d.js +184 -0
package/dist/models/yolo12.d.ts +23 -0
package/dist/models/yolo12.d.ts.map +1 -0
package/dist/models/yolo12.js +165 -0
package/dist/models/yolox.d.ts +18 -0
package/dist/models/yolox.d.ts.map +1 -0
package/dist/models/yolox.js +167 -0
package/dist/solution/animalDetector.d.ts +229 -0
package/dist/solution/animalDetector.d.ts.map +1 -0
package/dist/solution/animalDetector.js +663 -0
package/dist/solution/body.d.ts +16 -0
package/dist/solution/body.d.ts.map +1 -0
package/dist/solution/body.js +52 -0
package/dist/solution/bodyWithFeet.d.ts +16 -0
package/dist/solution/bodyWithFeet.d.ts.map +1 -0
package/dist/solution/bodyWithFeet.js +52 -0
package/dist/solution/customDetector.d.ts +137 -0
package/dist/solution/customDetector.d.ts.map +1 -0
package/dist/solution/customDetector.js +342 -0
package/dist/solution/hand.d.ts +14 -0
package/dist/solution/hand.d.ts.map +1 -0
package/dist/solution/hand.js +20 -0
package/dist/solution/index.d.ts +10 -0
package/dist/solution/index.d.ts.map +1 -0
package/dist/solution/index.js +9 -0
package/dist/solution/objectDetector.d.ts +172 -0
package/dist/solution/objectDetector.d.ts.map +1 -0
package/dist/solution/objectDetector.js +606 -0
package/dist/solution/pose3dDetector.d.ts +145 -0
package/dist/solution/pose3dDetector.d.ts.map +1 -0
package/dist/solution/pose3dDetector.js +611 -0
package/dist/solution/poseDetector.d.ts +198 -0
package/dist/solution/poseDetector.d.ts.map +1 -0
package/dist/solution/poseDetector.js +622 -0
package/dist/solution/poseTracker.d.ts +22 -0
package/dist/solution/poseTracker.d.ts.map +1 -0
package/dist/solution/poseTracker.js +106 -0
package/dist/solution/wholebody.d.ts +19 -0
package/dist/solution/wholebody.d.ts.map +1 -0
package/dist/solution/wholebody.js +82 -0
package/dist/solution/wholebody3d.d.ts +22 -0
package/dist/solution/wholebody3d.d.ts.map +1 -0
package/dist/solution/wholebody3d.js +75 -0
package/dist/types/index.d.ts +52 -0
package/dist/types/index.d.ts.map +1 -0
package/dist/types/index.js +5 -0
package/dist/visualization/draw.d.ts +57 -0
package/dist/visualization/draw.d.ts.map +1 -0
package/dist/visualization/draw.js +400 -0
package/dist/visualization/skeleton/coco133.d.ts +350 -0
package/dist/visualization/skeleton/coco133.d.ts.map +1 -0
package/dist/visualization/skeleton/coco133.js +120 -0
package/dist/visualization/skeleton/coco17.d.ts +180 -0
package/dist/visualization/skeleton/coco17.d.ts.map +1 -0
package/dist/visualization/skeleton/coco17.js +48 -0
package/dist/visualization/skeleton/halpe26.d.ts +278 -0
package/dist/visualization/skeleton/halpe26.d.ts.map +1 -0
package/dist/visualization/skeleton/halpe26.js +70 -0
package/dist/visualization/skeleton/hand21.d.ts +196 -0
package/dist/visualization/skeleton/hand21.d.ts.map +1 -0
package/dist/visualization/skeleton/hand21.js +51 -0
package/dist/visualization/skeleton/index.d.ts +10 -0
package/dist/visualization/skeleton/index.d.ts.map +1 -0
package/dist/visualization/skeleton/index.js +9 -0
package/dist/visualization/skeleton/openpose134.d.ts +357 -0
package/dist/visualization/skeleton/openpose134.d.ts.map +1 -0
package/dist/visualization/skeleton/openpose134.js +116 -0
package/dist/visualization/skeleton/openpose18.d.ts +177 -0
package/dist/visualization/skeleton/openpose18.d.ts.map +1 -0
package/dist/visualization/skeleton/openpose18.js +47 -0
package/docs/ANIMAL_DETECTOR.md +450 -0
package/docs/CUSTOM_DETECTOR.md +568 -0
package/docs/OBJECT_DETECTOR.md +373 -0
package/docs/POSE3D_DETECTOR.md +458 -0
package/docs/POSE_DETECTOR.md +442 -0
package/examples/README.md +119 -0
package/examples/index.html +746 -0
package/package.json +51 -0
package/playground/README.md +114 -0
package/playground/app/favicon.ico +0 -0
package/playground/app/globals.css +17 -0
package/playground/app/layout.tsx +19 -0
package/playground/app/page.tsx +1338 -0
package/playground/eslint.config.mjs +18 -0
package/playground/next.config.ts +34 -0
package/playground/package-lock.json +6723 -0
package/playground/package.json +27 -0
package/playground/postcss.config.mjs +7 -0
package/playground/tsconfig.json +34 -0
package/src/core/base.ts +66 -0
package/src/core/file.ts +141 -0
package/src/core/modelCache.ts +189 -0
package/src/core/posePostprocessing.ts +91 -0
package/src/core/postprocessing.ts +93 -0
package/src/core/preprocessing.ts +127 -0
package/src/index.ts +69 -0
package/src/models/rtmpose.ts +265 -0
package/src/models/rtmpose3d.ts +289 -0
package/src/models/yolo12.ts +220 -0
package/src/models/yolox.ts +214 -0
package/src/solution/animalDetector.ts +955 -0
package/src/solution/body.ts +89 -0
package/src/solution/bodyWithFeet.ts +89 -0
package/src/solution/customDetector.ts +474 -0
package/src/solution/hand.ts +52 -0
package/src/solution/index.ts +10 -0
package/src/solution/objectDetector.ts +816 -0
package/src/solution/pose3dDetector.ts +890 -0
package/src/solution/poseDetector.ts +892 -0
package/src/solution/poseTracker.ts +172 -0
package/src/solution/wholebody.ts +130 -0
package/src/solution/wholebody3d.ts +125 -0
package/src/types/index.ts +62 -0
package/src/visualization/draw.ts +543 -0
package/src/visualization/skeleton/coco133.ts +131 -0
package/src/visualization/skeleton/coco17.ts +49 -0
package/src/visualization/skeleton/halpe26.ts +71 -0
package/src/visualization/skeleton/hand21.ts +52 -0
package/src/visualization/skeleton/index.ts +10 -0
package/src/visualization/skeleton/openpose134.ts +125 -0
package/src/visualization/skeleton/openpose18.ts +48 -0
package/tsconfig.json +32 -0

package/src/solution/body.ts ADDED Viewed

@@ -0,0 +1,89 @@
+/**
+ * Body solution - body pose estimation with 17 or 26 keypoints
+ */
+import { YOLOX } from '../models/yolox';
+import { RTMPose } from '../models/rtmpose';
+import { BBox, ModeType, ModelConfig } from '../types/index';
+export class Body {
+  private detModel: YOLOX;
+  private poseModel: RTMPose;
+  private static readonly MODE: Record<ModeType, ModelConfig> = {
+    performance: {
+      det: 'https://download.openmmlab.com/mmpose/v1/projects/rtmposev1/onnx_sdk/yolox_l_8xb8-300e_humanart-ce1d7a62.zip',
+      detInputSize: [640, 640],
+      pose: 'https://download.openmmlab.com/mmpose/v1/projects/rtmposev1/onnx_sdk/rtmpose-l_simcc-body7_pt-body7_420e-384x288-3f5a1437_20230504.zip',
+      poseInputSize: [288, 384],
+    },
+    lightweight: {
+      det: 'https://download.openmmlab.com/mmpose/v1/projects/rtmposev1/onnx_sdk/yolox_nano_8xb8-300e_humanart-40f6f0d0.zip',
+      detInputSize: [416, 416],
+      pose: 'https://download.openmmlab.com/mmpose/v1/projects/rtmposev1/onnx_sdk/rtmpose-t_simcc-body7_pt-body7_420e-256x192-026a1439_20230504.zip',
+      poseInputSize: [192, 256],
+    },
+    balanced: {
+      det: 'https://download.openmmlab.com/mmpose/v1/projects/rtmposev1/onnx_sdk/yolox_m_8xb8-300e_humanart-c2c7a14a.zip',
+      detInputSize: [640, 640],
+      pose: 'https://download.openmmlab.com/mmpose/v1/projects/rtmposev1/onnx_sdk/rtmpose-m_simcc-body7_pt-body7_420e-256x192-e48f03d0_20230504.zip',
+      poseInputSize: [192, 256],
+    },
+  };
+  constructor(
+    det: string | null = null,
+    detInputSize: [number, number] = [640, 640],
+    pose: string | null = null,
+    poseInputSize: [number, number] = [288, 384],
+    mode: ModeType = 'balanced',
+    toOpenpose: boolean = false,
+    backend: 'onnxruntime' = 'onnxruntime',
+    device: string = 'cpu'
+  ) {
+    let finalDet = det;
+    let finalDetInputSize = detInputSize;
+    let finalPose = pose;
+    let finalPoseInputSize = poseInputSize;
+    if (det === null) {
+      finalDet = Body.MODE[mode].det;
+      finalDetInputSize = Body.MODE[mode].detInputSize;
+    }
+    if (pose === null) {
+      finalPose = Body.MODE[mode].pose;
+      finalPoseInputSize = Body.MODE[mode].poseInputSize;
+    }
+    this.detModel = new YOLOX(
+      finalDet!,
+      finalDetInputSize,
+      0.45,
+      0.7,
+      backend
+    );
+    this.poseModel = new RTMPose(
+      finalPose!,
+      finalPoseInputSize,
+      toOpenpose,
+      backend
+    );
+  }
+  async init(): Promise<void> {
+    await this.detModel.init();
+    await this.poseModel.init();
+  }
+  async call(
+    image: Uint8Array,
+    imgWidth: number,
+    imgHeight: number
+  ): Promise<{ keypoints: number[][]; scores: number[] }> {
+    const bboxes = await this.detModel.call(image, imgWidth, imgHeight);
+    const result = await this.poseModel.call(image, imgWidth, imgHeight, bboxes);
+    return result;
+  }
+}

package/src/solution/bodyWithFeet.ts ADDED Viewed

@@ -0,0 +1,89 @@
+/**
+ * BodyWithFeet solution - body pose estimation with 26 keypoints (including feet)
+ */
+import { YOLOX } from '../models/yolox';
+import { RTMPose } from '../models/rtmpose';
+import { ModeType, ModelConfig } from '../types/index';
+export class BodyWithFeet {
+  private detModel: YOLOX;
+  private poseModel: RTMPose;
+  private static readonly MODE: Record<ModeType, ModelConfig> = {
+    performance: {
+      det: 'https://download.openmmlab.com/mmpose/v1/projects/rtmposev1/onnx_sdk/yolox_l_8xb8-300e_humanart-ce1d7a62.zip',
+      detInputSize: [640, 640],
+      pose: 'https://download.openmmlab.com/mmpose/v1/projects/rtmposev1/onnx_sdk/rtmpose-l_simcc-body7_pt-body7-halpe26_700e-384x288-734182ce_20230605.zip',
+      poseInputSize: [288, 384],
+    },
+    lightweight: {
+      det: 'https://download.openmmlab.com/mmpose/v1/projects/rtmposev1/onnx_sdk/yolox_nano_8xb8-300e_humanart-40f6f0d0.zip',
+      detInputSize: [416, 416],
+      pose: 'https://download.openmmlab.com/mmpose/v1/projects/rtmposev1/onnx_sdk/rtmpose-t_simcc-body7_pt-body7-halpe26_700e-256x192-6020f8a6_20230605.zip',
+      poseInputSize: [192, 256],
+    },
+    balanced: {
+      det: 'https://download.openmmlab.com/mmpose/v1/projects/rtmposev1/onnx_sdk/yolox_m_8xb8-300e_humanart-c2c7a14a.zip',
+      detInputSize: [640, 640],
+      pose: 'https://download.openmmlab.com/mmpose/v1/projects/rtmposev1/onnx_sdk/rtmpose-m_simcc-body7_pt-body7-halpe26_700e-256x192-4d3e73dd_20230605.zip',
+      poseInputSize: [192, 256],
+    },
+  };
+  constructor(
+    det: string | null = null,
+    detInputSize: [number, number] = [640, 640],
+    pose: string | null = null,
+    poseInputSize: [number, number] = [288, 384],
+    mode: ModeType = 'balanced',
+    toOpenpose: boolean = false,
+    backend: 'onnxruntime' = 'onnxruntime',
+    device: string = 'cpu'
+  ) {
+    let finalDet = det;
+    let finalDetInputSize = detInputSize;
+    let finalPose = pose;
+    let finalPoseInputSize = poseInputSize;
+    if (det === null) {
+      finalDet = BodyWithFeet.MODE[mode].det;
+      finalDetInputSize = BodyWithFeet.MODE[mode].detInputSize;
+    }
+    if (pose === null) {
+      finalPose = BodyWithFeet.MODE[mode].pose;
+      finalPoseInputSize = BodyWithFeet.MODE[mode].poseInputSize;
+    }
+    this.detModel = new YOLOX(
+      finalDet!,
+      finalDetInputSize,
+      0.45,
+      0.7,
+      backend
+    );
+    this.poseModel = new RTMPose(
+      finalPose!,
+      finalPoseInputSize,
+      toOpenpose,
+      backend
+    );
+  }
+  async init(): Promise<void> {
+    await this.detModel.init();
+    await this.poseModel.init();
+  }
+  async call(
+    image: Uint8Array,
+    imgWidth: number,
+    imgHeight: number
+  ): Promise<{ keypoints: number[][]; scores: number[] }> {
+    const bboxes = await this.detModel.call(image, imgWidth, imgHeight);
+    const result = await this.poseModel.call(image, imgWidth, imgHeight, bboxes);
+    return result;
+  }
+}

package/src/solution/customDetector.ts ADDED Viewed

@@ -0,0 +1,474 @@
+/**
+ * CustomDetector - Maximum flexibility detector for any ONNX model
+ * Provides low-level API for custom model inference
+ *
+ * @example
+ * ```typescript
+ * // Simple usage with auto-config
+ * const detector = new CustomDetector({
+ *   model: 'path/to/model.onnx',
+ * });
+ * await detector.init();
+ * const results = await detector.run(imageData, width, height);
+ *
+ * // Advanced usage with custom preprocessing
+ * const detector = new CustomDetector({
+ *   model: 'path/to/model.onnx',
+ *   inputName: 'input',
+ *   outputNames: ['output1', 'output2'],
+ *   preprocessing: (data) => customPreprocess(data),
+ *   postprocessing: (outputs) => customPostprocess(outputs),
+ * });
+ * ```
+ */
+import * as ort from 'onnxruntime-web';
+import { getCachedModel, isModelCached } from '../core/modelCache';
+// Configure ONNX Runtime Web
+ort.env.wasm.wasmPaths = 'https://cdn.jsdelivr.net/npm/onnxruntime-web@1.23.0/dist/';
+ort.env.wasm.simd = true;
+ort.env.wasm.proxy = false;
+/**
+ * Configuration options for CustomDetector
+ */
+export interface CustomDetectorConfig {
+  /** Path to ONNX model (required) */
+  model: string;
+  /** Input tensor name (optional - auto-detected if not specified) */
+  inputName?: string;
+  /** Output tensor names (optional - auto-detected if not specified) */
+  outputNames?: string[];
+  /** Expected input shape [batch, channels, height, width] (optional) */
+  inputShape?: [number, number, number, number];
+  /** Custom preprocessing function */
+  preprocessing?: (data: ImageData, config: CustomDetectorConfig) => Float32Array | ort.Tensor;
+  /** Custom postprocessing function */
+  postprocessing?: (outputs: Record<string, ort.Tensor>, metadata: any) => any;
+  /** Execution backend (default: 'wasm') */
+  backend?: 'wasm' | 'webgpu';
+  /** Enable model caching (default: true) */
+  cache?: boolean;
+  /** Custom metadata for postprocessing */
+  metadata?: any;
+  /** Input normalization (default: { mean: [0, 0, 0], std: [1, 1, 1] }) */
+  normalization?: {
+    mean: number[];
+    std: number[];
+  };
+  /** Input size for automatic preprocessing (optional) */
+  inputSize?: [number, number];
+  /** Keep aspect ratio during preprocessing (default: true) */
+  keepAspectRatio?: boolean;
+  /** Background color for letterbox (default: black) */
+  backgroundColor?: string;
+}
+/**
+ * Detection result with metadata
+ */
+export interface DetectionResult<T = any> {
+  /** Raw model outputs */
+  outputs: Record<string, ort.Tensor>;
+  /** Processed results */
+  data: T;
+  /** Inference time in ms */
+  inferenceTime: number;
+  /** Input shape used */
+  inputShape: number[];
+}
+/**
+ * Default configuration
+ */
+const DEFAULT_CONFIG: Partial<CustomDetectorConfig> = {
+  backend: 'webgpu',  // Default to WebGPU for better performance
+  cache: true,
+  keepAspectRatio: true,
+  backgroundColor: '#000000',
+  normalization: {
+    mean: [0, 0, 0],
+    std: [1, 1, 1],
+  },
+};
+export class CustomDetector {
+  private config: Required<CustomDetectorConfig>;
+  private session: ort.InferenceSession | null = null;
+  private initialized = false;
+  private canvas: HTMLCanvasElement | null = null;
+  private ctx: CanvasRenderingContext2D | null = null;
+  constructor(config: CustomDetectorConfig) {
+    this.config = {
+      ...DEFAULT_CONFIG,
+      ...config,
+      outputNames: config.outputNames || [],
+      inputShape: config.inputShape || [1, 3, 224, 224],
+      normalization: config.normalization || { mean: [0, 0, 0], std: [1, 1, 1] },
+    } as Required<CustomDetectorConfig>;
+  }
+  /**
+   * Initialize the model
+   */
+  async init(): Promise<void> {
+    if (this.initialized) return;
+    try {
+      console.log(`[CustomDetector] Loading model from: ${this.config.model}`);
+      let modelBuffer: ArrayBuffer;
+      if (this.config.cache) {
+        const cached = await isModelCached(this.config.model);
+        console.log(`[CustomDetector] Cache ${cached ? 'hit' : 'miss'}`);
+        modelBuffer = await getCachedModel(this.config.model);
+      } else {
+        const response = await fetch(this.config.model);
+        if (!response.ok) {
+          throw new Error(`Failed to fetch model: HTTP ${response.status}`);
+        }
+        modelBuffer = await response.arrayBuffer();
+      }
+      this.session = await ort.InferenceSession.create(modelBuffer, {
+        executionProviders: [this.config.backend],
+        graphOptimizationLevel: 'all',
+      });
+      // Auto-detect input/output names if not specified
+      if (!this.config.inputName && this.session.inputNames.length > 0) {
+        console.log(`[CustomDetector] Auto-detected input name: ${this.session.inputNames[0]}`);
+      }
+      if (this.config.outputNames.length === 0 && this.session.outputNames.length > 0) {
+        this.config.outputNames = [...this.session.outputNames];
+        console.log(`[CustomDetector] Auto-detected output names: ${this.config.outputNames}`);
+      }
+      console.log(`[CustomDetector] ✅ Initialized (${this.config.backend})`);
+      this.initialized = true;
+    } catch (error) {
+      console.error('[CustomDetector] ❌ Initialization failed:', error);
+      throw error;
+    }
+  }
+  /**
+   * Run inference on canvas
+   */
+  async runFromCanvas<T = any>(canvas: HTMLCanvasElement): Promise<DetectionResult<T>> {
+    const ctx = canvas.getContext('2d');
+    if (!ctx) {
+      throw new Error('Could not get 2D context from canvas');
+    }
+    const imageData = ctx.getImageData(0, 0, canvas.width, canvas.height);
+    return this.run<T>(imageData, canvas.width, canvas.height);
+  }
+  /**
+   * Run inference on video
+   */
+  async runFromVideo<T = any>(
+    video: HTMLVideoElement,
+    targetCanvas?: HTMLCanvasElement
+  ): Promise<DetectionResult<T>> {
+    if (video.readyState < 2) {
+      throw new Error('Video not ready');
+    }
+    const canvas = targetCanvas || document.createElement('canvas');
+    canvas.width = video.videoWidth;
+    canvas.height = video.videoHeight;
+    const ctx = canvas.getContext('2d');
+    if (!ctx) {
+      throw new Error('Could not get 2D context from canvas');
+    }
+    ctx.drawImage(video, 0, 0, canvas.width, canvas.height);
+    const imageData = ctx.getImageData(0, 0, canvas.width, canvas.height);
+    return this.run<T>(imageData, canvas.width, canvas.height);
+  }
+  /**
+   * Run inference on image
+   */
+  async runFromImage<T = any>(
+    image: HTMLImageElement,
+    targetCanvas?: HTMLCanvasElement
+  ): Promise<DetectionResult<T>> {
+    if (!image.complete || !image.naturalWidth) {
+      throw new Error('Image not loaded');
+    }
+    const canvas = targetCanvas || document.createElement('canvas');
+    canvas.width = image.naturalWidth;
+    canvas.height = image.naturalHeight;
+    const ctx = canvas.getContext('2d');
+    if (!ctx) {
+      throw new Error('Could not get 2D context from canvas');
+    }
+    ctx.drawImage(image, 0, 0);
+    const imageData = ctx.getImageData(0, 0, canvas.width, canvas.height);
+    return this.run<T>(imageData, canvas.width, canvas.height);
+  }
+  /**
+   * Run inference on bitmap
+   */
+  async runFromBitmap<T = any>(
+    bitmap: ImageBitmap,
+    targetCanvas?: HTMLCanvasElement
+  ): Promise<DetectionResult<T>> {
+    const canvas = targetCanvas || document.createElement('canvas');
+    canvas.width = bitmap.width;
+    canvas.height = bitmap.height;
+    const ctx = canvas.getContext('2d');
+    if (!ctx) {
+      throw new Error('Could not get 2D context from canvas');
+    }
+    ctx.drawImage(bitmap, 0, 0);
+    const imageData = ctx.getImageData(0, 0, canvas.width, canvas.height);
+    return this.run<T>(imageData, canvas.width, canvas.height);
+  }
+  /**
+   * Run inference on file
+   */
+  async runFromFile<T = any>(
+    file: File,
+    targetCanvas?: HTMLCanvasElement
+  ): Promise<DetectionResult<T>> {
+    return new Promise((resolve, reject) => {
+      const img = new Image();
+      img.onload = async () => {
+        try {
+          const result = await this.runFromImage<T>(img, targetCanvas);
+          resolve(result);
+        } catch (error) {
+          reject(error);
+        }
+      };
+      img.onerror = () => reject(new Error('Failed to load image'));
+      img.src = URL.createObjectURL(file);
+    });
+  }
+  /**
+   * Run inference on blob
+   */
+  async runFromBlob<T = any>(
+    blob: Blob,
+    targetCanvas?: HTMLCanvasElement
+  ): Promise<DetectionResult<T>> {
+    const bitmap = await createImageBitmap(blob);
+    const result = await this.runFromBitmap<T>(bitmap, targetCanvas);
+    bitmap.close();
+    return result;
+  }
+  /**
+   * Run inference with custom preprocessing
+   */
+  async run<T = any>(
+    imageData: ImageData,
+    width: number,
+    height: number,
+    metadata?: any
+  ): Promise<DetectionResult<T>> {
+    if (!this.initialized) {
+      await this.init();
+    }
+    const startTime = performance.now();
+    // Preprocess
+    let inputTensor: ort.Tensor;
+    if (this.config.preprocessing) {
+      // Custom preprocessing
+      const result = this.config.preprocessing(imageData, this.config);
+      if (result instanceof Float32Array) {
+        const [h, w] = this.config.inputSize || [height, width];
+        inputTensor = new ort.Tensor('float32', result, [1, 3, h, w]);
+      } else {
+        inputTensor = result;
+      }
+    } else if (this.config.inputSize) {
+      // Automatic preprocessing with letterbox
+      inputTensor = this.preprocess(imageData, width, height, this.config.inputSize);
+    } else {
+      // Simple preprocessing - just normalize
+      inputTensor = this.simplePreprocess(imageData);
+    }
+    // Get input name
+    const inputName = this.config.inputName || this.session!.inputNames[0];
+    // Run inference
+    const feeds: Record<string, ort.Tensor> = {};
+    feeds[inputName] = inputTensor;
+    const results = await this.session!.run(feeds);
+    // Postprocess
+    let data: T;
+    if (this.config.postprocessing) {
+      data = this.config.postprocessing(results, metadata || this.config.metadata);
+    } else {
+      // Return raw outputs
+      data = results as any;
+    }
+    const inferenceTime = performance.now() - startTime;
+    return {
+      outputs: results,
+      data,
+      inferenceTime,
+      inputShape: [...inputTensor.dims],
+    };
+  }
+  /**
+   * Get model info
+   */
+  getModelInfo(): {
+    inputNames: string[];
+    outputNames: string[];
+    inputCount: number;
+    outputCount: number;
+  } {
+    if (!this.session) {
+      throw new Error('Model not initialized. Call init() first.');
+    }
+    return {
+      inputNames: [...this.session.inputNames],
+      outputNames: [...this.session.outputNames],
+      inputCount: this.session.inputNames.length,
+      outputCount: this.session.outputNames.length,
+    };
+  }
+  /**
+   * Get tensor by name from outputs
+   */
+  getOutputTensor<T extends ort.Tensor = ort.Tensor>(
+    outputs: Record<string, ort.Tensor>,
+    name?: string
+  ): T {
+    const tensorName = name || this.config.outputNames[0] || this.session!.outputNames[0];
+    return outputs[tensorName] as T;
+  }
+  /**
+   * Simple preprocessing - just normalize to [0, 1] and convert to CHW
+   */
+  private simplePreprocess(imageData: ImageData): ort.Tensor {
+    const { width, height, data } = imageData;
+    const tensor = new Float32Array(3 * width * height);
+    for (let i = 0; i < data.length; i += 4) {
+      const pixelIdx = i / 4;
+      tensor[pixelIdx] = data[i] / 255;
+      tensor[pixelIdx + width * height] = data[i + 1] / 255;
+      tensor[pixelIdx + 2 * width * height] = data[i + 2] / 255;
+    }
+    return new ort.Tensor('float32', tensor, [1, 3, height, width]);
+  }
+  /**
+   * Preprocess with letterbox and normalization
+   */
+  private preprocess(
+    imageData: ImageData,
+    imgWidth: number,
+    imgHeight: number,
+    inputSize: [number, number]
+  ): ort.Tensor {
+    const [inputW, inputH] = inputSize;
+    if (!this.canvas || !this.ctx) {
+      this.canvas = document.createElement('canvas');
+      this.canvas.width = inputW;
+      this.canvas.height = inputH;
+      this.ctx = this.canvas.getContext('2d', { willReadFrequently: true, alpha: false })!;
+    }
+    const ctx = this.ctx;
+    ctx.fillStyle = this.config.backgroundColor;
+    ctx.fillRect(0, 0, inputW, inputH);
+    // Calculate letterbox
+    const aspectRatio = imgWidth / imgHeight;
+    const targetAspectRatio = inputW / inputH;
+    let drawWidth: number, drawHeight: number, offsetX: number, offsetY: number;
+    if (this.config.keepAspectRatio) {
+      if (aspectRatio > targetAspectRatio) {
+        drawWidth = inputW;
+        drawHeight = Math.floor(inputW / aspectRatio);
+        offsetX = 0;
+        offsetY = Math.floor((inputH - drawHeight) / 2);
+      } else {
+        drawHeight = inputH;
+        drawWidth = Math.floor(inputH * aspectRatio);
+        offsetX = Math.floor((inputW - drawWidth) / 2);
+        offsetY = 0;
+      }
+    } else {
+      drawWidth = inputW;
+      drawHeight = inputH;
+      offsetX = 0;
+      offsetY = 0;
+    }
+    // Create source canvas
+    const srcCanvas = document.createElement('canvas');
+    const srcCtx = srcCanvas.getContext('2d')!;
+    srcCanvas.width = imgWidth;
+    srcCanvas.height = imgHeight;
+    srcCtx.putImageData(imageData, 0, 0);
+    // Draw with letterbox
+    ctx.drawImage(srcCanvas, 0, 0, imgWidth, imgHeight, offsetX, offsetY, drawWidth, drawHeight);
+    const paddedData = ctx.getImageData(0, 0, inputW, inputH);
+    const tensor = new Float32Array(inputW * inputH * 3);
+    const { mean, std } = this.config.normalization;
+    for (let i = 0; i < paddedData.data.length; i += 4) {
+      const pixelIdx = i / 4;
+      tensor[pixelIdx] = (paddedData.data[i] - mean[0]) / std[0];
+      tensor[pixelIdx + inputW * inputH] = (paddedData.data[i + 1] - mean[1]) / std[1];
+      tensor[pixelIdx + 2 * inputW * inputH] = (paddedData.data[i + 2] - mean[2]) / std[2];
+    }
+    return new ort.Tensor('float32', tensor, [1, 3, inputH, inputW]);
+  }
+  /**
+   * Dispose resources
+   */
+  dispose(): void {
+    if (this.session) {
+      this.session.release();
+      this.session = null;
+    }
+    this.initialized = false;
+  }
+}

package/src/solution/hand.ts ADDED Viewed

@@ -0,0 +1,52 @@
+/**
+ * Hand solution - hand pose estimation with 21 keypoints
+ */
+import { YOLOX } from '../models/yolox';
+import { RTMPose } from '../models/rtmpose';
+import { BBox } from '../types/index';
+export class Hand {
+  private detModel: YOLOX;
+  private poseModel: RTMPose;
+  constructor(
+    det: string = 'https://download.openmmlab.com/mmpose/v1/projects/rtmposev1/onnx_sdk/rtmdet_nano_8xb32-300e_hand-267f9c8f.zip',
+    detInputSize: [number, number] = [320, 320],
+    pose: string = 'https://download.openmmlab.com/mmpose/v1/projects/rtmposev1/onnx_sdk/rtmpose-m_simcc-hand5_pt-aic-coco_210e-256x256-74fb594_20230320.zip',
+    poseInputSize: [number, number] = [256, 256],
+    toOpenpose: boolean = false,
+    backend: 'onnxruntime' = 'onnxruntime',
+    device: string = 'cpu'
+  ) {
+    this.detModel = new YOLOX(
+      det,
+      detInputSize,
+      0.45,
+      0.5,
+      backend
+    );
+    this.poseModel = new RTMPose(
+      pose,
+      poseInputSize,
+      toOpenpose,
+      backend
+    );
+  }
+  async init(): Promise<void> {
+    await this.detModel.init();
+    await this.poseModel.init();
+  }
+  async call(
+    image: Uint8Array,
+    imgWidth: number,
+    imgHeight: number
+  ): Promise<{ keypoints: number[][]; scores: number[] }> {
+    const bboxes = await this.detModel.call(image, imgWidth, imgHeight);
+    const result = await this.poseModel.call(image, imgWidth, imgHeight, bboxes);
+    return result;
+  }
+}