PyPI - supervisely - Versions diffs - 6.73.356__py3-none-any.whl → 6.73.358__py3-none-any.whl - Mend

supervisely 6.73.356py3-none-any.whl → 6.73.358py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (46) hide show

supervisely/_utils.py +12 -0
supervisely/api/annotation_api.py +3 -0
supervisely/api/api.py +2 -2
supervisely/api/app_api.py +27 -2
supervisely/api/entity_annotation/tag_api.py +0 -1
supervisely/api/labeling_job_api.py +4 -1
supervisely/api/nn/__init__.py +0 -0
supervisely/api/nn/deploy_api.py +821 -0
supervisely/api/nn/neural_network_api.py +248 -0
supervisely/api/task_api.py +26 -467
supervisely/app/fastapi/subapp.py +1 -0
supervisely/nn/__init__.py +2 -1
supervisely/nn/artifacts/artifacts.py +5 -5
supervisely/nn/benchmark/object_detection/metric_provider.py +3 -0
supervisely/nn/experiments.py +28 -5
supervisely/nn/inference/cache.py +178 -114
supervisely/nn/inference/gui/gui.py +18 -35
supervisely/nn/inference/gui/serving_gui.py +3 -1
supervisely/nn/inference/inference.py +1421 -1265
supervisely/nn/inference/inference_request.py +412 -0
supervisely/nn/inference/object_detection_3d/object_detection_3d.py +31 -24
supervisely/nn/inference/session.py +2 -2
supervisely/nn/inference/tracking/base_tracking.py +45 -79
supervisely/nn/inference/tracking/bbox_tracking.py +220 -155
supervisely/nn/inference/tracking/mask_tracking.py +274 -250
supervisely/nn/inference/tracking/tracker_interface.py +23 -0
supervisely/nn/inference/uploader.py +164 -0
supervisely/nn/model/__init__.py +0 -0
supervisely/nn/model/model_api.py +259 -0
supervisely/nn/model/prediction.py +311 -0
supervisely/nn/model/prediction_session.py +632 -0
supervisely/nn/tracking/__init__.py +1 -0
supervisely/nn/tracking/boxmot.py +114 -0
supervisely/nn/tracking/tracking.py +24 -0
supervisely/nn/training/train_app.py +61 -19
supervisely/nn/utils.py +43 -3
supervisely/task/progress.py +12 -2
supervisely/video/video.py +107 -1
supervisely/volume_annotation/volume_figure.py +8 -2
{supervisely-6.73.356.dist-info → supervisely-6.73.358.dist-info}/METADATA +2 -1
{supervisely-6.73.356.dist-info → supervisely-6.73.358.dist-info}/RECORD +45 -34
supervisely/api/neural_network_api.py +0 -202
{supervisely-6.73.356.dist-info → supervisely-6.73.358.dist-info}/LICENSE +0 -0
{supervisely-6.73.356.dist-info → supervisely-6.73.358.dist-info}/WHEEL +0 -0
{supervisely-6.73.356.dist-info → supervisely-6.73.358.dist-info}/entry_points.txt +0 -0
{supervisely-6.73.356.dist-info → supervisely-6.73.358.dist-info}/top_level.txt +0 -0

supervisely/nn/inference/tracking/mask_tracking.py CHANGED Viewed

@@ -1,13 +1,12 @@
+import inspect
 import time
 import uuid
-from queue import Queue
-from threading import Event, Thread
 from typing import BinaryIO, Dict, List, Tuple
 import numpy as np
 from pydantic import ValidationError
-from supervisely._utils import find_value_by_keys
+from supervisely._utils import find_value_by_keys, get_valid_kwargs
 from supervisely.annotation.label import Geometry, Label
 from supervisely.annotation.obj_class import ObjClass
 from supervisely.api.api import Api
@@ -17,13 +16,14 @@ from supervisely.geometry.bitmap import Bitmap
 from supervisely.geometry.helpers import deserialize_geometry
 from supervisely.geometry.polygon import Polygon
 from supervisely.imaging import image as sly_image
+from supervisely.nn.inference.inference_request import InferenceRequest
 from supervisely.nn.inference.tracking.base_tracking import BaseTracking
 from supervisely.nn.inference.tracking.tracker_interface import (
     TrackerInterface,
     TrackerInterfaceV2,
 )
+from supervisely.nn.inference.uploader import Uploader
 from supervisely.sly_logger import logger
-from supervisely.task.progress import Progress
 class MaskTracking(BaseTracking):
@@ -92,19 +92,20 @@ class MaskTracking(BaseTracking):
                             )
         return results
-    def _track(self, api: Api, context: Dict):
-        self.video_interface = TrackerInterface(
+    def _track(self, api: Api, context: Dict, inference_request: InferenceRequest):
+        video_interface = TrackerInterface(
             context=context,
             api=api,
-            load_all_frames=True,
+            load_all_frames=False,
             notify_in_predict=True,
             per_point_polygon_tracking=False,
             frame_loader=self.cache.download_frame,
             frames_loader=self.cache.download_frames,
         )
+        video_interface.stop += video_interface.frames_count + 1
         range_of_frames = [
-            self.video_interface.frames_indexes[0],
-            self.video_interface.frames_indexes[-1],
+            video_interface.frames_indexes[0],
+            video_interface.frames_indexes[-1],
         ]
         if self.cache.is_persistent:
@@ -112,58 +113,201 @@ class MaskTracking(BaseTracking):
             self.cache.run_cache_task_manually(
                 api,
                 None,
-                video_id=self.video_interface.video_id,
+                video_id=video_interface.video_id,
             )
         else:
             # if cache is not persistent, run cache task for range of frames
             self.cache.run_cache_task_manually(
                 api,
                 [range_of_frames],
-                video_id=self.video_interface.video_id,
+                video_id=video_interface.video_id,
             )
-        api.logger.info("Starting tracking process")
+        api.logger.debug("frames_count = %s", video_interface.frames_count)
+        inference_request.set_stage("Downloading frames", 0, video_interface.frames_count)
         # load frames
-        frames = self.video_interface.frames
+        def _load_frames_cb(n: int = 1):
+            inference_request.done(n)
+            video_interface._notify(pos_increment=n, task="Downloading frames")
+        frames = self.cache.download_frames(
+            api,
+            video_interface.video_id,
+            video_interface.frames_indexes,
+            progress_cb=_load_frames_cb,
+        )
         # combine several binary masks into one multilabel mask
-        i = 0
+        i = 1
         label2id = {}
+        multilabel_mask = np.zeros(frames[0].shape, dtype=np.uint8)
+        for (fig_id, geometry), obj_id in zip(
+            video_interface.geometries.items(),
+            video_interface.object_ids,
+        ):
+            original_geometry = geometry.clone()
+            if not isinstance(geometry, Bitmap) and not isinstance(geometry, Polygon):
+                raise TypeError(f"This app does not support {geometry.geometry_name()} tracking")
+            # convert polygon to bitmap
+            if isinstance(geometry, Polygon):
+                polygon_obj_class = ObjClass("polygon", Polygon)
+                polygon_label = Label(geometry, polygon_obj_class)
+                bitmap_obj_class = ObjClass("bitmap", Bitmap)
+                bitmap_label = polygon_label.convert(bitmap_obj_class)[0]
+                geometry = bitmap_label.geometry
+            geometry.draw(bitmap=multilabel_mask, color=i)
+            label2id[i] = {
+                "fig_id": fig_id,
+                "obj_id": obj_id,
+                "original_geometry": original_geometry.geometry_name(),
+            }
+            i += 1
-        def _upload_loop(q: Queue, stop_event: Event, video_interface: TrackerInterface):
-            try:
-                while True:
-                    items = []
-                    while not q.empty():
-                        items.append(q.get_nowait())
-                    if len(items) > 0:
-                        video_interface.add_object_geometries_on_frames(*list(zip(*items)))
-                        continue
-                    if stop_event.is_set():
-                        video_interface._notify(True, task="stop tracking")
-                        return
-                    time.sleep(1)
-            except Exception as e:
-                api.logger.error("Error in upload loop: %s", str(e), exc_info=True)
-                video_interface._notify(True, task="stop tracking")
-                video_interface.global_stop_indicatior = True
-                raise
-        upload_queue = Queue()
-        stop_upload_event = Event()
-        Thread(
-            target=_upload_loop,
-            args=[upload_queue, stop_upload_event, self.video_interface],
-            daemon=True,
-        ).start()
-        try:
-            for (fig_id, geometry), obj_id in zip(
-                self.video_interface.geometries.items(),
-                self.video_interface.object_ids,
+        unique_labels = np.unique(multilabel_mask)
+        if 0 in unique_labels:
+            unique_labels = unique_labels[1:]
+        api.logger.debug("unique_labels = %s", unique_labels)
+        total_progress = len(unique_labels) * video_interface.frames_count
+        api.logger.info("Starting tracking process")
+        api.logger.debug("total_progress = %s", total_progress)
+        inference_request.set_stage(
+            InferenceRequest.Stage.INFERENCE,
+            0,
+            total_progress,
+        )
+        def _upload_f(items: List):
+            video_interface.add_object_geometries_on_frames(*list(zip(*items)))
+            inference_request.done(sum(item[-1] for item in items))
+        with Uploader(upload_f=_upload_f, logger=api.logger) as uploader:
+            # run tracker
+            tracked_multilabel_masks = self.predict(
+                frames=frames, input_mask=multilabel_mask[:, :, 0]
+            )
+            for curframe_i, mask in enumerate(
+                tracked_multilabel_masks, video_interface.frame_index
             ):
+                if curframe_i == video_interface.frame_index:
+                    continue
+                for i in unique_labels:
+                    binary_mask = mask == i
+                    fig_id = label2id[i]["fig_id"]
+                    obj_id = label2id[i]["obj_id"]
+                    geometry_type = label2id[i]["original_geometry"]
+                    if not np.any(binary_mask):
+                        api.logger.info(f"Skipping empty mask on frame {curframe_i}")
+                        inference_request.done()
+                    else:
+                        if geometry_type == "polygon":
+                            bitmap_geometry = Bitmap(binary_mask)
+                            bitmap_obj_class = ObjClass("bitmap", Bitmap)
+                            bitmap_label = Label(bitmap_geometry, bitmap_obj_class)
+                            polygon_obj_class = ObjClass("polygon", Polygon)
+                            polygon_labels = bitmap_label.convert(polygon_obj_class)
+                            geometries = [label.geometry for label in polygon_labels]
+                        else:
+                            geometries = [Bitmap(binary_mask)]
+                        uploader.put(
+                            [
+                                (
+                                    geometry,
+                                    obj_id,
+                                    curframe_i,
+                                    True if g_idx == len(geometries) - 1 else False,
+                                )
+                                for g_idx, geometry in enumerate(geometries)
+                            ]
+                        )
+                    if inference_request.is_stopped() or video_interface.global_stop_indicatior:
+                        api.logger.info(
+                            "Tracking stopped by user",
+                            extra={"inference_request_uuid": inference_request.uuid},
+                        )
+                        video_interface._notify(True, task="Stop tracking")
+                        return
+                    if uploader.has_exception():
+                        raise uploader.exception
+                api.logger.info(f"Frame {curframe_i} was successfully tracked")
+    def _track_async(self, api: Api, context: dict, inference_request: InferenceRequest):
+        tracker_interface = TrackerInterfaceV2(api, context, self.cache)
+        frames_count = tracker_interface.frames_count
+        figures = tracker_interface.figures
+        progress_total = frames_count * len(figures)
+        frame_range = [
+            tracker_interface.frame_indexes[0],
+            tracker_interface.frame_indexes[-1],
+        ]
+        frame_range_asc = [min(frame_range), max(frame_range)]
+        def _upload_f(items: List[Tuple[FigureInfo, bool]]):
+            inference_request.add_results([item[0] for item in items])
+            inference_request.done(sum(item[1] for item in items))
+        def _notify_f(items: List[Tuple[FigureInfo, bool]]):
+            frame_range = [
+                min(item[0].frame_index for item in items),
+                max(item[0].frame_index for item in items),
+            ]
+            tracker_interface.notify_progress(
+                inference_request.progress.current, inference_request.progress.total, frame_range
+            )
+        def _exception_handler(exception: Exception):
+            api.logger.error(f"Error saving predictions: {str(exception)}", exc_info=True)
+            tracker_interface.notify_progress(
+                inference_request.progress.current,
+                inference_request.progress.current,
+                frame_range_asc,
+            )
+            tracker_interface.notify_error(exception)
+            raise Exception
+        def _maybe_stop():
+            if inference_request.is_stopped() or tracker_interface.is_stopped():
+                if isinstance(tracker_interface.stop_reason(), Exception):
+                    raise tracker_interface.stop_reason()
+                api.logger.info(
+                    "Inference request stopped.",
+                    extra={"inference_request_uuid": inference_request.uuid},
+                )
+                tracker_interface.notify_progress(
+                    inference_request.progress.current,
+                    inference_request.progress.current,
+                    frame_range_asc,
+                )
+                return True
+            if uploader.has_exception():
+                raise uploader.exception
+            return False
+        # run tracker
+        frame_index = tracker_interface.frame_index
+        direction_n = tracker_interface.direction_n
+        api.logger.info("Start tracking.")
+        inference_request.set_stage(InferenceRequest.Stage.INFERENCE, 0, progress_total)
+        with Uploader(
+            upload_f=_upload_f,
+            notify_f=_notify_f,
+            exception_handler=_exception_handler,
+            logger=api.logger,
+        ) as uploader:
+            # combine several binary masks into one multilabel mask
+            i = 0
+            label2id = {}
+            # load frames
+            frames = tracker_interface.load_all_frames()
+            frames = [frame.image for frame in frames]
+            for figure in figures:
+                figure = api.video.figure._convert_json_info(figure)
+                fig_id = figure.id
+                obj_id = figure.object_id
+                geometry = deserialize_geometry(figure.geometry_type, figure.geometry)
                 original_geometry = geometry.clone()
-                if not isinstance(geometry, Bitmap) and not isinstance(geometry, Polygon):
-                    stop_upload_event.set()
+                if not isinstance(geometry, (Bitmap, Polygon)):
                     raise TypeError(
                         f"This app does not support {geometry.geometry_name()} tracking"
                     )
@@ -187,26 +331,34 @@ class MaskTracking(BaseTracking):
                     "obj_id": obj_id,
                     "original_geometry": original_geometry.geometry_name(),
                 }
-            # run tracker
+                if _maybe_stop():
+                    return
+            # predict
             tracked_multilabel_masks = self.predict(
                 frames=frames, input_mask=multilabel_mask[:, :, 0]
             )
             tracked_multilabel_masks = np.array(tracked_multilabel_masks)
             # decompose multilabel masks into binary masks
             for i in np.unique(tracked_multilabel_masks):
+                if _maybe_stop():
+                    return
                 if i != 0:
                     binary_masks = tracked_multilabel_masks == i
                     fig_id = label2id[i]["fig_id"]
                     obj_id = label2id[i]["obj_id"]
                     geometry_type = label2id[i]["original_geometry"]
-                    for j, mask in enumerate(binary_masks[1:]):
+                    for j, mask in enumerate(binary_masks[1:], 1):
+                        if _maybe_stop():
+                            return
+                        this_figure_index = frame_index + j * direction_n
                         # check if mask is not empty
                         if not np.any(mask):
-                            api.logger.info(
-                                f"Skipping empty mask on frame {self.video_interface.frame_index + j + 1}"
-                            )
+                            api.logger.info(f"Skipping empty mask on frame {this_figure_index}")
                             # update progress bar anyway (otherwise it will not be finished)
-                            self.video_interface._notify(task="add geometry on frame")
+                            inference_request.done()
                         else:
                             if geometry_type == "polygon":
                                 bitmap_geometry = Bitmap(mask)
@@ -218,184 +370,29 @@ class MaskTracking(BaseTracking):
                             else:
                                 geometries = [Bitmap(mask)]
                             for l, geometry in enumerate(geometries):
-                                if l == len(geometries) - 1:
-                                    notify = True
-                                else:
-                                    notify = False
-                                upload_queue.put(
-                                    (
-                                        geometry,
-                                        obj_id,
-                                        self.video_interface.frames_indexes[j + 1],
-                                        notify,
-                                    )
+                                figure_id = uuid.uuid5(
+                                    namespace=uuid.NAMESPACE_URL, name=f"{time.time()}"
+                                ).hex
+                                result_figure = api.video.figure._convert_json_info(
+                                    {
+                                        ApiField.ID: figure_id,
+                                        ApiField.OBJECT_ID: obj_id,
+                                        "meta": {"frame": this_figure_index},
+                                        ApiField.GEOMETRY_TYPE: geometry.geometry_name(),
+                                        ApiField.GEOMETRY: geometry.to_json(),
+                                        ApiField.TRACK_ID: tracker_interface.track_id,
+                                    }
                                 )
-                    if self.video_interface.global_stop_indicatior:
-                        stop_upload_event.set()
-                        return
-                    api.logger.info(f"Figure with id {fig_id} was successfully tracked")
-        except Exception:
-            stop_upload_event.set()
-            raise
-        stop_upload_event.set()
-    def _track_async(self, api: Api, context: dict, inference_request_uuid: str = None):
-        inference_request = self._inference_requests[inference_request_uuid]
-        tracker_interface = TrackerInterfaceV2(api, context, self.cache)
-        progress: Progress = inference_request["progress"]
-        frames_count = tracker_interface.frames_count
-        figures = tracker_interface.figures
-        progress_total = frames_count * len(figures)
-        progress.total = progress_total
-        def _upload_f(items: List[Tuple[FigureInfo, bool]]):
-            with inference_request["lock"]:
-                inference_request["pending_results"].extend([item[0] for item in items])
-        def _notify_f(items: List[Tuple[FigureInfo, bool]]):
-            items_by_object_id: Dict[int, List[Tuple[FigureInfo, bool]]] = {}
-            for item in items:
-                items_by_object_id.setdefault(item[0].object_id, []).append(item)
-            for object_id, object_items in items_by_object_id.items():
-                frame_range = [
-                    min(item[0].frame_index for item in object_items),
-                    max(item[0].frame_index for item in object_items),
-                ]
-                progress.iters_done_report(sum(1 for item in object_items if item[1]))
-                tracker_interface.notify_progress(progress.current, progress.total, frame_range)
-        # run tracker
-        frame_index = tracker_interface.frame_index
-        direction_n = tracker_interface.direction_n
-        api.logger.info("Start tracking.")
-        try:
-            with tracker_interface(_upload_f, _notify_f):
-                # combine several binary masks into one multilabel mask
-                i = 0
-                label2id = {}
-                # load frames
-                frames = tracker_interface.load_all_frames()
-                frames = [frame.image for frame in frames]
-                for figure in figures:
-                    figure = api.video.figure._convert_json_info(figure)
-                    fig_id = figure.id
-                    obj_id = figure.object_id
-                    geometry = deserialize_geometry(figure.geometry_type, figure.geometry)
-                    original_geometry = geometry.clone()
-                    if not isinstance(geometry, (Bitmap, Polygon)):
-                        raise TypeError(
-                            f"This app does not support {geometry.geometry_name()} tracking"
-                        )
-                    # convert polygon to bitmap
-                    if isinstance(geometry, Polygon):
-                        polygon_obj_class = ObjClass("polygon", Polygon)
-                        polygon_label = Label(geometry, polygon_obj_class)
-                        bitmap_obj_class = ObjClass("bitmap", Bitmap)
-                        bitmap_label = polygon_label.convert(bitmap_obj_class)[0]
-                        geometry = bitmap_label.geometry
-                    if i == 0:
-                        multilabel_mask = geometry.data.astype(int)
-                        multilabel_mask = np.zeros(frames[0].shape, dtype=np.uint8)
-                        geometry.draw(bitmap=multilabel_mask, color=[1, 1, 1])
-                        i += 1
-                    else:
-                        i += 1
-                        geometry.draw(bitmap=multilabel_mask, color=[i, i, i])
-                    label2id[i] = {
-                        "fig_id": fig_id,
-                        "obj_id": obj_id,
-                        "original_geometry": original_geometry.geometry_name(),
-                    }
-                    if inference_request["cancel_inference"]:
-                        return
-                    if tracker_interface.is_stopped():
-                        reason = tracker_interface.stop_reason()
-                        if isinstance(reason, Exception):
-                            raise reason
-                        return
-                # predict
-                tracked_multilabel_masks = self.predict(
-                    frames=frames, input_mask=multilabel_mask[:, :, 0]
-                )
-                tracked_multilabel_masks = np.array(tracked_multilabel_masks)
-                # decompose multilabel masks into binary masks
-                for i in np.unique(tracked_multilabel_masks):
-                    if inference_request["cancel_inference"]:
-                        return
-                    if tracker_interface.is_stopped():
-                        reason = tracker_interface.stop_reason()
-                        if isinstance(reason, Exception):
-                            raise reason
-                        return
-                    if i != 0:
-                        binary_masks = tracked_multilabel_masks == i
-                        fig_id = label2id[i]["fig_id"]
-                        obj_id = label2id[i]["obj_id"]
-                        geometry_type = label2id[i]["original_geometry"]
-                        for j, mask in enumerate(binary_masks[1:], 1):
-                            if inference_request["cancel_inference"]:
-                                return
-                            if tracker_interface.is_stopped():
-                                reason = tracker_interface.stop_reason()
-                                if isinstance(reason, Exception):
-                                    raise reason
-                                return
-                            this_figure_index = frame_index + j * direction_n
-                            # check if mask is not empty
-                            if not np.any(mask):
-                                api.logger.info(f"Skipping empty mask on frame {this_figure_index}")
-                                # update progress bar anyway (otherwise it will not be finished)
-                                progress.iter_done_report()
-                            else:
-                                if geometry_type == "polygon":
-                                    bitmap_geometry = Bitmap(mask)
-                                    bitmap_obj_class = ObjClass("bitmap", Bitmap)
-                                    bitmap_label = Label(bitmap_geometry, bitmap_obj_class)
-                                    polygon_obj_class = ObjClass("polygon", Polygon)
-                                    polygon_labels = bitmap_label.convert(polygon_obj_class)
-                                    geometries = [label.geometry for label in polygon_labels]
-                                else:
-                                    geometries = [Bitmap(mask)]
-                                for l, geometry in enumerate(geometries):
-                                    figure_id = uuid.uuid5(
-                                        namespace=uuid.NAMESPACE_URL, name=f"{time.time()}"
-                                    ).hex
-                                    result_figure = api.video.figure._convert_json_info(
-                                        {
-                                            ApiField.ID: figure_id,
-                                            ApiField.OBJECT_ID: obj_id,
-                                            "meta": {"frame": this_figure_index},
-                                            ApiField.GEOMETRY_TYPE: geometry.geometry_name(),
-                                            ApiField.GEOMETRY: geometry.to_json(),
-                                            ApiField.TRACK_ID: tracker_interface.track_id,
-                                        }
-                                    )
-                                    should_notify = l == len(geometries) - 1
-                                    tracker_interface.add_prediction((result_figure, should_notify))
-                        api.logger.info(
-                            "Figure [%d, %d] tracked.",
-                            i,
-                            len(figures),
-                            extra={"figure_id": figure.id},
-                        )
-        except Exception:
-            progress.message = "Error occured during tracking"
-            raise
-        else:
-            progress.message = "Ready"
-        finally:
-            progress.set(current=0, total=1, report=True)
-    # Implement the following methods in the derived class
-    def track(self, api: Api, state: Dict, context: Dict):
-        fn = self.send_error_data(api, context)(self._track)
-        self.schedule_task(fn, api, context)
-        return {"message": "Tracking has started."}
+                                should_notify = l == len(geometries) - 1
+                                tracker_interface.add_prediction((result_figure, should_notify))
+                    api.logger.info(
+                        "Figure [%d, %d] tracked.",
+                        i,
+                        len(figures),
+                        extra={"figure_id": figure.id},
+                    )
-    def track_api(self, api: Api, state: Dict, context: Dict):
+    def _track_api(self, api: Api, context: Dict, inference_request: InferenceRequest):
         # unused fields:
         context["trackId"] = "auto"
         context["objectIds"] = []
@@ -405,7 +402,7 @@ class MaskTracking(BaseTracking):
         input_geometries: list = context["input_geometries"]
-        self.video_interface = TrackerInterface(
+        video_interface = TrackerInterface(
             context=context,
             api=api,
             load_all_frames=True,
@@ -417,8 +414,8 @@ class MaskTracking(BaseTracking):
         )
         range_of_frames = [
-            self.video_interface.frames_indexes[0],
-            self.video_interface.frames_indexes[-1],
+            video_interface.frames_indexes[0],
+            video_interface.frames_indexes[-1],
         ]
         if self.cache.is_persistent:
@@ -426,24 +423,29 @@ class MaskTracking(BaseTracking):
             self.cache.run_cache_task_manually(
                 api,
                 None,
-                video_id=self.video_interface.video_id,
+                video_id=video_interface.video_id,
             )
         else:
             # if cache is not persistent, run cache task for range of frames
             self.cache.run_cache_task_manually(
                 api,
                 [range_of_frames],
-                video_id=self.video_interface.video_id,
+                video_id=video_interface.video_id,
             )
-        api.logger.info("Starting tracking process")
+        inference_request.set_stage("Downloading frames", 0, video_interface.frames_count)
         # load frames
-        frames = self.video_interface.frames
+        frames = self.cache.download_frames(
+            api,
+            video_interface.video_id,
+            video_interface.frames_indexes,
+            progress_cb=inference_request.done,
+        )
         # combine several binary masks into one multilabel mask
-        i = 0
         label2id = {}
-        for input_geom in input_geometries:
+        multilabel_mask = np.zeros(frames[0].shape, dtype=np.uint8)
+        for i, input_geom in enumerate(input_geometries, 1):
             geometry = self._deserialize_geometry(input_geom)
             if not isinstance(geometry, Bitmap) and not isinstance(geometry, Polygon):
                 raise TypeError(f"This app does not support {geometry.geometry_name()} tracking")
@@ -454,18 +456,24 @@ class MaskTracking(BaseTracking):
                 bitmap_obj_class = ObjClass("bitmap", Bitmap)
                 bitmap_label = polygon_label.convert(bitmap_obj_class)[0]
                 geometry = bitmap_label.geometry
-            if i == 0:
-                multilabel_mask = geometry.data.astype(int)
-                multilabel_mask = np.zeros(frames[0].shape, dtype=np.uint8)
-                geometry.draw(bitmap=multilabel_mask, color=[1, 1, 1])
-                i += 1
-            else:
-                i += 1
-                geometry.draw(bitmap=multilabel_mask, color=[i, i, i])
+            geometry.draw(bitmap=multilabel_mask, color=i)
             label2id[i] = {
                 "original_geometry": geometry.geometry_name(),
             }
+        result_indexes = np.unique(multilabel_mask)
+        progress_total = len(result_indexes)
+        if 0 in result_indexes:
+            progress_total -= 1
+        progress_total = progress_total * video_interface.frames_count
+        api.logger.info("Starting tracking process")
+        inference_request.set_stage(
+            InferenceRequest.Stage.INFERENCE,
+            0,
+            progress_total,
+        )
         # run tracker
         tracked_multilabel_masks = self.predict(frames=frames, input_mask=multilabel_mask[:, :, 0])
         tracked_multilabel_masks = np.array(tracked_multilabel_masks)
@@ -492,8 +500,25 @@ class MaskTracking(BaseTracking):
         # predictions must be NxK masks: N=number of frames, K=number of objects
         predictions = list(map(list, zip(*predictions)))
+        inference_request.final_result = predictions
         return predictions
+    # Implement the following methods in the derived class
+    def track(self, api: Api, state: Dict, context: Dict):
+        fn = self.send_error_data(api, context)(self._track)
+        self.inference_requests_manager.schedule_task(fn, api, context)
+        return {"message": "Tracking has started."}
+    def track_api(self, api: Api, state: Dict, context: Dict):
+        inference_request, future = self.inference_requests_manager.schedule_task(
+            self._track_api, api, context
+        )
+        future.result()
+        logger.info(
+            "Track-api request processed.", extra={"inference_request_uuid": inference_request.uuid}
+        )
+        return inference_request.final_result
     def track_api_files(
         self,
         files: List[BinaryIO],
@@ -524,15 +549,14 @@ class MaskTracking(BaseTracking):
                 f"Batch size should be less than or equal to {self.max_batch_size} for this model."
             )
-        inference_request_uuid = uuid.uuid5(namespace=uuid.NAMESPACE_URL, name=f"{time.time()}").hex
         fn = self.send_error_data(api, context)(self._track_async)
-        self.schedule_task(fn, api, context, inference_request_uuid=inference_request_uuid)
+        inference_request, _ = self.inference_requests_manager.schedule_task(fn, api, context)
         logger.debug(
             "Inference has scheduled from 'track_async' endpoint",
-            extra={"inference_request_uuid": inference_request_uuid},
+            extra={"inference_request_uuid": inference_request.uuid},
         )
         return {
             "message": "Inference has started.",
-            "inference_request_uuid": inference_request_uuid,
+            "inference_request_uuid": inference_request.uuid,
         }

supervisely 6.73.356__py3-none-any.whl → 6.73.358__py3-none-any.whl

supervisely 6.73.356py3-none-any.whl → 6.73.358py3-none-any.whl