PyPI - vidformer - Versions diffs - 0.11.0__py3-none-any.whl → 0.12.0__py3-none-any.whl - Mend

vidformer 0.11.0py3-none-any.whl → 0.12.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (7) hide show

vidformer/__init__.py +11 -6
vidformer/cv2/__init__.py +25 -7
vidformer/supervision/__init__.py +91 -1
{vidformer-0.11.0.dist-info → vidformer-0.12.0.dist-info}/METADATA +2 -2
vidformer-0.12.0.dist-info/RECORD +6 -0
{vidformer-0.11.0.dist-info → vidformer-0.12.0.dist-info}/WHEEL +1 -1
vidformer-0.11.0.dist-info/RECORD +0 -6

vidformer/__init__.py CHANGED Viewed

@@ -9,7 +9,7 @@ vidformer-py is a Python 🐍 interface for [vidformer](https://github.com/ixlab
 * [🧑‍💻 Source Code](https://github.com/ixlab/vidformer/tree/main/vidformer-py/)
 """
-__version__ = "0.11.0"
+__version__ = "0.12.0"
 import base64
@@ -105,14 +105,14 @@ def _play(namespace, hls_video_url, hls_js_url, method="html", status_url=None):
     <script src="{hls_js_url}"></script>
 </head>
 <body>
-    <div id="container"></div>
+    <div id="container-{namespace}"></div>
     <script>
         var statusUrl = '{status_url}';
         var videoSrc = '{hls_video_url}';
         var videoNamespace = '{namespace}';
         function showWaiting() {{
-            document.getElementById('container').textContent = 'Waiting...';
+            document.getElementById('container-{namespace}').textContent = 'Waiting...';
             pollStatus();
         }}
@@ -122,7 +122,7 @@ def _play(namespace, hls_video_url, hls_js_url, method="html", status_url=None):
                     .then(r => r.json())
                     .then(res => {{
                         if (res.ready) {{
-                            document.getElementById('container').textContent = '';
+                            document.getElementById('container-{namespace}').textContent = '';
                             attachHls();
                         }} else {{
                             pollStatus();
@@ -136,7 +136,7 @@ def _play(namespace, hls_video_url, hls_js_url, method="html", status_url=None):
         }}
         function attachHls() {{
-            var container = document.getElementById('container');
+            var container = document.getElementById('container-{namespace}');
             container.textContent = '';
             var video = document.createElement('video');
             video.id = 'video-' + videoNamespace;
@@ -1196,7 +1196,12 @@ class YrdenServer:
     def __del__(self):
         if self._proc is not None:
-            self._proc.kill()
+            self._proc.terminate()
+            try:
+                self._proc.wait(timeout=1)
+            except subprocess.TimeoutExpired:
+                self._proc.kill()
+                self._proc.wait()
 class YrdenSource:

vidformer/cv2/__init__.py CHANGED Viewed

@@ -265,8 +265,12 @@ class Frame:
                 raise NotImplementedError("Only 1-channel mask frames are supported")
             # Value should be a bgr or bgra color
-            if type(value) is not list or len(value) not in [3, 4]:
-                raise NotImplementedError("Value should be a 3 or 4 element list")
+            if (type(value) is not list and type(value) is not tuple) or len(
+                value
+            ) not in [3, 4]:
+                raise NotImplementedError(
+                    "Value should be a 3 or 4 element list or tuple"
+                )
             value = [float(x) for x in value]
             if len(value) == 3:
                 value.append(255.0)
@@ -348,7 +352,7 @@ class VideoCapture:
         elif prop == CAP_PROP_FRAME_HEIGHT:
             return self._source.fmt()["height"]
         elif prop == CAP_PROP_FRAME_COUNT:
-            return len(self._source.ts())
+            return len(self._source)
         elif prop == CAP_PROP_POS_FRAMES:
             return self._next_frame_idx
@@ -374,6 +378,20 @@ class VideoCapture:
         frame = Frame(frame, self._source.fmt())
         return True, frame
+    def __getitem__(self, key):
+        if not isinstance(key, int):
+            raise NotImplementedError("Only integer indexing is supported")
+        if key < 0:
+            key = len(self._source) + key
+        if key < 0 or key >= len(self._source):
+            raise IndexError("Index out of bounds")
+        frame = self._source.iloc[key]
+        frame = Frame(frame, self._source.fmt())
+        return frame
+    def __len__(self):
+        return len(self._source)
     def release(self):
         pass
@@ -425,7 +443,7 @@ class _IgniVideoWriter:
         assert isinstance(size, tuple) or isinstance(size, list)
         assert len(size) == 2
-        height, width = size
+        width, height = size
         assert ttl is None or isinstance(ttl, int)
         self._spec = server.create_spec(
             width, height, "yuv420p", vod_segment_length, 1 / self._f_time, ttl=ttl
@@ -514,8 +532,8 @@ class _YrdenVideoWriter:
     def spec(self) -> vf.YrdenSpec:
         fmt = {
-            "width": self._size[1],
-            "height": self._size[0],
+            "width": self._size[0],
+            "height": self._size[1],
             "pix_fmt": self._pix_fmt,
         }
         domain = _fps_to_ts(self._fps, len(self._frames))
@@ -658,7 +676,7 @@ def resize(src, dsize):
     assert isinstance(dsize, tuple) or isinstance(dsize, list)
     assert len(dsize) == 2
-    height, width = dsize
+    width, height = dsize
     f = _filter_scale(src._f, width=width, height=height)
     fmt = {"width": width, "height": height, "pix_fmt": src._fmt["pix_fmt"]}

vidformer/supervision/__init__.py CHANGED Viewed

@@ -14,6 +14,11 @@ from supervision.geometry.core import Position
 import vidformer.cv2 as vf_cv2
+try:
+    import cv2 as ocv_cv2
+except ImportError:
+    ocv_cv2 = None
 CV2_FONT = vf_cv2.FONT_HERSHEY_SIMPLEX
@@ -272,7 +277,6 @@ class DotAnnotator:
         outline_thickness: int = 0,
         outline_color=Color.BLACK,
     ):
         self.color = color
         self.radius: int = radius
         self.position: Position = position
@@ -537,3 +541,89 @@ class LabelAnnotator:
                     thickness=-1,
                 )
         return scene
+class MaskAnnotator:
+    def __init__(
+        self,
+        color=ColorPalette.DEFAULT,
+        opacity: float = 0.5,
+        color_lookup: ColorLookup = ColorLookup.CLASS,
+    ):
+        self.color = color
+        self.opacity = opacity
+        self.color_lookup: ColorLookup = color_lookup
+    def annotate(
+        self,
+        scene,
+        detections: Detections,
+        custom_color_lookup=None,
+    ):
+        if detections.mask is None:
+            return scene
+        colored_mask = scene.copy()
+        for detection_idx in np.flip(np.argsort(detections.box_area)):
+            color = resolve_color(
+                color=self.color,
+                detections=detections,
+                detection_idx=detection_idx,
+                color_lookup=(
+                    self.color_lookup
+                    if custom_color_lookup is None
+                    else custom_color_lookup
+                ),
+            )
+            mask = detections.mask[detection_idx]
+            colored_mask[mask] = color.as_bgr()
+        vf_cv2.addWeighted(
+            colored_mask, self.opacity, scene, 1 - self.opacity, 0, dst=scene
+        )
+        return scene
+class MaskStreamWriter:
+    def __init__(self, path: str, shape: tuple):
+        # Shape should be (width, height)
+        assert ocv_cv2 is not None, "OpenCV cv2 is required for ExternDetectionsBuilder"
+        assert type(shape) is tuple, "shape must be a tuple"
+        assert len(shape) == 2, "shape must be a tuple of length 2"
+        self._shape = (shape[1], shape[0])
+        self._writer = ocv_cv2.VideoWriter(
+            path, ocv_cv2.VideoWriter_fourcc(*"FFV1"), 1, shape, isColor=False
+        )
+        assert self._writer.isOpened(), f"Failed to open video writer at {path}"
+        self._i = 0
+    def write_detections(self, detections: Detections):
+        if len(detections) == 0:
+            return self._i
+        mask = detections.mask
+        assert (
+            mask.shape[1:] == self._shape
+        ), f"mask shape ({mask.shape[:1]}) must match the shape of the video ({self._shape})"
+        for i in range(mask.shape[0]):
+            frame_uint8 = detections.mask[i].astype(np.uint8)
+            self._writer.write(frame_uint8)
+            self._i += 1
+        return self._i
+    def release(self):
+        self._writer.release()
+def populate_mask(
+    detections: Detections, mask_stream: vf_cv2.VideoCapture, frame_idx: int
+):
+    assert type(detections) is Detections
+    assert detections.mask is None
+    detections.mask = []
+    assert len(detections) + frame_idx <= len(mask_stream)
+    for i in range(len(detections)):
+        mask = mask_stream[frame_idx + i]
+        assert mask.shape[2] == 1, "mask must be a single channel image"
+        detections.mask.append(mask)

{vidformer-0.11.0.dist-info → vidformer-0.12.0.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
-Metadata-Version: 2.3
+Metadata-Version: 2.4
 Name: vidformer
-Version: 0.11.0
+Version: 0.12.0
 Summary: vidformer-py is a Python 🐍 interface for [vidformer](https://github.com/ixlab/vidformer).
 Author-email: Dominik Winecki <dominikwinecki@gmail.com>
 Requires-Python: >=3.8

vidformer-0.12.0.dist-info/RECORD ADDED Viewed

@@ -0,0 +1,6 @@
+vidformer/__init__.py,sha256=2_IA8eCF8xIWqgdcpC06CSEsX_b2DPpOww3tuQlY3rg,55692
+vidformer/cv2/__init__.py,sha256=cp1qJPpxpRGCE3elmoHDxhzafZbopZ9wIkKcZJJI8HM,30105
+vidformer/supervision/__init__.py,sha256=dRHAcHiZN68gUH_2m3o7Ohsv3NBGxF4XGPeI0pn2_K4,20346
+vidformer-0.12.0.dist-info/WHEEL,sha256=_2ozNFCLWc93bK4WKHCO-eDUENDlo-dgc9cU3qokYO4,82
+vidformer-0.12.0.dist-info/METADATA,sha256=C3OsKiJjYPCgiUblJUan2-aQG5TOprdCn2cduqJBow0,1800
+vidformer-0.12.0.dist-info/RECORD,,

{vidformer-0.11.0.dist-info → vidformer-0.12.0.dist-info}/WHEEL RENAMED Viewed

@@ -1,4 +1,4 @@
 Wheel-Version: 1.0
-Generator: flit 3.10.1
+Generator: flit 3.11.0
 Root-Is-Purelib: true
 Tag: py3-none-any

vidformer-0.11.0.dist-info/RECORD DELETED Viewed

@@ -1,6 +0,0 @@
-vidformer/__init__.py,sha256=lbbyaiV57QsaXmvHfrz_RXLaRnFMfm5ulK2dN701X-E,55465
-vidformer/cv2/__init__.py,sha256=9J_PV306rHYlf4FgBeQqJnlJJ6d2Mcb9s0TfiH8fASA,29528
-vidformer/supervision/__init__.py,sha256=KR-keBgDG29TSyIFU4Czgd8Yc5qckJKlSaMcPj_z-Zc,17490
-vidformer-0.11.0.dist-info/WHEEL,sha256=CpUCUxeHQbRN5UGRQHYRJorO5Af-Qy_fHMctcQ8DSGI,82
-vidformer-0.11.0.dist-info/METADATA,sha256=K3-g51c1iXRrkmqRwoYLUN8uJThtSCkjMs7kzr2SvNw,1800
-vidformer-0.11.0.dist-info/RECORD,,

vidformer 0.11.0__py3-none-any.whl → 0.12.0__py3-none-any.whl

vidformer 0.11.0py3-none-any.whl → 0.12.0py3-none-any.whl