PyPI - ml-dash - Versions diffs - 0.6.14__tar.gz → 0.6.15__tar.gz - Mend

ml-dash 0.6.14tar.gz → 0.6.15tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (37) hide show

{ml_dash-0.6.14 → ml_dash-0.6.15}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.3
 Name: ml-dash
-Version: 0.6.14
+Version: 0.6.15
 Summary: ML experiment tracking and data storage
 Keywords: machine-learning,experiment-tracking,mlops,data-storage
 Author: Ge Yang, Tom Tao

{ml_dash-0.6.14 → ml_dash-0.6.15}/pyproject.toml RENAMED Viewed

@@ -1,6 +1,6 @@
 [project]
 name = "ml-dash"
-version = "0.6.14"
+version = "0.6.15"
 description = "ML experiment tracking and data storage"
 readme = "README.md"
 requires-python = ">=3.9"

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/buffer.py RENAMED Viewed

@@ -57,6 +57,11 @@ def _serialize_value(value: Any) -> Any:
 class BufferConfig:
     """Configuration for buffering behavior."""
+    # Internal constants for queue management (not exposed to users)
+    _MAX_QUEUE_SIZE = 100000  # Maximum items before blocking
+    _WARNING_THRESHOLD = 80000  # Warn at 80% capacity
+    _AGGRESSIVE_FLUSH_THRESHOLD = 50000  # Trigger immediate flush at 50% capacity
     def __init__(
         self,
         flush_interval: float = 5.0,
@@ -114,17 +119,20 @@ class BackgroundBufferManager:
         self._experiment = experiment
         self._config = config
-        # Resource-specific queues
-        self._log_queue: Queue = Queue()
+        # Resource-specific queues with bounded size to prevent OOM
+        self._log_queue: Queue = Queue(maxsize=config._MAX_QUEUE_SIZE)
         self._metric_queues: Dict[Optional[str], Queue] = {}  # Per-metric queues
         self._track_buffers: Dict[str, Dict[float, Dict[str, Any]]] = {}  # Per-topic: {timestamp: merged_data}
-        self._file_queue: Queue = Queue()
+        self._file_queue: Queue = Queue(maxsize=config._MAX_QUEUE_SIZE)
         # Track last flush times per resource type
         self._last_log_flush = time.time()
         self._last_metric_flush: Dict[Optional[str], float] = {}
         self._last_track_flush: Dict[str, float] = {}  # Per-topic flush times
+        # Track warnings to avoid spamming
+        self._warned_queues: set = set()
         # Background thread control
         self._thread: Optional[threading.Thread] = None
         self._stop_event = threading.Event()
@@ -184,6 +192,34 @@ class BackgroundBufferManager:
         self._thread = None
+    def _check_queue_pressure(self, queue: Queue, queue_name: str) -> None:
+        """
+        Check queue size and trigger aggressive flushing if needed.
+        This prevents OOM by flushing immediately when queue fills up.
+        Args:
+            queue: The queue to check
+            queue_name: Name for warning messages
+        """
+        qsize = queue.qsize()
+        # Trigger immediate flush if queue is getting full
+        if qsize >= self._config._AGGRESSIVE_FLUSH_THRESHOLD:
+            self._flush_event.set()
+        # Warn once if queue is filling up (80% capacity)
+        if qsize >= self._config._WARNING_THRESHOLD:
+            if queue_name not in self._warned_queues:
+                warnings.warn(
+                    f"[ML-Dash] {queue_name} queue is {qsize}/{self._config._MAX_QUEUE_SIZE} full. "
+                    f"Data is being generated faster than it can be flushed. "
+                    f"Consider reducing logging frequency or the background flush will block to prevent OOM.",
+                    RuntimeWarning,
+                    stacklevel=3
+                )
+                self._warned_queues.add(queue_name)
     def buffer_log(
         self,
         message: str,
@@ -192,7 +228,10 @@ class BackgroundBufferManager:
         timestamp: Optional[datetime],
     ) -> None:
         """
-        Add log to buffer (non-blocking).
+        Add log to buffer with automatic backpressure.
+        If queue is full, this will block until space is available.
+        This prevents OOM when logs are generated faster than they can be flushed.
         Args:
             message: Log message
@@ -200,6 +239,9 @@ class BackgroundBufferManager:
             metadata: Optional metadata
             timestamp: Optional timestamp
         """
+        # Check queue pressure and trigger aggressive flushing if needed
+        self._check_queue_pressure(self._log_queue, "Log")
         log_entry = {
             "timestamp": (timestamp or datetime.utcnow()).isoformat() + "Z",
             "level": level,
@@ -209,6 +251,7 @@ class BackgroundBufferManager:
         if metadata:
             log_entry["metadata"] = metadata
+        # Will block if queue is full (backpressure to prevent OOM)
         self._log_queue.put(log_entry)
     def buffer_metric(
@@ -220,7 +263,10 @@ class BackgroundBufferManager:
         metadata: Optional[Dict[str, Any]],
     ) -> None:
         """
-        Add metric datapoint to buffer (non-blocking).
+        Add metric datapoint to buffer with automatic backpressure.
+        If queue is full, this will block until space is available.
+        This prevents OOM when metrics are generated faster than they can be flushed.
         Args:
             metric_name: Metric name (can be None for unnamed metrics)
@@ -229,11 +275,18 @@ class BackgroundBufferManager:
             tags: Optional tags
             metadata: Optional metadata
         """
-        # Get or create queue for this metric
+        # Get or create queue for this metric (with bounded size)
         if metric_name not in self._metric_queues:
-            self._metric_queues[metric_name] = Queue()
+            self._metric_queues[metric_name] = Queue(maxsize=self._config._MAX_QUEUE_SIZE)
             self._last_metric_flush[metric_name] = time.time()
+        # Check queue pressure and trigger aggressive flushing if needed
+        metric_display = f"'{metric_name}'" if metric_name else "unnamed"
+        self._check_queue_pressure(
+            self._metric_queues[metric_name],
+            f"Metric {metric_display}"
+        )
         metric_entry = {
             "data": data,
             "description": description,
@@ -241,6 +294,7 @@ class BackgroundBufferManager:
             "metadata": metadata,
         }
+        # Will block if queue is full (backpressure to prevent OOM)
         self._metric_queues[metric_name].put(metric_entry)
     def buffer_track(
@@ -286,7 +340,9 @@ class BackgroundBufferManager:
         size_bytes: int,
     ) -> None:
         """
-        Add file upload to queue (non-blocking).
+        Add file upload to queue with automatic backpressure.
+        If queue is full, this will block until space is available.
         Args:
             file_path: Local file path
@@ -299,6 +355,9 @@ class BackgroundBufferManager:
             content_type: MIME type
             size_bytes: File size in bytes
         """
+        # Check queue pressure and trigger aggressive flushing if needed
+        self._check_queue_pressure(self._file_queue, "File")
         file_entry = {
             "file_path": file_path,
             "prefix": prefix,
@@ -311,6 +370,7 @@ class BackgroundBufferManager:
             "size_bytes": size_bytes,
         }
+        # Will block if queue is full (backpressure to prevent OOM)
         self._file_queue.put(file_entry)
     def flush_all(self) -> None:
@@ -425,13 +485,73 @@ class BackgroundBufferManager:
             if triggered:
                 self._flush_event.clear()
-        # Final flush on shutdown
-        self._flush_logs()
+        # Final flush on shutdown - loop until all queues are empty
+        # This ensures no data is lost when shutting down with large queues
+        # Show progress bar for large flushes
+        initial_counts = {
+            'logs': self._log_queue.qsize(),
+            'metrics': {name: q.qsize() for name, q in self._metric_queues.items()},
+            'tracks': {topic: len(entries) for topic, entries in self._track_buffers.items()},
+            'files': self._file_queue.qsize(),
+        }
+        total_items = (
+            initial_counts['logs'] +
+            sum(initial_counts['metrics'].values()) +
+            sum(initial_counts['tracks'].values()) +
+            initial_counts['files']
+        )
+        # Show progress bar if there are many items to flush
+        show_progress = total_items > 200
+        items_flushed = 0
+        def update_progress():
+            nonlocal items_flushed
+            if show_progress:
+                progress = items_flushed / total_items
+                bar_length = 40
+                filled = int(bar_length * progress)
+                bar = '█' * filled + '░' * (bar_length - filled)
+                percent = progress * 100
+                print(f'\r[ML-Dash] Flushing: |{bar}| {percent:.1f}% ({items_flushed}/{total_items})', end='', flush=True)
+        # Flush logs
+        log_batch_size = self._config.log_batch_size
+        while not self._log_queue.empty():
+            before = self._log_queue.qsize()
+            self._flush_logs()
+            after = self._log_queue.qsize()
+            items_flushed += before - after
+            update_progress()
+        # Flush metrics
+        metric_batch_size = self._config.metric_batch_size
         for metric_name in list(self._metric_queues.keys()):
-            self._flush_metric(metric_name)
+            while not self._metric_queues[metric_name].empty():
+                before = self._metric_queues[metric_name].qsize()
+                self._flush_metric(metric_name)
+                after = self._metric_queues[metric_name].qsize()
+                items_flushed += before - after
+                update_progress()
+        # Flush tracks
         for topic in list(self._track_buffers.keys()):
+            track_count = len(self._track_buffers.get(topic, {}))
             self._flush_track(topic)
-        self._flush_files()
+            items_flushed += track_count
+            update_progress()
+        # Flush files
+        while not self._file_queue.empty():
+            before = self._file_queue.qsize()
+            self._flush_files()
+            after = self._file_queue.qsize()
+            items_flushed += before - after
+            update_progress()
+        if show_progress:
+            print()  # New line after progress bar
     def _flush_logs(self) -> None:
         """Batch flush logs using client.create_log_entries()."""

{ml_dash-0.6.14 → ml_dash-0.6.15}/LICENSE RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/README.md RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/__init__.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/auth/__init__.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/auth/constants.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/auth/device_flow.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/auth/device_secret.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/auth/exceptions.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/auth/token_storage.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/auto_start.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/cli.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/cli_commands/__init__.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/cli_commands/api.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/cli_commands/create.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/cli_commands/download.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/cli_commands/list.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/cli_commands/login.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/cli_commands/logout.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/cli_commands/profile.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/cli_commands/remove.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/cli_commands/upload.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/client.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/config.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/experiment.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/files.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/log.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/metric.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/params.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/py.typed RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/remote_auto_start.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/run.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/snowflake.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/storage.py RENAMED Viewed

File without changes

{ml_dash-0.6.14 → ml_dash-0.6.15}/src/ml_dash/track.py RENAMED Viewed

File without changes

ml-dash 0.6.14__tar.gz → 0.6.15__tar.gz

ml-dash 0.6.14tar.gz → 0.6.15tar.gz