PyPI - dragon-ml-toolbox - Versions diffs - 19.13.0__py3-none-any.whl → 20.0.0__py3-none-any.whl - Mend

dragon-ml-toolbox 19.13.0py3-none-any.whl → 20.0.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (219) hide show

{dragon_ml_toolbox-19.13.0.dist-info → dragon_ml_toolbox-20.0.0.dist-info}/METADATA +29 -46
dragon_ml_toolbox-20.0.0.dist-info/RECORD +178 -0
ml_tools/{ETL_cleaning.py → ETL_cleaning/__init__.py} +13 -5
ml_tools/ETL_cleaning/_basic_clean.py +351 -0
ml_tools/ETL_cleaning/_clean_tools.py +128 -0
ml_tools/ETL_cleaning/_dragon_cleaner.py +245 -0
ml_tools/ETL_cleaning/_imprimir.py +13 -0
ml_tools/{ETL_engineering.py → ETL_engineering/__init__.py} +8 -4
ml_tools/ETL_engineering/_dragon_engineering.py +261 -0
ml_tools/ETL_engineering/_imprimir.py +24 -0
ml_tools/{_core/_ETL_engineering.py → ETL_engineering/_transforms.py} +14 -267
ml_tools/{_core → GUI_tools}/_GUI_tools.py +37 -40
ml_tools/{GUI_tools.py → GUI_tools/__init__.py} +7 -5
ml_tools/GUI_tools/_imprimir.py +12 -0
ml_tools/IO_tools/_IO_loggers.py +235 -0
ml_tools/IO_tools/_IO_save_load.py +151 -0
ml_tools/IO_tools/_IO_utils.py +140 -0
ml_tools/{IO_tools.py → IO_tools/__init__.py} +13 -5
ml_tools/IO_tools/_imprimir.py +14 -0
ml_tools/MICE/_MICE_imputation.py +132 -0
ml_tools/{MICE_imputation.py → MICE/__init__.py} +6 -7
ml_tools/{_core/_MICE_imputation.py → MICE/_dragon_mice.py} +243 -322
ml_tools/MICE/_imprimir.py +11 -0
ml_tools/{ML_callbacks.py → ML_callbacks/__init__.py} +12 -4
ml_tools/ML_callbacks/_base.py +101 -0
ml_tools/ML_callbacks/_checkpoint.py +232 -0
ml_tools/ML_callbacks/_early_stop.py +208 -0
ml_tools/ML_callbacks/_imprimir.py +12 -0
ml_tools/ML_callbacks/_scheduler.py +197 -0
ml_tools/{ML_chaining_utilities.py → ML_chain/__init__.py} +8 -3
ml_tools/{_core/_ML_chaining_utilities.py → ML_chain/_chaining_tools.py} +5 -129
ml_tools/ML_chain/_dragon_chain.py +140 -0
ml_tools/ML_chain/_imprimir.py +11 -0
ml_tools/ML_configuration/__init__.py +90 -0
ml_tools/ML_configuration/_base_model_config.py +69 -0
ml_tools/ML_configuration/_finalize.py +366 -0
ml_tools/ML_configuration/_imprimir.py +47 -0
ml_tools/ML_configuration/_metrics.py +593 -0
ml_tools/ML_configuration/_models.py +206 -0
ml_tools/ML_configuration/_training.py +124 -0
ml_tools/ML_datasetmaster/__init__.py +28 -0
ml_tools/ML_datasetmaster/_base_datasetmaster.py +337 -0
ml_tools/{_core/_ML_datasetmaster.py → ML_datasetmaster/_datasetmaster.py} +9 -329
ml_tools/ML_datasetmaster/_imprimir.py +15 -0
ml_tools/{_core/_ML_sequence_datasetmaster.py → ML_datasetmaster/_sequence_datasetmaster.py} +13 -15
ml_tools/{_core/_ML_vision_datasetmaster.py → ML_datasetmaster/_vision_datasetmaster.py} +63 -65
ml_tools/ML_evaluation/__init__.py +53 -0
ml_tools/ML_evaluation/_classification.py +629 -0
ml_tools/ML_evaluation/_feature_importance.py +409 -0
ml_tools/ML_evaluation/_imprimir.py +25 -0
ml_tools/ML_evaluation/_loss.py +92 -0
ml_tools/ML_evaluation/_regression.py +273 -0
ml_tools/{_core/_ML_sequence_evaluation.py → ML_evaluation/_sequence.py} +8 -11
ml_tools/{_core/_ML_vision_evaluation.py → ML_evaluation/_vision.py} +12 -17
ml_tools/{_core → ML_evaluation_captum}/_ML_evaluation_captum.py +11 -38
ml_tools/{ML_evaluation_captum.py → ML_evaluation_captum/__init__.py} +6 -4
ml_tools/ML_evaluation_captum/_imprimir.py +10 -0
ml_tools/{_core → ML_finalize_handler}/_ML_finalize_handler.py +3 -7
ml_tools/ML_finalize_handler/__init__.py +10 -0
ml_tools/ML_finalize_handler/_imprimir.py +8 -0
ml_tools/ML_inference/__init__.py +22 -0
ml_tools/ML_inference/_base_inference.py +166 -0
ml_tools/{_core/_ML_chaining_inference.py → ML_inference/_chain_inference.py} +14 -17
ml_tools/ML_inference/_dragon_inference.py +332 -0
ml_tools/ML_inference/_imprimir.py +11 -0
ml_tools/ML_inference/_multi_inference.py +180 -0
ml_tools/ML_inference_sequence/__init__.py +10 -0
ml_tools/ML_inference_sequence/_imprimir.py +8 -0
ml_tools/{_core/_ML_sequence_inference.py → ML_inference_sequence/_sequence_inference.py} +11 -15
ml_tools/ML_inference_vision/__init__.py +10 -0
ml_tools/ML_inference_vision/_imprimir.py +8 -0
ml_tools/{_core/_ML_vision_inference.py → ML_inference_vision/_vision_inference.py} +15 -19
ml_tools/ML_models/__init__.py +32 -0
ml_tools/{_core/_ML_models_advanced.py → ML_models/_advanced_models.py} +22 -18
ml_tools/ML_models/_base_mlp_attention.py +198 -0
ml_tools/{_core/_models_advanced_base.py → ML_models/_base_save_load.py} +73 -49
ml_tools/ML_models/_dragon_tabular.py +248 -0
ml_tools/ML_models/_imprimir.py +18 -0
ml_tools/ML_models/_mlp_attention.py +134 -0
ml_tools/{_core → ML_models}/_models_advanced_helpers.py +13 -13
ml_tools/ML_models_sequence/__init__.py +10 -0
ml_tools/ML_models_sequence/_imprimir.py +8 -0
ml_tools/{_core/_ML_sequence_models.py → ML_models_sequence/_sequence_models.py} +5 -8
ml_tools/ML_models_vision/__init__.py +29 -0
ml_tools/ML_models_vision/_base_wrapper.py +254 -0
ml_tools/ML_models_vision/_image_classification.py +182 -0
ml_tools/ML_models_vision/_image_segmentation.py +108 -0
ml_tools/ML_models_vision/_imprimir.py +16 -0
ml_tools/ML_models_vision/_object_detection.py +135 -0
ml_tools/ML_optimization/__init__.py +21 -0
ml_tools/ML_optimization/_imprimir.py +13 -0
ml_tools/{_core/_ML_optimization_pareto.py → ML_optimization/_multi_dragon.py} +18 -24
ml_tools/ML_optimization/_single_dragon.py +203 -0
ml_tools/{_core/_ML_optimization.py → ML_optimization/_single_manual.py} +75 -213
ml_tools/{_core → ML_scaler}/_ML_scaler.py +8 -11
ml_tools/ML_scaler/__init__.py +10 -0
ml_tools/ML_scaler/_imprimir.py +8 -0
ml_tools/ML_trainer/__init__.py +20 -0
ml_tools/ML_trainer/_base_trainer.py +297 -0
ml_tools/ML_trainer/_dragon_detection_trainer.py +402 -0
ml_tools/ML_trainer/_dragon_sequence_trainer.py +540 -0
ml_tools/ML_trainer/_dragon_trainer.py +1160 -0
ml_tools/ML_trainer/_imprimir.py +10 -0
ml_tools/{ML_utilities.py → ML_utilities/__init__.py} +14 -6
ml_tools/ML_utilities/_artifact_finder.py +382 -0
ml_tools/ML_utilities/_imprimir.py +16 -0
ml_tools/ML_utilities/_inspection.py +325 -0
ml_tools/ML_utilities/_train_tools.py +205 -0
ml_tools/{ML_vision_transformers.py → ML_vision_transformers/__init__.py} +9 -6
ml_tools/{_core/_ML_vision_transformers.py → ML_vision_transformers/_core_transforms.py} +11 -155
ml_tools/ML_vision_transformers/_imprimir.py +14 -0
ml_tools/ML_vision_transformers/_offline_augmentation.py +159 -0
ml_tools/{_core/_PSO_optimization.py → PSO_optimization/_PSO.py} +58 -15
ml_tools/{PSO_optimization.py → PSO_optimization/__init__.py} +5 -3
ml_tools/PSO_optimization/_imprimir.py +10 -0
ml_tools/SQL/__init__.py +7 -0
ml_tools/{_core/_SQL.py → SQL/_dragon_SQL.py} +7 -11
ml_tools/SQL/_imprimir.py +8 -0
ml_tools/{_core → VIF}/_VIF_factor.py +5 -8
ml_tools/{VIF_factor.py → VIF/__init__.py} +4 -2
ml_tools/VIF/_imprimir.py +10 -0
ml_tools/_core/__init__.py +7 -1
ml_tools/_core/_logger.py +8 -18
ml_tools/_core/_schema_load_ops.py +43 -0
ml_tools/_core/_script_info.py +2 -2
ml_tools/{data_exploration.py → data_exploration/__init__.py} +32 -16
ml_tools/data_exploration/_analysis.py +214 -0
ml_tools/data_exploration/_cleaning.py +566 -0
ml_tools/data_exploration/_features.py +583 -0
ml_tools/data_exploration/_imprimir.py +32 -0
ml_tools/data_exploration/_plotting.py +487 -0
ml_tools/data_exploration/_schema_ops.py +176 -0
ml_tools/{ensemble_evaluation.py → ensemble_evaluation/__init__.py} +6 -4
ml_tools/{_core → ensemble_evaluation}/_ensemble_evaluation.py +3 -7
ml_tools/ensemble_evaluation/_imprimir.py +14 -0
ml_tools/{ensemble_inference.py → ensemble_inference/__init__.py} +5 -3
ml_tools/{_core → ensemble_inference}/_ensemble_inference.py +15 -18
ml_tools/ensemble_inference/_imprimir.py +9 -0
ml_tools/{ensemble_learning.py → ensemble_learning/__init__.py} +4 -6
ml_tools/{_core → ensemble_learning}/_ensemble_learning.py +7 -10
ml_tools/ensemble_learning/_imprimir.py +10 -0
ml_tools/{excel_handler.py → excel_handler/__init__.py} +5 -3
ml_tools/{_core → excel_handler}/_excel_handler.py +6 -10
ml_tools/excel_handler/_imprimir.py +13 -0
ml_tools/{keys.py → keys/__init__.py} +4 -1
ml_tools/keys/_imprimir.py +11 -0
ml_tools/{_core → keys}/_keys.py +2 -0
ml_tools/{math_utilities.py → math_utilities/__init__.py} +5 -2
ml_tools/math_utilities/_imprimir.py +11 -0
ml_tools/{_core → math_utilities}/_math_utilities.py +1 -5
ml_tools/{optimization_tools.py → optimization_tools/__init__.py} +9 -4
ml_tools/optimization_tools/_imprimir.py +13 -0
ml_tools/optimization_tools/_optimization_bounds.py +236 -0
ml_tools/optimization_tools/_optimization_plots.py +218 -0
ml_tools/{path_manager.py → path_manager/__init__.py} +6 -3
ml_tools/{_core/_path_manager.py → path_manager/_dragonmanager.py} +11 -347
ml_tools/path_manager/_imprimir.py +15 -0
ml_tools/path_manager/_path_tools.py +346 -0
ml_tools/plot_fonts/__init__.py +8 -0
ml_tools/plot_fonts/_imprimir.py +8 -0
ml_tools/{_core → plot_fonts}/_plot_fonts.py +2 -5
ml_tools/schema/__init__.py +15 -0
ml_tools/schema/_feature_schema.py +223 -0
ml_tools/schema/_gui_schema.py +191 -0
ml_tools/schema/_imprimir.py +10 -0
ml_tools/{serde.py → serde/__init__.py} +4 -2
ml_tools/serde/_imprimir.py +10 -0
ml_tools/{_core → serde}/_serde.py +3 -8
ml_tools/{utilities.py → utilities/__init__.py} +11 -6
ml_tools/utilities/_imprimir.py +18 -0
ml_tools/{_core/_utilities.py → utilities/_utility_save_load.py} +13 -190
ml_tools/utilities/_utility_tools.py +192 -0
dragon_ml_toolbox-19.13.0.dist-info/RECORD +0 -111
ml_tools/ML_chaining_inference.py +0 -8
ml_tools/ML_configuration.py +0 -86
ml_tools/ML_configuration_pytab.py +0 -14
ml_tools/ML_datasetmaster.py +0 -10
ml_tools/ML_evaluation.py +0 -16
ml_tools/ML_evaluation_multi.py +0 -12
ml_tools/ML_finalize_handler.py +0 -8
ml_tools/ML_inference.py +0 -12
ml_tools/ML_models.py +0 -14
ml_tools/ML_models_advanced.py +0 -14
ml_tools/ML_models_pytab.py +0 -14
ml_tools/ML_optimization.py +0 -14
ml_tools/ML_optimization_pareto.py +0 -8
ml_tools/ML_scaler.py +0 -8
ml_tools/ML_sequence_datasetmaster.py +0 -8
ml_tools/ML_sequence_evaluation.py +0 -10
ml_tools/ML_sequence_inference.py +0 -8
ml_tools/ML_sequence_models.py +0 -8
ml_tools/ML_trainer.py +0 -12
ml_tools/ML_vision_datasetmaster.py +0 -12
ml_tools/ML_vision_evaluation.py +0 -10
ml_tools/ML_vision_inference.py +0 -8
ml_tools/ML_vision_models.py +0 -18
ml_tools/SQL.py +0 -8
ml_tools/_core/_ETL_cleaning.py +0 -694
ml_tools/_core/_IO_tools.py +0 -498
ml_tools/_core/_ML_callbacks.py +0 -702
ml_tools/_core/_ML_configuration.py +0 -1332
ml_tools/_core/_ML_configuration_pytab.py +0 -102
ml_tools/_core/_ML_evaluation.py +0 -867
ml_tools/_core/_ML_evaluation_multi.py +0 -544
ml_tools/_core/_ML_inference.py +0 -646
ml_tools/_core/_ML_models.py +0 -668
ml_tools/_core/_ML_models_pytab.py +0 -693
ml_tools/_core/_ML_trainer.py +0 -2323
ml_tools/_core/_ML_utilities.py +0 -886
ml_tools/_core/_ML_vision_models.py +0 -644
ml_tools/_core/_data_exploration.py +0 -1901
ml_tools/_core/_optimization_tools.py +0 -493
ml_tools/_core/_schema.py +0 -359
ml_tools/plot_fonts.py +0 -8
ml_tools/schema.py +0 -12
{dragon_ml_toolbox-19.13.0.dist-info → dragon_ml_toolbox-20.0.0.dist-info}/WHEEL +0 -0
{dragon_ml_toolbox-19.13.0.dist-info → dragon_ml_toolbox-20.0.0.dist-info}/licenses/LICENSE +0 -0
{dragon_ml_toolbox-19.13.0.dist-info → dragon_ml_toolbox-20.0.0.dist-info}/licenses/LICENSE-THIRD-PARTY.md +0 -0
{dragon_ml_toolbox-19.13.0.dist-info → dragon_ml_toolbox-20.0.0.dist-info}/top_level.txt +0 -0

ml_tools/ML_callbacks/_scheduler.py ADDED Viewed

@@ -0,0 +1,197 @@
+import torch
+from typing import Literal
+from ..keys._keys import PyTorchLogKeys
+from .._core import get_logger
+from ._base import _Callback
+_LOGGER = get_logger("LR Scheduler")
+__all__ = [
+    "DragonScheduler",
+    "DragonPlateauScheduler"
+]
+class _DragonLRScheduler(_Callback):
+    """
+    Base class for Dragon LR Schedulers.
+    Handles common logic like logging and attaching to the trainer.
+    """
+    def __init__(self):
+        super().__init__()
+        self.scheduler = None
+        self.previous_lr = None
+    def set_trainer(self, trainer):
+        """Associates the callback with the trainer."""
+        super().set_trainer(trainer)
+        # Note: Subclasses must ensure self.scheduler is set before or during this call
+        # if they want to register it immediately.
+        if self.scheduler:
+            self.trainer.scheduler = self.scheduler # type: ignore
+    def on_train_begin(self, logs=None):
+        """Store the initial learning rate."""
+        if not self.trainer.optimizer: # type: ignore
+            _LOGGER.warning("No optimizer found in trainer. LRScheduler cannot track learning rate.")
+            return
+        self.previous_lr = self.trainer.optimizer.param_groups[0]['lr'] # type: ignore
+    def _check_and_log_lr(self, epoch, logs, verbose: bool):
+        """Helper to log LR changes and update history."""
+        if not self.trainer.optimizer: # type: ignore
+            return
+        current_lr = self.trainer.optimizer.param_groups[0]['lr'] # type: ignore
+        # Log change
+        if self.previous_lr is not None and current_lr != self.previous_lr:
+            if verbose:
+                print(f"    > Epoch {epoch}: Learning rate changed to {current_lr:.6f}")
+            self.previous_lr = current_lr
+        # Log to dictionary
+        logs[PyTorchLogKeys.LEARNING_RATE] = current_lr
+        # Log to history
+        if hasattr(self.trainer, 'history'):
+            self.trainer.history.setdefault(PyTorchLogKeys.LEARNING_RATE, []).append(current_lr) # type: ignore
+class DragonScheduler(_DragonLRScheduler):
+    """
+    Callback for standard PyTorch Learning Rate Schedulers.
+    Compatible with: StepLR, MultiStepLR, ExponentialLR, CosineAnnealingLR, etc.
+    NOT Compatible with: ReduceLROnPlateau (Use `DragonReduceLROnPlateau` instead).
+    """
+    def __init__(self, scheduler, verbose: bool=True):
+        """
+        Args:
+            scheduler: An initialized PyTorch learning rate scheduler instance.
+            verbose (bool): If True, logs learning rate changes to console.
+        """
+        super().__init__()
+        if isinstance(scheduler, torch.optim.lr_scheduler.ReduceLROnPlateau):
+            raise ValueError(
+                "DragonLRScheduler does not support 'ReduceLROnPlateau'. "
+                "Please use the `DragonReduceLROnPlateau` callback instead."
+            )
+        self.scheduler = scheduler
+        self.verbose = verbose
+    def set_trainer(self, trainer):
+        super().set_trainer(trainer)
+        # Explicitly register the scheduler again to be safe
+        self.trainer.scheduler = self.scheduler # type: ignore
+        if self.verbose:
+            _LOGGER.info(f"Registered LR Scheduler: {self.scheduler.__class__.__name__}")
+    def on_epoch_end(self, epoch, logs=None):
+        logs = logs or {}
+        # Standard step (no metrics needed)
+        self.scheduler.step()
+        self._check_and_log_lr(epoch, logs, self.verbose)
+class DragonPlateauScheduler(_DragonLRScheduler):
+    """
+    Specific callback for `torch.optim.lr_scheduler.ReduceLROnPlateau`. Reduces learning rate when a monitored metric has stopped improving.
+    This wrapper initializes the scheduler internally using the Trainer's optimizer, simplifying the setup process.
+    """
+    def __init__(self,
+                 monitor: Literal["Training Loss", "Validation Loss"] = "Validation Loss",
+                 mode: Literal['min', 'max'] = 'min',
+                 factor: float = 0.1,
+                 patience: int = 5,
+                 threshold: float = 1e-4,
+                 threshold_mode: Literal['rel', 'abs'] = 'rel',
+                 cooldown: int = 0,
+                 min_lr: float = 0,
+                 eps: float = 1e-8,
+                 verbose: bool = True):
+        """
+        Args:
+            monitor ("Training Loss", "Validation Loss"): Metric to monitor.
+            mode ('min', 'max'): One of 'min', 'max'.
+            factor (float): Factor by which the learning rate will be reduced. new_lr = lr * factor.
+            patience (int): Number of epochs with no improvement after which learning rate will be reduced.
+            threshold (float): Threshold for measuring the new optimum.
+            threshold_mode ('rel', 'abs'): One of 'rel', 'abs'.
+            cooldown (int): Number of epochs to wait before resuming normal operation after lr has been reduced.
+            min_lr (float or list): A scalar or a list of scalars.
+            eps (float): Minimal decay applied to lr.
+            verbose (bool): If True, logs learning rate changes to console.
+        """
+        super().__init__()
+        # Standardize monitor key
+        if monitor == "Training Loss":
+            std_monitor = PyTorchLogKeys.TRAIN_LOSS
+        elif monitor == "Validation Loss":
+            std_monitor = PyTorchLogKeys.VAL_LOSS
+        else:
+            _LOGGER.error(f"Unknown monitor key: {monitor}.")
+            raise ValueError()
+        self.monitor = std_monitor
+        self.verbose = verbose
+        # Config storage for delayed initialization
+        self.config = {
+            'mode': mode,
+            'factor': factor,
+            'patience': patience,
+            'threshold': threshold,
+            'threshold_mode': threshold_mode,
+            'cooldown': cooldown,
+            'min_lr': min_lr,
+            'eps': eps,
+        }
+    def set_trainer(self, trainer):
+        """
+        Initializes the ReduceLROnPlateau scheduler using the trainer's optimizer and registers it.
+        """
+        super().set_trainer(trainer)
+        if not hasattr(self.trainer, 'optimizer'):
+            _LOGGER.error("Trainer has no optimizer. Cannot initialize ReduceLROnPlateau.")
+            raise ValueError()
+        # Initialize the actual scheduler with the optimizer
+        if self.verbose:
+            _LOGGER.info(f"Initializing ReduceLROnPlateau monitoring '{self.monitor}'")
+        self.scheduler = torch.optim.lr_scheduler.ReduceLROnPlateau(
+            optimizer=self.trainer.optimizer, # type: ignore
+            **self.config
+        )
+        # Register with trainer for checkpointing
+        self.trainer.scheduler = self.scheduler # type: ignore
+    def on_epoch_end(self, epoch, logs=None):
+        logs = logs or {}
+        metric_val = logs.get(self.monitor)
+        if metric_val is None:
+            _LOGGER.warning(f"DragonReduceLROnPlateau could not find metric '{self.monitor}' in logs. Scheduler step skipped.")
+            # Still log LR to keep history consistent
+            self._check_and_log_lr(epoch, logs, self.verbose)
+            return
+        # Step with metric
+        self.scheduler.step(metric_val)
+        self._check_and_log_lr(epoch, logs, self.verbose)

ml_tools/{ML_chaining_utilities.py → ML_chain/__init__.py} RENAMED Viewed

@@ -1,11 +1,16 @@
-from ._core._ML_chaining_utilities import (
-    DragonChainOrchestrator,
+from ._dragon_chain import (
+    DragonChainOrchestrator
+)
+from ._chaining_tools import (
     augment_dataset_with_predictions,
     augment_dataset_with_predictions_multi,
     prepare_chaining_dataset,
-    info
 )
+from ._imprimir import info
 __all__ = [
     "DragonChainOrchestrator",
     "augment_dataset_with_predictions",

ml_tools/{_core/_ML_chaining_utilities.py → ML_chain/_chaining_tools.py} RENAMED Viewed

@@ -3,17 +3,16 @@ import numpy as np
 from math import ceil
 from typing import Optional, Literal
-from ._ML_inference import DragonInferenceHandler
-from ._keys import MLTaskKeys, PyTorchInferenceKeys
-from ._logger import get_logger
-from ._script_info import _script_info
+from ..ML_inference import DragonInferenceHandler
+from ..keys._keys import MLTaskKeys, PyTorchInferenceKeys
+from .._core import get_logger
-_LOGGER = get_logger("ML Chaining")
+_LOGGER = get_logger("ML Chain")
 __all__ = [
-    "DragonChainOrchestrator",
     "augment_dataset_with_predictions",
     "augment_dataset_with_predictions_multi",
     "prepare_chaining_dataset",
@@ -321,126 +320,3 @@ def prepare_chaining_dataset(
     return df
-class DragonChainOrchestrator:
-    """
-    Manages the data flow for a sequential chain of ML models (Model 1 -> Model 2 -> ... -> Model N).
-    This orchestrator maintains a master copy of the dataset that grows as models are applied.
-    1. Use `get_training_data` to extract a clean, target-specific subset for training a model.
-    2. Train your model externally.
-    3. Use `update_with_inference` to run that model on the master dataset and append predictions
-       as features for subsequent steps.
-    """
-    def __init__(self, initial_dataset: pd.DataFrame, all_targets: list[str]):
-        """
-        Args:
-            initial_dataset (pd.DataFrame): The starting dataframe with original features and all ground truth targets.
-            all_targets (list[str]): A list of all ground truth target column names present in the dataset.
-        """
-        # Validation: Ensure targets exist
-        missing = [t for t in all_targets if t not in initial_dataset.columns]
-        if missing:
-            _LOGGER.error(f"The following targets were not found in the initial dataset: {missing}")
-            raise ValueError()
-        self.current_dataset = initial_dataset.copy()
-        self.all_targets = all_targets
-        _LOGGER.info(f"Orchestrator initialized with {len(initial_dataset)} samples, {len(initial_dataset.columns) - len(all_targets)} features, and {len(all_targets)} targets.")
-    def get_training_data(
-        self,
-        target_subset: list[str],
-        dropna_how: Literal["any", "all"] = "all"
-    ) -> pd.DataFrame:
-        """
-        Generates a clean dataframe tailored for training a specific step in the chain.
-        This method does NOT modify the internal state. It returns a view with:
-        - Current features (including previous model predictions).
-        - Only the specified `target_subset`.
-        - Rows cleaned based on `dropna_how`.
-        Args:
-            target_subset (list[str]): The targets for the current model.
-            dropna_how (Literal["any", "all"]): "any" drops row if any target is missing; "all" drops if all are missing.
-        Returns:
-            pd.DataFrame: A prepared dataframe for training.
-        """
-        _LOGGER.info(f"Extracting training data for targets {target_subset}...")
-        return prepare_chaining_dataset(
-            dataset=self.current_dataset,
-            all_targets=self.all_targets,
-            target_subset=target_subset,
-            dropna_how=dropna_how,
-            verbose=False
-        )
-    def update_with_inference(
-        self,
-        handler: DragonInferenceHandler,
-        prefix: str = "pred_",
-        batch_size: int = 4096
-    ) -> None:
-        """
-        Runs inference using the provided handler on the full internal dataset and appends the results as new features.
-        This updates the internal state of the Orchestrator. Subsequent calls to `get_training_data`
-        will include these new prediction columns as features.
-        Args:
-            handler (DragonInferenceHandler): The trained model handler.
-            prefix (str): Prefix for the new prediction columns (e.g., "m1_", "step2_").
-            batch_size (int): Batch size for inference.
-        """
-        _LOGGER.info(f"Orchestrator: Updating internal state with predictions from handler (Targets: {handler.target_ids})...")
-        # We use the existing utility to handle the augmentation
-        # This keeps the logic consistent (drop GT -> predict -> concat GT)
-        self.current_dataset = augment_dataset_with_predictions(
-            handler=handler,
-            dataset=self.current_dataset,
-            ground_truth_targets=self.all_targets,
-            prediction_col_prefix=prefix,
-            batch_size=batch_size
-        )
-        _LOGGER.debug(f"Orchestrator State updated. Current feature count (approx): {self.current_dataset.shape[1] - len(self.all_targets)}")
-    def update_with_ensemble(
-        self,
-        handlers: list[DragonInferenceHandler],
-        prefixes: Optional[list[str]] = None,
-        batch_size: int = 4096
-    ) -> None:
-        """
-        Runs multiple independent inference handlers (e.g. for Stacking) on the full internal dataset
-        and appends all results as new features.
-        Args:
-            handlers (list[DragonInferenceHandler]): List of trained model handlers.
-            prefixes (list[str], optional): Prefixes for each model's columns.
-            batch_size (int): Batch size for inference.
-        """
-        _LOGGER.info(f"Orchestrator: Updating internal state with ensemble of {len(handlers)} models...")
-        self.current_dataset = augment_dataset_with_predictions_multi(
-            handlers=handlers,
-            dataset=self.current_dataset,
-            ground_truth_targets=self.all_targets,
-            model_prefixes=prefixes,
-            batch_size=batch_size
-        )
-        new_feat_count = self.current_dataset.shape[1] - len(self.all_targets)
-        _LOGGER.debug(f"Orchestrator: State updated. Total current features: {new_feat_count}")
-    @property
-    def latest_dataset(self) -> pd.DataFrame:
-        """Returns a copy of the current master dataset including all accumulated predictions."""
-        return self.current_dataset.copy()
-def info():
-    _script_info(__all__)

ml_tools/ML_chain/_dragon_chain.py ADDED Viewed

@@ -0,0 +1,140 @@
+import pandas as pd
+from typing import Optional, Literal
+from ..ML_inference import DragonInferenceHandler
+from .._core import get_logger
+from ._chaining_tools import (
+    augment_dataset_with_predictions,
+    augment_dataset_with_predictions_multi,
+    prepare_chaining_dataset,
+)
+_LOGGER = get_logger("DragonChainOrchestrator")
+__all__ = [
+    "DragonChainOrchestrator",
+]
+class DragonChainOrchestrator:
+    """
+    Manages the data flow for a sequential chain of ML models (Model 1 -> Model 2 -> ... -> Model N).
+    This orchestrator maintains a master copy of the dataset that grows as models are applied.
+    1. Use `get_training_data` to extract a clean, target-specific subset for training a model.
+    2. Train your model externally.
+    3. Use `update_with_inference` to run that model on the master dataset and append predictions
+       as features for subsequent steps.
+    """
+    def __init__(self, initial_dataset: pd.DataFrame, all_targets: list[str]):
+        """
+        Args:
+            initial_dataset (pd.DataFrame): The starting dataframe with original features and all ground truth targets.
+            all_targets (list[str]): A list of all ground truth target column names present in the dataset.
+        """
+        # Validation: Ensure targets exist
+        missing = [t for t in all_targets if t not in initial_dataset.columns]
+        if missing:
+            _LOGGER.error(f"The following targets were not found in the initial dataset: {missing}")
+            raise ValueError()
+        self.current_dataset = initial_dataset.copy()
+        self.all_targets = all_targets
+        _LOGGER.info(f"Orchestrator initialized with {len(initial_dataset)} samples, {len(initial_dataset.columns) - len(all_targets)} features, and {len(all_targets)} targets.")
+    def get_training_data(
+        self,
+        target_subset: list[str],
+        dropna_how: Literal["any", "all"] = "all"
+    ) -> pd.DataFrame:
+        """
+        Generates a clean dataframe tailored for training a specific step in the chain.
+        This method does NOT modify the internal state. It returns a view with:
+        - Current features (including previous model predictions).
+        - Only the specified `target_subset`.
+        - Rows cleaned based on `dropna_how`.
+        Args:
+            target_subset (list[str]): The targets for the current model.
+            dropna_how (Literal["any", "all"]): "any" drops row if any target is missing; "all" drops if all are missing.
+        Returns:
+            pd.DataFrame: A prepared dataframe for training.
+        """
+        _LOGGER.info(f"Extracting training data for targets {target_subset}...")
+        return prepare_chaining_dataset(
+            dataset=self.current_dataset,
+            all_targets=self.all_targets,
+            target_subset=target_subset,
+            dropna_how=dropna_how,
+            verbose=False
+        )
+    def update_with_inference(
+        self,
+        handler: DragonInferenceHandler,
+        prefix: str = "pred_",
+        batch_size: int = 4096
+    ) -> None:
+        """
+        Runs inference using the provided handler on the full internal dataset and appends the results as new features.
+        This updates the internal state of the Orchestrator. Subsequent calls to `get_training_data`
+        will include these new prediction columns as features.
+        Args:
+            handler (DragonInferenceHandler): The trained model handler.
+            prefix (str): Prefix for the new prediction columns (e.g., "m1_", "step2_").
+            batch_size (int): Batch size for inference.
+        """
+        _LOGGER.info(f"Orchestrator: Updating internal state with predictions from handler (Targets: {handler.target_ids})...")
+        # We use the existing utility to handle the augmentation
+        # This keeps the logic consistent (drop GT -> predict -> concat GT)
+        self.current_dataset = augment_dataset_with_predictions(
+            handler=handler,
+            dataset=self.current_dataset,
+            ground_truth_targets=self.all_targets,
+            prediction_col_prefix=prefix,
+            batch_size=batch_size
+        )
+        _LOGGER.debug(f"Orchestrator State updated. Current feature count (approx): {self.current_dataset.shape[1] - len(self.all_targets)}")
+    def update_with_ensemble(
+        self,
+        handlers: list[DragonInferenceHandler],
+        prefixes: Optional[list[str]] = None,
+        batch_size: int = 4096
+    ) -> None:
+        """
+        Runs multiple independent inference handlers (e.g. for Stacking) on the full internal dataset
+        and appends all results as new features.
+        Args:
+            handlers (list[DragonInferenceHandler]): List of trained model handlers.
+            prefixes (list[str], optional): Prefixes for each model's columns.
+            batch_size (int): Batch size for inference.
+        """
+        _LOGGER.info(f"Orchestrator: Updating internal state with ensemble of {len(handlers)} models...")
+        self.current_dataset = augment_dataset_with_predictions_multi(
+            handlers=handlers,
+            dataset=self.current_dataset,
+            ground_truth_targets=self.all_targets,
+            model_prefixes=prefixes,
+            batch_size=batch_size
+        )
+        new_feat_count = self.current_dataset.shape[1] - len(self.all_targets)
+        _LOGGER.debug(f"Orchestrator: State updated. Total current features: {new_feat_count}")
+    @property
+    def latest_dataset(self) -> pd.DataFrame:
+        """Returns a copy of the current master dataset including all accumulated predictions."""
+        return self.current_dataset.copy()

ml_tools/ML_chain/_imprimir.py ADDED Viewed

@@ -0,0 +1,11 @@
+from .._core import _imprimir_disponibles
+_GRUPOS = [
+    "DragonChainOrchestrator",
+    "augment_dataset_with_predictions",
+    "augment_dataset_with_predictions_multi",
+    "prepare_chaining_dataset",
+]
+def info():
+    _imprimir_disponibles(_GRUPOS)

ml_tools/ML_configuration/__init__.py ADDED Viewed

@@ -0,0 +1,90 @@
+from ._metrics import (
+    FormatRegressionMetrics,
+    FormatMultiTargetRegressionMetrics,
+    FormatBinaryClassificationMetrics,
+    FormatMultiClassClassificationMetrics,
+    FormatBinaryImageClassificationMetrics,
+    FormatMultiClassImageClassificationMetrics,
+    FormatMultiLabelBinaryClassificationMetrics,
+    FormatBinarySegmentationMetrics,
+    FormatMultiClassSegmentationMetrics,
+    FormatSequenceValueMetrics,
+    FormatSequenceSequenceMetrics,
+)
+from ._finalize import (
+    FinalizeBinaryClassification,
+    FinalizeBinarySegmentation,
+    FinalizeBinaryImageClassification,
+    FinalizeMultiClassClassification,
+    FinalizeMultiClassImageClassification,
+    FinalizeMultiClassSegmentation,
+    FinalizeMultiLabelBinaryClassification,
+    FinalizeMultiTargetRegression,
+    FinalizeRegression,
+    FinalizeObjectDetection,
+    FinalizeSequenceSequencePrediction,
+    FinalizeSequenceValuePrediction,
+)
+from ._models import (
+    DragonMLPParams,
+    DragonAttentionMLPParams,
+    DragonMultiHeadAttentionNetParams,
+    DragonTabularTransformerParams,
+    DragonGateParams,
+    DragonNodeParams,
+    DragonTabNetParams,
+    DragonAutoIntParams,
+)
+from ._training import (
+    DragonTrainingConfig,
+    DragonParetoConfig,
+)
+from ._imprimir import info
+__all__ = [
+    # --- Metrics Formats ---
+    "FormatRegressionMetrics",
+    "FormatMultiTargetRegressionMetrics",
+    "FormatBinaryClassificationMetrics",
+    "FormatMultiClassClassificationMetrics",
+    "FormatBinaryImageClassificationMetrics",
+    "FormatMultiClassImageClassificationMetrics",
+    "FormatMultiLabelBinaryClassificationMetrics",
+    "FormatBinarySegmentationMetrics",
+    "FormatMultiClassSegmentationMetrics",
+    "FormatSequenceValueMetrics",
+    "FormatSequenceSequenceMetrics",
+    # --- Finalize Configs ---
+    "FinalizeBinaryClassification",
+    "FinalizeBinarySegmentation",
+    "FinalizeBinaryImageClassification",
+    "FinalizeMultiClassClassification",
+    "FinalizeMultiClassImageClassification",
+    "FinalizeMultiClassSegmentation",
+    "FinalizeMultiLabelBinaryClassification",
+    "FinalizeMultiTargetRegression",
+    "FinalizeRegression",
+    "FinalizeObjectDetection",
+    "FinalizeSequenceSequencePrediction",
+    "FinalizeSequenceValuePrediction",
+    # --- Model Parameter Configs ---
+    "DragonMLPParams",
+    "DragonAttentionMLPParams",
+    "DragonMultiHeadAttentionNetParams",
+    "DragonTabularTransformerParams",
+    "DragonGateParams",
+    "DragonNodeParams",
+    "DragonTabNetParams",
+    "DragonAutoIntParams",
+    # --- Training Config ---
+    "DragonTrainingConfig",
+    "DragonParetoConfig",
+]

ml_tools/ML_configuration/_base_model_config.py ADDED Viewed

@@ -0,0 +1,69 @@
+from typing import Any
+from pathlib import Path
+from collections.abc import Mapping
+from ..schema import FeatureSchema
+__all__ = [
+    "_BaseModelParams",
+]
+class _BaseModelParams(Mapping):
+    """
+    [PRIVATE] Base class for model parameter configs.
+    Inherits from Mapping to behave like a dictionary, enabling
+    `**params` unpacking directly into model constructors.
+    """
+    def __getitem__(self, key: str) -> Any:
+        return self.__dict__[key]
+    def __iter__(self):
+        return iter(self.__dict__)
+    def __len__(self) -> int:
+        return len(self.__dict__)
+    def __or__(self, other) -> dict[str, Any]:
+        """Allows merging with other Mappings using the | operator."""
+        if isinstance(other, Mapping):
+            return dict(self) | dict(other)
+        return NotImplemented
+    def __ror__(self, other) -> dict[str, Any]:
+        """Allows merging with other Mappings using the | operator."""
+        if isinstance(other, Mapping):
+            return dict(other) | dict(self)
+        return NotImplemented
+    def __repr__(self) -> str:
+        """Returns a formatted multi-line string representation."""
+        class_name = self.__class__.__name__
+        # Format parameters for clean logging
+        params = []
+        for k, v in self.__dict__.items():
+            # If value is huge (like FeatureSchema), use its own repr
+            val_str = repr(v)
+            params.append(f"  {k}={val_str}")
+        params_str = ",\n".join(params)
+        return f"{class_name}(\n{params_str}\n)"
+    def to_log(self) -> dict[str, Any]:
+        """
+        Safely converts complex types (like FeatureSchema) to their string
+        representation for cleaner JSON logging.
+        """
+        clean_dict = {}
+        for k, v in self.__dict__.items():
+            if isinstance(v, FeatureSchema):
+                # Force the repr() string, otherwise json.dump treats it as a list
+                clean_dict[k] = repr(v)
+            elif isinstance(v, Path):
+                # JSON cannot serialize Path objects, convert to string
+                clean_dict[k] = str(v)
+            else:
+                clean_dict[k] = v
+        return clean_dict

dragon-ml-toolbox 19.13.0__py3-none-any.whl → 20.0.0__py3-none-any.whl

dragon-ml-toolbox 19.13.0py3-none-any.whl → 20.0.0py3-none-any.whl