PyPI - dragon-ml-toolbox - Versions diffs - 19.14.0__py3-none-any.whl → 20.0.0__py3-none-any.whl - Mend

dragon-ml-toolbox 19.14.0py3-none-any.whl → 20.0.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (219) hide show

{dragon_ml_toolbox-19.14.0.dist-info → dragon_ml_toolbox-20.0.0.dist-info}/METADATA +29 -46
dragon_ml_toolbox-20.0.0.dist-info/RECORD +178 -0
ml_tools/{ETL_cleaning.py → ETL_cleaning/__init__.py} +13 -5
ml_tools/ETL_cleaning/_basic_clean.py +351 -0
ml_tools/ETL_cleaning/_clean_tools.py +128 -0
ml_tools/ETL_cleaning/_dragon_cleaner.py +245 -0
ml_tools/ETL_cleaning/_imprimir.py +13 -0
ml_tools/{ETL_engineering.py → ETL_engineering/__init__.py} +8 -4
ml_tools/ETL_engineering/_dragon_engineering.py +261 -0
ml_tools/ETL_engineering/_imprimir.py +24 -0
ml_tools/{_core/_ETL_engineering.py → ETL_engineering/_transforms.py} +14 -267
ml_tools/{_core → GUI_tools}/_GUI_tools.py +37 -40
ml_tools/{GUI_tools.py → GUI_tools/__init__.py} +7 -5
ml_tools/GUI_tools/_imprimir.py +12 -0
ml_tools/IO_tools/_IO_loggers.py +235 -0
ml_tools/IO_tools/_IO_save_load.py +151 -0
ml_tools/IO_tools/_IO_utils.py +140 -0
ml_tools/{IO_tools.py → IO_tools/__init__.py} +13 -5
ml_tools/IO_tools/_imprimir.py +14 -0
ml_tools/MICE/_MICE_imputation.py +132 -0
ml_tools/{MICE_imputation.py → MICE/__init__.py} +6 -7
ml_tools/{_core/_MICE_imputation.py → MICE/_dragon_mice.py} +243 -322
ml_tools/MICE/_imprimir.py +11 -0
ml_tools/{ML_callbacks.py → ML_callbacks/__init__.py} +12 -4
ml_tools/ML_callbacks/_base.py +101 -0
ml_tools/ML_callbacks/_checkpoint.py +232 -0
ml_tools/ML_callbacks/_early_stop.py +208 -0
ml_tools/ML_callbacks/_imprimir.py +12 -0
ml_tools/ML_callbacks/_scheduler.py +197 -0
ml_tools/{ML_chaining_utilities.py → ML_chain/__init__.py} +8 -3
ml_tools/{_core/_ML_chaining_utilities.py → ML_chain/_chaining_tools.py} +5 -129
ml_tools/ML_chain/_dragon_chain.py +140 -0
ml_tools/ML_chain/_imprimir.py +11 -0
ml_tools/ML_configuration/__init__.py +90 -0
ml_tools/ML_configuration/_base_model_config.py +69 -0
ml_tools/ML_configuration/_finalize.py +366 -0
ml_tools/ML_configuration/_imprimir.py +47 -0
ml_tools/ML_configuration/_metrics.py +593 -0
ml_tools/ML_configuration/_models.py +206 -0
ml_tools/ML_configuration/_training.py +124 -0
ml_tools/ML_datasetmaster/__init__.py +28 -0
ml_tools/ML_datasetmaster/_base_datasetmaster.py +337 -0
ml_tools/{_core/_ML_datasetmaster.py → ML_datasetmaster/_datasetmaster.py} +9 -329
ml_tools/ML_datasetmaster/_imprimir.py +15 -0
ml_tools/{_core/_ML_sequence_datasetmaster.py → ML_datasetmaster/_sequence_datasetmaster.py} +13 -15
ml_tools/{_core/_ML_vision_datasetmaster.py → ML_datasetmaster/_vision_datasetmaster.py} +63 -65
ml_tools/ML_evaluation/__init__.py +53 -0
ml_tools/ML_evaluation/_classification.py +629 -0
ml_tools/ML_evaluation/_feature_importance.py +409 -0
ml_tools/ML_evaluation/_imprimir.py +25 -0
ml_tools/ML_evaluation/_loss.py +92 -0
ml_tools/ML_evaluation/_regression.py +273 -0
ml_tools/{_core/_ML_sequence_evaluation.py → ML_evaluation/_sequence.py} +8 -11
ml_tools/{_core/_ML_vision_evaluation.py → ML_evaluation/_vision.py} +12 -17
ml_tools/{_core → ML_evaluation_captum}/_ML_evaluation_captum.py +11 -38
ml_tools/{ML_evaluation_captum.py → ML_evaluation_captum/__init__.py} +6 -4
ml_tools/ML_evaluation_captum/_imprimir.py +10 -0
ml_tools/{_core → ML_finalize_handler}/_ML_finalize_handler.py +3 -7
ml_tools/ML_finalize_handler/__init__.py +10 -0
ml_tools/ML_finalize_handler/_imprimir.py +8 -0
ml_tools/ML_inference/__init__.py +22 -0
ml_tools/ML_inference/_base_inference.py +166 -0
ml_tools/{_core/_ML_chaining_inference.py → ML_inference/_chain_inference.py} +14 -17
ml_tools/ML_inference/_dragon_inference.py +332 -0
ml_tools/ML_inference/_imprimir.py +11 -0
ml_tools/ML_inference/_multi_inference.py +180 -0
ml_tools/ML_inference_sequence/__init__.py +10 -0
ml_tools/ML_inference_sequence/_imprimir.py +8 -0
ml_tools/{_core/_ML_sequence_inference.py → ML_inference_sequence/_sequence_inference.py} +11 -15
ml_tools/ML_inference_vision/__init__.py +10 -0
ml_tools/ML_inference_vision/_imprimir.py +8 -0
ml_tools/{_core/_ML_vision_inference.py → ML_inference_vision/_vision_inference.py} +15 -19
ml_tools/ML_models/__init__.py +32 -0
ml_tools/{_core/_ML_models_advanced.py → ML_models/_advanced_models.py} +22 -18
ml_tools/ML_models/_base_mlp_attention.py +198 -0
ml_tools/{_core/_models_advanced_base.py → ML_models/_base_save_load.py} +73 -49
ml_tools/ML_models/_dragon_tabular.py +248 -0
ml_tools/ML_models/_imprimir.py +18 -0
ml_tools/ML_models/_mlp_attention.py +134 -0
ml_tools/{_core → ML_models}/_models_advanced_helpers.py +13 -13
ml_tools/ML_models_sequence/__init__.py +10 -0
ml_tools/ML_models_sequence/_imprimir.py +8 -0
ml_tools/{_core/_ML_sequence_models.py → ML_models_sequence/_sequence_models.py} +5 -8
ml_tools/ML_models_vision/__init__.py +29 -0
ml_tools/ML_models_vision/_base_wrapper.py +254 -0
ml_tools/ML_models_vision/_image_classification.py +182 -0
ml_tools/ML_models_vision/_image_segmentation.py +108 -0
ml_tools/ML_models_vision/_imprimir.py +16 -0
ml_tools/ML_models_vision/_object_detection.py +135 -0
ml_tools/ML_optimization/__init__.py +21 -0
ml_tools/ML_optimization/_imprimir.py +13 -0
ml_tools/{_core/_ML_optimization_pareto.py → ML_optimization/_multi_dragon.py} +18 -24
ml_tools/ML_optimization/_single_dragon.py +203 -0
ml_tools/{_core/_ML_optimization.py → ML_optimization/_single_manual.py} +75 -213
ml_tools/{_core → ML_scaler}/_ML_scaler.py +8 -11
ml_tools/ML_scaler/__init__.py +10 -0
ml_tools/ML_scaler/_imprimir.py +8 -0
ml_tools/ML_trainer/__init__.py +20 -0
ml_tools/ML_trainer/_base_trainer.py +297 -0
ml_tools/ML_trainer/_dragon_detection_trainer.py +402 -0
ml_tools/ML_trainer/_dragon_sequence_trainer.py +540 -0
ml_tools/ML_trainer/_dragon_trainer.py +1160 -0
ml_tools/ML_trainer/_imprimir.py +10 -0
ml_tools/{ML_utilities.py → ML_utilities/__init__.py} +14 -6
ml_tools/ML_utilities/_artifact_finder.py +382 -0
ml_tools/ML_utilities/_imprimir.py +16 -0
ml_tools/ML_utilities/_inspection.py +325 -0
ml_tools/ML_utilities/_train_tools.py +205 -0
ml_tools/{ML_vision_transformers.py → ML_vision_transformers/__init__.py} +9 -6
ml_tools/{_core/_ML_vision_transformers.py → ML_vision_transformers/_core_transforms.py} +11 -155
ml_tools/ML_vision_transformers/_imprimir.py +14 -0
ml_tools/ML_vision_transformers/_offline_augmentation.py +159 -0
ml_tools/{_core/_PSO_optimization.py → PSO_optimization/_PSO.py} +58 -15
ml_tools/{PSO_optimization.py → PSO_optimization/__init__.py} +5 -3
ml_tools/PSO_optimization/_imprimir.py +10 -0
ml_tools/SQL/__init__.py +7 -0
ml_tools/{_core/_SQL.py → SQL/_dragon_SQL.py} +7 -11
ml_tools/SQL/_imprimir.py +8 -0
ml_tools/{_core → VIF}/_VIF_factor.py +5 -8
ml_tools/{VIF_factor.py → VIF/__init__.py} +4 -2
ml_tools/VIF/_imprimir.py +10 -0
ml_tools/_core/__init__.py +7 -1
ml_tools/_core/_logger.py +8 -18
ml_tools/_core/_schema_load_ops.py +43 -0
ml_tools/_core/_script_info.py +2 -2
ml_tools/{data_exploration.py → data_exploration/__init__.py} +32 -16
ml_tools/data_exploration/_analysis.py +214 -0
ml_tools/data_exploration/_cleaning.py +566 -0
ml_tools/data_exploration/_features.py +583 -0
ml_tools/data_exploration/_imprimir.py +32 -0
ml_tools/data_exploration/_plotting.py +487 -0
ml_tools/data_exploration/_schema_ops.py +176 -0
ml_tools/{ensemble_evaluation.py → ensemble_evaluation/__init__.py} +6 -4
ml_tools/{_core → ensemble_evaluation}/_ensemble_evaluation.py +3 -7
ml_tools/ensemble_evaluation/_imprimir.py +14 -0
ml_tools/{ensemble_inference.py → ensemble_inference/__init__.py} +5 -3
ml_tools/{_core → ensemble_inference}/_ensemble_inference.py +15 -18
ml_tools/ensemble_inference/_imprimir.py +9 -0
ml_tools/{ensemble_learning.py → ensemble_learning/__init__.py} +4 -6
ml_tools/{_core → ensemble_learning}/_ensemble_learning.py +7 -10
ml_tools/ensemble_learning/_imprimir.py +10 -0
ml_tools/{excel_handler.py → excel_handler/__init__.py} +5 -3
ml_tools/{_core → excel_handler}/_excel_handler.py +6 -10
ml_tools/excel_handler/_imprimir.py +13 -0
ml_tools/{keys.py → keys/__init__.py} +4 -1
ml_tools/keys/_imprimir.py +11 -0
ml_tools/{_core → keys}/_keys.py +2 -0
ml_tools/{math_utilities.py → math_utilities/__init__.py} +5 -2
ml_tools/math_utilities/_imprimir.py +11 -0
ml_tools/{_core → math_utilities}/_math_utilities.py +1 -5
ml_tools/{optimization_tools.py → optimization_tools/__init__.py} +9 -4
ml_tools/optimization_tools/_imprimir.py +13 -0
ml_tools/optimization_tools/_optimization_bounds.py +236 -0
ml_tools/optimization_tools/_optimization_plots.py +218 -0
ml_tools/{path_manager.py → path_manager/__init__.py} +6 -3
ml_tools/{_core/_path_manager.py → path_manager/_dragonmanager.py} +11 -347
ml_tools/path_manager/_imprimir.py +15 -0
ml_tools/path_manager/_path_tools.py +346 -0
ml_tools/plot_fonts/__init__.py +8 -0
ml_tools/plot_fonts/_imprimir.py +8 -0
ml_tools/{_core → plot_fonts}/_plot_fonts.py +2 -5
ml_tools/schema/__init__.py +15 -0
ml_tools/schema/_feature_schema.py +223 -0
ml_tools/schema/_gui_schema.py +191 -0
ml_tools/schema/_imprimir.py +10 -0
ml_tools/{serde.py → serde/__init__.py} +4 -2
ml_tools/serde/_imprimir.py +10 -0
ml_tools/{_core → serde}/_serde.py +3 -8
ml_tools/{utilities.py → utilities/__init__.py} +11 -6
ml_tools/utilities/_imprimir.py +18 -0
ml_tools/{_core/_utilities.py → utilities/_utility_save_load.py} +13 -190
ml_tools/utilities/_utility_tools.py +192 -0
dragon_ml_toolbox-19.14.0.dist-info/RECORD +0 -111
ml_tools/ML_chaining_inference.py +0 -8
ml_tools/ML_configuration.py +0 -86
ml_tools/ML_configuration_pytab.py +0 -14
ml_tools/ML_datasetmaster.py +0 -10
ml_tools/ML_evaluation.py +0 -16
ml_tools/ML_evaluation_multi.py +0 -12
ml_tools/ML_finalize_handler.py +0 -8
ml_tools/ML_inference.py +0 -12
ml_tools/ML_models.py +0 -14
ml_tools/ML_models_advanced.py +0 -14
ml_tools/ML_models_pytab.py +0 -14
ml_tools/ML_optimization.py +0 -14
ml_tools/ML_optimization_pareto.py +0 -8
ml_tools/ML_scaler.py +0 -8
ml_tools/ML_sequence_datasetmaster.py +0 -8
ml_tools/ML_sequence_evaluation.py +0 -10
ml_tools/ML_sequence_inference.py +0 -8
ml_tools/ML_sequence_models.py +0 -8
ml_tools/ML_trainer.py +0 -12
ml_tools/ML_vision_datasetmaster.py +0 -12
ml_tools/ML_vision_evaluation.py +0 -10
ml_tools/ML_vision_inference.py +0 -8
ml_tools/ML_vision_models.py +0 -18
ml_tools/SQL.py +0 -8
ml_tools/_core/_ETL_cleaning.py +0 -694
ml_tools/_core/_IO_tools.py +0 -498
ml_tools/_core/_ML_callbacks.py +0 -702
ml_tools/_core/_ML_configuration.py +0 -1332
ml_tools/_core/_ML_configuration_pytab.py +0 -102
ml_tools/_core/_ML_evaluation.py +0 -867
ml_tools/_core/_ML_evaluation_multi.py +0 -544
ml_tools/_core/_ML_inference.py +0 -646
ml_tools/_core/_ML_models.py +0 -668
ml_tools/_core/_ML_models_pytab.py +0 -693
ml_tools/_core/_ML_trainer.py +0 -2323
ml_tools/_core/_ML_utilities.py +0 -886
ml_tools/_core/_ML_vision_models.py +0 -644
ml_tools/_core/_data_exploration.py +0 -1909
ml_tools/_core/_optimization_tools.py +0 -493
ml_tools/_core/_schema.py +0 -359
ml_tools/plot_fonts.py +0 -8
ml_tools/schema.py +0 -12
{dragon_ml_toolbox-19.14.0.dist-info → dragon_ml_toolbox-20.0.0.dist-info}/WHEEL +0 -0
{dragon_ml_toolbox-19.14.0.dist-info → dragon_ml_toolbox-20.0.0.dist-info}/licenses/LICENSE +0 -0
{dragon_ml_toolbox-19.14.0.dist-info → dragon_ml_toolbox-20.0.0.dist-info}/licenses/LICENSE-THIRD-PARTY.md +0 -0
{dragon_ml_toolbox-19.14.0.dist-info → dragon_ml_toolbox-20.0.0.dist-info}/top_level.txt +0 -0

ml_tools/{_core/_ML_datasetmaster.py → ML_datasetmaster/_datasetmaster.py} RENAMED Viewed

@@ -1,20 +1,15 @@
 import torch
-from torch.utils.data import Dataset
 import pandas
-import numpy
 from sklearn.model_selection import train_test_split
-from typing import Literal, Union, List, Optional, Tuple
-from abc import ABC
-from pathlib import Path
+from typing import Literal, Union, Optional
-from ._path_manager import make_fullpath, sanitize_filename
-from ._logger import get_logger
-from ._script_info import _script_info
-from ._IO_tools import save_list_strings
-from ._ML_scaler import DragonScaler
-from ._keys import DatasetKeys, MLTaskKeys, ScalerKeys
-from ._schema import FeatureSchema
-from ._IO_tools import custom_logger
+from ..ML_scaler import DragonScaler
+from ..schema import FeatureSchema
+from .._core import get_logger
+from ..keys._keys import MLTaskKeys
+from ._base_datasetmaster import _BaseDatasetMaker, _PytorchDataset
 _LOGGER = get_logger("DragonDataset")
@@ -26,318 +21,6 @@ __all__ = [
 ]
-# --- Internal Helper Class ---
-class _PytorchDataset(Dataset):
-    """
-    Internal helper class to create a PyTorch Dataset.
-    Converts numpy/pandas data into tensors for model consumption.
-    """
-    def __init__(self, features: Union[numpy.ndarray, pandas.DataFrame],
-                 labels: Union[numpy.ndarray, pandas.Series, pandas.DataFrame],
-                 labels_dtype: torch.dtype,
-                 features_dtype: torch.dtype = torch.float32,
-                 feature_names: Optional[List[str]] = None,
-                 target_names: Optional[List[str]] = None):
-        if isinstance(features, numpy.ndarray):
-            self.features = torch.tensor(features, dtype=features_dtype)
-        else: # It's a pandas.DataFrame
-            self.features = torch.tensor(features.to_numpy(), dtype=features_dtype)
-        if isinstance(labels, numpy.ndarray):
-            self.labels = torch.tensor(labels, dtype=labels_dtype)
-        elif isinstance(labels, (pandas.Series, pandas.DataFrame)):
-            self.labels = torch.tensor(labels.to_numpy(), dtype=labels_dtype)
-        else:
-            self.labels = torch.tensor(labels, dtype=labels_dtype)
-        self._feature_names = feature_names
-        self._target_names = target_names
-        self._classes: List[str] = []
-        self._class_map: dict[str,int] = dict()
-        self._feature_scaler: Optional[DragonScaler] = None
-        self._target_scaler: Optional[DragonScaler] = None
-    def __len__(self):
-        return len(self.features)
-    def __getitem__(self, index):
-        return self.features[index], self.labels[index]
-    @property
-    def feature_names(self):
-        if self._feature_names is not None:
-            return self._feature_names
-        else:
-            _LOGGER.error(f"Dataset {self.__class__} has not been initialized with any feature names.")
-            raise ValueError()
-    @property
-    def target_names(self):
-        if self._target_names is not None:
-            return self._target_names
-        else:
-            _LOGGER.error(f"Dataset {self.__class__} has not been initialized with any target names.")
-            raise ValueError()
-    @property
-    def classes(self):
-        return self._classes
-    @property
-    def class_map(self):
-        return self._class_map
-    @property
-    def feature_scaler(self):
-        return self._feature_scaler
-    @property
-    def target_scaler(self):
-        return self._target_scaler
-# --- Abstract Base Class ---
-class _BaseDatasetMaker(ABC):
-    """
-    Abstract base class for dataset makers. Contains shared logic.
-    """
-    def __init__(self):
-        self._train_ds: Optional[Dataset] = None
-        self._val_ds: Optional[Dataset] = None
-        self._test_ds: Optional[Dataset] = None
-        self.feature_scaler: Optional[DragonScaler] = None
-        self.target_scaler: Optional[DragonScaler] = None
-        self._id: Optional[str] = None
-        self._feature_names: List[str] = []
-        self._target_names: List[str] = []
-        self._X_train_shape = (0,0)
-        self._X_val_shape = (0,0)
-        self._X_test_shape = (0,0)
-        self._y_train_shape = (0,)
-        self._y_val_shape = (0,)
-        self._y_test_shape = (0,)
-        self.class_map: dict[str, int] = dict()
-        self.classes: list[str] = list()
-    def _prepare_feature_scaler(self,
-                        X_train: pandas.DataFrame,
-                        y_train: Union[pandas.Series, pandas.DataFrame],
-                        X_val: pandas.DataFrame,
-                        X_test: pandas.DataFrame,
-                        label_dtype: torch.dtype,
-                        schema: FeatureSchema) -> Tuple[numpy.ndarray, numpy.ndarray, numpy.ndarray]:
-        """Internal helper to fit and apply a DragonScaler for FEATURES using a FeatureSchema."""
-        continuous_feature_indices: Optional[List[int]] = None
-        # Get continuous feature indices *from the schema*
-        if schema.continuous_feature_names:
-            _LOGGER.info("Getting continuous feature indices from schema.")
-            try:
-                # Convert columns to a standard list for .index()
-                train_cols_list = X_train.columns.to_list()
-                # Map names from schema to column indices in the training DataFrame
-                continuous_feature_indices = [train_cols_list.index(name) for name in schema.continuous_feature_names]
-            except ValueError as e:
-                _LOGGER.error(f"Feature name from schema not found in training data columns:\n{e}")
-                raise ValueError()
-        else:
-            _LOGGER.info("No continuous features listed in schema. Feature scaler will not be fitted.")
-        X_train_values = X_train.to_numpy()
-        X_val_values = X_val.to_numpy()
-        X_test_values = X_test.to_numpy()
-        # continuous_feature_indices is derived
-        if self.feature_scaler is None and continuous_feature_indices:
-            _LOGGER.info("Fitting a new DragonScaler on training features.")
-            temp_train_ds = _PytorchDataset(X_train_values, y_train, label_dtype)
-            self.feature_scaler = DragonScaler.fit(temp_train_ds, continuous_feature_indices)
-        if self.feature_scaler and self.feature_scaler.mean_ is not None:
-            _LOGGER.info("Applying scaler transformation to train, validation, and test feature sets.")
-            X_train_tensor = self.feature_scaler.transform(torch.tensor(X_train_values, dtype=torch.float32))
-            X_val_tensor = self.feature_scaler.transform(torch.tensor(X_val_values, dtype=torch.float32))
-            X_test_tensor = self.feature_scaler.transform(torch.tensor(X_test_values, dtype=torch.float32))
-            return X_train_tensor.numpy(), X_val_tensor.numpy(), X_test_tensor.numpy()
-        return X_train_values, X_val_values, X_test_values
-    def _prepare_target_scaler(self,
-                               y_train: Union[pandas.Series, pandas.DataFrame],
-                               y_val: Union[pandas.Series, pandas.DataFrame],
-                               y_test: Union[pandas.Series, pandas.DataFrame]) -> Tuple[numpy.ndarray, numpy.ndarray, numpy.ndarray]:
-        """Internal helper to fit and apply a DragonScaler for TARGETS."""
-        y_train_arr = y_train.to_numpy() if isinstance(y_train, (pandas.Series, pandas.DataFrame)) else y_train
-        y_val_arr = y_val.to_numpy() if isinstance(y_val, (pandas.Series, pandas.DataFrame)) else y_val
-        y_test_arr = y_test.to_numpy() if isinstance(y_test, (pandas.Series, pandas.DataFrame)) else y_test
-        if self.target_scaler is None:
-            _LOGGER.info("Fitting a new DragonScaler on training targets.")
-            # Convert to float tensor for calculation
-            y_train_tensor = torch.tensor(y_train_arr, dtype=torch.float32)
-            self.target_scaler = DragonScaler.fit_tensor(y_train_tensor)
-        if self.target_scaler and self.target_scaler.mean_ is not None:
-             _LOGGER.info("Applying scaler transformation to train, validation, and test targets.")
-             y_train_tensor = self.target_scaler.transform(torch.tensor(y_train_arr, dtype=torch.float32))
-             y_val_tensor = self.target_scaler.transform(torch.tensor(y_val_arr, dtype=torch.float32))
-             y_test_tensor = self.target_scaler.transform(torch.tensor(y_test_arr, dtype=torch.float32))
-             return y_train_tensor.numpy(), y_val_tensor.numpy(), y_test_tensor.numpy()
-        return y_train_arr, y_val_arr, y_test_arr
-    def _attach_scalers_to_datasets(self):
-        """Helper to attach the master scalers to the child datasets."""
-        for ds in [self._train_ds, self._val_ds, self._test_ds]:
-            if ds is not None:
-                ds._feature_scaler = self.feature_scaler
-                ds._target_scaler = self.target_scaler
-    @property
-    def train_dataset(self) -> Dataset:
-        if self._train_ds is None:
-            _LOGGER.error("Train Dataset not yet created.")
-            raise RuntimeError()
-        return self._train_ds
-    @property
-    def validation_dataset(self) -> Dataset:
-        if self._val_ds is None:
-            _LOGGER.error("Validation Dataset not yet created.")
-            raise RuntimeError()
-        return self._val_ds
-    @property
-    def test_dataset(self) -> Dataset:
-        if self._test_ds is None:
-            _LOGGER.error("Test Dataset not yet created.")
-            raise RuntimeError()
-        return self._test_ds
-    @property
-    def feature_names(self) -> list[str]:
-        return self._feature_names
-    @property
-    def target_names(self) -> list[str]:
-        return self._target_names
-    @property
-    def number_of_features(self) -> int:
-        return len(self._feature_names)
-    @property
-    def number_of_targets(self) -> int:
-        return len(self._target_names)
-    @property
-    def id(self) -> Optional[str]:
-        return self._id
-    @id.setter
-    def id(self, dataset_id: str):
-        if not isinstance(dataset_id, str): raise ValueError("ID must be a string.")
-        self._id = dataset_id
-    def dataframes_info(self) -> None:
-        print("--- DataFrame Shapes After Split ---")
-        print(f"  X_train shape: {self._X_train_shape}, y_train shape: {self._y_train_shape}")
-        print(f"  X_val shape:   {self._X_val_shape}, y_val shape:   {self._y_val_shape}")
-        print(f"  X_test shape:  {self._X_test_shape}, y_test shape:  {self._y_test_shape}")
-        print("------------------------------------")
-    def save_feature_names(self, directory: Union[str, Path], verbose: bool=True) -> None:
-        save_list_strings(list_strings=self._feature_names,
-                          directory=directory,
-                          filename=DatasetKeys.FEATURE_NAMES,
-                          verbose=verbose)
-    def save_target_names(self, directory: Union[str, Path], verbose: bool=True) -> None:
-        save_list_strings(list_strings=self._target_names,
-                          directory=directory,
-                          filename=DatasetKeys.TARGET_NAMES,
-                          verbose=verbose)
-    def save_scaler(self, directory: Union[str, Path], verbose: bool=True) -> None:
-        """
-        Saves both feature and target scalers (if they exist) to a single .pth file
-        using a dictionary structure.
-        """
-        if self.feature_scaler is None and self.target_scaler is None:
-            _LOGGER.warning("No scalers (feature or target) were fitted. Nothing to save.")
-            return
-        if not self.id:
-            _LOGGER.error("Must set the dataset `id` before saving scaler.")
-            raise ValueError()
-        save_path = make_fullpath(directory, make=True, enforce="directory")
-        sanitized_id = sanitize_filename(self.id)
-        filename = f"{DatasetKeys.SCALER_PREFIX}{sanitized_id}.pth"
-        filepath = save_path / filename
-        # Construct the consolidated dictionary
-        combined_state = {}
-        print_message = "Saved "
-        if self.feature_scaler:
-            combined_state[ScalerKeys.FEATURE_SCALER] = self.feature_scaler._get_state()
-            print_message += "feature scaler "
-        if self.target_scaler:
-            if self.feature_scaler:
-                print_message += "and "
-            combined_state[ScalerKeys.TARGET_SCALER] = self.target_scaler._get_state()
-            print_message += "target scaler "
-        torch.save(combined_state, filepath)
-        if verbose:
-            _LOGGER.info(f"{print_message}to '{filepath.name}'.")
-    def save_class_map(self, directory: Union[str,Path], verbose: bool=True) -> None:
-        """
-        Saves the class map dictionary to a JSON file.
-        Args:
-            directory (str | Path): Directory to save the class map.
-            verbose (bool): Whether to print log messages.
-        """
-        if not self.class_map:
-            _LOGGER.warning(f"No class_map defined. Skipping.")
-            return
-        log_name = f"Class_to_Index_{self.id}" if self.id else "Class_to_Index"
-        custom_logger(data=self.class_map,
-                      save_directory=directory,
-                      log_name=log_name,
-                      add_timestamp=False,
-                      dict_as="json")
-        if verbose:
-            _LOGGER.info(f"Class map for '{self.id}' saved as '{log_name}.json'.")
-    def save_artifacts(self, directory: Union[str, Path], verbose: bool=True) -> None:
-        """
-        Saves all dataset artifacts: feature names, target names, scalers, and class map (if applicable).
-        Args:
-            directory (str | Path): Directory to save artifacts.
-            verbose (bool): Whether to print log messages.
-        """
-        self.save_feature_names(directory=directory, verbose=verbose)
-        self.save_target_names(directory=directory, verbose=verbose)
-        if self.feature_scaler is not None or self.target_scaler is not None:
-            self.save_scaler(directory=directory, verbose=verbose)
-        if self.class_map:
-            self.save_class_map(directory=directory, verbose=verbose)
 # Single target dataset
 class DragonDataset(_BaseDatasetMaker):
     """
@@ -549,7 +232,7 @@ class DragonDatasetMulti(_BaseDatasetMaker):
     """
     def __init__(self,
                  pandas_df: pandas.DataFrame,
-                 target_columns: List[str],
+                 target_columns: list[str],
                  schema: FeatureSchema,
                  kind: Literal["multitarget regression", "multilabel binary classification"],
                  feature_scaler: Union[Literal["fit"], Literal["none"], DragonScaler] = "fit",
@@ -700,6 +383,3 @@ class DragonDatasetMulti(_BaseDatasetMaker):
         if self._test_ds: s += f"  Test Samples: {len(self._test_ds)}\n" # type: ignore
         return s
-def info():
-    _script_info(__all__)

ml_tools/ML_datasetmaster/_imprimir.py ADDED Viewed

@@ -0,0 +1,15 @@
+from .._core import _imprimir_disponibles
+_GRUPOS = [
+    "DragonDataset",
+    "DragonDatasetMulti",
+    # sequence
+    "DragonDatasetSequence",
+    # vision
+    "DragonDatasetVision",
+    "DragonDatasetSegmentation",
+    "DragonDatasetObjectDetection",
+]
+def info():
+    _imprimir_disponibles(_GRUPOS)

ml_tools/{_core/_ML_sequence_datasetmaster.py → ML_datasetmaster/_sequence_datasetmaster.py} RENAMED Viewed

@@ -2,19 +2,20 @@ import torch
 from torch.utils.data import Dataset
 import pandas
 import numpy
-from typing import Literal, Union, Tuple
+from typing import Literal, Union
 import matplotlib.pyplot as plt
 from pathlib import Path
-from ._path_manager import make_fullpath
-from ._logger import get_logger
-from ._script_info import _script_info
-from ._ML_scaler import DragonScaler
-from ._ML_datasetmaster import _PytorchDataset
-from ._keys import DatasetKeys, MLTaskKeys, SequenceDatasetKeys, ScalerKeys
+from ..ML_scaler import DragonScaler
+from ..path_manager import make_fullpath
+from .._core import get_logger
+from ..keys._keys import DatasetKeys, MLTaskKeys, SequenceDatasetKeys, ScalerKeys
-_LOGGER = get_logger("DragonDataset")
+from ._base_datasetmaster import _PytorchDataset
+_LOGGER = get_logger("DragonSequenceDataset")
 __all__ = [
@@ -202,8 +203,8 @@ class DragonDatasetSequence:
         if self.scaler is not None:
             for ds in [self._train_dataset, self._val_dataset, self._test_dataset]:
                 if ds is not None:
-                    ds._feature_scaler = self.scaler
-                    ds._target_scaler = self.scaler
+                    ds._feature_scaler = self.scaler # type: ignore
+                    ds._target_scaler = self.scaler # type: ignore
         self._are_windows_generated = True
         _LOGGER.info("Feature and label windows generated for train, validation, and test sets.")
@@ -291,7 +292,7 @@ class DragonDatasetSequence:
         _LOGGER.info(f"📈 Sequence data splits saved as '{full_path.name}'.")
         plt.close()
-    def get_datasets(self) -> Tuple[Dataset, Dataset, Dataset]:
+    def get_datasets(self) -> tuple[Dataset, Dataset, Dataset]:
         """Returns the final train, validation, and test datasets."""
         if not self._are_windows_generated:
             _LOGGER.error("Windows have not been generated. Call .generate_windows() first.")
@@ -349,7 +350,7 @@ class DragonDatasetSequence:
         start_idx = val_split_idx - self.sequence_length
         end_idx = val_split_idx
-        return self.sequence[start_idx:end_idx]
+        return self.sequence[start_idx:end_idx] # type: ignore
     @property
     def feature_names(self):
@@ -398,6 +399,3 @@ class DragonDatasetSequence:
         return s
-def info():
-    _script_info(__all__)

dragon-ml-toolbox 19.14.0__py3-none-any.whl → 20.0.0__py3-none-any.whl

dragon-ml-toolbox 19.14.0py3-none-any.whl → 20.0.0py3-none-any.whl