PyPI - dragon-ml-toolbox - Versions diffs - 19.13.0__py3-none-any.whl → 20.0.0__py3-none-any.whl - Mend

dragon-ml-toolbox 19.13.0py3-none-any.whl → 20.0.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (219) hide show

{dragon_ml_toolbox-19.13.0.dist-info → dragon_ml_toolbox-20.0.0.dist-info}/METADATA +29 -46
dragon_ml_toolbox-20.0.0.dist-info/RECORD +178 -0
ml_tools/{ETL_cleaning.py → ETL_cleaning/__init__.py} +13 -5
ml_tools/ETL_cleaning/_basic_clean.py +351 -0
ml_tools/ETL_cleaning/_clean_tools.py +128 -0
ml_tools/ETL_cleaning/_dragon_cleaner.py +245 -0
ml_tools/ETL_cleaning/_imprimir.py +13 -0
ml_tools/{ETL_engineering.py → ETL_engineering/__init__.py} +8 -4
ml_tools/ETL_engineering/_dragon_engineering.py +261 -0
ml_tools/ETL_engineering/_imprimir.py +24 -0
ml_tools/{_core/_ETL_engineering.py → ETL_engineering/_transforms.py} +14 -267
ml_tools/{_core → GUI_tools}/_GUI_tools.py +37 -40
ml_tools/{GUI_tools.py → GUI_tools/__init__.py} +7 -5
ml_tools/GUI_tools/_imprimir.py +12 -0
ml_tools/IO_tools/_IO_loggers.py +235 -0
ml_tools/IO_tools/_IO_save_load.py +151 -0
ml_tools/IO_tools/_IO_utils.py +140 -0
ml_tools/{IO_tools.py → IO_tools/__init__.py} +13 -5
ml_tools/IO_tools/_imprimir.py +14 -0
ml_tools/MICE/_MICE_imputation.py +132 -0
ml_tools/{MICE_imputation.py → MICE/__init__.py} +6 -7
ml_tools/{_core/_MICE_imputation.py → MICE/_dragon_mice.py} +243 -322
ml_tools/MICE/_imprimir.py +11 -0
ml_tools/{ML_callbacks.py → ML_callbacks/__init__.py} +12 -4
ml_tools/ML_callbacks/_base.py +101 -0
ml_tools/ML_callbacks/_checkpoint.py +232 -0
ml_tools/ML_callbacks/_early_stop.py +208 -0
ml_tools/ML_callbacks/_imprimir.py +12 -0
ml_tools/ML_callbacks/_scheduler.py +197 -0
ml_tools/{ML_chaining_utilities.py → ML_chain/__init__.py} +8 -3
ml_tools/{_core/_ML_chaining_utilities.py → ML_chain/_chaining_tools.py} +5 -129
ml_tools/ML_chain/_dragon_chain.py +140 -0
ml_tools/ML_chain/_imprimir.py +11 -0
ml_tools/ML_configuration/__init__.py +90 -0
ml_tools/ML_configuration/_base_model_config.py +69 -0
ml_tools/ML_configuration/_finalize.py +366 -0
ml_tools/ML_configuration/_imprimir.py +47 -0
ml_tools/ML_configuration/_metrics.py +593 -0
ml_tools/ML_configuration/_models.py +206 -0
ml_tools/ML_configuration/_training.py +124 -0
ml_tools/ML_datasetmaster/__init__.py +28 -0
ml_tools/ML_datasetmaster/_base_datasetmaster.py +337 -0
ml_tools/{_core/_ML_datasetmaster.py → ML_datasetmaster/_datasetmaster.py} +9 -329
ml_tools/ML_datasetmaster/_imprimir.py +15 -0
ml_tools/{_core/_ML_sequence_datasetmaster.py → ML_datasetmaster/_sequence_datasetmaster.py} +13 -15
ml_tools/{_core/_ML_vision_datasetmaster.py → ML_datasetmaster/_vision_datasetmaster.py} +63 -65
ml_tools/ML_evaluation/__init__.py +53 -0
ml_tools/ML_evaluation/_classification.py +629 -0
ml_tools/ML_evaluation/_feature_importance.py +409 -0
ml_tools/ML_evaluation/_imprimir.py +25 -0
ml_tools/ML_evaluation/_loss.py +92 -0
ml_tools/ML_evaluation/_regression.py +273 -0
ml_tools/{_core/_ML_sequence_evaluation.py → ML_evaluation/_sequence.py} +8 -11
ml_tools/{_core/_ML_vision_evaluation.py → ML_evaluation/_vision.py} +12 -17
ml_tools/{_core → ML_evaluation_captum}/_ML_evaluation_captum.py +11 -38
ml_tools/{ML_evaluation_captum.py → ML_evaluation_captum/__init__.py} +6 -4
ml_tools/ML_evaluation_captum/_imprimir.py +10 -0
ml_tools/{_core → ML_finalize_handler}/_ML_finalize_handler.py +3 -7
ml_tools/ML_finalize_handler/__init__.py +10 -0
ml_tools/ML_finalize_handler/_imprimir.py +8 -0
ml_tools/ML_inference/__init__.py +22 -0
ml_tools/ML_inference/_base_inference.py +166 -0
ml_tools/{_core/_ML_chaining_inference.py → ML_inference/_chain_inference.py} +14 -17
ml_tools/ML_inference/_dragon_inference.py +332 -0
ml_tools/ML_inference/_imprimir.py +11 -0
ml_tools/ML_inference/_multi_inference.py +180 -0
ml_tools/ML_inference_sequence/__init__.py +10 -0
ml_tools/ML_inference_sequence/_imprimir.py +8 -0
ml_tools/{_core/_ML_sequence_inference.py → ML_inference_sequence/_sequence_inference.py} +11 -15
ml_tools/ML_inference_vision/__init__.py +10 -0
ml_tools/ML_inference_vision/_imprimir.py +8 -0
ml_tools/{_core/_ML_vision_inference.py → ML_inference_vision/_vision_inference.py} +15 -19
ml_tools/ML_models/__init__.py +32 -0
ml_tools/{_core/_ML_models_advanced.py → ML_models/_advanced_models.py} +22 -18
ml_tools/ML_models/_base_mlp_attention.py +198 -0
ml_tools/{_core/_models_advanced_base.py → ML_models/_base_save_load.py} +73 -49
ml_tools/ML_models/_dragon_tabular.py +248 -0
ml_tools/ML_models/_imprimir.py +18 -0
ml_tools/ML_models/_mlp_attention.py +134 -0
ml_tools/{_core → ML_models}/_models_advanced_helpers.py +13 -13
ml_tools/ML_models_sequence/__init__.py +10 -0
ml_tools/ML_models_sequence/_imprimir.py +8 -0
ml_tools/{_core/_ML_sequence_models.py → ML_models_sequence/_sequence_models.py} +5 -8
ml_tools/ML_models_vision/__init__.py +29 -0
ml_tools/ML_models_vision/_base_wrapper.py +254 -0
ml_tools/ML_models_vision/_image_classification.py +182 -0
ml_tools/ML_models_vision/_image_segmentation.py +108 -0
ml_tools/ML_models_vision/_imprimir.py +16 -0
ml_tools/ML_models_vision/_object_detection.py +135 -0
ml_tools/ML_optimization/__init__.py +21 -0
ml_tools/ML_optimization/_imprimir.py +13 -0
ml_tools/{_core/_ML_optimization_pareto.py → ML_optimization/_multi_dragon.py} +18 -24
ml_tools/ML_optimization/_single_dragon.py +203 -0
ml_tools/{_core/_ML_optimization.py → ML_optimization/_single_manual.py} +75 -213
ml_tools/{_core → ML_scaler}/_ML_scaler.py +8 -11
ml_tools/ML_scaler/__init__.py +10 -0
ml_tools/ML_scaler/_imprimir.py +8 -0
ml_tools/ML_trainer/__init__.py +20 -0
ml_tools/ML_trainer/_base_trainer.py +297 -0
ml_tools/ML_trainer/_dragon_detection_trainer.py +402 -0
ml_tools/ML_trainer/_dragon_sequence_trainer.py +540 -0
ml_tools/ML_trainer/_dragon_trainer.py +1160 -0
ml_tools/ML_trainer/_imprimir.py +10 -0
ml_tools/{ML_utilities.py → ML_utilities/__init__.py} +14 -6
ml_tools/ML_utilities/_artifact_finder.py +382 -0
ml_tools/ML_utilities/_imprimir.py +16 -0
ml_tools/ML_utilities/_inspection.py +325 -0
ml_tools/ML_utilities/_train_tools.py +205 -0
ml_tools/{ML_vision_transformers.py → ML_vision_transformers/__init__.py} +9 -6
ml_tools/{_core/_ML_vision_transformers.py → ML_vision_transformers/_core_transforms.py} +11 -155
ml_tools/ML_vision_transformers/_imprimir.py +14 -0
ml_tools/ML_vision_transformers/_offline_augmentation.py +159 -0
ml_tools/{_core/_PSO_optimization.py → PSO_optimization/_PSO.py} +58 -15
ml_tools/{PSO_optimization.py → PSO_optimization/__init__.py} +5 -3
ml_tools/PSO_optimization/_imprimir.py +10 -0
ml_tools/SQL/__init__.py +7 -0
ml_tools/{_core/_SQL.py → SQL/_dragon_SQL.py} +7 -11
ml_tools/SQL/_imprimir.py +8 -0
ml_tools/{_core → VIF}/_VIF_factor.py +5 -8
ml_tools/{VIF_factor.py → VIF/__init__.py} +4 -2
ml_tools/VIF/_imprimir.py +10 -0
ml_tools/_core/__init__.py +7 -1
ml_tools/_core/_logger.py +8 -18
ml_tools/_core/_schema_load_ops.py +43 -0
ml_tools/_core/_script_info.py +2 -2
ml_tools/{data_exploration.py → data_exploration/__init__.py} +32 -16
ml_tools/data_exploration/_analysis.py +214 -0
ml_tools/data_exploration/_cleaning.py +566 -0
ml_tools/data_exploration/_features.py +583 -0
ml_tools/data_exploration/_imprimir.py +32 -0
ml_tools/data_exploration/_plotting.py +487 -0
ml_tools/data_exploration/_schema_ops.py +176 -0
ml_tools/{ensemble_evaluation.py → ensemble_evaluation/__init__.py} +6 -4
ml_tools/{_core → ensemble_evaluation}/_ensemble_evaluation.py +3 -7
ml_tools/ensemble_evaluation/_imprimir.py +14 -0
ml_tools/{ensemble_inference.py → ensemble_inference/__init__.py} +5 -3
ml_tools/{_core → ensemble_inference}/_ensemble_inference.py +15 -18
ml_tools/ensemble_inference/_imprimir.py +9 -0
ml_tools/{ensemble_learning.py → ensemble_learning/__init__.py} +4 -6
ml_tools/{_core → ensemble_learning}/_ensemble_learning.py +7 -10
ml_tools/ensemble_learning/_imprimir.py +10 -0
ml_tools/{excel_handler.py → excel_handler/__init__.py} +5 -3
ml_tools/{_core → excel_handler}/_excel_handler.py +6 -10
ml_tools/excel_handler/_imprimir.py +13 -0
ml_tools/{keys.py → keys/__init__.py} +4 -1
ml_tools/keys/_imprimir.py +11 -0
ml_tools/{_core → keys}/_keys.py +2 -0
ml_tools/{math_utilities.py → math_utilities/__init__.py} +5 -2
ml_tools/math_utilities/_imprimir.py +11 -0
ml_tools/{_core → math_utilities}/_math_utilities.py +1 -5
ml_tools/{optimization_tools.py → optimization_tools/__init__.py} +9 -4
ml_tools/optimization_tools/_imprimir.py +13 -0
ml_tools/optimization_tools/_optimization_bounds.py +236 -0
ml_tools/optimization_tools/_optimization_plots.py +218 -0
ml_tools/{path_manager.py → path_manager/__init__.py} +6 -3
ml_tools/{_core/_path_manager.py → path_manager/_dragonmanager.py} +11 -347
ml_tools/path_manager/_imprimir.py +15 -0
ml_tools/path_manager/_path_tools.py +346 -0
ml_tools/plot_fonts/__init__.py +8 -0
ml_tools/plot_fonts/_imprimir.py +8 -0
ml_tools/{_core → plot_fonts}/_plot_fonts.py +2 -5
ml_tools/schema/__init__.py +15 -0
ml_tools/schema/_feature_schema.py +223 -0
ml_tools/schema/_gui_schema.py +191 -0
ml_tools/schema/_imprimir.py +10 -0
ml_tools/{serde.py → serde/__init__.py} +4 -2
ml_tools/serde/_imprimir.py +10 -0
ml_tools/{_core → serde}/_serde.py +3 -8
ml_tools/{utilities.py → utilities/__init__.py} +11 -6
ml_tools/utilities/_imprimir.py +18 -0
ml_tools/{_core/_utilities.py → utilities/_utility_save_load.py} +13 -190
ml_tools/utilities/_utility_tools.py +192 -0
dragon_ml_toolbox-19.13.0.dist-info/RECORD +0 -111
ml_tools/ML_chaining_inference.py +0 -8
ml_tools/ML_configuration.py +0 -86
ml_tools/ML_configuration_pytab.py +0 -14
ml_tools/ML_datasetmaster.py +0 -10
ml_tools/ML_evaluation.py +0 -16
ml_tools/ML_evaluation_multi.py +0 -12
ml_tools/ML_finalize_handler.py +0 -8
ml_tools/ML_inference.py +0 -12
ml_tools/ML_models.py +0 -14
ml_tools/ML_models_advanced.py +0 -14
ml_tools/ML_models_pytab.py +0 -14
ml_tools/ML_optimization.py +0 -14
ml_tools/ML_optimization_pareto.py +0 -8
ml_tools/ML_scaler.py +0 -8
ml_tools/ML_sequence_datasetmaster.py +0 -8
ml_tools/ML_sequence_evaluation.py +0 -10
ml_tools/ML_sequence_inference.py +0 -8
ml_tools/ML_sequence_models.py +0 -8
ml_tools/ML_trainer.py +0 -12
ml_tools/ML_vision_datasetmaster.py +0 -12
ml_tools/ML_vision_evaluation.py +0 -10
ml_tools/ML_vision_inference.py +0 -8
ml_tools/ML_vision_models.py +0 -18
ml_tools/SQL.py +0 -8
ml_tools/_core/_ETL_cleaning.py +0 -694
ml_tools/_core/_IO_tools.py +0 -498
ml_tools/_core/_ML_callbacks.py +0 -702
ml_tools/_core/_ML_configuration.py +0 -1332
ml_tools/_core/_ML_configuration_pytab.py +0 -102
ml_tools/_core/_ML_evaluation.py +0 -867
ml_tools/_core/_ML_evaluation_multi.py +0 -544
ml_tools/_core/_ML_inference.py +0 -646
ml_tools/_core/_ML_models.py +0 -668
ml_tools/_core/_ML_models_pytab.py +0 -693
ml_tools/_core/_ML_trainer.py +0 -2323
ml_tools/_core/_ML_utilities.py +0 -886
ml_tools/_core/_ML_vision_models.py +0 -644
ml_tools/_core/_data_exploration.py +0 -1901
ml_tools/_core/_optimization_tools.py +0 -493
ml_tools/_core/_schema.py +0 -359
ml_tools/plot_fonts.py +0 -8
ml_tools/schema.py +0 -12
{dragon_ml_toolbox-19.13.0.dist-info → dragon_ml_toolbox-20.0.0.dist-info}/WHEEL +0 -0
{dragon_ml_toolbox-19.13.0.dist-info → dragon_ml_toolbox-20.0.0.dist-info}/licenses/LICENSE +0 -0
{dragon_ml_toolbox-19.13.0.dist-info → dragon_ml_toolbox-20.0.0.dist-info}/licenses/LICENSE-THIRD-PARTY.md +0 -0
{dragon_ml_toolbox-19.13.0.dist-info → dragon_ml_toolbox-20.0.0.dist-info}/top_level.txt +0 -0

ml_tools/ML_optimization/_single_dragon.py ADDED Viewed

@@ -0,0 +1,203 @@
+from typing import Literal, Union, Optional
+from pathlib import Path
+from ..optimization_tools import create_optimization_bounds
+from ..ML_inference import DragonInferenceHandler
+from ..schema import FeatureSchema
+from .._core import get_logger
+from ..keys._keys import MLTaskKeys
+from ._single_manual import FitnessEvaluator, create_pytorch_problem, run_optimization
+_LOGGER = get_logger("DragonOptimizer")
+__all__ = [
+    "DragonOptimizer",
+]
+class DragonOptimizer:
+    """
+    A wrapper class for setting up and running EvoTorch optimization tasks for regression models.
+    This class combines the functionality of `FitnessEvaluator`, `create_pytorch_problem`, and
+    `run_optimization` into a single, streamlined workflow.
+    SNES and CEM algorithms do not accept bounds, the given bounds will be used as an initial starting point.
+    Example:
+        >>> # 1. Define bounds for continuous features
+        >>> cont_bounds = {'feature_A': (0, 100), 'feature_B': (-10, 10)}
+        >>>
+        >>> # 2. Initialize the optimizer
+        >>> optimizer = DragonOptimizer(
+        ...     inference_handler=my_handler,
+        ...     schema=schema,
+        ...     target_name="my_target",
+        ...     continuous_bounds_map=cont_bounds,
+        ...     task="max",
+        ...     algorithm="Genetic",
+        ... )
+        >>> # 3. Run the optimization
+        >>> best_result = optimizer.run(
+        ...     num_generations=100,
+        ...     save_dir="/path/to/results",
+        ...     save_format="csv"
+        ... )
+    """
+    def __init__(self,
+                 inference_handler: DragonInferenceHandler,
+                 schema: FeatureSchema,
+                 target_name: str,
+                 continuous_bounds_map: dict[str, tuple[float, float]],
+                 task: Literal["min", "max"],
+                 algorithm: Literal["SNES", "CEM", "Genetic"] = "Genetic",
+                 population_size: int = 200,
+                 discretize_start_at_zero: bool = True,
+                 **searcher_kwargs):
+        """
+        Initializes the optimizer by creating the EvoTorch problem and searcher.
+        Args:
+            inference_handler (DragonInferenceHandler):
+                An initialized inference handler containing the model.
+            schema (FeatureSchema):
+                The definitive schema object from data_exploration.
+            target_name (str):
+                target name to optimize.
+            continuous_bounds_map (Dict[str, Tuple[float, float]]):
+                A dictionary mapping the *name* of each **continuous** feature
+                to its (min_bound, max_bound) tuple.
+            task (str): The optimization goal, either "min" or "max".
+            algorithm (str): The search algorithm to use ("SNES", "CEM", "Genetic").
+            population_size (int): Population size for CEM and GeneticAlgorithm.
+            discretize_start_at_zero (bool):
+                True if the discrete encoding starts at 0 (e.g., [0, 1, 2]).
+                False if it starts at 1 (e.g., [1, 2, 3]).
+            **searcher_kwargs: Additional keyword arguments for the selected
+                               search algorithm's constructor.
+        """
+        # --- Store schema ---
+        self.schema = schema
+        # --- Store inference handler ---
+        self.inference_handler = inference_handler
+        # Ensure only Regression tasks are used
+        allowed_tasks = [MLTaskKeys.REGRESSION, MLTaskKeys.MULTITARGET_REGRESSION]
+        if self.inference_handler.task not in allowed_tasks:
+            _LOGGER.error(f"DragonOptimizer only supports {allowed_tasks}. Got '{self.inference_handler.task}'.")
+            raise ValueError(f"Invalid Task: {self.inference_handler.task}")
+        # --- store target name ---
+        self.target_name = target_name
+        # --- flag to control single vs multi-target ---
+        self.is_multi_target = False
+        # --- 1. Create bounds from schema ---
+        # This is the robust way to get bounds
+        bounds = create_optimization_bounds(
+            schema=schema,
+            continuous_bounds_map=continuous_bounds_map,
+            start_at_zero=discretize_start_at_zero
+        )
+        # Resolve target index if multi-target
+        target_index = None
+        if self.inference_handler.target_ids is None:
+            # This should be caught by ML_inference logic
+            _LOGGER.error("The provided inference handler does not have 'target_ids' defined.")
+            raise ValueError()
+        if target_name not in self.inference_handler.target_ids:
+            _LOGGER.error(f"Target name '{target_name}' not found in the inference handler's 'target_ids': {self.inference_handler.target_ids}")
+            raise ValueError()
+        if len(self.inference_handler.target_ids) == 1:
+            # Single target regression
+            target_index = None
+            _LOGGER.info(f"Optimization locked to single-target model '{target_name}'.")
+        else:
+            # Multi-target regression (optimizing one specific column)
+            target_index = self.inference_handler.target_ids.index(target_name)
+            self.is_multi_target = True
+            _LOGGER.info(f"Optimization locked to target '{target_name}' (Index {target_index}) in a multi-target model.")
+        # --- 2. Make a fitness function ---
+        self.evaluator = FitnessEvaluator(
+            inference_handler=inference_handler,
+            # Get categorical info from the schema
+            categorical_index_map=schema.categorical_index_map,
+            discretize_start_at_zero=discretize_start_at_zero,
+            target_index=target_index
+        )
+        # --- 3. Create the problem and searcher factory ---
+        self.problem, self.searcher_factory = create_pytorch_problem(
+            evaluator=self.evaluator,
+            bounds=bounds,
+            task=task,
+            algorithm=algorithm,
+            population_size=population_size,
+            **searcher_kwargs
+        )
+        # --- 4. Store other info needed by run() ---
+        self.discretize_start_at_zero = discretize_start_at_zero
+    def run(self,
+            num_generations: int,
+            save_dir: Union[str, Path],
+            save_format: Literal['csv', 'sqlite', 'both'],
+            repetitions: int = 1,
+            verbose: bool = True) -> Optional[dict]:
+        """
+        Runs the evolutionary optimization process using the pre-configured settings.
+        The `feature_names` are automatically pulled from the `FeatureSchema`
+        provided during initialization.
+        Args:
+            num_generations (int): The total number of generations for each repetition.
+            save_dir (str | Path): The directory where result files will be saved.
+            save_format (Literal['csv', 'sqlite', 'both']): The format for saving results.
+            repetitions (int): The number of independent times to run the optimization.
+            verbose (bool): If True, enables detailed logging.
+        Returns:
+            Optional[dict]: A dictionary with the best result if repetitions is 1,
+                            otherwise None.
+        """
+        # Pass inference handler and target names for multi-target only
+        if self.is_multi_target:
+            target_names_to_pass = self.inference_handler.target_ids
+            inference_handler_to_pass = self.inference_handler
+        else:
+            target_names_to_pass = None
+            inference_handler_to_pass = None
+        # Call the existing run function, passing info from the schema
+        return run_optimization(
+            problem=self.problem,
+            searcher_factory=self.searcher_factory,
+            num_generations=num_generations,
+            target_name=self.target_name,
+            save_dir=save_dir,
+            save_format=save_format,
+            # Get the definitive feature names (as a list) from the schema
+            feature_names=list(self.schema.feature_names),
+            # Get categorical info from the schema
+            categorical_map=self.schema.categorical_index_map,
+            categorical_mappings=self.schema.categorical_mappings,
+            repetitions=repetitions,
+            verbose=verbose,
+            discretize_start_at_zero=self.discretize_start_at_zero,
+            all_target_names=target_names_to_pass,
+            inference_handler=inference_handler_to_pass
+        )

ml_tools/{_core/_ML_optimization.py → ML_optimization/_single_manual.py} RENAMED Viewed

@@ -1,222 +1,39 @@
-import pandas # logger
+import pandas as pd
 import torch
-import numpy    #handling torch to numpy
+import numpy
 import evotorch
 from evotorch.algorithms import SNES, CEM, GeneticAlgorithm
 from evotorch.logging import PandasLogger
 from evotorch.operators import SimulatedBinaryCrossOver, GaussianMutation
-from typing import Literal, Union, Tuple, List, Optional, Any, Callable, Dict
+from typing import Literal, Union, Optional, Any, Callable
 from pathlib import Path
 from tqdm.auto import trange
 from contextlib import nullcontext
 from functools import partial
-from ._SQL import DragonSQL
-from ._optimization_tools import _save_result, create_optimization_bounds
-from ._utilities import save_dataframe_filename
-from ._math_utilities import discretize_categorical_values
-from ._ML_inference import DragonInferenceHandler
-from ._path_manager import make_fullpath, sanitize_filename
-from ._logger import get_logger
-from ._script_info import _script_info
-from ._keys import PyTorchInferenceKeys, MLTaskKeys
-from ._schema import FeatureSchema
+from ..SQL import DragonSQL
+from ..utilities import save_dataframe_filename
+from ..ML_inference import DragonInferenceHandler
+from ..math_utilities import discretize_categorical_values
+from ..path_manager import make_fullpath, sanitize_filename
+from .._core import get_logger
+from ..keys._keys import PyTorchInferenceKeys
-_LOGGER = get_logger("Optimizer")
+_LOGGER = get_logger("Optimization")
 __all__ = [
-    "DragonOptimizer",
     "FitnessEvaluator",
     "create_pytorch_problem",
-    "run_optimization"
+    "run_optimization",
+    "_save_result",
+    "_handle_pandas_log",
+    "_run_single_optimization_rep"
 ]
-class DragonOptimizer:
-    """
-    A wrapper class for setting up and running EvoTorch optimization tasks for regression models.
-    This class combines the functionality of `FitnessEvaluator`, `create_pytorch_problem`, and
-    `run_optimization` into a single, streamlined workflow.
-    SNES and CEM algorithms do not accept bounds, the given bounds will be used as an initial starting point.
-    Example:
-        >>> # 1. Define bounds for continuous features
-        >>> cont_bounds = {'feature_A': (0, 100), 'feature_B': (-10, 10)}
-        >>>
-        >>> # 2. Initialize the optimizer
-        >>> optimizer = DragonOptimizer(
-        ...     inference_handler=my_handler,
-        ...     schema=schema,
-        ...     target_name="my_target",
-        ...     continuous_bounds_map=cont_bounds,
-        ...     task="max",
-        ...     algorithm="Genetic",
-        ... )
-        >>> # 3. Run the optimization
-        >>> best_result = optimizer.run(
-        ...     num_generations=100,
-        ...     save_dir="/path/to/results",
-        ...     save_format="csv"
-        ... )
-    """
-    def __init__(self,
-                 inference_handler: DragonInferenceHandler,
-                 schema: FeatureSchema,
-                 target_name: str,
-                 continuous_bounds_map: Dict[str, Tuple[float, float]],
-                 task: Literal["min", "max"],
-                 algorithm: Literal["SNES", "CEM", "Genetic"] = "Genetic",
-                 population_size: int = 200,
-                 discretize_start_at_zero: bool = True,
-                 **searcher_kwargs):
-        """
-        Initializes the optimizer by creating the EvoTorch problem and searcher.
-        Args:
-            inference_handler (DragonInferenceHandler):
-                An initialized inference handler containing the model.
-            schema (FeatureSchema):
-                The definitive schema object from data_exploration.
-            target_name (str):
-                target name to optimize.
-            continuous_bounds_map (Dict[str, Tuple[float, float]]):
-                A dictionary mapping the *name* of each **continuous** feature
-                to its (min_bound, max_bound) tuple.
-            task (str): The optimization goal, either "min" or "max".
-            algorithm (str): The search algorithm to use ("SNES", "CEM", "Genetic").
-            population_size (int): Population size for CEM and GeneticAlgorithm.
-            discretize_start_at_zero (bool):
-                True if the discrete encoding starts at 0 (e.g., [0, 1, 2]).
-                False if it starts at 1 (e.g., [1, 2, 3]).
-            **searcher_kwargs: Additional keyword arguments for the selected
-                               search algorithm's constructor.
-        """
-        # --- Store schema ---
-        self.schema = schema
-        # --- Store inference handler ---
-        self.inference_handler = inference_handler
-        # Ensure only Regression tasks are used
-        allowed_tasks = [MLTaskKeys.REGRESSION, MLTaskKeys.MULTITARGET_REGRESSION]
-        if self.inference_handler.task not in allowed_tasks:
-            _LOGGER.error(f"DragonOptimizer only supports {allowed_tasks}. Got '{self.inference_handler.task}'.")
-            raise ValueError(f"Invalid Task: {self.inference_handler.task}")
-        # --- store target name ---
-        self.target_name = target_name
-        # --- flag to control single vs multi-target ---
-        self.is_multi_target = False
-        # --- 1. Create bounds from schema ---
-        # This is the robust way to get bounds
-        bounds = create_optimization_bounds(
-            schema=schema,
-            continuous_bounds_map=continuous_bounds_map,
-            start_at_zero=discretize_start_at_zero
-        )
-        # Resolve target index if multi-target
-        target_index = None
-        if self.inference_handler.target_ids is None:
-            # This should be caught by ML_inference logic
-            _LOGGER.error("The provided inference handler does not have 'target_ids' defined.")
-            raise ValueError()
-        if target_name not in self.inference_handler.target_ids:
-            _LOGGER.error(f"Target name '{target_name}' not found in the inference handler's 'target_ids': {self.inference_handler.target_ids}")
-            raise ValueError()
-        if len(self.inference_handler.target_ids) == 1:
-            # Single target regression
-            target_index = None
-            _LOGGER.info(f"Optimization locked to single-target model '{target_name}'.")
-        else:
-            # Multi-target regression (optimizing one specific column)
-            target_index = self.inference_handler.target_ids.index(target_name)
-            self.is_multi_target = True
-            _LOGGER.info(f"Optimization locked to target '{target_name}' (Index {target_index}) in a multi-target model.")
-        # --- 2. Make a fitness function ---
-        self.evaluator = FitnessEvaluator(
-            inference_handler=inference_handler,
-            # Get categorical info from the schema
-            categorical_index_map=schema.categorical_index_map,
-            discretize_start_at_zero=discretize_start_at_zero,
-            target_index=target_index
-        )
-        # --- 3. Create the problem and searcher factory ---
-        self.problem, self.searcher_factory = create_pytorch_problem(
-            evaluator=self.evaluator,
-            bounds=bounds,
-            task=task,
-            algorithm=algorithm,
-            population_size=population_size,
-            **searcher_kwargs
-        )
-        # --- 4. Store other info needed by run() ---
-        self.discretize_start_at_zero = discretize_start_at_zero
-    def run(self,
-            num_generations: int,
-            save_dir: Union[str, Path],
-            save_format: Literal['csv', 'sqlite', 'both'],
-            repetitions: int = 1,
-            verbose: bool = True) -> Optional[dict]:
-        """
-        Runs the evolutionary optimization process using the pre-configured settings.
-        The `feature_names` are automatically pulled from the `FeatureSchema`
-        provided during initialization.
-        Args:
-            num_generations (int): The total number of generations for each repetition.
-            save_dir (str | Path): The directory where result files will be saved.
-            save_format (Literal['csv', 'sqlite', 'both']): The format for saving results.
-            repetitions (int): The number of independent times to run the optimization.
-            verbose (bool): If True, enables detailed logging.
-        Returns:
-            Optional[dict]: A dictionary with the best result if repetitions is 1,
-                            otherwise None.
-        """
-        # Pass inference handler and target names for multi-target only
-        if self.is_multi_target:
-            target_names_to_pass = self.inference_handler.target_ids
-            inference_handler_to_pass = self.inference_handler
-        else:
-            target_names_to_pass = None
-            inference_handler_to_pass = None
-        # Call the existing run function, passing info from the schema
-        return run_optimization(
-            problem=self.problem,
-            searcher_factory=self.searcher_factory,
-            num_generations=num_generations,
-            target_name=self.target_name,
-            save_dir=save_dir,
-            save_format=save_format,
-            # Get the definitive feature names (as a list) from the schema
-            feature_names=list(self.schema.feature_names),
-            # Get categorical info from the schema
-            categorical_map=self.schema.categorical_index_map,
-            categorical_mappings=self.schema.categorical_mappings,
-            repetitions=repetitions,
-            verbose=verbose,
-            discretize_start_at_zero=self.discretize_start_at_zero,
-            all_target_names=target_names_to_pass,
-            inference_handler=inference_handler_to_pass
-        )
 class FitnessEvaluator:
     """
     A callable class that wraps the PyTorch model inference handler and performs
@@ -227,7 +44,7 @@ class FitnessEvaluator:
     """
     def __init__(self,
                  inference_handler: DragonInferenceHandler,
-                 categorical_index_map: Optional[Dict[int, int]] = None,
+                 categorical_index_map: Optional[dict[int, int]] = None,
                  target_index: Optional[int] = None,
                  discretize_start_at_zero: bool = True):
         """
@@ -287,12 +104,12 @@ class FitnessEvaluator:
 def create_pytorch_problem(
     evaluator: FitnessEvaluator,
-    bounds: Tuple[List[float], List[float]],
+    bounds: tuple[list[float], list[float]],
     task: Literal["min", "max"],
     algorithm: Literal["SNES", "CEM", "Genetic"] = "Genetic",
     population_size: int = 200,
     **searcher_kwargs
-) -> Tuple[evotorch.Problem, Callable[[], Any]]:
+) -> tuple[evotorch.Problem, Callable[[], Any]]:
     """
     Creates and configures an EvoTorch Problem and a Searcher factory class for a PyTorch model.
@@ -389,13 +206,13 @@ def run_optimization(
     target_name: str,
     save_dir: Union[str, Path],
     save_format: Literal['csv', 'sqlite', 'both'],
-    feature_names: Optional[List[str]],
+    feature_names: Optional[list[str]],
     repetitions: int = 1,
     verbose: bool = True,
-    categorical_map: Optional[Dict[int, int]] = None,
-    categorical_mappings: Optional[Dict[str, Dict[str, int]]] = None,
+    categorical_map: Optional[dict[int, int]] = None,
+    categorical_mappings: Optional[dict[str, dict[str, int]]] = None,
     discretize_start_at_zero: bool = True,
-    all_target_names: Optional[List[str]] = None,
+    all_target_names: Optional[list[str]] = None,
     inference_handler: Optional[DragonInferenceHandler] = None
 ) -> Optional[dict]:
     """
@@ -563,14 +380,14 @@ def run_optimization(
 def _run_single_optimization_rep(
     searcher_factory: Callable[[],Any],
     num_generations: int,
-    feature_names: List[str],
+    feature_names: list[str],
     target_name: str,
-    categorical_map: Optional[Dict[int, int]],
+    categorical_map: Optional[dict[int, int]],
     discretize_start_at_zero: bool,
     attach_logger: bool,
-    all_target_names: List[str],
+    all_target_names: list[str],
     inference_handler: Optional[DragonInferenceHandler]
-) -> Tuple[dict, Optional[PandasLogger]]:
+) -> tuple[dict, Optional[PandasLogger]]:
     """
     Internal helper to run one full optimization repetition.
@@ -639,10 +456,55 @@ def _run_single_optimization_rep(
     return result_dict, pandas_logger
+def _save_result(
+        result_dict: dict,
+        save_format: Literal['csv', 'sqlite', 'both'],
+        csv_path: Path,
+        db_manager: Optional[DragonSQL] = None,
+        db_table_name: Optional[str] = None,
+        categorical_mappings: Optional[dict[str, dict[str, int]]] = None
+    ):
+    """
+    Private helper to handle saving a single result to CSV, SQLite, or both.
+    If `categorical_mappings` is provided, it will reverse-map integer values
+    to their string representations before saving.
+    """
+    # --- Reverse Mapping Logic ---
+    # Create a copy to hold the values to be saved
+    save_dict = result_dict.copy()
+    if categorical_mappings:
+        for feature_name, mapping in categorical_mappings.items():
+            if feature_name in save_dict:
+                # Create a reverse map {0: 'Category_A', 1: 'Category_B'}
+                reverse_map = {idx: name for name, idx in mapping.items()}
+                # Get the integer value from the results (e.g., 0)
+                int_value = save_dict[feature_name]
+                # Find the corresponding string (e.g., 'Category_A')
+                # Use .get() for safety, defaulting to the original value if not found
+                string_value = reverse_map.get(int_value, int_value)
+                # Update the dictionary that will be saved
+                save_dict[feature_name] = string_value
+    # Save to CSV
+    if save_format in ['csv', 'both']:
+        df_row = pd.DataFrame([save_dict])
+        file_exists = csv_path.exists()
+        df_row.to_csv(csv_path, mode='a', index=False, header=not file_exists)
+    # Save to SQLite
+    if save_format in ['sqlite', 'both']:
+        if db_manager and db_table_name:
+            db_manager.insert_row(db_table_name, save_dict)
+        else:
+            _LOGGER.warning("SQLite saving requested but db_manager or table_name not provided.")
 def _handle_pandas_log(logger: PandasLogger, save_path: Path, target_name: str):
     log_dataframe = logger.to_dataframe()
     save_dataframe_filename(df=log_dataframe, save_dir=save_path / "EvolutionLogs", filename=target_name)
-def info():
-    _script_info(__all__)

ml_tools/{_core → ML_scaler}/_ML_scaler.py RENAMED Viewed

@@ -1,12 +1,11 @@
 import torch
 from torch.utils.data import Dataset, DataLoader
 from pathlib import Path
-from typing import Union, List, Optional
+from typing import Union, Optional
-from ._logger import get_logger
-from ._script_info import _script_info
-from ._path_manager import make_fullpath
-from ._keys import ScalerKeys
+from .._core import get_logger
+from ..path_manager import make_fullpath
+from ..keys._keys import ScalerKeys
 _LOGGER = get_logger("DragonScaler")
@@ -25,7 +24,7 @@ class DragonScaler:
     def __init__(self,
                  mean: Optional[torch.Tensor] = None,
                  std: Optional[torch.Tensor] = None,
-                 continuous_feature_indices: Optional[List[int]] = None):
+                 continuous_feature_indices: Optional[list[int]] = None):
         """
         Initializes the scaler.
         """
@@ -34,7 +33,7 @@ class DragonScaler:
         self.continuous_feature_indices = continuous_feature_indices
     @classmethod
-    def fit(cls, dataset: Dataset, continuous_feature_indices: List[int], batch_size: int = 64) -> 'DragonScaler':
+    def fit(cls, dataset: Dataset, continuous_feature_indices: list[int], batch_size: int = 64) -> 'DragonScaler':
         """
         Fits the scaler using a PyTorch Dataset (Method A) using Batched Welford's Algorithm.
         """
@@ -72,7 +71,7 @@ class DragonScaler:
             else:
                 # Batched Welford's Update
                 # Combine existing global stats (A) with new batch stats (B)
-                delta = mean_batch - mean_global
+                delta = mean_batch - mean_global # type: ignore
                 new_n_total = n_total + n_batch
                 # Update M2 (Sum of Squares)
@@ -93,7 +92,7 @@ class DragonScaler:
         # Unbiased estimator (divide by n-1)
         if n_total < 2:
             _LOGGER.warning(f"Only one sample found. Standard deviation set to 1.")
-            std = torch.ones_like(mean_global)
+            std = torch.ones_like(mean_global) # type: ignore
         else:
             variance = m2_global / (n_total - 1)
             std = torch.sqrt(torch.clamp(variance, min=1e-8))
@@ -218,5 +217,3 @@ class DragonScaler:
             return f"DragonScaler(fitted for {num_features} columns)"
         return "DragonScaler(not fitted)"
-def info():
-    _script_info(__all__)

ml_tools/ML_scaler/__init__.py ADDED Viewed

@@ -0,0 +1,10 @@
+from ._ML_scaler import (
+    DragonScaler
+)
+from ._imprimir import info
+__all__ = [
+    "DragonScaler"
+]

ml_tools/ML_scaler/_imprimir.py ADDED Viewed

@@ -0,0 +1,8 @@
+from .._core import _imprimir_disponibles
+_GRUPOS = [
+    "DragonScaler"
+]
+def info():
+    _imprimir_disponibles(_GRUPOS)

ml_tools/ML_trainer/__init__.py ADDED Viewed

@@ -0,0 +1,20 @@
+from ._dragon_trainer import (
+    DragonTrainer
+)
+from ._dragon_sequence_trainer import (
+    DragonSequenceTrainer
+)
+from ._dragon_detection_trainer import (
+    DragonDetectionTrainer
+)
+from ._imprimir import info
+__all__ = [
+    "DragonTrainer",
+    "DragonSequenceTrainer",
+    "DragonDetectionTrainer",
+]

dragon-ml-toolbox 19.13.0__py3-none-any.whl → 20.0.0__py3-none-any.whl

dragon-ml-toolbox 19.13.0py3-none-any.whl → 20.0.0py3-none-any.whl