PyPI - dragon-ml-toolbox - Versions diffs - 19.14.0__py3-none-any.whl → 20.0.0__py3-none-any.whl - Mend

dragon-ml-toolbox 19.14.0py3-none-any.whl → 20.0.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (219) hide show

{dragon_ml_toolbox-19.14.0.dist-info → dragon_ml_toolbox-20.0.0.dist-info}/METADATA +29 -46
dragon_ml_toolbox-20.0.0.dist-info/RECORD +178 -0
ml_tools/{ETL_cleaning.py → ETL_cleaning/__init__.py} +13 -5
ml_tools/ETL_cleaning/_basic_clean.py +351 -0
ml_tools/ETL_cleaning/_clean_tools.py +128 -0
ml_tools/ETL_cleaning/_dragon_cleaner.py +245 -0
ml_tools/ETL_cleaning/_imprimir.py +13 -0
ml_tools/{ETL_engineering.py → ETL_engineering/__init__.py} +8 -4
ml_tools/ETL_engineering/_dragon_engineering.py +261 -0
ml_tools/ETL_engineering/_imprimir.py +24 -0
ml_tools/{_core/_ETL_engineering.py → ETL_engineering/_transforms.py} +14 -267
ml_tools/{_core → GUI_tools}/_GUI_tools.py +37 -40
ml_tools/{GUI_tools.py → GUI_tools/__init__.py} +7 -5
ml_tools/GUI_tools/_imprimir.py +12 -0
ml_tools/IO_tools/_IO_loggers.py +235 -0
ml_tools/IO_tools/_IO_save_load.py +151 -0
ml_tools/IO_tools/_IO_utils.py +140 -0
ml_tools/{IO_tools.py → IO_tools/__init__.py} +13 -5
ml_tools/IO_tools/_imprimir.py +14 -0
ml_tools/MICE/_MICE_imputation.py +132 -0
ml_tools/{MICE_imputation.py → MICE/__init__.py} +6 -7
ml_tools/{_core/_MICE_imputation.py → MICE/_dragon_mice.py} +243 -322
ml_tools/MICE/_imprimir.py +11 -0
ml_tools/{ML_callbacks.py → ML_callbacks/__init__.py} +12 -4
ml_tools/ML_callbacks/_base.py +101 -0
ml_tools/ML_callbacks/_checkpoint.py +232 -0
ml_tools/ML_callbacks/_early_stop.py +208 -0
ml_tools/ML_callbacks/_imprimir.py +12 -0
ml_tools/ML_callbacks/_scheduler.py +197 -0
ml_tools/{ML_chaining_utilities.py → ML_chain/__init__.py} +8 -3
ml_tools/{_core/_ML_chaining_utilities.py → ML_chain/_chaining_tools.py} +5 -129
ml_tools/ML_chain/_dragon_chain.py +140 -0
ml_tools/ML_chain/_imprimir.py +11 -0
ml_tools/ML_configuration/__init__.py +90 -0
ml_tools/ML_configuration/_base_model_config.py +69 -0
ml_tools/ML_configuration/_finalize.py +366 -0
ml_tools/ML_configuration/_imprimir.py +47 -0
ml_tools/ML_configuration/_metrics.py +593 -0
ml_tools/ML_configuration/_models.py +206 -0
ml_tools/ML_configuration/_training.py +124 -0
ml_tools/ML_datasetmaster/__init__.py +28 -0
ml_tools/ML_datasetmaster/_base_datasetmaster.py +337 -0
ml_tools/{_core/_ML_datasetmaster.py → ML_datasetmaster/_datasetmaster.py} +9 -329
ml_tools/ML_datasetmaster/_imprimir.py +15 -0
ml_tools/{_core/_ML_sequence_datasetmaster.py → ML_datasetmaster/_sequence_datasetmaster.py} +13 -15
ml_tools/{_core/_ML_vision_datasetmaster.py → ML_datasetmaster/_vision_datasetmaster.py} +63 -65
ml_tools/ML_evaluation/__init__.py +53 -0
ml_tools/ML_evaluation/_classification.py +629 -0
ml_tools/ML_evaluation/_feature_importance.py +409 -0
ml_tools/ML_evaluation/_imprimir.py +25 -0
ml_tools/ML_evaluation/_loss.py +92 -0
ml_tools/ML_evaluation/_regression.py +273 -0
ml_tools/{_core/_ML_sequence_evaluation.py → ML_evaluation/_sequence.py} +8 -11
ml_tools/{_core/_ML_vision_evaluation.py → ML_evaluation/_vision.py} +12 -17
ml_tools/{_core → ML_evaluation_captum}/_ML_evaluation_captum.py +11 -38
ml_tools/{ML_evaluation_captum.py → ML_evaluation_captum/__init__.py} +6 -4
ml_tools/ML_evaluation_captum/_imprimir.py +10 -0
ml_tools/{_core → ML_finalize_handler}/_ML_finalize_handler.py +3 -7
ml_tools/ML_finalize_handler/__init__.py +10 -0
ml_tools/ML_finalize_handler/_imprimir.py +8 -0
ml_tools/ML_inference/__init__.py +22 -0
ml_tools/ML_inference/_base_inference.py +166 -0
ml_tools/{_core/_ML_chaining_inference.py → ML_inference/_chain_inference.py} +14 -17
ml_tools/ML_inference/_dragon_inference.py +332 -0
ml_tools/ML_inference/_imprimir.py +11 -0
ml_tools/ML_inference/_multi_inference.py +180 -0
ml_tools/ML_inference_sequence/__init__.py +10 -0
ml_tools/ML_inference_sequence/_imprimir.py +8 -0
ml_tools/{_core/_ML_sequence_inference.py → ML_inference_sequence/_sequence_inference.py} +11 -15
ml_tools/ML_inference_vision/__init__.py +10 -0
ml_tools/ML_inference_vision/_imprimir.py +8 -0
ml_tools/{_core/_ML_vision_inference.py → ML_inference_vision/_vision_inference.py} +15 -19
ml_tools/ML_models/__init__.py +32 -0
ml_tools/{_core/_ML_models_advanced.py → ML_models/_advanced_models.py} +22 -18
ml_tools/ML_models/_base_mlp_attention.py +198 -0
ml_tools/{_core/_models_advanced_base.py → ML_models/_base_save_load.py} +73 -49
ml_tools/ML_models/_dragon_tabular.py +248 -0
ml_tools/ML_models/_imprimir.py +18 -0
ml_tools/ML_models/_mlp_attention.py +134 -0
ml_tools/{_core → ML_models}/_models_advanced_helpers.py +13 -13
ml_tools/ML_models_sequence/__init__.py +10 -0
ml_tools/ML_models_sequence/_imprimir.py +8 -0
ml_tools/{_core/_ML_sequence_models.py → ML_models_sequence/_sequence_models.py} +5 -8
ml_tools/ML_models_vision/__init__.py +29 -0
ml_tools/ML_models_vision/_base_wrapper.py +254 -0
ml_tools/ML_models_vision/_image_classification.py +182 -0
ml_tools/ML_models_vision/_image_segmentation.py +108 -0
ml_tools/ML_models_vision/_imprimir.py +16 -0
ml_tools/ML_models_vision/_object_detection.py +135 -0
ml_tools/ML_optimization/__init__.py +21 -0
ml_tools/ML_optimization/_imprimir.py +13 -0
ml_tools/{_core/_ML_optimization_pareto.py → ML_optimization/_multi_dragon.py} +18 -24
ml_tools/ML_optimization/_single_dragon.py +203 -0
ml_tools/{_core/_ML_optimization.py → ML_optimization/_single_manual.py} +75 -213
ml_tools/{_core → ML_scaler}/_ML_scaler.py +8 -11
ml_tools/ML_scaler/__init__.py +10 -0
ml_tools/ML_scaler/_imprimir.py +8 -0
ml_tools/ML_trainer/__init__.py +20 -0
ml_tools/ML_trainer/_base_trainer.py +297 -0
ml_tools/ML_trainer/_dragon_detection_trainer.py +402 -0
ml_tools/ML_trainer/_dragon_sequence_trainer.py +540 -0
ml_tools/ML_trainer/_dragon_trainer.py +1160 -0
ml_tools/ML_trainer/_imprimir.py +10 -0
ml_tools/{ML_utilities.py → ML_utilities/__init__.py} +14 -6
ml_tools/ML_utilities/_artifact_finder.py +382 -0
ml_tools/ML_utilities/_imprimir.py +16 -0
ml_tools/ML_utilities/_inspection.py +325 -0
ml_tools/ML_utilities/_train_tools.py +205 -0
ml_tools/{ML_vision_transformers.py → ML_vision_transformers/__init__.py} +9 -6
ml_tools/{_core/_ML_vision_transformers.py → ML_vision_transformers/_core_transforms.py} +11 -155
ml_tools/ML_vision_transformers/_imprimir.py +14 -0
ml_tools/ML_vision_transformers/_offline_augmentation.py +159 -0
ml_tools/{_core/_PSO_optimization.py → PSO_optimization/_PSO.py} +58 -15
ml_tools/{PSO_optimization.py → PSO_optimization/__init__.py} +5 -3
ml_tools/PSO_optimization/_imprimir.py +10 -0
ml_tools/SQL/__init__.py +7 -0
ml_tools/{_core/_SQL.py → SQL/_dragon_SQL.py} +7 -11
ml_tools/SQL/_imprimir.py +8 -0
ml_tools/{_core → VIF}/_VIF_factor.py +5 -8
ml_tools/{VIF_factor.py → VIF/__init__.py} +4 -2
ml_tools/VIF/_imprimir.py +10 -0
ml_tools/_core/__init__.py +7 -1
ml_tools/_core/_logger.py +8 -18
ml_tools/_core/_schema_load_ops.py +43 -0
ml_tools/_core/_script_info.py +2 -2
ml_tools/{data_exploration.py → data_exploration/__init__.py} +32 -16
ml_tools/data_exploration/_analysis.py +214 -0
ml_tools/data_exploration/_cleaning.py +566 -0
ml_tools/data_exploration/_features.py +583 -0
ml_tools/data_exploration/_imprimir.py +32 -0
ml_tools/data_exploration/_plotting.py +487 -0
ml_tools/data_exploration/_schema_ops.py +176 -0
ml_tools/{ensemble_evaluation.py → ensemble_evaluation/__init__.py} +6 -4
ml_tools/{_core → ensemble_evaluation}/_ensemble_evaluation.py +3 -7
ml_tools/ensemble_evaluation/_imprimir.py +14 -0
ml_tools/{ensemble_inference.py → ensemble_inference/__init__.py} +5 -3
ml_tools/{_core → ensemble_inference}/_ensemble_inference.py +15 -18
ml_tools/ensemble_inference/_imprimir.py +9 -0
ml_tools/{ensemble_learning.py → ensemble_learning/__init__.py} +4 -6
ml_tools/{_core → ensemble_learning}/_ensemble_learning.py +7 -10
ml_tools/ensemble_learning/_imprimir.py +10 -0
ml_tools/{excel_handler.py → excel_handler/__init__.py} +5 -3
ml_tools/{_core → excel_handler}/_excel_handler.py +6 -10
ml_tools/excel_handler/_imprimir.py +13 -0
ml_tools/{keys.py → keys/__init__.py} +4 -1
ml_tools/keys/_imprimir.py +11 -0
ml_tools/{_core → keys}/_keys.py +2 -0
ml_tools/{math_utilities.py → math_utilities/__init__.py} +5 -2
ml_tools/math_utilities/_imprimir.py +11 -0
ml_tools/{_core → math_utilities}/_math_utilities.py +1 -5
ml_tools/{optimization_tools.py → optimization_tools/__init__.py} +9 -4
ml_tools/optimization_tools/_imprimir.py +13 -0
ml_tools/optimization_tools/_optimization_bounds.py +236 -0
ml_tools/optimization_tools/_optimization_plots.py +218 -0
ml_tools/{path_manager.py → path_manager/__init__.py} +6 -3
ml_tools/{_core/_path_manager.py → path_manager/_dragonmanager.py} +11 -347
ml_tools/path_manager/_imprimir.py +15 -0
ml_tools/path_manager/_path_tools.py +346 -0
ml_tools/plot_fonts/__init__.py +8 -0
ml_tools/plot_fonts/_imprimir.py +8 -0
ml_tools/{_core → plot_fonts}/_plot_fonts.py +2 -5
ml_tools/schema/__init__.py +15 -0
ml_tools/schema/_feature_schema.py +223 -0
ml_tools/schema/_gui_schema.py +191 -0
ml_tools/schema/_imprimir.py +10 -0
ml_tools/{serde.py → serde/__init__.py} +4 -2
ml_tools/serde/_imprimir.py +10 -0
ml_tools/{_core → serde}/_serde.py +3 -8
ml_tools/{utilities.py → utilities/__init__.py} +11 -6
ml_tools/utilities/_imprimir.py +18 -0
ml_tools/{_core/_utilities.py → utilities/_utility_save_load.py} +13 -190
ml_tools/utilities/_utility_tools.py +192 -0
dragon_ml_toolbox-19.14.0.dist-info/RECORD +0 -111
ml_tools/ML_chaining_inference.py +0 -8
ml_tools/ML_configuration.py +0 -86
ml_tools/ML_configuration_pytab.py +0 -14
ml_tools/ML_datasetmaster.py +0 -10
ml_tools/ML_evaluation.py +0 -16
ml_tools/ML_evaluation_multi.py +0 -12
ml_tools/ML_finalize_handler.py +0 -8
ml_tools/ML_inference.py +0 -12
ml_tools/ML_models.py +0 -14
ml_tools/ML_models_advanced.py +0 -14
ml_tools/ML_models_pytab.py +0 -14
ml_tools/ML_optimization.py +0 -14
ml_tools/ML_optimization_pareto.py +0 -8
ml_tools/ML_scaler.py +0 -8
ml_tools/ML_sequence_datasetmaster.py +0 -8
ml_tools/ML_sequence_evaluation.py +0 -10
ml_tools/ML_sequence_inference.py +0 -8
ml_tools/ML_sequence_models.py +0 -8
ml_tools/ML_trainer.py +0 -12
ml_tools/ML_vision_datasetmaster.py +0 -12
ml_tools/ML_vision_evaluation.py +0 -10
ml_tools/ML_vision_inference.py +0 -8
ml_tools/ML_vision_models.py +0 -18
ml_tools/SQL.py +0 -8
ml_tools/_core/_ETL_cleaning.py +0 -694
ml_tools/_core/_IO_tools.py +0 -498
ml_tools/_core/_ML_callbacks.py +0 -702
ml_tools/_core/_ML_configuration.py +0 -1332
ml_tools/_core/_ML_configuration_pytab.py +0 -102
ml_tools/_core/_ML_evaluation.py +0 -867
ml_tools/_core/_ML_evaluation_multi.py +0 -544
ml_tools/_core/_ML_inference.py +0 -646
ml_tools/_core/_ML_models.py +0 -668
ml_tools/_core/_ML_models_pytab.py +0 -693
ml_tools/_core/_ML_trainer.py +0 -2323
ml_tools/_core/_ML_utilities.py +0 -886
ml_tools/_core/_ML_vision_models.py +0 -644
ml_tools/_core/_data_exploration.py +0 -1909
ml_tools/_core/_optimization_tools.py +0 -493
ml_tools/_core/_schema.py +0 -359
ml_tools/plot_fonts.py +0 -8
ml_tools/schema.py +0 -12
{dragon_ml_toolbox-19.14.0.dist-info → dragon_ml_toolbox-20.0.0.dist-info}/WHEEL +0 -0
{dragon_ml_toolbox-19.14.0.dist-info → dragon_ml_toolbox-20.0.0.dist-info}/licenses/LICENSE +0 -0
{dragon_ml_toolbox-19.14.0.dist-info → dragon_ml_toolbox-20.0.0.dist-info}/licenses/LICENSE-THIRD-PARTY.md +0 -0
{dragon_ml_toolbox-19.14.0.dist-info → dragon_ml_toolbox-20.0.0.dist-info}/top_level.txt +0 -0

ml_tools/{_core/_ML_vision_transformers.py → ML_vision_transformers/_core_transforms.py} RENAMED Viewed

@@ -1,14 +1,13 @@
-from typing import Union, Dict, Type, Callable, Optional, Any, List, Literal, Tuple
+from typing import Union, Type, Callable, Any
 from PIL import ImageOps, Image
 from torchvision import transforms
 from pathlib import Path
 import json
 import random
-from ._logger import get_logger
-from ._script_info import _script_info
-from ._keys import VisionTransformRecipeKeys
-from ._path_manager import make_fullpath
+from .._core import get_logger
+from ..keys._keys import VisionTransformRecipeKeys
+from ..path_manager import make_fullpath
 _LOGGER = get_logger("Transformers")
@@ -20,7 +19,8 @@ __all__ = [
     "LetterboxResize",
     "HistogramEqualization",
     "RandomHistogramEqualization",
-    "create_offline_augmentations"
+    "_save_recipe",
+    "_load_recipe_and_build_transform",
 ]
 # --- Custom Vision Transform Class ---
@@ -82,7 +82,7 @@ class LetterboxResize:
     """
     def __init__(
         self,
-        target_size: Union[int, Tuple[int, int]],
+        target_size: Union[int, tuple[int, int]],
         pad_color: Union[str, int] = "black"
     ) -> None:
@@ -189,7 +189,7 @@ class RandomHistogramEqualization:
 #############################################################
 #NOTE: Add custom transforms.
-TRANSFORM_REGISTRY: Dict[str, Type[Callable]] = {
+TRANSFORM_REGISTRY: dict[str, Type[Callable]] = {
     "ResizeAspectFill": ResizeAspectFill,
     "LetterboxResize": LetterboxResize,
     "HistogramEqualization": HistogramEqualization,
@@ -198,153 +198,12 @@ TRANSFORM_REGISTRY: Dict[str, Type[Callable]] = {
 #############################################################
-def create_offline_augmentations(
-    input_directory: Union[str, Path],
-    output_directory: Union[str, Path],
-    results_per_image: int,
-    recipe: Optional[Dict[str, Any]] = None,
-    save_format: Literal["WEBP", "JPEG", "PNG", "BMP", "TIF"] = "WEBP",
-    save_quality: int = 80
-) -> None:
-    """
-    Reads all valid images from an input directory, applies augmentations,
-    and saves the new images to an output directory (offline augmentation).
-    Skips subdirectories in the input path.
-    Args:
-        input_directory (Union[str, Path]): Path to the directory of source images.
-        output_directory (Union[str, Path]): Path to save the augmented images.
-        results_per_image (int): The number of augmented versions to create
-                                 for each source image.
-        recipe (Optional[Dict[str, Any]]): A transform recipe dictionary. If None,
-                                           a default set of strong, random
-                                           augmentations will be used.
-        save_format (str): The format to save images (e.g., "WEBP", "JPEG", "PNG").
-                           Defaults to "WEBP" for good compression.
-        save_quality (int): The quality for lossy formats (1-100). Defaults to 80.
-    """
-    VALID_IMG_EXTENSIONS = ('.jpg', '.jpeg', '.png', '.bmp', '.webp', '.tif', '.tiff')
-    # --- 1. Validate Paths ---
-    in_path = make_fullpath(input_directory, enforce="directory")
-    out_path = make_fullpath(output_directory, make=True, enforce="directory")
-    _LOGGER.info(f"Starting offline augmentation:\n\tInput: {in_path}\n\tOutput: {out_path}")
-    # --- 2. Find Images ---
-    image_files = [
-        f for f in in_path.iterdir()
-        if f.is_file() and f.suffix.lower() in VALID_IMG_EXTENSIONS
-    ]
-    if not image_files:
-        _LOGGER.warning(f"No valid image files found in {in_path}.")
-        return
-    _LOGGER.info(f"Found {len(image_files)} images to process.")
-    # --- 3. Define Transform Pipeline ---
-    transform_pipeline: transforms.Compose
-    if recipe:
-        _LOGGER.info("Building transformations from provided recipe.")
-        try:
-            transform_pipeline = _build_transform_from_recipe(recipe)
-        except Exception as e:
-            _LOGGER.error(f"Failed to build transform from recipe: {e}")
-            return
-    else:
-        _LOGGER.info("No recipe provided. Using default random augmentation pipeline.")
-        # Default "random" pipeline
-        transform_pipeline = transforms.Compose([
-            transforms.RandomResizedCrop(256, scale=(0.4, 1.0)),
-            transforms.RandomHorizontalFlip(p=0.5),
-            transforms.RandomRotation(degrees=90),
-            transforms.ColorJitter(brightness=0.3, contrast=0.3, saturation=0.3, hue=0.15),
-            transforms.RandomPerspective(distortion_scale=0.2, p=0.4),
-            transforms.RandomAffine(degrees=0, translate=(0.1, 0.1)),
-            transforms.RandomApply([
-                transforms.GaussianBlur(kernel_size=3)
-            ], p=0.3)
-        ])
-    # --- 4. Process Images ---
-    total_saved = 0
-    format_upper = save_format.upper()
-    for img_path in image_files:
-        _LOGGER.debug(f"Processing {img_path.name}...")
-        try:
-            original_image = Image.open(img_path).convert("RGB")
-            for i in range(results_per_image):
-                new_stem = f"{img_path.stem}_aug_{i+1:03d}"
-                output_path = out_path / f"{new_stem}.{format_upper.lower()}"
-                # Apply transform
-                transformed_image = transform_pipeline(original_image)
-                # Save
-                transformed_image.save(
-                    output_path,
-                    format=format_upper,
-                    quality=save_quality,
-                    optimize=True # Add optimize flag
-                )
-                total_saved += 1
-        except Exception as e:
-            _LOGGER.warning(f"Failed to process or save augmentations for {img_path.name}: {e}")
-    _LOGGER.info(f"Offline augmentation complete. Saved {total_saved} new images.")
-def _build_transform_from_recipe(recipe: Dict[str, Any]) -> transforms.Compose:
-    """Internal helper to build a transform pipeline from a recipe dict."""
-    pipeline_steps: List[Callable] = []
-    if VisionTransformRecipeKeys.PIPELINE not in recipe:
-        _LOGGER.error("Recipe dict is invalid: missing 'pipeline' key.")
-        raise ValueError("Invalid recipe format.")
-    for step in recipe[VisionTransformRecipeKeys.PIPELINE]:
-        t_name = step.get(VisionTransformRecipeKeys.NAME)
-        t_kwargs = step.get(VisionTransformRecipeKeys.KWARGS, {})
-        if not t_name:
-            _LOGGER.error(f"Invalid transform step, missing 'name': {step}")
-            continue
-        transform_class: Any = None
-        # 1. Check standard torchvision transforms
-        if hasattr(transforms, t_name):
-            transform_class = getattr(transforms, t_name)
-        # 2. Check custom transforms
-        elif t_name in TRANSFORM_REGISTRY:
-            transform_class = TRANSFORM_REGISTRY[t_name]
-        # 3. Not found
-        else:
-            _LOGGER.error(f"Unknown transform '{t_name}' in recipe. Not found in torchvision.transforms or TRANSFORM_REGISTRY.")
-            raise ValueError(f"Unknown transform name: {t_name}")
-        # Instantiate the transform
-        try:
-            pipeline_steps.append(transform_class(**t_kwargs))
-        except Exception as e:
-            _LOGGER.error(f"Failed to instantiate transform '{t_name}' with kwargs {t_kwargs}: {e}")
-            raise
-    return transforms.Compose(pipeline_steps)
-def _save_recipe(recipe: Dict[str, Any], filepath: Path) -> None:
+def _save_recipe(recipe: dict[str, Any], filepath: Path) -> None:
     """
     Saves a transform recipe dictionary to a JSON file.
     Args:
-        recipe (Dict[str, Any]): The recipe dictionary to save.
+        recipe (dict[str, Any]): The recipe dictionary to save.
         filepath (str): The path to the output .json file.
     """
     final_filepath = filepath.with_suffix(".json")
@@ -383,7 +242,7 @@ def _load_recipe_and_build_transform(filepath: Union[str,Path]) -> transforms.Co
         _LOGGER.error(f"Failed to load recipe from '{final_filepath}': {e}")
         raise
-    pipeline_steps: List[Callable] = []
+    pipeline_steps: list[Callable] = []
     if VisionTransformRecipeKeys.PIPELINE not in recipe:
         _LOGGER.error("Recipe file is invalid: missing 'pipeline' key.")
@@ -416,6 +275,3 @@ def _load_recipe_and_build_transform(filepath: Union[str,Path]) -> transforms.Co
     _LOGGER.info(f"Successfully loaded and built transform pipeline from '{final_filepath.name}'.")
     return transforms.Compose(pipeline_steps)
-def info():
-    _script_info(__all__)

ml_tools/ML_vision_transformers/_imprimir.py ADDED Viewed

@@ -0,0 +1,14 @@
+from .._core import _imprimir_disponibles
+_GRUPOS = [
+    # Custom Transforms
+    "ResizeAspectFill",
+    "LetterboxResize",
+    "HistogramEqualization",
+    "RandomHistogramEqualization",
+    # Offline Augmentation
+    "create_offline_augmentations",
+]
+def info():
+    _imprimir_disponibles(_GRUPOS)

ml_tools/ML_vision_transformers/_offline_augmentation.py ADDED Viewed

@@ -0,0 +1,159 @@
+from typing import Union, Callable, Optional, Any, Literal
+from PIL import Image
+from torchvision import transforms
+from pathlib import Path
+from .._core import get_logger
+from ..keys._keys import VisionTransformRecipeKeys
+from ..path_manager import make_fullpath
+from ._core_transforms import TRANSFORM_REGISTRY
+_LOGGER = get_logger("Offline Augmentation")
+__all__ = [
+    "create_offline_augmentations"
+]
+def create_offline_augmentations(
+    input_directory: Union[str, Path],
+    output_directory: Union[str, Path],
+    results_per_image: int,
+    recipe: Optional[dict[str, Any]] = None,
+    save_format: Literal["WEBP", "JPEG", "PNG", "BMP", "TIF"] = "WEBP",
+    save_quality: int = 80
+) -> None:
+    """
+    Reads all valid images from an input directory, applies augmentations,
+    and saves the new images to an output directory (offline augmentation).
+    Skips subdirectories in the input path.
+    Args:
+        input_directory (Union[str, Path]): Path to the directory of source images.
+        output_directory (Union[str, Path]): Path to save the augmented images.
+        results_per_image (int): The number of augmented versions to create
+                                 for each source image.
+        recipe (Optional[Dict[str, Any]]): A transform recipe dictionary. If None,
+                                           a default set of strong, random
+                                           augmentations will be used.
+        save_format (str): The format to save images (e.g., "WEBP", "JPEG", "PNG").
+                           Defaults to "WEBP" for good compression.
+        save_quality (int): The quality for lossy formats (1-100). Defaults to 80.
+    """
+    VALID_IMG_EXTENSIONS = ('.jpg', '.jpeg', '.png', '.bmp', '.webp', '.tif', '.tiff')
+    # --- 1. Validate Paths ---
+    in_path = make_fullpath(input_directory, enforce="directory")
+    out_path = make_fullpath(output_directory, make=True, enforce="directory")
+    _LOGGER.info(f"Starting offline augmentation:\n\tInput: {in_path}\n\tOutput: {out_path}")
+    # --- 2. Find Images ---
+    image_files = [
+        f for f in in_path.iterdir()
+        if f.is_file() and f.suffix.lower() in VALID_IMG_EXTENSIONS
+    ]
+    if not image_files:
+        _LOGGER.warning(f"No valid image files found in {in_path}.")
+        return
+    _LOGGER.info(f"Found {len(image_files)} images to process.")
+    # --- 3. Define Transform Pipeline ---
+    transform_pipeline: transforms.Compose
+    if recipe:
+        _LOGGER.info("Building transformations from provided recipe.")
+        try:
+            transform_pipeline = _build_transform_from_recipe(recipe)
+        except Exception as e:
+            _LOGGER.error(f"Failed to build transform from recipe: {e}")
+            return
+    else:
+        _LOGGER.info("No recipe provided. Using default random augmentation pipeline.")
+        # Default "random" pipeline
+        transform_pipeline = transforms.Compose([
+            transforms.RandomResizedCrop(256, scale=(0.4, 1.0)),
+            transforms.RandomHorizontalFlip(p=0.5),
+            transforms.RandomRotation(degrees=90),
+            transforms.ColorJitter(brightness=0.3, contrast=0.3, saturation=0.3, hue=0.15),
+            transforms.RandomPerspective(distortion_scale=0.2, p=0.4),
+            transforms.RandomAffine(degrees=0, translate=(0.1, 0.1)),
+            transforms.RandomApply([
+                transforms.GaussianBlur(kernel_size=3)
+            ], p=0.3)
+        ])
+    # --- 4. Process Images ---
+    total_saved = 0
+    format_upper = save_format.upper()
+    for img_path in image_files:
+        _LOGGER.debug(f"Processing {img_path.name}...")
+        try:
+            original_image = Image.open(img_path).convert("RGB")
+            for i in range(results_per_image):
+                new_stem = f"{img_path.stem}_aug_{i+1:03d}"
+                output_path = out_path / f"{new_stem}.{format_upper.lower()}"
+                # Apply transform
+                transformed_image = transform_pipeline(original_image)
+                # Save
+                transformed_image.save(
+                    output_path,
+                    format=format_upper,
+                    quality=save_quality,
+                    optimize=True # Add optimize flag
+                )
+                total_saved += 1
+        except Exception as e:
+            _LOGGER.warning(f"Failed to process or save augmentations for {img_path.name}: {e}")
+    _LOGGER.info(f"Offline augmentation complete. Saved {total_saved} new images.")
+def _build_transform_from_recipe(recipe: dict[str, Any]) -> transforms.Compose:
+    """Internal helper to build a transform pipeline from a recipe dict."""
+    pipeline_steps: list[Callable] = []
+    if VisionTransformRecipeKeys.PIPELINE not in recipe:
+        _LOGGER.error("Recipe dict is invalid: missing 'pipeline' key.")
+        raise ValueError("Invalid recipe format.")
+    for step in recipe[VisionTransformRecipeKeys.PIPELINE]:
+        t_name = step.get(VisionTransformRecipeKeys.NAME)
+        t_kwargs = step.get(VisionTransformRecipeKeys.KWARGS, {})
+        if not t_name:
+            _LOGGER.error(f"Invalid transform step, missing 'name': {step}")
+            continue
+        transform_class: Any = None
+        # 1. Check standard torchvision transforms
+        if hasattr(transforms, t_name):
+            transform_class = getattr(transforms, t_name)
+        # 2. Check custom transforms
+        elif t_name in TRANSFORM_REGISTRY:
+            transform_class = TRANSFORM_REGISTRY[t_name]
+        # 3. Not found
+        else:
+            _LOGGER.error(f"Unknown transform '{t_name}' in recipe. Not found in torchvision.transforms or TRANSFORM_REGISTRY.")
+            raise ValueError(f"Unknown transform name: {t_name}")
+        # Instantiate the transform
+        try:
+            pipeline_steps.append(transform_class(**t_kwargs))
+        except Exception as e:
+            _LOGGER.error(f"Failed to instantiate transform '{t_name}' with kwargs {t_kwargs}: {e}")
+            raise
+    return transforms.Compose(pipeline_steps)

ml_tools/{_core/_PSO_optimization.py → PSO_optimization/_PSO.py} RENAMED Viewed

@@ -1,21 +1,21 @@
 import numpy as np
+import pandas as pd
 from pathlib import Path
 import xgboost as xgb
 import lightgbm as lgb
-from typing import Literal, Union, Tuple, Dict, Optional
+from typing import Literal, Union, Optional
 from copy import deepcopy
 import torch
 from tqdm import trange
 from contextlib import nullcontext
-from ._serde import deserialize_object
-from ._math_utilities import threshold_binary_values, threshold_binary_values_batch
-from ._path_manager import sanitize_filename, make_fullpath, list_files_by_extension
-from ._logger import get_logger
-from ._keys import EnsembleKeys
-from ._script_info import _script_info
-from ._SQL import DragonSQL
-from ._optimization_tools import _save_result
+from ..serde import deserialize_object
+from ..SQL import DragonSQL
+from ..math_utilities import threshold_binary_values, threshold_binary_values_batch
+from ..keys._keys import EnsembleKeys
+from ..path_manager import sanitize_filename, make_fullpath, list_files_by_extension
+from .._core import get_logger
 _LOGGER = get_logger("PSO")
@@ -247,7 +247,7 @@ def run_pso(lower_boundaries: list[float],
             swarm_size: int=200,
             max_iterations: int=3000,
             random_state: int=101,
-            post_hoc_analysis: Optional[int]=20) -> Optional[Tuple[Dict[str, float], Dict[str, float]]]:
+            post_hoc_analysis: Optional[int]=20) -> Optional[tuple[dict[str, float], dict[str, float]]]:
     """
     Executes Particle Swarm Optimization (PSO) to optimize a given objective function and saves the results as a CSV file.
@@ -384,6 +384,54 @@ def run_pso(lower_boundaries: list[float],
             return None
+def _save_result(
+        result_dict: dict,
+        save_format: Literal['csv', 'sqlite', 'both'],
+        csv_path: Path,
+        db_manager: Optional[DragonSQL] = None,
+        db_table_name: Optional[str] = None,
+        categorical_mappings: Optional[dict[str, dict[str, int]]] = None
+    ):
+    """
+    Private helper to handle saving a single result to CSV, SQLite, or both.
+    If `categorical_mappings` is provided, it will reverse-map integer values
+    to their string representations before saving.
+    """
+    # --- Reverse Mapping Logic ---
+    # Create a copy to hold the values to be saved
+    save_dict = result_dict.copy()
+    if categorical_mappings:
+        for feature_name, mapping in categorical_mappings.items():
+            if feature_name in save_dict:
+                # Create a reverse map {0: 'Category_A', 1: 'Category_B'}
+                reverse_map = {idx: name for name, idx in mapping.items()}
+                # Get the integer value from the results (e.g., 0)
+                int_value = save_dict[feature_name]
+                # Find the corresponding string (e.g., 'Category_A')
+                # Use .get() for safety, defaulting to the original value if not found
+                string_value = reverse_map.get(int_value, int_value)
+                # Update the dictionary that will be saved
+                save_dict[feature_name] = string_value
+    # Save to CSV
+    if save_format in ['csv', 'both']:
+        df_row = pd.DataFrame([save_dict])
+        file_exists = csv_path.exists()
+        df_row.to_csv(csv_path, mode='a', index=False, header=not file_exists)
+    # Save to SQLite
+    if save_format in ['sqlite', 'both']:
+        if db_manager and db_table_name:
+            db_manager.insert_row(db_table_name, save_dict)
+        else:
+            _LOGGER.warning("SQLite saving requested but db_manager or table_name not provided.")
 def _pso(func: ObjectiveFunction,
          lb: np.ndarray,
          ub: np.ndarray,
@@ -536,8 +584,3 @@ def _pso(func: ObjectiveFunction,
     else:
         return best_position, best_score
-def info():
-    _script_info(__all__)

ml_tools/{PSO_optimization.py → PSO_optimization/__init__.py} RENAMED Viewed

@@ -1,10 +1,12 @@
-from ._core._PSO_optimization import (
+from ._PSO import (
     ObjectiveFunction,
     multiple_objective_functions_from_dir,
-    run_pso,
-    info
+    run_pso
 )
+from ._imprimir import info
 __all__ = [
     "ObjectiveFunction",
     "multiple_objective_functions_from_dir",

ml_tools/PSO_optimization/_imprimir.py ADDED Viewed

@@ -0,0 +1,10 @@
+from .._core import _imprimir_disponibles
+_GRUPOS = [
+    "ObjectiveFunction",
+    "multiple_objective_functions_from_dir",
+    "run_pso"
+]
+def info():
+    _imprimir_disponibles(_GRUPOS)

ml_tools/SQL/__init__.py ADDED Viewed

@@ -0,0 +1,7 @@
+from ._dragon_SQL import DragonSQL
+from ._imprimir import info
+__all__ = [
+    "DragonSQL",
+]

ml_tools/{_core/_SQL.py → SQL/_dragon_SQL.py} RENAMED Viewed

@@ -1,11 +1,10 @@
 import sqlite3
 import pandas as pd
 from pathlib import Path
-from typing import Union, Dict, Any, Optional, List, Literal
+from typing import Union, Any, Optional, Literal
-from ._logger import get_logger
-from ._script_info import _script_info
-from ._path_manager import make_fullpath, sanitize_filename
+from .._core import get_logger
+from ..path_manager import make_fullpath, sanitize_filename
 _LOGGER = get_logger("DragonSQL")
@@ -80,7 +79,7 @@ class DragonSQL:
             self.conn.close()
             _LOGGER.info(f"Database connection closed: {self.db_path.name}")
-    def create_table(self, table_name: str, schema: Dict[str, str], if_not_exists: bool = True):
+    def create_table(self, table_name: str, schema: dict[str, str], if_not_exists: bool = True):
         """
         Creates a new table in the database based on a provided schema.
@@ -109,7 +108,7 @@ class DragonSQL:
         _LOGGER.info(f"➡️ Executing: {query}")
         self.cursor.execute(query)
-    def insert_row(self, table_name: str, data: Dict[str, Any]):
+    def insert_row(self, table_name: str, data: dict[str, Any]):
         """
         Inserts a single row of data into the specified table.
@@ -175,7 +174,7 @@ class DragonSQL:
         self.cursor.execute(query, params if params else ())
-    def insert_many(self, table_name: str, data: List[Dict[str, Any]]):
+    def insert_many(self, table_name: str, data: list[dict[str, Any]]):
         """
         Inserts multiple rows into the specified table in a single, efficient transaction.
@@ -239,7 +238,7 @@ class DragonSQL:
         )
         _LOGGER.info(f"➡️ Wrote {len(df)} rows from DataFrame to table '{table_name}' using mode '{if_exists}'.")
-    def list_tables(self) -> List[str]:
+    def list_tables(self) -> list[str]:
         """Returns a list of all table names in the database."""
         if not self.cursor:
             _LOGGER.error("Database connection is not open.")
@@ -300,6 +299,3 @@ class DragonSQL:
         else:
             _LOGGER.error("Cannot commit: Database connection is not open.")
-def info():
-    _script_info(__all__)

ml_tools/SQL/_imprimir.py ADDED Viewed

@@ -0,0 +1,8 @@
+from .._core import _imprimir_disponibles
+_GRUPOS = [
+    "DragonSQL",
+]
+def info():
+    _imprimir_disponibles(_GRUPOS)

ml_tools/{_core → VIF}/_VIF_factor.py RENAMED Viewed

@@ -7,10 +7,10 @@ from statsmodels.tools.tools import add_constant
 import warnings
 from pathlib import Path
-from ._utilities import yield_dataframes_from_dir, save_dataframe_filename
-from ._path_manager import sanitize_filename, make_fullpath
-from ._logger import get_logger
-from ._script_info import _script_info
+from ..utilities import yield_dataframes_from_dir, save_dataframe_filename
+from ..path_manager import sanitize_filename, make_fullpath
+from .._core import get_logger
 _LOGGER = get_logger("VIF")
@@ -31,7 +31,7 @@ def compute_vif(
     save_dir: Optional[Union[str,Path]] = None,
     filename: Optional[str] = None,
     fontsize: int = 14,
-    show_plot: bool = True
+    show_plot: bool = False
 ) -> pd.DataFrame:
     """
     Computes Variance Inflation Factors (VIF) for numeric columns in a DataFrame. Optionally, generates a bar plot of VIF values.
@@ -234,6 +234,3 @@ def compute_vif_multi(input_directory: Union[str, Path],
             if len(dropped_cols) > 0:
                 save_dataframe_filename(df=result_df, save_dir=output_dataset_path, filename=new_filename)
-def info():
-    _script_info(__all__)

ml_tools/{VIF_factor.py → VIF/__init__.py} RENAMED Viewed

@@ -1,10 +1,12 @@
-from ._core._VIF_factor import (
+from ._VIF_factor import (
     compute_vif,
     drop_vif_based,
     compute_vif_multi,
-    info
 )
+from ._imprimir import info
 __all__ = [
     "compute_vif",
     "drop_vif_based",

ml_tools/VIF/_imprimir.py ADDED Viewed

@@ -0,0 +1,10 @@
+from .._core import _imprimir_disponibles
+_GRUPOS = [
+    "compute_vif",
+    "drop_vif_based",
+    "compute_vif_multi"
+]
+def info():
+    _imprimir_disponibles(_GRUPOS)

ml_tools/_core/__init__.py CHANGED Viewed

@@ -1 +1,7 @@
-__all__ = []
+from ._script_info import _imprimir_disponibles
+from ._logger import get_logger
+__all__ = [
+    "_imprimir_disponibles",
+    "get_logger"
+]

dragon-ml-toolbox 19.14.0__py3-none-any.whl → 20.0.0__py3-none-any.whl

dragon-ml-toolbox 19.14.0py3-none-any.whl → 20.0.0py3-none-any.whl