PyPI - ins-pricing - Versions diffs - 0.4.5__py3-none-any.whl → 0.5.0__py3-none-any.whl - Mend

ins-pricing 0.4.5py3-none-any.whl → 0.5.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (84) hide show

ins_pricing/README.md +48 -22
ins_pricing/__init__.py +142 -90
ins_pricing/cli/BayesOpt_entry.py +52 -50
ins_pricing/cli/BayesOpt_incremental.py +39 -105
ins_pricing/cli/Explain_Run.py +31 -23
ins_pricing/cli/Explain_entry.py +532 -579
ins_pricing/cli/Pricing_Run.py +31 -23
ins_pricing/cli/bayesopt_entry_runner.py +11 -9
ins_pricing/cli/utils/cli_common.py +256 -256
ins_pricing/cli/utils/cli_config.py +375 -375
ins_pricing/cli/utils/import_resolver.py +382 -365
ins_pricing/cli/utils/notebook_utils.py +340 -340
ins_pricing/cli/watchdog_run.py +209 -201
ins_pricing/frontend/__init__.py +10 -10
ins_pricing/frontend/example_workflows.py +1 -1
ins_pricing/governance/__init__.py +20 -20
ins_pricing/governance/release.py +159 -159
ins_pricing/modelling/__init__.py +147 -92
ins_pricing/modelling/{core/bayesopt → bayesopt}/README.md +2 -2
ins_pricing/modelling/{core/bayesopt → bayesopt}/__init__.py +64 -102
ins_pricing/modelling/{core/bayesopt → bayesopt}/config_preprocess.py +562 -562
ins_pricing/modelling/{core/bayesopt → bayesopt}/core.py +965 -964
ins_pricing/modelling/{core/bayesopt → bayesopt}/model_explain_mixin.py +296 -296
ins_pricing/modelling/{core/bayesopt → bayesopt}/model_plotting_mixin.py +482 -548
ins_pricing/modelling/{core/bayesopt → bayesopt}/models/__init__.py +27 -27
ins_pricing/modelling/{core/bayesopt → bayesopt}/models/model_ft_trainer.py +915 -913
ins_pricing/modelling/{core/bayesopt → bayesopt}/models/model_gnn.py +788 -785
ins_pricing/modelling/{core/bayesopt → bayesopt}/models/model_resn.py +448 -446
ins_pricing/modelling/bayesopt/trainers/__init__.py +19 -0
ins_pricing/modelling/{core/bayesopt → bayesopt}/trainers/trainer_base.py +1308 -1308
ins_pricing/modelling/{core/bayesopt → bayesopt}/trainers/trainer_ft.py +3 -3
ins_pricing/modelling/{core/bayesopt → bayesopt}/trainers/trainer_glm.py +197 -198
ins_pricing/modelling/{core/bayesopt → bayesopt}/trainers/trainer_gnn.py +344 -344
ins_pricing/modelling/{core/bayesopt → bayesopt}/trainers/trainer_resn.py +283 -283
ins_pricing/modelling/{core/bayesopt → bayesopt}/trainers/trainer_xgb.py +346 -347
ins_pricing/modelling/bayesopt/utils/__init__.py +67 -0
ins_pricing/modelling/bayesopt/utils/constants.py +21 -0
ins_pricing/modelling/bayesopt/utils/io_utils.py +7 -0
ins_pricing/modelling/bayesopt/utils/losses.py +27 -0
ins_pricing/modelling/bayesopt/utils/metrics_and_devices.py +17 -0
ins_pricing/modelling/{core/bayesopt → bayesopt}/utils/torch_trainer_mixin.py +623 -623
ins_pricing/modelling/{core/evaluation.py → evaluation.py} +113 -104
ins_pricing/modelling/explain/__init__.py +55 -55
ins_pricing/modelling/explain/metrics.py +27 -174
ins_pricing/modelling/explain/permutation.py +237 -237
ins_pricing/modelling/plotting/__init__.py +40 -36
ins_pricing/modelling/plotting/compat.py +228 -0
ins_pricing/modelling/plotting/curves.py +572 -572
ins_pricing/modelling/plotting/diagnostics.py +163 -163
ins_pricing/modelling/plotting/geo.py +362 -362
ins_pricing/modelling/plotting/importance.py +121 -121
ins_pricing/pricing/__init__.py +27 -27
ins_pricing/production/__init__.py +35 -25
ins_pricing/production/{predict.py → inference.py} +140 -57
ins_pricing/production/monitoring.py +8 -21
ins_pricing/reporting/__init__.py +11 -11
ins_pricing/setup.py +1 -1
ins_pricing/tests/production/test_inference.py +90 -0
ins_pricing/utils/__init__.py +116 -83
ins_pricing/utils/device.py +255 -255
ins_pricing/utils/features.py +53 -0
ins_pricing/utils/io.py +72 -0
ins_pricing/{modelling/core/bayesopt/utils → utils}/losses.py +125 -129
ins_pricing/utils/metrics.py +158 -24
ins_pricing/utils/numerics.py +76 -0
ins_pricing/utils/paths.py +9 -1
{ins_pricing-0.4.5.dist-info → ins_pricing-0.5.0.dist-info}/METADATA +182 -182
ins_pricing-0.5.0.dist-info/RECORD +131 -0
ins_pricing/modelling/core/BayesOpt.py +0 -146
ins_pricing/modelling/core/__init__.py +0 -1
ins_pricing/modelling/core/bayesopt/trainers/__init__.py +0 -19
ins_pricing/modelling/core/bayesopt/utils/__init__.py +0 -86
ins_pricing/modelling/core/bayesopt/utils/constants.py +0 -183
ins_pricing/modelling/core/bayesopt/utils/io_utils.py +0 -126
ins_pricing/modelling/core/bayesopt/utils/metrics_and_devices.py +0 -555
ins_pricing/modelling/core/bayesopt/utils.py +0 -105
ins_pricing/modelling/core/bayesopt/utils_backup.py +0 -1503
ins_pricing/tests/production/test_predict.py +0 -233
ins_pricing-0.4.5.dist-info/RECORD +0 -130
/ins_pricing/modelling/{core/bayesopt → bayesopt}/config_components.py +0 -0
/ins_pricing/modelling/{core/bayesopt → bayesopt}/models/model_ft_components.py +0 -0
/ins_pricing/modelling/{core/bayesopt → bayesopt}/utils/distributed_utils.py +0 -0
{ins_pricing-0.4.5.dist-info → ins_pricing-0.5.0.dist-info}/WHEEL +0 -0
{ins_pricing-0.4.5.dist-info → ins_pricing-0.5.0.dist-info}/top_level.txt +0 -0

ins_pricing/modelling/core/bayesopt/utils/__init__.py DELETED Viewed

@@ -1,86 +0,0 @@
-"""Backward compatibility re-exports from refactored utils modules.
-This module ensures all existing imports continue to work:
-    from ins_pricing.modelling.core.bayesopt.utils import EPS, IOUtils, ...
-The utils.py file has been split into focused modules for better maintainability:
-- constants.py: EPS, set_global_seed, etc.
-- io_utils.py: IOUtils for file I/O
-- distributed_utils.py: DistributedUtils, TrainingUtils for DDP
-- torch_trainer_mixin.py: TorchTrainerMixin for PyTorch training
-- metrics_and_devices.py: Metrics, GPU/device management, CV strategies, plotting
-"""
-from __future__ import annotations
-# Constants and simple utilities
-from .constants import (
-    EPS,
-    set_global_seed,
-    ensure_parent_dir,
-    compute_batch_size,
-    tweedie_loss,
-    infer_factor_and_cate_list,
-)
-# I/O utilities
-from .io_utils import (
-    IOUtils,
-    csv_to_dict,
-)
-# Distributed training
-from .distributed_utils import (
-    DistributedUtils,
-    TrainingUtils,
-    free_cuda,
-)
-# PyTorch training mixin
-from .torch_trainer_mixin import (
-    TorchTrainerMixin,
-)
-# Metrics, devices, CV, and plotting
-from .metrics_and_devices import (
-    get_logger,
-    MetricFactory,
-    GPUMemoryManager,
-    DeviceManager,
-    CVStrategyResolver,
-    PlotUtils,
-    split_data,
-    plot_lift_list,
-    plot_dlift_list,
-    _OrderedSplitter,
-)
-__all__ = [
-    # Constants
-    'EPS',
-    'set_global_seed',
-    'ensure_parent_dir',
-    'compute_batch_size',
-    'tweedie_loss',
-    'infer_factor_and_cate_list',
-    # I/O
-    'IOUtils',
-    'csv_to_dict',
-    # Distributed
-    'DistributedUtils',
-    'TrainingUtils',
-    'free_cuda',
-    # PyTorch
-    'TorchTrainerMixin',
-    # Utilities
-    'get_logger',
-    'MetricFactory',
-    'GPUMemoryManager',
-    'DeviceManager',
-    'CVStrategyResolver',
-    'PlotUtils',
-    'split_data',
-    'plot_lift_list',
-    'plot_dlift_list',
-    '_OrderedSplitter',
-]

ins_pricing/modelling/core/bayesopt/utils/constants.py DELETED Viewed

@@ -1,183 +0,0 @@
-"""Core constants and simple utility functions.
-This module contains:
-- EPS constant for numerical stability
-- set_global_seed() for reproducibility
-- ensure_parent_dir() for file operations
-- compute_batch_size() for adaptive batching
-- tweedie_loss() for regression loss
-- infer_factor_and_cate_list() for automatic feature detection
-"""
-from __future__ import annotations
-import random
-from pathlib import Path
-from typing import List, Optional, Tuple
-import numpy as np
-import pandas as pd
-import torch
-# Constants
-# =============================================================================
-EPS = 1e-8
-"""Small epsilon value for numerical stability."""
-# Simple utility functions
-# =============================================================================
-def set_global_seed(seed: int) -> None:
-    """Set random seed for reproducibility across all libraries.
-    Args:
-        seed: Random seed value
-    """
-    random.seed(seed)
-    np.random.seed(seed)
-    torch.manual_seed(seed)
-    if torch.cuda.is_available():
-        torch.cuda.manual_seed_all(seed)
-def ensure_parent_dir(file_path: str) -> None:
-    """Create parent directories when missing.
-    Args:
-        file_path: Path to file whose parent directory should be created
-    """
-    directory = Path(file_path).parent
-    if directory and not directory.exists():
-        directory.mkdir(parents=True, exist_ok=True)
-def compute_batch_size(data_size: int, learning_rate: float,
-                      batch_num: int, minimum: int) -> int:
-    """Compute adaptive batch size based on data size and learning rate.
-    Args:
-        data_size: Total number of samples
-        learning_rate: Learning rate value
-        batch_num: Target number of batches
-        minimum: Minimum batch size
-    Returns:
-        Computed batch size
-    """
-    estimated = int((learning_rate / 1e-4) ** 0.5 *
-                   (data_size / max(batch_num, 1)))
-    return max(1, min(data_size, max(minimum, estimated)))
-def tweedie_loss(pred, target, p=1.5, eps=1e-6, max_clip=1e6):
-    """Compute Tweedie deviance loss for PyTorch.
-    Reference: https://scikit-learn.org/stable/modules/model_evaluation.html
-    Args:
-        pred: Predicted values (tensor)
-        target: True values (tensor)
-        p: Tweedie power parameter (1.0-2.0)
-        eps: Small epsilon for numerical stability
-        max_clip: Maximum value for clipping
-    Returns:
-        Tweedie negative log-likelihood (tensor)
-    """
-    # Clamp predictions to positive values for stability
-    pred_clamped = torch.clamp(pred, min=eps)
-    if p == 1:
-        # Poisson
-        term1 = target * torch.log(target / pred_clamped + eps)
-        term2 = -target + pred_clamped
-        term3 = 0
-    elif p == 0:
-        # Gaussian
-        term1 = 0.5 * torch.pow(target - pred_clamped, 2)
-        term2 = 0
-        term3 = 0
-    elif p == 2:
-        # Gamma
-        term1 = torch.log(pred_clamped / target + eps)
-        term2 = -target / pred_clamped + 1
-        term3 = 0
-    else:
-        # General Tweedie
-        term1 = torch.pow(target, 2 - p) / ((1 - p) * (2 - p))
-        term2 = target * torch.pow(pred_clamped, 1 - p) / (1 - p)
-        term3 = torch.pow(pred_clamped, 2 - p) / (2 - p)
-    return torch.nan_to_num(
-        2 * (term1 - term2 + term3),
-        nan=eps,
-        posinf=max_clip,
-        neginf=-max_clip
-    )
-def infer_factor_and_cate_list(
-    train_df: pd.DataFrame,
-    test_df: pd.DataFrame,
-    resp_nme: str,
-    weight_nme: str,
-    binary_resp_nme: Optional[str] = None,
-    factor_nmes: Optional[List[str]] = None,
-    cate_list: Optional[List[str]] = None,
-    infer_categorical_max_unique: int = 50,
-    infer_categorical_max_ratio: float = 0.05
-) -> Tuple[List[str], List[str]]:
-    """Infer factor_nmes/cate_list when feature names are not provided.
-    Rules:
-      - factor_nmes: start from shared train/test columns, exclude target/weight/(optional binary target).
-      - cate_list: object/category/bool plus low-cardinality integer columns.
-      - Always intersect with shared train/test columns to avoid mismatches.
-    Args:
-        train_df: Training DataFrame
-        test_df: Test DataFrame
-        resp_nme: Response/target column name
-        weight_nme: Sample weight column name
-        binary_resp_nme: Optional binary response column name
-        factor_nmes: Optional list of feature column names
-        cate_list: Optional list of categorical feature names
-        infer_categorical_max_unique: Max unique values for categorical inference
-        infer_categorical_max_ratio: Max ratio of unique/total for categorical inference
-    Returns:
-        Tuple of (factor_nmes, cate_list)
-    """
-    excluded = {resp_nme, weight_nme}
-    if binary_resp_nme:
-        excluded.add(binary_resp_nme)
-    common_cols = [c for c in train_df.columns if c in test_df.columns]
-    if factor_nmes is None:
-        factors = [c for c in common_cols if c not in excluded]
-    else:
-        factors = [
-            c for c in factor_nmes if c in common_cols and c not in excluded
-        ]
-    if cate_list is not None:
-        cats = [c for c in cate_list if c in factors]
-        return factors, cats
-    n_rows = max(1, len(train_df))
-    cats: List[str] = []
-    for col in factors:
-        s = train_df[col]
-        if (pd.api.types.is_bool_dtype(s) or
-            pd.api.types.is_object_dtype(s) or
-            isinstance(s.dtype, pd.CategoricalDtype)):
-            cats.append(col)
-            continue
-        if pd.api.types.is_integer_dtype(s):
-            nunique = int(s.nunique(dropna=True))
-            if (nunique <= infer_categorical_max_unique or
-                (nunique / n_rows) <= infer_categorical_max_ratio):
-                cats.append(col)
-    return factors, cats

ins_pricing/modelling/core/bayesopt/utils/io_utils.py DELETED Viewed

@@ -1,126 +0,0 @@
-"""File I/O and parameter loading utilities.
-This module contains:
-- IOUtils class for loading parameters from JSON/CSV/TSV files
-- csv_to_dict() for CSV file handling
-- File path sanitization utilities
-"""
-from __future__ import annotations
-import csv
-import json
-from pathlib import Path
-from typing import Any, Dict, List
-import pandas as pd
-class IOUtils:
-    """File and path utilities for model parameters and configs."""
-    @staticmethod
-    def csv_to_dict(file_path: str) -> List[Dict[str, Any]]:
-        """Load CSV file as list of dictionaries.
-        Args:
-            file_path: Path to CSV file
-        Returns:
-            List of dictionaries, one per row
-        """
-        with open(file_path, mode='r', encoding='utf-8') as file:
-            reader = csv.DictReader(file)
-            return [
-                dict(filter(lambda item: item[0] != '', row.items()))
-                for row in reader
-            ]
-    @staticmethod
-    def ensure_parent_dir(file_path: str) -> None:
-        """Create parent directories when missing.
-        Args:
-            file_path: Path to file whose parent directory should be created
-        """
-        directory = Path(file_path).parent
-        if directory and not directory.exists():
-            directory.mkdir(parents=True, exist_ok=True)
-    @staticmethod
-    def _sanitize_params_dict(params: Dict[str, Any]) -> Dict[str, Any]:
-        """Filter index-like columns such as "Unnamed: 0" from pandas I/O.
-        Args:
-            params: Parameter dictionary
-        Returns:
-            Sanitized parameter dictionary
-        """
-        return {
-            k: v
-            for k, v in (params or {}).items()
-            if k and not str(k).startswith("Unnamed")
-        }
-    @staticmethod
-    def load_params_file(path: str) -> Dict[str, Any]:
-        """Load parameter dict from JSON/CSV/TSV files.
-        Supported formats:
-        - JSON: accept dict or {"best_params": {...}} wrapper
-        - CSV/TSV: read the first row as params
-        Args:
-            path: Path to parameter file
-        Returns:
-            Parameter dictionary
-        Raises:
-            FileNotFoundError: If file doesn't exist
-            ValueError: If file format is unsupported or invalid
-        """
-        file_path = Path(path).expanduser().resolve()
-        if not file_path.exists():
-            raise FileNotFoundError(f"params file not found: {file_path}")
-        suffix = file_path.suffix.lower()
-        if suffix == ".json":
-            payload = json.loads(file_path.read_text(
-                encoding="utf-8", errors="replace"))
-            if isinstance(payload, dict) and "best_params" in payload:
-                payload = payload.get("best_params") or {}
-            if not isinstance(payload, dict):
-                raise ValueError(
-                    f"Invalid JSON params file (expect dict): {file_path}")
-            return IOUtils._sanitize_params_dict(dict(payload))
-        if suffix in (".csv", ".tsv"):
-            df = pd.read_csv(file_path, sep="\t" if suffix == ".tsv" else ",")
-            if df.empty:
-                raise ValueError(f"Empty params file: {file_path}")
-            params = df.iloc[0].to_dict()
-            return IOUtils._sanitize_params_dict(params)
-        raise ValueError(
-            f"Unsupported params file type '{suffix}': {file_path}")
-# Backward compatibility function wrapper
-def csv_to_dict(file_path: str) -> List[Dict[str, Any]]:
-    """Load CSV file as list of dictionaries (legacy function).
-    Args:
-        file_path: Path to CSV file
-    Returns:
-        List of dictionaries, one per row
-    """
-    return IOUtils.csv_to_dict(file_path)
-def ensure_parent_dir(file_path: str) -> None:
-    """Create parent directories when missing (legacy function)."""
-    IOUtils.ensure_parent_dir(file_path)

ins-pricing 0.4.5__py3-none-any.whl → 0.5.0__py3-none-any.whl

ins-pricing 0.4.5py3-none-any.whl → 0.5.0py3-none-any.whl