PyPI - ins-pricing - Versions diffs - 0.4.4__py3-none-any.whl → 0.5.0__py3-none-any.whl - Mend

ins-pricing 0.4.4py3-none-any.whl → 0.5.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (96) hide show

ins_pricing/README.md +74 -56
ins_pricing/__init__.py +142 -90
ins_pricing/cli/BayesOpt_entry.py +52 -50
ins_pricing/cli/BayesOpt_incremental.py +832 -898
ins_pricing/cli/Explain_Run.py +31 -23
ins_pricing/cli/Explain_entry.py +532 -579
ins_pricing/cli/Pricing_Run.py +31 -23
ins_pricing/cli/bayesopt_entry_runner.py +1440 -1438
ins_pricing/cli/utils/cli_common.py +256 -256
ins_pricing/cli/utils/cli_config.py +375 -375
ins_pricing/cli/utils/import_resolver.py +382 -365
ins_pricing/cli/utils/notebook_utils.py +340 -340
ins_pricing/cli/watchdog_run.py +209 -201
ins_pricing/frontend/README.md +573 -419
ins_pricing/frontend/__init__.py +10 -10
ins_pricing/frontend/config_builder.py +1 -0
ins_pricing/frontend/example_workflows.py +1 -1
ins_pricing/governance/__init__.py +20 -20
ins_pricing/governance/release.py +159 -159
ins_pricing/modelling/README.md +67 -0
ins_pricing/modelling/__init__.py +147 -92
ins_pricing/modelling/bayesopt/README.md +59 -0
ins_pricing/modelling/{core/bayesopt → bayesopt}/__init__.py +64 -102
ins_pricing/modelling/{core/bayesopt → bayesopt}/config_preprocess.py +562 -550
ins_pricing/modelling/{core/bayesopt → bayesopt}/core.py +965 -962
ins_pricing/modelling/{core/bayesopt → bayesopt}/model_explain_mixin.py +296 -296
ins_pricing/modelling/{core/bayesopt → bayesopt}/model_plotting_mixin.py +482 -548
ins_pricing/modelling/{core/bayesopt → bayesopt}/models/__init__.py +27 -27
ins_pricing/modelling/{core/bayesopt → bayesopt}/models/model_ft_trainer.py +915 -913
ins_pricing/modelling/{core/bayesopt → bayesopt}/models/model_gnn.py +788 -785
ins_pricing/modelling/{core/bayesopt → bayesopt}/models/model_resn.py +448 -446
ins_pricing/modelling/bayesopt/trainers/__init__.py +19 -0
ins_pricing/modelling/{core/bayesopt → bayesopt}/trainers/trainer_base.py +1308 -1308
ins_pricing/modelling/{core/bayesopt → bayesopt}/trainers/trainer_ft.py +3 -3
ins_pricing/modelling/{core/bayesopt → bayesopt}/trainers/trainer_glm.py +197 -198
ins_pricing/modelling/{core/bayesopt → bayesopt}/trainers/trainer_gnn.py +344 -344
ins_pricing/modelling/{core/bayesopt → bayesopt}/trainers/trainer_resn.py +283 -283
ins_pricing/modelling/{core/bayesopt → bayesopt}/trainers/trainer_xgb.py +346 -347
ins_pricing/modelling/bayesopt/utils/__init__.py +67 -0
ins_pricing/modelling/bayesopt/utils/constants.py +21 -0
ins_pricing/modelling/bayesopt/utils/io_utils.py +7 -0
ins_pricing/modelling/bayesopt/utils/losses.py +27 -0
ins_pricing/modelling/bayesopt/utils/metrics_and_devices.py +17 -0
ins_pricing/modelling/{core/bayesopt → bayesopt}/utils/torch_trainer_mixin.py +623 -623
ins_pricing/modelling/{core/evaluation.py → evaluation.py} +113 -104
ins_pricing/modelling/explain/__init__.py +55 -55
ins_pricing/modelling/explain/metrics.py +27 -174
ins_pricing/modelling/explain/permutation.py +237 -237
ins_pricing/modelling/plotting/__init__.py +40 -36
ins_pricing/modelling/plotting/compat.py +228 -0
ins_pricing/modelling/plotting/curves.py +572 -572
ins_pricing/modelling/plotting/diagnostics.py +163 -163
ins_pricing/modelling/plotting/geo.py +362 -362
ins_pricing/modelling/plotting/importance.py +121 -121
ins_pricing/pricing/__init__.py +27 -27
ins_pricing/production/__init__.py +35 -25
ins_pricing/production/{predict.py → inference.py} +140 -57
ins_pricing/production/monitoring.py +8 -21
ins_pricing/reporting/__init__.py +11 -11
ins_pricing/setup.py +1 -1
ins_pricing/tests/production/test_inference.py +90 -0
ins_pricing/utils/__init__.py +116 -83
ins_pricing/utils/device.py +255 -255
ins_pricing/utils/features.py +53 -0
ins_pricing/utils/io.py +72 -0
ins_pricing/{modelling/core/bayesopt/utils → utils}/losses.py +125 -129
ins_pricing/utils/metrics.py +158 -24
ins_pricing/utils/numerics.py +76 -0
ins_pricing/utils/paths.py +9 -1
{ins_pricing-0.4.4.dist-info → ins_pricing-0.5.0.dist-info}/METADATA +55 -35
ins_pricing-0.5.0.dist-info/RECORD +131 -0
ins_pricing/CHANGELOG.md +0 -272
ins_pricing/RELEASE_NOTES_0.2.8.md +0 -344
ins_pricing/docs/LOSS_FUNCTIONS.md +0 -78
ins_pricing/docs/modelling/BayesOpt_USAGE.md +0 -945
ins_pricing/docs/modelling/README.md +0 -34
ins_pricing/frontend/QUICKSTART.md +0 -152
ins_pricing/modelling/core/BayesOpt.py +0 -146
ins_pricing/modelling/core/__init__.py +0 -1
ins_pricing/modelling/core/bayesopt/PHASE2_REFACTORING_SUMMARY.md +0 -449
ins_pricing/modelling/core/bayesopt/PHASE3_REFACTORING_SUMMARY.md +0 -406
ins_pricing/modelling/core/bayesopt/REFACTORING_SUMMARY.md +0 -247
ins_pricing/modelling/core/bayesopt/trainers/__init__.py +0 -19
ins_pricing/modelling/core/bayesopt/utils/__init__.py +0 -86
ins_pricing/modelling/core/bayesopt/utils/constants.py +0 -183
ins_pricing/modelling/core/bayesopt/utils/io_utils.py +0 -126
ins_pricing/modelling/core/bayesopt/utils/metrics_and_devices.py +0 -555
ins_pricing/modelling/core/bayesopt/utils.py +0 -105
ins_pricing/modelling/core/bayesopt/utils_backup.py +0 -1503
ins_pricing/tests/production/test_predict.py +0 -233
ins_pricing-0.4.4.dist-info/RECORD +0 -137
/ins_pricing/modelling/{core/bayesopt → bayesopt}/config_components.py +0 -0
/ins_pricing/modelling/{core/bayesopt → bayesopt}/models/model_ft_components.py +0 -0
/ins_pricing/modelling/{core/bayesopt → bayesopt}/utils/distributed_utils.py +0 -0
{ins_pricing-0.4.4.dist-info → ins_pricing-0.5.0.dist-info}/WHEEL +0 -0
{ins_pricing-0.4.4.dist-info → ins_pricing-0.5.0.dist-info}/top_level.txt +0 -0

ins_pricing/cli/utils/cli_common.py CHANGED Viewed

@@ -1,256 +1,256 @@
-"""CLI common utilities.
-This module re-exports shared utilities from ins_pricing.utils and provides
-CLI-specific functionality for configuration loading and train/test splitting.
-"""
-from __future__ import annotations
-from pathlib import Path
-from typing import Any, Dict, Optional, Sequence, Tuple
-import pandas as pd
-from sklearn.model_selection import GroupShuffleSplit, train_test_split
-# Re-export shared utilities for backward compatibility
-from ins_pricing.utils.paths import (
-    PLOT_MODEL_LABELS,
-    PYTORCH_TRAINERS,
-    dedupe_preserve_order,
-    build_model_names,
-    parse_model_pairs,
-    resolve_path,
-    resolve_dir_path,
-    resolve_data_path,
-    load_dataset,
-    coerce_dataset_types,
-    fingerprint_file,
-)
-__all__ = [
-    # From shared utils
-    "PLOT_MODEL_LABELS",
-    "PYTORCH_TRAINERS",
-    "dedupe_preserve_order",
-    "build_model_names",
-    "parse_model_pairs",
-    "resolve_path",
-    "resolve_dir_path",
-    "resolve_data_path",
-    "load_dataset",
-    "coerce_dataset_types",
-    "fingerprint_file",
-    # CLI-specific
-    "split_train_test",
-    "resolve_config_path",
-    "load_config_json",
-    "set_env",
-    "normalize_config_paths",
-    "resolve_dtype_map",
-    "resolve_data_config",
-    "resolve_report_config",
-    "resolve_split_config",
-    "resolve_runtime_config",
-    "resolve_output_dirs",
-    "resolve_and_load_config",
-]
-# =============================================================================
-# CLI-specific: Train/Test Splitting
-# =============================================================================
-def split_train_test(
-    df: pd.DataFrame,
-    *,
-    holdout_ratio: float,
-    strategy: str = "random",
-    group_col: Optional[str] = None,
-    time_col: Optional[str] = None,
-    time_ascending: bool = True,
-    rand_seed: Optional[int] = None,
-    reset_index_mode: str = "none",
-    ratio_label: str = "holdout_ratio",
-    include_strategy_in_ratio_error: bool = False,
-    validate_ratio: bool = True,
-) -> Tuple[pd.DataFrame, pd.DataFrame]:
-    """Split a DataFrame into train and test sets.
-    Args:
-        df: Input DataFrame
-        holdout_ratio: Proportion for test set (0.0-1.0)
-        strategy: Split strategy ('random', 'time', 'group')
-        group_col: Column name for group-based splitting
-        time_col: Column name for time-based splitting
-        time_ascending: Sort order for time-based splitting
-        rand_seed: Random seed for reproducibility
-        reset_index_mode: When to reset index ('none', 'always', 'time_group')
-        ratio_label: Label for ratio in error messages
-        include_strategy_in_ratio_error: Include strategy in error messages
-        validate_ratio: Whether to validate ratio bounds
-    Returns:
-        Tuple of (train_df, test_df)
-    """
-    strategy = str(strategy or "random").strip().lower()
-    holdout_ratio = float(holdout_ratio)
-    if include_strategy_in_ratio_error and strategy in {
-        "time",
-        "timeseries",
-        "temporal",
-        "group",
-        "grouped",
-    }:
-        strategy_label = (
-            "time" if strategy in {"time", "timeseries", "temporal"} else "group"
-        )
-        ratio_error = (
-            f"{ratio_label} must be in (0, 1) for {strategy_label} split; "
-            f"got {holdout_ratio}."
-        )
-    else:
-        ratio_error = f"{ratio_label} must be in (0, 1); got {holdout_ratio}."
-    if strategy in {"time", "timeseries", "temporal"}:
-        if not time_col:
-            raise ValueError("split_time_col is required for time split_strategy.")
-        if time_col not in df.columns:
-            raise KeyError(f"split_time_col '{time_col}' not in dataset columns.")
-        if validate_ratio and not (0.0 < holdout_ratio < 1.0):
-            raise ValueError(ratio_error)
-        ordered = df.sort_values(time_col, ascending=bool(time_ascending))
-        cutoff = int(len(ordered) * (1.0 - holdout_ratio))
-        if cutoff <= 0 or cutoff >= len(ordered):
-            raise ValueError(
-                f"{ratio_label}={holdout_ratio} leaves no data for train/test split."
-            )
-        train_df = ordered.iloc[:cutoff]
-        test_df = ordered.iloc[cutoff:]
-    elif strategy in {"group", "grouped"}:
-        if not group_col:
-            raise ValueError("split_group_col is required for group split_strategy.")
-        if group_col not in df.columns:
-            raise KeyError(f"split_group_col '{group_col}' not in dataset columns.")
-        if validate_ratio and not (0.0 < holdout_ratio < 1.0):
-            raise ValueError(ratio_error)
-        splitter = GroupShuffleSplit(
-            n_splits=1,
-            test_size=holdout_ratio,
-            random_state=rand_seed,
-        )
-        train_idx, test_idx = next(splitter.split(df, groups=df[group_col]))
-        train_df = df.iloc[train_idx]
-        test_df = df.iloc[test_idx]
-    else:
-        train_df, test_df = train_test_split(
-            df, test_size=holdout_ratio, random_state=rand_seed
-        )
-    if reset_index_mode == "always" or (
-        reset_index_mode == "time_group"
-        and strategy in {"time", "timeseries", "temporal", "group", "grouped"}
-    ):
-        train_df = train_df.reset_index(drop=True)
-        test_df = test_df.reset_index(drop=True)
-    return train_df, test_df
-# =============================================================================
-# CLI-specific: Configuration Loading (delegated to cli_config)
-# =============================================================================
-def _load_cli_config():
-    """Load the cli_config module."""
-    try:
-        from . import cli_config as _cli_config
-    except Exception:
-        import cli_config as _cli_config
-    return _cli_config
-def resolve_config_path(raw: str, script_dir: Path) -> Path:
-    """Resolve a configuration file path."""
-    return _load_cli_config().resolve_config_path(raw, script_dir)
-def load_config_json(path: Path, required_keys: Sequence[str]) -> Dict[str, Any]:
-    """Load and validate a JSON configuration file."""
-    return _load_cli_config().load_config_json(path, required_keys)
-def set_env(env_overrides: Dict[str, Any]) -> None:
-    """Set environment variables from configuration."""
-    _load_cli_config().set_env(env_overrides)
-def normalize_config_paths(cfg: Dict[str, Any], config_path: Path) -> Dict[str, Any]:
-    """Normalize paths in configuration relative to config file location."""
-    return _load_cli_config().normalize_config_paths(cfg, config_path)
-def resolve_dtype_map(value: Any, base_dir: Path) -> Dict[str, Any]:
-    """Resolve dtype mapping from configuration."""
-    return _load_cli_config().resolve_dtype_map(value, base_dir)
-def resolve_data_config(
-    cfg: Dict[str, Any],
-    config_path: Path,
-    *,
-    create_data_dir: bool = False,
-) -> Tuple[Path, str, Optional[str], Dict[str, Any]]:
-    """Resolve data configuration from config file."""
-    return _load_cli_config().resolve_data_config(
-        cfg,
-        config_path,
-        create_data_dir=create_data_dir,
-    )
-def resolve_report_config(cfg: Dict[str, Any]) -> Dict[str, Any]:
-    """Resolve report configuration."""
-    return _load_cli_config().resolve_report_config(cfg)
-def resolve_split_config(cfg: Dict[str, Any]) -> Dict[str, Any]:
-    """Resolve train/test split configuration."""
-    return _load_cli_config().resolve_split_config(cfg)
-def resolve_runtime_config(cfg: Dict[str, Any]) -> Dict[str, Any]:
-    """Resolve runtime configuration."""
-    return _load_cli_config().resolve_runtime_config(cfg)
-def resolve_output_dirs(
-    cfg: Dict[str, Any],
-    config_path: Path,
-    *,
-    output_override: Optional[str] = None,
-) -> Dict[str, Optional[str]]:
-    """Resolve output directory paths."""
-    return _load_cli_config().resolve_output_dirs(
-        cfg,
-        config_path,
-        output_override=output_override,
-    )
-def resolve_and_load_config(
-    raw: str,
-    script_dir: Path,
-    required_keys: Sequence[str],
-    *,
-    apply_env: bool = True,
-) -> Tuple[Path, Dict[str, Any]]:
-    """Resolve and load a configuration file."""
-    return _load_cli_config().resolve_and_load_config(
-        raw,
-        script_dir,
-        required_keys,
-        apply_env=apply_env,
-    )
+"""CLI common utilities.
+This module re-exports shared utilities from ins_pricing.utils and provides
+CLI-specific functionality for configuration loading and train/test splitting.
+"""
+from __future__ import annotations
+from pathlib import Path
+from typing import Any, Dict, Optional, Sequence, Tuple
+import pandas as pd
+from sklearn.model_selection import GroupShuffleSplit, train_test_split
+# Re-export shared utilities for backward compatibility
+from ins_pricing.utils.paths import (
+    PLOT_MODEL_LABELS,
+    PYTORCH_TRAINERS,
+    dedupe_preserve_order,
+    build_model_names,
+    parse_model_pairs,
+    resolve_path,
+    resolve_dir_path,
+    resolve_data_path,
+    load_dataset,
+    coerce_dataset_types,
+    fingerprint_file,
+)
+__all__ = [
+    # From shared utils
+    "PLOT_MODEL_LABELS",
+    "PYTORCH_TRAINERS",
+    "dedupe_preserve_order",
+    "build_model_names",
+    "parse_model_pairs",
+    "resolve_path",
+    "resolve_dir_path",
+    "resolve_data_path",
+    "load_dataset",
+    "coerce_dataset_types",
+    "fingerprint_file",
+    # CLI-specific
+    "split_train_test",
+    "resolve_config_path",
+    "load_config_json",
+    "set_env",
+    "normalize_config_paths",
+    "resolve_dtype_map",
+    "resolve_data_config",
+    "resolve_report_config",
+    "resolve_split_config",
+    "resolve_runtime_config",
+    "resolve_output_dirs",
+    "resolve_and_load_config",
+]
+# =============================================================================
+# CLI-specific: Train/Test Splitting
+# =============================================================================
+def split_train_test(
+    df: pd.DataFrame,
+    *,
+    holdout_ratio: float,
+    strategy: str = "random",
+    group_col: Optional[str] = None,
+    time_col: Optional[str] = None,
+    time_ascending: bool = True,
+    rand_seed: Optional[int] = None,
+    reset_index_mode: str = "none",
+    ratio_label: str = "holdout_ratio",
+    include_strategy_in_ratio_error: bool = False,
+    validate_ratio: bool = True,
+) -> Tuple[pd.DataFrame, pd.DataFrame]:
+    """Split a DataFrame into train and test sets.
+    Args:
+        df: Input DataFrame
+        holdout_ratio: Proportion for test set (0.0-1.0)
+        strategy: Split strategy ('random', 'time', 'group')
+        group_col: Column name for group-based splitting
+        time_col: Column name for time-based splitting
+        time_ascending: Sort order for time-based splitting
+        rand_seed: Random seed for reproducibility
+        reset_index_mode: When to reset index ('none', 'always', 'time_group')
+        ratio_label: Label for ratio in error messages
+        include_strategy_in_ratio_error: Include strategy in error messages
+        validate_ratio: Whether to validate ratio bounds
+    Returns:
+        Tuple of (train_df, test_df)
+    """
+    strategy = str(strategy or "random").strip().lower()
+    holdout_ratio = float(holdout_ratio)
+    if include_strategy_in_ratio_error and strategy in {
+        "time",
+        "timeseries",
+        "temporal",
+        "group",
+        "grouped",
+    }:
+        strategy_label = (
+            "time" if strategy in {"time", "timeseries", "temporal"} else "group"
+        )
+        ratio_error = (
+            f"{ratio_label} must be in (0, 1) for {strategy_label} split; "
+            f"got {holdout_ratio}."
+        )
+    else:
+        ratio_error = f"{ratio_label} must be in (0, 1); got {holdout_ratio}."
+    if strategy in {"time", "timeseries", "temporal"}:
+        if not time_col:
+            raise ValueError("split_time_col is required for time split_strategy.")
+        if time_col not in df.columns:
+            raise KeyError(f"split_time_col '{time_col}' not in dataset columns.")
+        if validate_ratio and not (0.0 < holdout_ratio < 1.0):
+            raise ValueError(ratio_error)
+        ordered = df.sort_values(time_col, ascending=bool(time_ascending))
+        cutoff = int(len(ordered) * (1.0 - holdout_ratio))
+        if cutoff <= 0 or cutoff >= len(ordered):
+            raise ValueError(
+                f"{ratio_label}={holdout_ratio} leaves no data for train/test split."
+            )
+        train_df = ordered.iloc[:cutoff]
+        test_df = ordered.iloc[cutoff:]
+    elif strategy in {"group", "grouped"}:
+        if not group_col:
+            raise ValueError("split_group_col is required for group split_strategy.")
+        if group_col not in df.columns:
+            raise KeyError(f"split_group_col '{group_col}' not in dataset columns.")
+        if validate_ratio and not (0.0 < holdout_ratio < 1.0):
+            raise ValueError(ratio_error)
+        splitter = GroupShuffleSplit(
+            n_splits=1,
+            test_size=holdout_ratio,
+            random_state=rand_seed,
+        )
+        train_idx, test_idx = next(splitter.split(df, groups=df[group_col]))
+        train_df = df.iloc[train_idx]
+        test_df = df.iloc[test_idx]
+    else:
+        train_df, test_df = train_test_split(
+            df, test_size=holdout_ratio, random_state=rand_seed
+        )
+    if reset_index_mode == "always" or (
+        reset_index_mode == "time_group"
+        and strategy in {"time", "timeseries", "temporal", "group", "grouped"}
+    ):
+        train_df = train_df.reset_index(drop=True)
+        test_df = test_df.reset_index(drop=True)
+    return train_df, test_df
+# =============================================================================
+# CLI-specific: Configuration Loading (delegated to cli_config)
+# =============================================================================
+def _load_cli_config():
+    """Load the cli_config module."""
+    try:
+        from ins_pricing.cli.utils import cli_config as _cli_config
+    except Exception:
+        import cli_config as _cli_config
+    return _cli_config
+def resolve_config_path(raw: str, script_dir: Path) -> Path:
+    """Resolve a configuration file path."""
+    return _load_cli_config().resolve_config_path(raw, script_dir)
+def load_config_json(path: Path, required_keys: Sequence[str]) -> Dict[str, Any]:
+    """Load and validate a JSON configuration file."""
+    return _load_cli_config().load_config_json(path, required_keys)
+def set_env(env_overrides: Dict[str, Any]) -> None:
+    """Set environment variables from configuration."""
+    _load_cli_config().set_env(env_overrides)
+def normalize_config_paths(cfg: Dict[str, Any], config_path: Path) -> Dict[str, Any]:
+    """Normalize paths in configuration relative to config file location."""
+    return _load_cli_config().normalize_config_paths(cfg, config_path)
+def resolve_dtype_map(value: Any, base_dir: Path) -> Dict[str, Any]:
+    """Resolve dtype mapping from configuration."""
+    return _load_cli_config().resolve_dtype_map(value, base_dir)
+def resolve_data_config(
+    cfg: Dict[str, Any],
+    config_path: Path,
+    *,
+    create_data_dir: bool = False,
+) -> Tuple[Path, str, Optional[str], Dict[str, Any]]:
+    """Resolve data configuration from config file."""
+    return _load_cli_config().resolve_data_config(
+        cfg,
+        config_path,
+        create_data_dir=create_data_dir,
+    )
+def resolve_report_config(cfg: Dict[str, Any]) -> Dict[str, Any]:
+    """Resolve report configuration."""
+    return _load_cli_config().resolve_report_config(cfg)
+def resolve_split_config(cfg: Dict[str, Any]) -> Dict[str, Any]:
+    """Resolve train/test split configuration."""
+    return _load_cli_config().resolve_split_config(cfg)
+def resolve_runtime_config(cfg: Dict[str, Any]) -> Dict[str, Any]:
+    """Resolve runtime configuration."""
+    return _load_cli_config().resolve_runtime_config(cfg)
+def resolve_output_dirs(
+    cfg: Dict[str, Any],
+    config_path: Path,
+    *,
+    output_override: Optional[str] = None,
+) -> Dict[str, Optional[str]]:
+    """Resolve output directory paths."""
+    return _load_cli_config().resolve_output_dirs(
+        cfg,
+        config_path,
+        output_override=output_override,
+    )
+def resolve_and_load_config(
+    raw: str,
+    script_dir: Path,
+    required_keys: Sequence[str],
+    *,
+    apply_env: bool = True,
+) -> Tuple[Path, Dict[str, Any]]:
+    """Resolve and load a configuration file."""
+    return _load_cli_config().resolve_and_load_config(
+        raw,
+        script_dir,
+        required_keys,
+        apply_env=apply_env,
+    )

ins-pricing 0.4.4__py3-none-any.whl → 0.5.0__py3-none-any.whl

ins-pricing 0.4.4py3-none-any.whl → 0.5.0py3-none-any.whl