PyPI - ins-pricing - Versions diffs - 0.1.11__py3-none-any.whl → 0.2.0__py3-none-any.whl - Mend

ins-pricing 0.1.11py3-none-any.whl → 0.2.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (126) hide show

ins_pricing/README.md +9 -6
ins_pricing/__init__.py +3 -11
ins_pricing/cli/BayesOpt_entry.py +24 -0
ins_pricing/{modelling → cli}/BayesOpt_incremental.py +197 -64
ins_pricing/cli/Explain_Run.py +25 -0
ins_pricing/{modelling → cli}/Explain_entry.py +169 -124
ins_pricing/cli/Pricing_Run.py +25 -0
ins_pricing/cli/__init__.py +1 -0
ins_pricing/cli/bayesopt_entry_runner.py +1312 -0
ins_pricing/cli/utils/__init__.py +1 -0
ins_pricing/cli/utils/cli_common.py +320 -0
ins_pricing/cli/utils/cli_config.py +375 -0
ins_pricing/{modelling → cli/utils}/notebook_utils.py +74 -19
{ins_pricing_gemini/modelling → ins_pricing/cli}/watchdog_run.py +2 -2
ins_pricing/{modelling → docs/modelling}/BayesOpt_USAGE.md +69 -49
ins_pricing/docs/modelling/README.md +34 -0
ins_pricing/modelling/__init__.py +57 -6
ins_pricing/modelling/core/__init__.py +1 -0
ins_pricing/modelling/{bayesopt → core/bayesopt}/config_preprocess.py +64 -1
ins_pricing/modelling/{bayesopt → core/bayesopt}/core.py +150 -810
ins_pricing/modelling/core/bayesopt/model_explain_mixin.py +296 -0
ins_pricing/modelling/core/bayesopt/model_plotting_mixin.py +548 -0
ins_pricing/modelling/core/bayesopt/models/__init__.py +27 -0
ins_pricing/modelling/core/bayesopt/models/model_ft_components.py +316 -0
ins_pricing/modelling/core/bayesopt/models/model_ft_trainer.py +808 -0
ins_pricing/modelling/core/bayesopt/models/model_gnn.py +675 -0
ins_pricing/modelling/core/bayesopt/models/model_resn.py +435 -0
ins_pricing/modelling/core/bayesopt/trainers/__init__.py +19 -0
ins_pricing/modelling/core/bayesopt/trainers/trainer_base.py +1020 -0
ins_pricing/modelling/core/bayesopt/trainers/trainer_ft.py +787 -0
ins_pricing/modelling/core/bayesopt/trainers/trainer_glm.py +195 -0
ins_pricing/modelling/core/bayesopt/trainers/trainer_gnn.py +312 -0
ins_pricing/modelling/core/bayesopt/trainers/trainer_resn.py +261 -0
ins_pricing/modelling/core/bayesopt/trainers/trainer_xgb.py +348 -0
ins_pricing/modelling/{bayesopt → core/bayesopt}/utils.py +2 -2
ins_pricing/modelling/core/evaluation.py +115 -0
ins_pricing/production/__init__.py +4 -0
ins_pricing/production/preprocess.py +71 -0
ins_pricing/setup.py +10 -5
{ins_pricing_gemini/modelling/tests → ins_pricing/tests/modelling}/test_plotting.py +2 -2
{ins_pricing-0.1.11.dist-info → ins_pricing-0.2.0.dist-info}/METADATA +4 -4
ins_pricing-0.2.0.dist-info/RECORD +125 -0
{ins_pricing-0.1.11.dist-info → ins_pricing-0.2.0.dist-info}/top_level.txt +0 -1
ins_pricing/modelling/BayesOpt_entry.py +0 -633
ins_pricing/modelling/Explain_Run.py +0 -36
ins_pricing/modelling/Pricing_Run.py +0 -36
ins_pricing/modelling/README.md +0 -33
ins_pricing/modelling/bayesopt/models.py +0 -2196
ins_pricing/modelling/bayesopt/trainers.py +0 -2446
ins_pricing/modelling/cli_common.py +0 -136
ins_pricing/modelling/tests/test_plotting.py +0 -63
ins_pricing/modelling/watchdog_run.py +0 -211
ins_pricing-0.1.11.dist-info/RECORD +0 -169
ins_pricing_gemini/__init__.py +0 -23
ins_pricing_gemini/governance/__init__.py +0 -20
ins_pricing_gemini/governance/approval.py +0 -93
ins_pricing_gemini/governance/audit.py +0 -37
ins_pricing_gemini/governance/registry.py +0 -99
ins_pricing_gemini/governance/release.py +0 -159
ins_pricing_gemini/modelling/Explain_Run.py +0 -36
ins_pricing_gemini/modelling/Pricing_Run.py +0 -36
ins_pricing_gemini/modelling/__init__.py +0 -151
ins_pricing_gemini/modelling/cli_common.py +0 -141
ins_pricing_gemini/modelling/config.py +0 -249
ins_pricing_gemini/modelling/config_preprocess.py +0 -254
ins_pricing_gemini/modelling/core.py +0 -741
ins_pricing_gemini/modelling/data_container.py +0 -42
ins_pricing_gemini/modelling/explain/__init__.py +0 -55
ins_pricing_gemini/modelling/explain/gradients.py +0 -334
ins_pricing_gemini/modelling/explain/metrics.py +0 -176
ins_pricing_gemini/modelling/explain/permutation.py +0 -155
ins_pricing_gemini/modelling/explain/shap_utils.py +0 -146
ins_pricing_gemini/modelling/features.py +0 -215
ins_pricing_gemini/modelling/model_manager.py +0 -148
ins_pricing_gemini/modelling/model_plotting.py +0 -463
ins_pricing_gemini/modelling/models.py +0 -2203
ins_pricing_gemini/modelling/notebook_utils.py +0 -294
ins_pricing_gemini/modelling/plotting/__init__.py +0 -45
ins_pricing_gemini/modelling/plotting/common.py +0 -63
ins_pricing_gemini/modelling/plotting/curves.py +0 -572
ins_pricing_gemini/modelling/plotting/diagnostics.py +0 -139
ins_pricing_gemini/modelling/plotting/geo.py +0 -362
ins_pricing_gemini/modelling/plotting/importance.py +0 -121
ins_pricing_gemini/modelling/run_logging.py +0 -133
ins_pricing_gemini/modelling/tests/conftest.py +0 -8
ins_pricing_gemini/modelling/tests/test_cross_val_generic.py +0 -66
ins_pricing_gemini/modelling/tests/test_distributed_utils.py +0 -18
ins_pricing_gemini/modelling/tests/test_explain.py +0 -56
ins_pricing_gemini/modelling/tests/test_geo_tokens_split.py +0 -49
ins_pricing_gemini/modelling/tests/test_graph_cache.py +0 -33
ins_pricing_gemini/modelling/tests/test_plotting_library.py +0 -150
ins_pricing_gemini/modelling/tests/test_preprocessor.py +0 -48
ins_pricing_gemini/modelling/trainers.py +0 -2447
ins_pricing_gemini/modelling/utils.py +0 -1020
ins_pricing_gemini/pricing/__init__.py +0 -27
ins_pricing_gemini/pricing/calibration.py +0 -39
ins_pricing_gemini/pricing/data_quality.py +0 -117
ins_pricing_gemini/pricing/exposure.py +0 -85
ins_pricing_gemini/pricing/factors.py +0 -91
ins_pricing_gemini/pricing/monitoring.py +0 -99
ins_pricing_gemini/pricing/rate_table.py +0 -78
ins_pricing_gemini/production/__init__.py +0 -21
ins_pricing_gemini/production/drift.py +0 -30
ins_pricing_gemini/production/monitoring.py +0 -143
ins_pricing_gemini/production/scoring.py +0 -40
ins_pricing_gemini/reporting/__init__.py +0 -11
ins_pricing_gemini/reporting/report_builder.py +0 -72
ins_pricing_gemini/reporting/scheduler.py +0 -45
ins_pricing_gemini/scripts/BayesOpt_incremental.py +0 -722
ins_pricing_gemini/scripts/Explain_entry.py +0 -545
ins_pricing_gemini/scripts/__init__.py +0 -1
ins_pricing_gemini/scripts/train.py +0 -568
ins_pricing_gemini/setup.py +0 -55
ins_pricing_gemini/smoke_test.py +0 -28
/ins_pricing/{modelling → cli/utils}/run_logging.py +0 -0
/ins_pricing/modelling/{BayesOpt.py → core/BayesOpt.py} +0 -0
/ins_pricing/modelling/{bayesopt → core/bayesopt}/__init__.py +0 -0
/ins_pricing/{modelling/tests → tests/modelling}/conftest.py +0 -0
/ins_pricing/{modelling/tests → tests/modelling}/test_cross_val_generic.py +0 -0
/ins_pricing/{modelling/tests → tests/modelling}/test_distributed_utils.py +0 -0
/ins_pricing/{modelling/tests → tests/modelling}/test_explain.py +0 -0
/ins_pricing/{modelling/tests → tests/modelling}/test_geo_tokens_split.py +0 -0
/ins_pricing/{modelling/tests → tests/modelling}/test_graph_cache.py +0 -0
/ins_pricing/{modelling/tests → tests/modelling}/test_plotting_library.py +0 -0
/ins_pricing/{modelling/tests → tests/modelling}/test_preprocessor.py +0 -0
{ins_pricing-0.1.11.dist-info → ins_pricing-0.2.0.dist-info}/WHEEL +0 -0

ins_pricing_gemini/modelling/data_container.py DELETED Viewed

@@ -1,42 +0,0 @@
-from __future__ import annotations
-from dataclasses import dataclass, field
-from typing import Any, Dict, List, Optional
-import pandas as pd
-@dataclass
-class DataContainer:
-    """Encapsulates all data structures used during training."""
-    # Raw Data
-    train_data: pd.DataFrame
-    test_data: pd.DataFrame
-    # Preprocessed Views
-    train_oht_data: Optional[pd.DataFrame] = None
-    test_oht_data: Optional[pd.DataFrame] = None
-    # Scaled Views (for Neural Nets)
-    train_oht_scl_data: Optional[pd.DataFrame] = None
-    test_oht_scl_data: Optional[pd.DataFrame] = None
-    # Special Features
-    train_geo_tokens: Optional[pd.DataFrame] = None
-    test_geo_tokens: Optional[pd.DataFrame] = None
-    geo_token_cols: List[str] = field(default_factory=list)
-    # Metadata
-    var_nmes: List[str] = field(default_factory=list)
-    num_features: List[str] = field(default_factory=list)
-    cat_categories_for_shap: Dict[str, List[Any]] = field(default_factory=dict)
-    def set_preprocessed_data(self, preprocessor: 'DatasetPreprocessor') -> None:
-        """Populate from a run DatasetPreprocessor."""
-        self.train_data = preprocessor.train_data
-        self.test_data = preprocessor.test_data
-        self.train_oht_data = preprocessor.train_oht_data
-        self.test_oht_data = preprocessor.test_oht_data
-        self.train_oht_scl_data = preprocessor.train_oht_scl_data
-        self.test_oht_scl_data = preprocessor.test_oht_scl_data
-        self.var_nmes = preprocessor.var_nmes
-        self.num_features = preprocessor.num_features
-        self.cat_categories_for_shap = preprocessor.cat_categories_for_shap

ins_pricing_gemini/modelling/explain/__init__.py DELETED Viewed

@@ -1,55 +0,0 @@
-from __future__ import annotations
-from .gradients import (
-    ft_integrated_gradients,
-    gradient_x_input_torch,
-    integrated_gradients_multi_input_torch,
-    integrated_gradients_torch,
-    resnet_integrated_gradients,
-    summarize_attributions,
-)
-from .metrics import (
-    auc_score,
-    logloss,
-    mae,
-    mape,
-    gamma_deviance,
-    poisson_deviance,
-    r2_score,
-    rmse,
-    tweedie_deviance,
-    resolve_metric,
-)
-from .permutation import permutation_importance
-from .shap_utils import (
-    compute_shap_core,
-    compute_shap_ft,
-    compute_shap_glm,
-    compute_shap_resn,
-    compute_shap_xgb,
-)
-__all__ = [
-    "auc_score",
-    "logloss",
-    "mae",
-    "mape",
-    "gamma_deviance",
-    "poisson_deviance",
-    "tweedie_deviance",
-    "r2_score",
-    "rmse",
-    "resolve_metric",
-    "permutation_importance",
-    "gradient_x_input_torch",
-    "integrated_gradients_torch",
-    "integrated_gradients_multi_input_torch",
-    "summarize_attributions",
-    "resnet_integrated_gradients",
-    "ft_integrated_gradients",
-    "compute_shap_core",
-    "compute_shap_glm",
-    "compute_shap_xgb",
-    "compute_shap_resn",
-    "compute_shap_ft",
-]

ins_pricing_gemini/modelling/explain/gradients.py DELETED Viewed

@@ -1,334 +0,0 @@
-from __future__ import annotations
-from typing import Callable, Dict, Optional, Sequence, Tuple
-import numpy as np
-import pandas as pd
-try:
-    import torch
-except Exception as exc:  # pragma: no cover
-    torch = None
-    _torch_import_error = exc
-else:
-    _torch_import_error = None
-def _require_torch(func_name: str) -> None:
-    if torch is None:
-        raise RuntimeError(f"{func_name} requires torch: {_torch_import_error}")
-def _prepare_tensor(arr, device) -> "torch.Tensor":
-    _require_torch("_prepare_tensor")
-    if isinstance(arr, torch.Tensor):
-        return arr.to(device=device, dtype=torch.float32)
-    return torch.as_tensor(arr, dtype=torch.float32, device=device)
-def _prepare_baseline(inputs: "torch.Tensor", baseline) -> "torch.Tensor":
-    if baseline is None or baseline == "zeros":
-        base = torch.zeros_like(inputs)
-    elif isinstance(baseline, str):
-        if baseline == "mean":
-            base_vec = inputs.mean(dim=0, keepdim=True)
-        elif baseline == "median":
-            base_vec = inputs.median(dim=0, keepdim=True).values
-        else:
-            raise ValueError("baseline must be None, 'zeros', 'mean', 'median', or array-like.")
-        base = base_vec.repeat(inputs.shape[0], 1)
-    else:
-        base = _prepare_tensor(baseline, inputs.device)
-        if base.ndim == 1:
-            base = base.reshape(1, -1).repeat(inputs.shape[0], 1)
-        if base.shape != inputs.shape:
-            raise ValueError("baseline shape must match inputs shape.")
-    return base
-def _select_output(output: "torch.Tensor", target: Optional[int]) -> "torch.Tensor":
-    if output.ndim == 2 and output.shape[1] > 1:
-        if target is None:
-            raise ValueError("target must be provided for multi-class outputs.")
-        output = output[:, int(target)]
-    return output.reshape(-1)
-def gradient_x_input_torch(
-    forward_fn: Callable[["torch.Tensor"], "torch.Tensor"],
-    inputs,
-    *,
-    target: Optional[int] = None,
-    device: Optional[str] = None,
-) -> np.ndarray:
-    """Single-step gradient * input (fast but rough attribution)."""
-    _require_torch("gradient_x_input_torch")
-    device = device or "cpu"
-    X = _prepare_tensor(inputs, device)
-    X.requires_grad_(True)
-    with torch.enable_grad():
-        output = forward_fn(X)
-        output = _select_output(output, target)
-        grads = torch.autograd.grad(
-            outputs=output,
-            inputs=X,
-            grad_outputs=torch.ones_like(output),
-            create_graph=False,
-            retain_graph=False,
-        )[0]
-    return (grads * X).detach().cpu().numpy()
-def integrated_gradients_torch(
-    forward_fn: Callable[["torch.Tensor"], "torch.Tensor"],
-    inputs,
-    *,
-    baseline=None,
-    steps: int = 50,
-    batch_size: int = 256,
-    target: Optional[int] = None,
-    device: Optional[str] = None,
-) -> np.ndarray:
-    """Integrated gradients for a single tensor input."""
-    _require_torch("integrated_gradients_torch")
-    device = device or "cpu"
-    steps = max(1, int(steps))
-    batch_size = max(1, int(batch_size))
-    X_full = _prepare_tensor(inputs, device)
-    baseline_full = _prepare_baseline(X_full, baseline)
-    n_rows = X_full.shape[0]
-    out = np.zeros_like(X_full.detach().cpu().numpy(), dtype=np.float32)
-    alphas = torch.linspace(0.0, 1.0, steps, device=device)
-    with torch.enable_grad():
-        for start in range(0, n_rows, batch_size):
-            end = min(start + batch_size, n_rows)
-            X = X_full[start:end]
-            base = baseline_full[start:end]
-            total_grad = torch.zeros_like(X)
-            for alpha in alphas:
-                scaled = base + alpha * (X - base)
-                scaled.requires_grad_(True)
-                output = forward_fn(scaled)
-                output = _select_output(output, target)
-                grads = torch.autograd.grad(
-                    outputs=output,
-                    inputs=scaled,
-                    grad_outputs=torch.ones_like(output),
-                    create_graph=False,
-                    retain_graph=False,
-                )[0]
-                total_grad += grads
-            avg_grad = total_grad / float(steps)
-            attr = (X - base) * avg_grad
-            out[start:end] = attr.detach().cpu().numpy()
-    return out
-def integrated_gradients_multi_input_torch(
-    forward_fn: Callable[..., "torch.Tensor"],
-    inputs: Sequence,
-    *,
-    baselines: Optional[Sequence] = None,
-    steps: int = 50,
-    batch_size: int = 256,
-    target: Optional[int] = None,
-    device: Optional[str] = None,
-) -> Tuple[np.ndarray, ...]:
-    """Integrated gradients for multiple tensor inputs (e.g., numeric + geo)."""
-    _require_torch("integrated_gradients_multi_input_torch")
-    device = device or "cpu"
-    steps = max(1, int(steps))
-    batch_size = max(1, int(batch_size))
-    tensors = [_prepare_tensor(inp, device) for inp in inputs]
-    if baselines is None:
-        baselines = [None for _ in tensors]
-    base_tensors = [_prepare_baseline(t, b) for t, b in zip(tensors, baselines)]
-    n_rows = tensors[0].shape[0]
-    outputs = [np.zeros_like(t.detach().cpu().numpy(), dtype=np.float32) for t in tensors]
-    alphas = torch.linspace(0.0, 1.0, steps, device=device)
-    with torch.enable_grad():
-        for start in range(0, n_rows, batch_size):
-            end = min(start + batch_size, n_rows)
-            batch_inputs = [t[start:end] for t in tensors]
-            batch_bases = [b[start:end] for b in base_tensors]
-            total_grads = [torch.zeros_like(t) for t in batch_inputs]
-            for alpha in alphas:
-                scaled_inputs = []
-                for t, b in zip(batch_inputs, batch_bases):
-                    s = b + alpha * (t - b)
-                    s.requires_grad_(True)
-                    scaled_inputs.append(s)
-                output = forward_fn(*scaled_inputs)
-                output = _select_output(output, target)
-                grads = torch.autograd.grad(
-                    outputs=output,
-                    inputs=scaled_inputs,
-                    grad_outputs=torch.ones_like(output),
-                    create_graph=False,
-                    retain_graph=False,
-                )
-                total_grads = [g_acc + g for g_acc, g in zip(total_grads, grads)]
-            for idx, (t, b, g) in enumerate(zip(batch_inputs, batch_bases, total_grads)):
-                avg_grad = g / float(steps)
-                attr = (t - b) * avg_grad
-                outputs[idx][start:end] = attr.detach().cpu().numpy()
-    return tuple(outputs)
-def summarize_attributions(
-    attributions: np.ndarray,
-    feature_names: Sequence[str],
-    *,
-    agg: str = "mean_abs",
-) -> pd.Series:
-    if attributions.ndim != 2:
-        raise ValueError("attributions must be 2d (n_samples, n_features).")
-    if len(feature_names) != attributions.shape[1]:
-        raise ValueError("feature_names length must match attribution dimension.")
-    if agg == "mean_abs":
-        scores = np.mean(np.abs(attributions), axis=0)
-    elif agg == "mean":
-        scores = np.mean(attributions, axis=0)
-    elif agg == "sum_abs":
-        scores = np.sum(np.abs(attributions), axis=0)
-    else:
-        raise ValueError("agg must be 'mean_abs', 'mean', or 'sum_abs'.")
-    return pd.Series(scores, index=list(feature_names)).sort_values(ascending=False)
-def resnet_integrated_gradients(
-    model,
-    X,
-    *,
-    baseline=None,
-    steps: int = 50,
-    batch_size: int = 256,
-    target: Optional[int] = None,
-    device: Optional[str] = None,
-) -> Dict[str, object]:
-    """Integrated gradients wrapper for ResNetSklearn."""
-    _require_torch("resnet_integrated_gradients")
-    if isinstance(X, pd.DataFrame):
-        feature_names = list(X.columns)
-        X_np = X.to_numpy(dtype=np.float32, copy=False)
-    else:
-        X_np = np.asarray(X, dtype=np.float32)
-        feature_names = [f"x{i}" for i in range(X_np.shape[1])]
-    if device is None:
-        try:
-            device = next(model.resnet.parameters()).device
-        except Exception:
-            device = "cpu"
-    model.resnet.eval()
-    def forward_fn(x):
-        out = model.resnet(x)
-        if getattr(model, "task_type", None) == "classification":
-            out = torch.sigmoid(out)
-        return out
-    attrs = integrated_gradients_torch(
-        forward_fn,
-        X_np,
-        baseline=baseline,
-        steps=steps,
-        batch_size=batch_size,
-        target=target,
-        device=device,
-    )
-    importance = summarize_attributions(attrs, feature_names)
-    return {"attributions": attrs, "importance": importance, "feature_names": feature_names}
-def ft_integrated_gradients(
-    model,
-    X: pd.DataFrame,
-    *,
-    geo_tokens: Optional[np.ndarray] = None,
-    baseline_num=None,
-    baseline_geo=None,
-    steps: int = 50,
-    batch_size: int = 256,
-    target: Optional[int] = None,
-    device: Optional[str] = None,
-) -> Dict[str, object]:
-    """Integrated gradients for FTTransformerSklearn (numeric + optional geo tokens).
-    Categorical features are held fixed; gradients are computed for numeric/geo inputs.
-    """
-    _require_torch("ft_integrated_gradients")
-    if device is None:
-        try:
-            device = next(model.ft.parameters()).device
-        except Exception:
-            device = "cpu"
-    model.ft.eval()
-    X_num, X_cat, X_geo, _, _, _ = model._tensorize_split(
-        X, None, None, geo_tokens=geo_tokens, allow_none=True
-    )
-    X_num = X_num.to(device)
-    X_cat = X_cat.to(device)
-    X_geo = X_geo.to(device)
-    def forward_fn(num, geo=None):
-        if geo is None:
-            out = model.ft(num, X_cat, X_geo)
-        else:
-            out = model.ft(num, X_cat, geo)
-        if getattr(model, "task_type", None) == "classification":
-            out = torch.sigmoid(out)
-        return out
-    attrs_num = None
-    attrs_geo = None
-    if X_geo.shape[1] == 0:
-        attrs_num = integrated_gradients_torch(
-            lambda num: forward_fn(num, None),
-            X_num,
-            baseline=baseline_num,
-            steps=steps,
-            batch_size=batch_size,
-            target=target,
-            device=device,
-        )
-    else:
-        attrs_num, attrs_geo = integrated_gradients_multi_input_torch(
-            forward_fn,
-            (X_num, X_geo),
-            baselines=(baseline_num, baseline_geo),
-            steps=steps,
-            batch_size=batch_size,
-            target=target,
-            device=device,
-        )
-    num_names = list(getattr(model, "num_cols", []))
-    geo_names = [f"geo_{i}" for i in range(X_geo.shape[1])]
-    results = {
-        "attributions_num": attrs_num,
-        "attributions_geo": attrs_geo,
-        "num_feature_names": num_names,
-        "geo_feature_names": geo_names,
-    }
-    if attrs_num is not None and num_names:
-        results["importance_num"] = summarize_attributions(attrs_num, num_names)
-    if attrs_geo is not None and geo_names:
-        results["importance_geo"] = summarize_attributions(attrs_geo, geo_names)
-    return results

ins_pricing_gemini/modelling/explain/metrics.py DELETED Viewed

@@ -1,176 +0,0 @@
-from __future__ import annotations
-from typing import Callable, Optional, Tuple
-import numpy as np
-try:
-    from sklearn.metrics import roc_auc_score
-except Exception:  # pragma: no cover
-    roc_auc_score = None
-def _to_numpy(arr) -> np.ndarray:
-    out = np.asarray(arr, dtype=float)
-    return out.reshape(-1)
-def _align(y_true, y_pred, sample_weight=None) -> Tuple[np.ndarray, np.ndarray, Optional[np.ndarray]]:
-    y_t = _to_numpy(y_true)
-    y_p = _to_numpy(y_pred)
-    if y_t.shape[0] != y_p.shape[0]:
-        raise ValueError("y_true and y_pred must have the same length.")
-    if sample_weight is None:
-        return y_t, y_p, None
-    w = _to_numpy(sample_weight)
-    if w.shape[0] != y_t.shape[0]:
-        raise ValueError("sample_weight must have the same length as y_true.")
-    return y_t, y_p, w
-def _weighted_mean(values: np.ndarray, weight: Optional[np.ndarray]) -> float:
-    if weight is None:
-        return float(np.mean(values))
-    total = float(np.sum(weight))
-    if total <= 0:
-        return float(np.mean(values))
-    return float(np.sum(values * weight) / total)
-def rmse(y_true, y_pred, sample_weight=None) -> float:
-    y_t, y_p, w = _align(y_true, y_pred, sample_weight)
-    err = (y_t - y_p) ** 2
-    return float(np.sqrt(_weighted_mean(err, w)))
-def mae(y_true, y_pred, sample_weight=None) -> float:
-    y_t, y_p, w = _align(y_true, y_pred, sample_weight)
-    err = np.abs(y_t - y_p)
-    return _weighted_mean(err, w)
-def mape(y_true, y_pred, sample_weight=None, eps: float = 1e-8) -> float:
-    y_t, y_p, w = _align(y_true, y_pred, sample_weight)
-    denom = np.maximum(np.abs(y_t), eps)
-    err = np.abs((y_t - y_p) / denom)
-    return _weighted_mean(err, w)
-def r2_score(y_true, y_pred, sample_weight=None) -> float:
-    y_t, y_p, w = _align(y_true, y_pred, sample_weight)
-    if w is None:
-        y_mean = float(np.mean(y_t))
-        sse = float(np.sum((y_t - y_p) ** 2))
-        sst = float(np.sum((y_t - y_mean) ** 2))
-    else:
-        w_sum = float(np.sum(w))
-        if w_sum <= 0:
-            y_mean = float(np.mean(y_t))
-        else:
-            y_mean = float(np.sum(w * y_t) / w_sum)
-        sse = float(np.sum(w * (y_t - y_p) ** 2))
-        sst = float(np.sum(w * (y_t - y_mean) ** 2))
-    if sst <= 0:
-        return 0.0
-    return 1.0 - sse / sst
-def logloss(y_true, y_pred, sample_weight=None, eps: float = 1e-8) -> float:
-    y_t, y_p, w = _align(y_true, y_pred, sample_weight)
-    p = np.clip(y_p, eps, 1 - eps)
-    loss = -(y_t * np.log(p) + (1 - y_t) * np.log(1 - p))
-    return _weighted_mean(loss, w)
-def tweedie_deviance(
-    y_true,
-    y_pred,
-    sample_weight=None,
-    *,
-    power: float = 1.5,
-    eps: float = 1e-8,
-) -> float:
-    """Tweedie deviance (power=1 -> Poisson, power=2 -> Gamma, power=0 -> Normal)."""
-    if power < 0:
-        raise ValueError("power must be >= 0.")
-    y_t, y_p, w = _align(y_true, y_pred, sample_weight)
-    y_p = np.clip(y_p, eps, None)
-    y_t_safe = np.clip(y_t, eps, None)
-    if power == 0:
-        dev = (y_t - y_p) ** 2
-    elif power == 1:
-        dev = 2 * (y_t_safe * np.log(y_t_safe / y_p) - (y_t_safe - y_p))
-    elif power == 2:
-        ratio = y_t_safe / y_p
-        dev = 2 * ((ratio - 1) - np.log(ratio))
-    else:
-        term1 = np.power(y_t_safe, 2 - power) / ((1 - power) * (2 - power))
-        term2 = y_t_safe * np.power(y_p, 1 - power) / (1 - power)
-        term3 = np.power(y_p, 2 - power) / (2 - power)
-        dev = 2 * (term1 - term2 + term3)
-    return _weighted_mean(dev, w)
-def poisson_deviance(y_true, y_pred, sample_weight=None, eps: float = 1e-8) -> float:
-    return tweedie_deviance(
-        y_true,
-        y_pred,
-        sample_weight=sample_weight,
-        power=1.0,
-        eps=eps,
-    )
-def gamma_deviance(y_true, y_pred, sample_weight=None, eps: float = 1e-8) -> float:
-    return tweedie_deviance(
-        y_true,
-        y_pred,
-        sample_weight=sample_weight,
-        power=2.0,
-        eps=eps,
-    )
-def auc_score(y_true, y_pred, sample_weight=None) -> float:
-    if roc_auc_score is None:
-        raise RuntimeError("auc requires scikit-learn.")
-    y_t, y_p, w = _align(y_true, y_pred, sample_weight)
-    return float(roc_auc_score(y_t, y_p, sample_weight=w))
-def resolve_metric(
-    metric: str | Callable,
-    *,
-    task_type: Optional[str] = None,
-    higher_is_better: Optional[bool] = None,
-) -> Tuple[Callable, bool, str]:
-    if callable(metric):
-        if higher_is_better is None:
-            raise ValueError("higher_is_better must be provided for custom metric.")
-        return metric, bool(higher_is_better), getattr(metric, "__name__", "custom")
-    name = str(metric or "auto").lower()
-    if name == "auto":
-        if task_type == "classification":
-            name = "logloss"
-        else:
-            name = "rmse"
-    mapping = {
-        "rmse": (rmse, False),
-        "mae": (mae, False),
-        "mape": (mape, False),
-        "r2": (r2_score, True),
-        "logloss": (logloss, False),
-        "poisson": (poisson_deviance, False),
-        "gamma": (gamma_deviance, False),
-        "tweedie": (tweedie_deviance, False),
-        "auc": (auc_score, True),
-    }
-    if name not in mapping:
-        raise ValueError(f"Unsupported metric: {metric}")
-    fn, hib = mapping[name]
-    if higher_is_better is not None:
-        hib = bool(higher_is_better)
-    return fn, hib, name

ins-pricing 0.1.11__py3-none-any.whl → 0.2.0__py3-none-any.whl

ins-pricing 0.1.11py3-none-any.whl → 0.2.0py3-none-any.whl