PyPI - ins-pricing - Versions diffs - 0.4.5__py3-none-any.whl → 0.5.1__py3-none-any.whl - Mend

ins-pricing 0.4.5py3-none-any.whl → 0.5.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (93) hide show

ins_pricing/README.md +48 -22
ins_pricing/__init__.py +142 -90
ins_pricing/cli/BayesOpt_entry.py +58 -46
ins_pricing/cli/BayesOpt_incremental.py +77 -110
ins_pricing/cli/Explain_Run.py +42 -23
ins_pricing/cli/Explain_entry.py +551 -577
ins_pricing/cli/Pricing_Run.py +42 -23
ins_pricing/cli/bayesopt_entry_runner.py +51 -16
ins_pricing/cli/utils/bootstrap.py +23 -0
ins_pricing/cli/utils/cli_common.py +256 -256
ins_pricing/cli/utils/cli_config.py +379 -360
ins_pricing/cli/utils/import_resolver.py +375 -358
ins_pricing/cli/utils/notebook_utils.py +256 -242
ins_pricing/cli/watchdog_run.py +216 -198
ins_pricing/frontend/__init__.py +10 -10
ins_pricing/frontend/app.py +132 -61
ins_pricing/frontend/config_builder.py +33 -0
ins_pricing/frontend/example_config.json +11 -0
ins_pricing/frontend/example_workflows.py +1 -1
ins_pricing/frontend/runner.py +340 -388
ins_pricing/governance/__init__.py +20 -20
ins_pricing/governance/release.py +159 -159
ins_pricing/modelling/README.md +1 -1
ins_pricing/modelling/__init__.py +147 -92
ins_pricing/modelling/{core/bayesopt → bayesopt}/README.md +31 -13
ins_pricing/modelling/{core/bayesopt → bayesopt}/__init__.py +64 -102
ins_pricing/modelling/{core/bayesopt → bayesopt}/config_components.py +12 -0
ins_pricing/modelling/{core/bayesopt → bayesopt}/config_preprocess.py +589 -552
ins_pricing/modelling/{core/bayesopt → bayesopt}/core.py +987 -958
ins_pricing/modelling/{core/bayesopt → bayesopt}/model_explain_mixin.py +296 -296
ins_pricing/modelling/{core/bayesopt → bayesopt}/model_plotting_mixin.py +488 -548
ins_pricing/modelling/{core/bayesopt → bayesopt}/models/__init__.py +27 -27
ins_pricing/modelling/{core/bayesopt → bayesopt}/models/model_ft_components.py +349 -342
ins_pricing/modelling/{core/bayesopt → bayesopt}/models/model_ft_trainer.py +921 -913
ins_pricing/modelling/{core/bayesopt → bayesopt}/models/model_gnn.py +794 -785
ins_pricing/modelling/{core/bayesopt → bayesopt}/models/model_resn.py +454 -446
ins_pricing/modelling/bayesopt/trainers/__init__.py +19 -0
ins_pricing/modelling/{core/bayesopt → bayesopt}/trainers/trainer_base.py +1294 -1282
ins_pricing/modelling/{core/bayesopt → bayesopt}/trainers/trainer_ft.py +64 -56
ins_pricing/modelling/{core/bayesopt → bayesopt}/trainers/trainer_glm.py +203 -198
ins_pricing/modelling/{core/bayesopt → bayesopt}/trainers/trainer_gnn.py +333 -325
ins_pricing/modelling/{core/bayesopt → bayesopt}/trainers/trainer_resn.py +279 -267
ins_pricing/modelling/{core/bayesopt → bayesopt}/trainers/trainer_xgb.py +515 -313
ins_pricing/modelling/bayesopt/utils/__init__.py +67 -0
ins_pricing/modelling/bayesopt/utils/constants.py +21 -0
ins_pricing/modelling/{core/bayesopt → bayesopt}/utils/distributed_utils.py +193 -186
ins_pricing/modelling/bayesopt/utils/io_utils.py +7 -0
ins_pricing/modelling/bayesopt/utils/losses.py +27 -0
ins_pricing/modelling/bayesopt/utils/metrics_and_devices.py +17 -0
ins_pricing/modelling/{core/bayesopt → bayesopt}/utils/torch_trainer_mixin.py +636 -623
ins_pricing/modelling/{core/evaluation.py → evaluation.py} +113 -104
ins_pricing/modelling/explain/__init__.py +55 -55
ins_pricing/modelling/explain/metrics.py +27 -174
ins_pricing/modelling/explain/permutation.py +237 -237
ins_pricing/modelling/plotting/__init__.py +40 -36
ins_pricing/modelling/plotting/compat.py +228 -0
ins_pricing/modelling/plotting/curves.py +572 -572
ins_pricing/modelling/plotting/diagnostics.py +163 -163
ins_pricing/modelling/plotting/geo.py +362 -362
ins_pricing/modelling/plotting/importance.py +121 -121
ins_pricing/pricing/__init__.py +27 -27
ins_pricing/pricing/factors.py +67 -56
ins_pricing/production/__init__.py +35 -25
ins_pricing/production/{predict.py → inference.py} +140 -57
ins_pricing/production/monitoring.py +8 -21
ins_pricing/reporting/__init__.py +11 -11
ins_pricing/setup.py +1 -1
ins_pricing/tests/production/test_inference.py +90 -0
ins_pricing/utils/__init__.py +112 -78
ins_pricing/utils/device.py +258 -237
ins_pricing/utils/features.py +53 -0
ins_pricing/utils/io.py +72 -0
ins_pricing/utils/logging.py +34 -1
ins_pricing/{modelling/core/bayesopt/utils → utils}/losses.py +125 -129
ins_pricing/utils/metrics.py +158 -24
ins_pricing/utils/numerics.py +76 -0
ins_pricing/utils/paths.py +9 -1
ins_pricing/utils/profiling.py +8 -4
{ins_pricing-0.4.5.dist-info → ins_pricing-0.5.1.dist-info}/METADATA +1 -1
ins_pricing-0.5.1.dist-info/RECORD +132 -0
ins_pricing/modelling/core/BayesOpt.py +0 -146
ins_pricing/modelling/core/__init__.py +0 -1
ins_pricing/modelling/core/bayesopt/trainers/__init__.py +0 -19
ins_pricing/modelling/core/bayesopt/utils/__init__.py +0 -86
ins_pricing/modelling/core/bayesopt/utils/constants.py +0 -183
ins_pricing/modelling/core/bayesopt/utils/io_utils.py +0 -126
ins_pricing/modelling/core/bayesopt/utils/metrics_and_devices.py +0 -555
ins_pricing/modelling/core/bayesopt/utils.py +0 -105
ins_pricing/modelling/core/bayesopt/utils_backup.py +0 -1503
ins_pricing/tests/production/test_predict.py +0 -233
ins_pricing-0.4.5.dist-info/RECORD +0 -130
{ins_pricing-0.4.5.dist-info → ins_pricing-0.5.1.dist-info}/WHEEL +0 -0
{ins_pricing-0.4.5.dist-info → ins_pricing-0.5.1.dist-info}/top_level.txt +0 -0

ins_pricing/modelling/explain/permutation.py CHANGED Viewed

@@ -1,237 +1,237 @@
-from __future__ import annotations
-from typing import Callable, Optional, Sequence
-import numpy as np
-import pandas as pd
-from joblib import Parallel, delayed
-from .metrics import resolve_metric
-def _compute_feature_importance(
-    feat, X_data, y_arr, w_arr, predict_fn, metric_fn,
-    baseline_score, higher_is_better, n_repeats, random_state, metric_name,
-    return_scores, is_dataframe=True, feat_idx=None
-):
-    """Helper function to compute importance for a single feature (parallelizable)."""
-    rng = np.random.default_rng(random_state)
-    if is_dataframe:
-        # Work on a copy for thread safety in parallel execution
-        X_work = X_data.copy()
-        orig_values = X_work[feat].to_numpy(copy=False).copy()
-        scores = []
-        for _ in range(n_repeats):
-            X_work[feat] = rng.permutation(orig_values)
-            pred = predict_fn(X_work)
-            score = metric_fn(y_arr, pred, w_arr)
-            scores.append(float(score))
-    else:
-        X_work = X_data.copy()
-        orig_col = X_data[:, feat_idx].copy()
-        scores = []
-        for _ in range(n_repeats):
-            X_work[:, feat_idx] = rng.permutation(orig_col)
-            pred = predict_fn(X_work)
-            score = metric_fn(y_arr, pred, w_arr)
-            scores.append(float(score))
-    scores_arr = np.asarray(scores, dtype=float)
-    if higher_is_better:
-        delta = baseline_score - scores_arr
-    else:
-        delta = scores_arr - baseline_score
-    entry = {
-        "feature": feat,
-        "importance_mean": float(np.mean(delta)),
-        "importance_std": float(np.std(delta)),
-        "baseline_score": float(baseline_score),
-        "permutation_score_mean": float(np.mean(scores_arr)),
-        "metric": metric_name,
-    }
-    if return_scores:
-        entry["permutation_scores"] = scores
-    return entry
-def _prepare_data(X, y, sample_weight, max_rows, rng):
-    y_arr = np.asarray(y)
-    if y_arr.ndim != 1:
-        y_arr = y_arr.reshape(-1)
-    w_arr = None
-    if sample_weight is not None:
-        w_arr = np.asarray(sample_weight).reshape(-1)
-        if w_arr.shape[0] != y_arr.shape[0]:
-            raise ValueError("sample_weight length must match y.")
-    if isinstance(X, pd.DataFrame):
-        X_data = X
-        if len(X_data) != len(y_arr):
-            raise ValueError("X and y must have the same length.")
-        if max_rows and len(X_data) > max_rows:
-            idx = rng.choice(len(X_data), size=int(max_rows), replace=False)
-            X_data = X_data.iloc[idx].copy()
-            y_arr = y_arr[idx]
-            if w_arr is not None:
-                w_arr = w_arr[idx]
-        return X_data, y_arr, w_arr
-    X_np = np.asarray(X)
-    if X_np.ndim != 2:
-        raise ValueError("X must be 2d when not a DataFrame.")
-    if X_np.shape[0] != y_arr.shape[0]:
-        raise ValueError("X and y must have the same length.")
-    if max_rows and X_np.shape[0] > max_rows:
-        idx = rng.choice(X_np.shape[0], size=int(max_rows), replace=False)
-        X_np = X_np[idx]
-        y_arr = y_arr[idx]
-        if w_arr is not None:
-            w_arr = w_arr[idx]
-    return X_np, y_arr, w_arr
-def permutation_importance(
-    predict_fn: Callable,
-    X,
-    y,
-    *,
-    sample_weight=None,
-    metric: str | Callable = "auto",
-    task_type: Optional[str] = None,
-    higher_is_better: Optional[bool] = None,
-    n_repeats: int = 5,
-    random_state: Optional[int] = None,
-    max_rows: Optional[int] = 5000,
-    features: Optional[Sequence[str]] = None,
-    return_scores: bool = False,
-    safe_copy: bool = False,
-    n_jobs: Optional[int] = None,
-) -> pd.DataFrame:
-    """Permutation importance on tabular data.
-    predict_fn should accept the same type as X (DataFrame or ndarray).
-    Set safe_copy=True if predict_fn mutates its input.
-    Set n_jobs to enable parallel processing across features (default: None = sequential).
-    """
-    rng = np.random.default_rng(random_state)
-    n_repeats = max(1, int(n_repeats))
-    X_data, y_arr, w_arr = _prepare_data(X, y, sample_weight, max_rows, rng)
-    metric_fn, higher_is_better, metric_name = resolve_metric(
-        metric, task_type=task_type, higher_is_better=higher_is_better
-    )
-    baseline_pred = predict_fn(X_data)
-    baseline_score = metric_fn(y_arr, baseline_pred, w_arr)
-    if isinstance(X_data, pd.DataFrame):
-        feature_names = list(X_data.columns)
-        if features is not None:
-            feature_names = [f for f in features if f in X_data.columns]
-        # Use parallel processing if n_jobs is specified
-        if n_jobs is not None and n_jobs != 1:
-            # Generate different random seeds for each feature to ensure reproducibility
-            seeds = [random_state + i if random_state is not None else None
-                     for i in range(len(feature_names))]
-            results = Parallel(n_jobs=n_jobs, prefer="threads")(
-                delayed(_compute_feature_importance)(
-                    feat, X_data, y_arr, w_arr, predict_fn, metric_fn,
-                    baseline_score, higher_is_better, n_repeats, seed,
-                    metric_name, return_scores, is_dataframe=True
-                )
-                for feat, seed in zip(feature_names, seeds)
-            )
-        else:
-            # Sequential processing (original optimized version)
-            X_perm = X_data if not safe_copy else X_data.copy()
-            results = []
-            for feat in feature_names:
-                # Store original values directly without extra copy
-                orig_values = X_perm[feat].to_numpy(copy=False)
-                orig_copy = orig_values.copy()  # Only copy the column, not the entire DataFrame
-                scores = []
-                for _ in range(n_repeats):
-                    X_perm[feat] = rng.permutation(orig_copy)
-                    pred = predict_fn(X_perm)
-                    score = metric_fn(y_arr, pred, w_arr)
-                    scores.append(float(score))
-                # Restore original column values
-                X_perm[feat] = orig_copy
-                scores_arr = np.asarray(scores, dtype=float)
-                if higher_is_better:
-                    delta = baseline_score - scores_arr
-                else:
-                    delta = scores_arr - baseline_score
-                entry = {
-                    "feature": feat,
-                    "importance_mean": float(np.mean(delta)),
-                    "importance_std": float(np.std(delta)),
-                    "baseline_score": float(baseline_score),
-                    "permutation_score_mean": float(np.mean(scores_arr)),
-                    "metric": metric_name,
-                }
-                if return_scores:
-                    entry["permutation_scores"] = scores
-                results.append(entry)
-    else:
-        if features is not None:
-            if len(features) != X_data.shape[1]:
-                raise ValueError("features length must match X columns for ndarray input.")
-            feature_names = list(features)
-        else:
-            feature_names = [f"x{i}" for i in range(X_data.shape[1])]
-        X_base = np.asarray(X_data)
-        # Use parallel processing if n_jobs is specified
-        if n_jobs is not None and n_jobs != 1:
-            seeds = [random_state + i if random_state is not None else None
-                     for i in range(len(feature_names))]
-            results = Parallel(n_jobs=n_jobs, prefer="threads")(
-                delayed(_compute_feature_importance)(
-                    feat, X_base, y_arr, w_arr, predict_fn, metric_fn,
-                    baseline_score, higher_is_better, n_repeats, seed,
-                    metric_name, return_scores, is_dataframe=False, feat_idx=idx
-                )
-                for idx, (feat, seed) in enumerate(zip(feature_names, seeds))
-            )
-        else:
-            # Sequential processing
-            X_perm = X_base.copy()
-            results = []
-            for idx, feat in enumerate(feature_names):
-                orig_col = X_base[:, idx].copy()
-                scores = []
-                for _ in range(n_repeats):
-                    X_perm[:, idx] = rng.permutation(orig_col)
-                    pred_input = X_perm.copy() if safe_copy else X_perm
-                    pred = predict_fn(pred_input)
-                    score = metric_fn(y_arr, pred, w_arr)
-                    scores.append(float(score))
-                X_perm[:, idx] = orig_col
-                scores_arr = np.asarray(scores, dtype=float)
-                if higher_is_better:
-                    delta = baseline_score - scores_arr
-                else:
-                    delta = scores_arr - baseline_score
-                entry = {
-                    "feature": feat,
-                    "importance_mean": float(np.mean(delta)),
-                    "importance_std": float(np.std(delta)),
-                    "baseline_score": float(baseline_score),
-                    "permutation_score_mean": float(np.mean(scores_arr)),
-                    "metric": metric_name,
-                }
-                if return_scores:
-                    entry["permutation_scores"] = scores
-                results.append(entry)
-    df = pd.DataFrame(results)
-    df = df.sort_values(by="importance_mean", ascending=False).reset_index(drop=True)
-    return df
+from __future__ import annotations
+from typing import Callable, Optional, Sequence
+import numpy as np
+import pandas as pd
+from joblib import Parallel, delayed
+from ins_pricing.modelling.explain.metrics import resolve_metric
+def _compute_feature_importance(
+    feat, X_data, y_arr, w_arr, predict_fn, metric_fn,
+    baseline_score, higher_is_better, n_repeats, random_state, metric_name,
+    return_scores, is_dataframe=True, feat_idx=None
+):
+    """Helper function to compute importance for a single feature (parallelizable)."""
+    rng = np.random.default_rng(random_state)
+    if is_dataframe:
+        # Work on a copy for thread safety in parallel execution
+        X_work = X_data.copy()
+        orig_values = X_work[feat].to_numpy(copy=False).copy()
+        scores = []
+        for _ in range(n_repeats):
+            X_work[feat] = rng.permutation(orig_values)
+            pred = predict_fn(X_work)
+            score = metric_fn(y_arr, pred, w_arr)
+            scores.append(float(score))
+    else:
+        X_work = X_data.copy()
+        orig_col = X_data[:, feat_idx].copy()
+        scores = []
+        for _ in range(n_repeats):
+            X_work[:, feat_idx] = rng.permutation(orig_col)
+            pred = predict_fn(X_work)
+            score = metric_fn(y_arr, pred, w_arr)
+            scores.append(float(score))
+    scores_arr = np.asarray(scores, dtype=float)
+    if higher_is_better:
+        delta = baseline_score - scores_arr
+    else:
+        delta = scores_arr - baseline_score
+    entry = {
+        "feature": feat,
+        "importance_mean": float(np.mean(delta)),
+        "importance_std": float(np.std(delta)),
+        "baseline_score": float(baseline_score),
+        "permutation_score_mean": float(np.mean(scores_arr)),
+        "metric": metric_name,
+    }
+    if return_scores:
+        entry["permutation_scores"] = scores
+    return entry
+def _prepare_data(X, y, sample_weight, max_rows, rng):
+    y_arr = np.asarray(y)
+    if y_arr.ndim != 1:
+        y_arr = y_arr.reshape(-1)
+    w_arr = None
+    if sample_weight is not None:
+        w_arr = np.asarray(sample_weight).reshape(-1)
+        if w_arr.shape[0] != y_arr.shape[0]:
+            raise ValueError("sample_weight length must match y.")
+    if isinstance(X, pd.DataFrame):
+        X_data = X
+        if len(X_data) != len(y_arr):
+            raise ValueError("X and y must have the same length.")
+        if max_rows and len(X_data) > max_rows:
+            idx = rng.choice(len(X_data), size=int(max_rows), replace=False)
+            X_data = X_data.iloc[idx].copy()
+            y_arr = y_arr[idx]
+            if w_arr is not None:
+                w_arr = w_arr[idx]
+        return X_data, y_arr, w_arr
+    X_np = np.asarray(X)
+    if X_np.ndim != 2:
+        raise ValueError("X must be 2d when not a DataFrame.")
+    if X_np.shape[0] != y_arr.shape[0]:
+        raise ValueError("X and y must have the same length.")
+    if max_rows and X_np.shape[0] > max_rows:
+        idx = rng.choice(X_np.shape[0], size=int(max_rows), replace=False)
+        X_np = X_np[idx]
+        y_arr = y_arr[idx]
+        if w_arr is not None:
+            w_arr = w_arr[idx]
+    return X_np, y_arr, w_arr
+def permutation_importance(
+    predict_fn: Callable,
+    X,
+    y,
+    *,
+    sample_weight=None,
+    metric: str | Callable = "auto",
+    task_type: Optional[str] = None,
+    higher_is_better: Optional[bool] = None,
+    n_repeats: int = 5,
+    random_state: Optional[int] = None,
+    max_rows: Optional[int] = 5000,
+    features: Optional[Sequence[str]] = None,
+    return_scores: bool = False,
+    safe_copy: bool = False,
+    n_jobs: Optional[int] = None,
+) -> pd.DataFrame:
+    """Permutation importance on tabular data.
+    predict_fn should accept the same type as X (DataFrame or ndarray).
+    Set safe_copy=True if predict_fn mutates its input.
+    Set n_jobs to enable parallel processing across features (default: None = sequential).
+    """
+    rng = np.random.default_rng(random_state)
+    n_repeats = max(1, int(n_repeats))
+    X_data, y_arr, w_arr = _prepare_data(X, y, sample_weight, max_rows, rng)
+    metric_fn, higher_is_better, metric_name = resolve_metric(
+        metric, task_type=task_type, higher_is_better=higher_is_better
+    )
+    baseline_pred = predict_fn(X_data)
+    baseline_score = metric_fn(y_arr, baseline_pred, w_arr)
+    if isinstance(X_data, pd.DataFrame):
+        feature_names = list(X_data.columns)
+        if features is not None:
+            feature_names = [f for f in features if f in X_data.columns]
+        # Use parallel processing if n_jobs is specified
+        if n_jobs is not None and n_jobs != 1:
+            # Generate different random seeds for each feature to ensure reproducibility
+            seeds = [random_state + i if random_state is not None else None
+                     for i in range(len(feature_names))]
+            results = Parallel(n_jobs=n_jobs, prefer="threads")(
+                delayed(_compute_feature_importance)(
+                    feat, X_data, y_arr, w_arr, predict_fn, metric_fn,
+                    baseline_score, higher_is_better, n_repeats, seed,
+                    metric_name, return_scores, is_dataframe=True
+                )
+                for feat, seed in zip(feature_names, seeds)
+            )
+        else:
+            # Sequential processing (original optimized version)
+            X_perm = X_data if not safe_copy else X_data.copy()
+            results = []
+            for feat in feature_names:
+                # Store original values directly without extra copy
+                orig_values = X_perm[feat].to_numpy(copy=False)
+                orig_copy = orig_values.copy()  # Only copy the column, not the entire DataFrame
+                scores = []
+                for _ in range(n_repeats):
+                    X_perm[feat] = rng.permutation(orig_copy)
+                    pred = predict_fn(X_perm)
+                    score = metric_fn(y_arr, pred, w_arr)
+                    scores.append(float(score))
+                # Restore original column values
+                X_perm[feat] = orig_copy
+                scores_arr = np.asarray(scores, dtype=float)
+                if higher_is_better:
+                    delta = baseline_score - scores_arr
+                else:
+                    delta = scores_arr - baseline_score
+                entry = {
+                    "feature": feat,
+                    "importance_mean": float(np.mean(delta)),
+                    "importance_std": float(np.std(delta)),
+                    "baseline_score": float(baseline_score),
+                    "permutation_score_mean": float(np.mean(scores_arr)),
+                    "metric": metric_name,
+                }
+                if return_scores:
+                    entry["permutation_scores"] = scores
+                results.append(entry)
+    else:
+        if features is not None:
+            if len(features) != X_data.shape[1]:
+                raise ValueError("features length must match X columns for ndarray input.")
+            feature_names = list(features)
+        else:
+            feature_names = [f"x{i}" for i in range(X_data.shape[1])]
+        X_base = np.asarray(X_data)
+        # Use parallel processing if n_jobs is specified
+        if n_jobs is not None and n_jobs != 1:
+            seeds = [random_state + i if random_state is not None else None
+                     for i in range(len(feature_names))]
+            results = Parallel(n_jobs=n_jobs, prefer="threads")(
+                delayed(_compute_feature_importance)(
+                    feat, X_base, y_arr, w_arr, predict_fn, metric_fn,
+                    baseline_score, higher_is_better, n_repeats, seed,
+                    metric_name, return_scores, is_dataframe=False, feat_idx=idx
+                )
+                for idx, (feat, seed) in enumerate(zip(feature_names, seeds))
+            )
+        else:
+            # Sequential processing
+            X_perm = X_base.copy()
+            results = []
+            for idx, feat in enumerate(feature_names):
+                orig_col = X_base[:, idx].copy()
+                scores = []
+                for _ in range(n_repeats):
+                    X_perm[:, idx] = rng.permutation(orig_col)
+                    pred_input = X_perm.copy() if safe_copy else X_perm
+                    pred = predict_fn(pred_input)
+                    score = metric_fn(y_arr, pred, w_arr)
+                    scores.append(float(score))
+                X_perm[:, idx] = orig_col
+                scores_arr = np.asarray(scores, dtype=float)
+                if higher_is_better:
+                    delta = baseline_score - scores_arr
+                else:
+                    delta = scores_arr - baseline_score
+                entry = {
+                    "feature": feat,
+                    "importance_mean": float(np.mean(delta)),
+                    "importance_std": float(np.std(delta)),
+                    "baseline_score": float(baseline_score),
+                    "permutation_score_mean": float(np.mean(scores_arr)),
+                    "metric": metric_name,
+                }
+                if return_scores:
+                    entry["permutation_scores"] = scores
+                results.append(entry)
+    df = pd.DataFrame(results)
+    df = df.sort_values(by="importance_mean", ascending=False).reset_index(drop=True)
+    return df

ins_pricing/modelling/plotting/__init__.py CHANGED Viewed

@@ -1,45 +1,49 @@
-from __future__ import annotations
-from .common import EPS, PlotStyle
-from .curves import (
+from __future__ import annotations
+from ins_pricing.modelling.plotting.common import EPS, PlotStyle
+from ins_pricing.modelling.plotting.curves import (
     double_lift_table,
     lift_table,
-    plot_calibration_curve,
-    plot_conversion_lift,
-    plot_double_lift_curve,
-    plot_ks_curve,
-    plot_lift_curve,
+    plot_calibration_curve,
+    plot_conversion_lift,
+    plot_double_lift_curve,
+    plot_ks_curve,
+    plot_lift_curve,
     plot_pr_curves,
     plot_roc_curves,
 )
-from .diagnostics import plot_loss_curve, plot_oneway
-from .geo import (
-    plot_geo_contour,
-    plot_geo_contour_on_map,
-    plot_geo_heatmap,
-    plot_geo_heatmap_on_map,
-)
-from .importance import plot_feature_importance, plot_shap_importance, shap_importance
-__all__ = [
-    "EPS",
-    "PlotStyle",
-    "double_lift_table",
-    "lift_table",
-    "plot_calibration_curve",
-    "plot_conversion_lift",
-    "plot_double_lift_curve",
-    "plot_feature_importance",
-    "plot_geo_contour",
-    "plot_geo_contour_on_map",
-    "plot_geo_heatmap",
-    "plot_geo_heatmap_on_map",
-    "plot_ks_curve",
-    "plot_lift_curve",
-    "plot_loss_curve",
-    "plot_oneway",
-    "plot_pr_curves",
+from ins_pricing.modelling.plotting.compat import PlotUtils, plot_dlift_list, plot_lift_list
+from ins_pricing.modelling.plotting.diagnostics import plot_loss_curve, plot_oneway
+from ins_pricing.modelling.plotting.geo import (
+    plot_geo_contour,
+    plot_geo_contour_on_map,
+    plot_geo_heatmap,
+    plot_geo_heatmap_on_map,
+)
+from ins_pricing.modelling.plotting.importance import plot_feature_importance, plot_shap_importance, shap_importance
+__all__ = [
+    "EPS",
+    "PlotStyle",
+    "double_lift_table",
+    "lift_table",
+    "plot_calibration_curve",
+    "plot_conversion_lift",
+    "plot_double_lift_curve",
+    "plot_feature_importance",
+    "plot_geo_contour",
+    "plot_geo_contour_on_map",
+    "plot_geo_heatmap",
+    "plot_geo_heatmap_on_map",
+    "plot_ks_curve",
+    "plot_lift_curve",
+    "plot_loss_curve",
+    "plot_oneway",
+    "plot_pr_curves",
     "plot_roc_curves",
     "plot_shap_importance",
     "shap_importance",
+    "PlotUtils",
+    "plot_lift_list",
+    "plot_dlift_list",
 ]

ins-pricing 0.4.5__py3-none-any.whl → 0.5.1__py3-none-any.whl

ins-pricing 0.4.5py3-none-any.whl → 0.5.1py3-none-any.whl