PyPI - ins-pricing - Versions diffs - 0.4.5__py3-none-any.whl → 0.5.1__py3-none-any.whl - Mend

ins-pricing 0.4.5py3-none-any.whl → 0.5.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (93) hide show

ins_pricing/README.md +48 -22
ins_pricing/__init__.py +142 -90
ins_pricing/cli/BayesOpt_entry.py +58 -46
ins_pricing/cli/BayesOpt_incremental.py +77 -110
ins_pricing/cli/Explain_Run.py +42 -23
ins_pricing/cli/Explain_entry.py +551 -577
ins_pricing/cli/Pricing_Run.py +42 -23
ins_pricing/cli/bayesopt_entry_runner.py +51 -16
ins_pricing/cli/utils/bootstrap.py +23 -0
ins_pricing/cli/utils/cli_common.py +256 -256
ins_pricing/cli/utils/cli_config.py +379 -360
ins_pricing/cli/utils/import_resolver.py +375 -358
ins_pricing/cli/utils/notebook_utils.py +256 -242
ins_pricing/cli/watchdog_run.py +216 -198
ins_pricing/frontend/__init__.py +10 -10
ins_pricing/frontend/app.py +132 -61
ins_pricing/frontend/config_builder.py +33 -0
ins_pricing/frontend/example_config.json +11 -0
ins_pricing/frontend/example_workflows.py +1 -1
ins_pricing/frontend/runner.py +340 -388
ins_pricing/governance/__init__.py +20 -20
ins_pricing/governance/release.py +159 -159
ins_pricing/modelling/README.md +1 -1
ins_pricing/modelling/__init__.py +147 -92
ins_pricing/modelling/{core/bayesopt → bayesopt}/README.md +31 -13
ins_pricing/modelling/{core/bayesopt → bayesopt}/__init__.py +64 -102
ins_pricing/modelling/{core/bayesopt → bayesopt}/config_components.py +12 -0
ins_pricing/modelling/{core/bayesopt → bayesopt}/config_preprocess.py +589 -552
ins_pricing/modelling/{core/bayesopt → bayesopt}/core.py +987 -958
ins_pricing/modelling/{core/bayesopt → bayesopt}/model_explain_mixin.py +296 -296
ins_pricing/modelling/{core/bayesopt → bayesopt}/model_plotting_mixin.py +488 -548
ins_pricing/modelling/{core/bayesopt → bayesopt}/models/__init__.py +27 -27
ins_pricing/modelling/{core/bayesopt → bayesopt}/models/model_ft_components.py +349 -342
ins_pricing/modelling/{core/bayesopt → bayesopt}/models/model_ft_trainer.py +921 -913
ins_pricing/modelling/{core/bayesopt → bayesopt}/models/model_gnn.py +794 -785
ins_pricing/modelling/{core/bayesopt → bayesopt}/models/model_resn.py +454 -446
ins_pricing/modelling/bayesopt/trainers/__init__.py +19 -0
ins_pricing/modelling/{core/bayesopt → bayesopt}/trainers/trainer_base.py +1294 -1282
ins_pricing/modelling/{core/bayesopt → bayesopt}/trainers/trainer_ft.py +64 -56
ins_pricing/modelling/{core/bayesopt → bayesopt}/trainers/trainer_glm.py +203 -198
ins_pricing/modelling/{core/bayesopt → bayesopt}/trainers/trainer_gnn.py +333 -325
ins_pricing/modelling/{core/bayesopt → bayesopt}/trainers/trainer_resn.py +279 -267
ins_pricing/modelling/{core/bayesopt → bayesopt}/trainers/trainer_xgb.py +515 -313
ins_pricing/modelling/bayesopt/utils/__init__.py +67 -0
ins_pricing/modelling/bayesopt/utils/constants.py +21 -0
ins_pricing/modelling/{core/bayesopt → bayesopt}/utils/distributed_utils.py +193 -186
ins_pricing/modelling/bayesopt/utils/io_utils.py +7 -0
ins_pricing/modelling/bayesopt/utils/losses.py +27 -0
ins_pricing/modelling/bayesopt/utils/metrics_and_devices.py +17 -0
ins_pricing/modelling/{core/bayesopt → bayesopt}/utils/torch_trainer_mixin.py +636 -623
ins_pricing/modelling/{core/evaluation.py → evaluation.py} +113 -104
ins_pricing/modelling/explain/__init__.py +55 -55
ins_pricing/modelling/explain/metrics.py +27 -174
ins_pricing/modelling/explain/permutation.py +237 -237
ins_pricing/modelling/plotting/__init__.py +40 -36
ins_pricing/modelling/plotting/compat.py +228 -0
ins_pricing/modelling/plotting/curves.py +572 -572
ins_pricing/modelling/plotting/diagnostics.py +163 -163
ins_pricing/modelling/plotting/geo.py +362 -362
ins_pricing/modelling/plotting/importance.py +121 -121
ins_pricing/pricing/__init__.py +27 -27
ins_pricing/pricing/factors.py +67 -56
ins_pricing/production/__init__.py +35 -25
ins_pricing/production/{predict.py → inference.py} +140 -57
ins_pricing/production/monitoring.py +8 -21
ins_pricing/reporting/__init__.py +11 -11
ins_pricing/setup.py +1 -1
ins_pricing/tests/production/test_inference.py +90 -0
ins_pricing/utils/__init__.py +112 -78
ins_pricing/utils/device.py +258 -237
ins_pricing/utils/features.py +53 -0
ins_pricing/utils/io.py +72 -0
ins_pricing/utils/logging.py +34 -1
ins_pricing/{modelling/core/bayesopt/utils → utils}/losses.py +125 -129
ins_pricing/utils/metrics.py +158 -24
ins_pricing/utils/numerics.py +76 -0
ins_pricing/utils/paths.py +9 -1
ins_pricing/utils/profiling.py +8 -4
{ins_pricing-0.4.5.dist-info → ins_pricing-0.5.1.dist-info}/METADATA +1 -1
ins_pricing-0.5.1.dist-info/RECORD +132 -0
ins_pricing/modelling/core/BayesOpt.py +0 -146
ins_pricing/modelling/core/__init__.py +0 -1
ins_pricing/modelling/core/bayesopt/trainers/__init__.py +0 -19
ins_pricing/modelling/core/bayesopt/utils/__init__.py +0 -86
ins_pricing/modelling/core/bayesopt/utils/constants.py +0 -183
ins_pricing/modelling/core/bayesopt/utils/io_utils.py +0 -126
ins_pricing/modelling/core/bayesopt/utils/metrics_and_devices.py +0 -555
ins_pricing/modelling/core/bayesopt/utils.py +0 -105
ins_pricing/modelling/core/bayesopt/utils_backup.py +0 -1503
ins_pricing/tests/production/test_predict.py +0 -233
ins_pricing-0.4.5.dist-info/RECORD +0 -130
{ins_pricing-0.4.5.dist-info → ins_pricing-0.5.1.dist-info}/WHEEL +0 -0
{ins_pricing-0.4.5.dist-info → ins_pricing-0.5.1.dist-info}/top_level.txt +0 -0

ins_pricing/modelling/{core/bayesopt → bayesopt}/model_explain_mixin.py RENAMED Viewed

@@ -1,296 +1,296 @@
-from __future__ import annotations
-from typing import Any, Optional
-import numpy as np
-import pandas as pd
-import torch
-import statsmodels.api as sm
-try:
-    from ...explain import gradients as explain_gradients
-    from ...explain import permutation as explain_permutation
-    from ...explain import shap_utils as explain_shap
-except Exception:  # pragma: no cover - optional for legacy imports
-    try:  # best-effort for non-package imports
-        from ins_pricing.explain import gradients as explain_gradients
-        from ins_pricing.explain import permutation as explain_permutation
-        from ins_pricing.explain import shap_utils as explain_shap
-    except Exception:  # pragma: no cover
-        explain_gradients = None
-        explain_permutation = None
-        explain_shap = None
-class BayesOptExplainMixin:
-    def compute_permutation_importance(self,
-                                       model_key: str,
-                                       on_train: bool = True,
-                                       metric: Any = "auto",
-                                       n_repeats: int = 5,
-                                       max_rows: int = 5000,
-                                       random_state: Optional[int] = None):
-        if explain_permutation is None:
-            raise RuntimeError("explain.permutation is not available.")
-        model_key = str(model_key)
-        data = self.train_data if on_train else self.test_data
-        if self.resp_nme not in data.columns:
-            raise RuntimeError("Missing response column for permutation importance.")
-        y = data[self.resp_nme]
-        w = data[self.weight_nme] if self.weight_nme in data.columns else None
-        if model_key == "resn":
-            if self.resn_best is None:
-                raise RuntimeError("ResNet model not trained.")
-            X = self.train_oht_scl_data if on_train else self.test_oht_scl_data
-            if X is None:
-                raise RuntimeError("Missing standardized features for ResNet.")
-            X = X[self.var_nmes]
-            predict_fn = lambda df: self.resn_best.predict(df)
-        elif model_key == "ft":
-            if self.ft_best is None:
-                raise RuntimeError("FT model not trained.")
-            if str(self.config.ft_role) != "model":
-                raise RuntimeError("FT role is not 'model'; FT predictions unavailable.")
-            X = data[self.factor_nmes]
-            geo_tokens = self.train_geo_tokens if on_train else self.test_geo_tokens
-            geo_np = None
-            if geo_tokens is not None:
-                geo_np = geo_tokens.to_numpy(dtype=np.float32, copy=False)
-            predict_fn = lambda df, geo=geo_np: self.ft_best.predict(df, geo_tokens=geo)
-        elif model_key == "xgb":
-            if self.xgb_best is None:
-                raise RuntimeError("XGB model not trained.")
-            X = data[self.factor_nmes]
-            predict_fn = lambda df: self.xgb_best.predict(df)
-        else:
-            raise ValueError("Unsupported model_key for permutation importance.")
-        return explain_permutation.permutation_importance(
-            predict_fn,
-            X,
-            y,
-            sample_weight=w,
-            metric=metric,
-            task_type=self.task_type,
-            n_repeats=n_repeats,
-            random_state=random_state,
-            max_rows=max_rows,
-        )
-    # ========= Deep explainability: Integrated Gradients =========
-    def compute_integrated_gradients_resn(self,
-                                          on_train: bool = True,
-                                          baseline: Any = None,
-                                          steps: int = 50,
-                                          batch_size: int = 256,
-                                          target: Optional[int] = None):
-        if explain_gradients is None:
-            raise RuntimeError("explain.gradients is not available.")
-        if self.resn_best is None:
-            raise RuntimeError("ResNet model not trained.")
-        X = self.train_oht_scl_data if on_train else self.test_oht_scl_data
-        if X is None:
-            raise RuntimeError("Missing standardized features for ResNet.")
-        X = X[self.var_nmes]
-        return explain_gradients.resnet_integrated_gradients(
-            self.resn_best,
-            X,
-            baseline=baseline,
-            steps=steps,
-            batch_size=batch_size,
-            target=target,
-        )
-    def compute_integrated_gradients_ft(self,
-                                        on_train: bool = True,
-                                        geo_tokens: Optional[np.ndarray] = None,
-                                        baseline_num: Any = None,
-                                        baseline_geo: Any = None,
-                                        steps: int = 50,
-                                        batch_size: int = 256,
-                                        target: Optional[int] = None):
-        if explain_gradients is None:
-            raise RuntimeError("explain.gradients is not available.")
-        if self.ft_best is None:
-            raise RuntimeError("FT model not trained.")
-        if str(self.config.ft_role) != "model":
-            raise RuntimeError("FT role is not 'model'; FT explanations unavailable.")
-        data = self.train_data if on_train else self.test_data
-        X = data[self.factor_nmes]
-        if geo_tokens is None and getattr(self.ft_best, "num_geo", 0) > 0:
-            tokens_df = self.train_geo_tokens if on_train else self.test_geo_tokens
-            if tokens_df is not None:
-                geo_tokens = tokens_df.to_numpy(dtype=np.float32, copy=False)
-        return explain_gradients.ft_integrated_gradients(
-            self.ft_best,
-            X,
-            geo_tokens=geo_tokens,
-            baseline_num=baseline_num,
-            baseline_geo=baseline_geo,
-            steps=steps,
-            batch_size=batch_size,
-            target=target,
-        )
-    def _sample_rows(self, data: pd.DataFrame, n: int) -> pd.DataFrame:
-        if len(data) == 0:
-            return data
-        return data.sample(min(len(data), n), random_state=self.rand_seed)
-    @staticmethod
-    def _shap_nsamples(arr: np.ndarray, max_nsamples: int = 300) -> int:
-        min_needed = arr.shape[1] + 2
-        return max(min_needed, min(max_nsamples, arr.shape[0] * arr.shape[1]))
-    def _build_ft_shap_matrix(self, data: pd.DataFrame) -> np.ndarray:
-        matrices = []
-        for col in self.factor_nmes:
-            s = data[col]
-            if col in self.cate_list:
-                cats = pd.Categorical(
-                    s,
-                    categories=self.cat_categories_for_shap[col]
-                )
-                codes = np.asarray(cats.codes, dtype=np.float64).reshape(-1, 1)
-                matrices.append(codes)
-            else:
-                vals = pd.to_numeric(s, errors="coerce")
-                arr = vals.to_numpy(dtype=np.float64, copy=True).reshape(-1, 1)
-                matrices.append(arr)
-        X_mat = np.concatenate(matrices, axis=1)  # Result shape (N, F)
-        return X_mat
-    def _decode_ft_shap_matrix_to_df(self, X_mat: np.ndarray) -> pd.DataFrame:
-        data_dict = {}
-        for j, col in enumerate(self.factor_nmes):
-            col_vals = X_mat[:, j]
-            if col in self.cate_list:
-                cats = self.cat_categories_for_shap[col]
-                codes = np.round(col_vals).astype(int)
-                codes = np.clip(codes, -1, len(cats) - 1)
-                cat_series = pd.Categorical.from_codes(
-                    codes,
-                    categories=cats
-                )
-                data_dict[col] = cat_series
-            else:
-                data_dict[col] = col_vals.astype(float)
-        df = pd.DataFrame(data_dict, columns=self.factor_nmes)
-        for col in self.cate_list:
-            if col in df.columns:
-                df[col] = df[col].astype("category")
-        return df
-    def _build_glm_design(self, data: pd.DataFrame) -> pd.DataFrame:
-        X = data[self.var_nmes]
-        return sm.add_constant(X, has_constant='add')
-    def _compute_shap_core(self,
-                           model_key: str,
-                           n_background: int,
-                           n_samples: int,
-                           on_train: bool,
-                           X_df: pd.DataFrame,
-                           prep_fn,
-                           predict_fn,
-                           cleanup_fn=None):
-        if explain_shap is None:
-            raise RuntimeError("explain.shap_utils is not available.")
-        return explain_shap.compute_shap_core(
-            self,
-            model_key,
-            n_background,
-            n_samples,
-            on_train,
-            X_df=X_df,
-            prep_fn=prep_fn,
-            predict_fn=predict_fn,
-            cleanup_fn=cleanup_fn,
-        )
-    # ========= GLM SHAP explainability =========
-    def compute_shap_glm(self, n_background: int = 500,
-                         n_samples: int = 200,
-                         on_train: bool = True):
-        if explain_shap is None:
-            raise RuntimeError("explain.shap_utils is not available.")
-        self.shap_glm = explain_shap.compute_shap_glm(
-            self,
-            n_background=n_background,
-            n_samples=n_samples,
-            on_train=on_train,
-        )
-        return self.shap_glm
-    # ========= XGBoost SHAP explainability =========
-    def compute_shap_xgb(self, n_background: int = 500,
-                         n_samples: int = 200,
-                         on_train: bool = True):
-        if explain_shap is None:
-            raise RuntimeError("explain.shap_utils is not available.")
-        self.shap_xgb = explain_shap.compute_shap_xgb(
-            self,
-            n_background=n_background,
-            n_samples=n_samples,
-            on_train=on_train,
-        )
-        return self.shap_xgb
-    # ========= ResNet SHAP explainability =========
-    def _resn_predict_wrapper(self, X_np):
-        model = self.resn_best.resnet.to("cpu")
-        with torch.no_grad():
-            X_tensor = torch.tensor(X_np, dtype=torch.float32)
-            y_pred = model(X_tensor).cpu().numpy()
-        y_pred = np.clip(y_pred, 1e-6, None)
-        return y_pred.reshape(-1)
-    def compute_shap_resn(self, n_background: int = 500,
-                          n_samples: int = 200,
-                          on_train: bool = True):
-        if explain_shap is None:
-            raise RuntimeError("explain.shap_utils is not available.")
-        self.shap_resn = explain_shap.compute_shap_resn(
-            self,
-            n_background=n_background,
-            n_samples=n_samples,
-            on_train=on_train,
-        )
-        return self.shap_resn
-    # ========= FT-Transformer SHAP explainability =========
-    def _ft_shap_predict_wrapper(self, X_mat: np.ndarray) -> np.ndarray:
-        df_input = self._decode_ft_shap_matrix_to_df(X_mat)
-        y_pred = self.ft_best.predict(df_input)
-        return np.asarray(y_pred, dtype=np.float64).reshape(-1)
-    def compute_shap_ft(self, n_background: int = 500,
-                        n_samples: int = 200,
-                        on_train: bool = True):
-        if explain_shap is None:
-            raise RuntimeError("explain.shap_utils is not available.")
-        self.shap_ft = explain_shap.compute_shap_ft(
-            self,
-            n_background=n_background,
-            n_samples=n_samples,
-            on_train=on_train,
-        )
-        return self.shap_ft
+from __future__ import annotations
+from typing import Any, Optional
+import numpy as np
+import pandas as pd
+import torch
+import statsmodels.api as sm
+try:
+    from ins_pricing.modelling.explain import gradients as explain_gradients
+    from ins_pricing.modelling.explain import permutation as explain_permutation
+    from ins_pricing.modelling.explain import shap_utils as explain_shap
+except Exception:  # pragma: no cover - optional for legacy imports
+    try:  # best-effort for non-package imports
+        from ins_pricing.explain import gradients as explain_gradients
+        from ins_pricing.explain import permutation as explain_permutation
+        from ins_pricing.explain import shap_utils as explain_shap
+    except Exception:  # pragma: no cover
+        explain_gradients = None
+        explain_permutation = None
+        explain_shap = None
+class BayesOptExplainMixin:
+    def compute_permutation_importance(self,
+                                       model_key: str,
+                                       on_train: bool = True,
+                                       metric: Any = "auto",
+                                       n_repeats: int = 5,
+                                       max_rows: int = 5000,
+                                       random_state: Optional[int] = None):
+        if explain_permutation is None:
+            raise RuntimeError("explain.permutation is not available.")
+        model_key = str(model_key)
+        data = self.train_data if on_train else self.test_data
+        if self.resp_nme not in data.columns:
+            raise RuntimeError("Missing response column for permutation importance.")
+        y = data[self.resp_nme]
+        w = data[self.weight_nme] if self.weight_nme in data.columns else None
+        if model_key == "resn":
+            if self.resn_best is None:
+                raise RuntimeError("ResNet model not trained.")
+            X = self.train_oht_scl_data if on_train else self.test_oht_scl_data
+            if X is None:
+                raise RuntimeError("Missing standardized features for ResNet.")
+            X = X[self.var_nmes]
+            predict_fn = lambda df: self.resn_best.predict(df)
+        elif model_key == "ft":
+            if self.ft_best is None:
+                raise RuntimeError("FT model not trained.")
+            if str(self.config.ft_role) != "model":
+                raise RuntimeError("FT role is not 'model'; FT predictions unavailable.")
+            X = data[self.factor_nmes]
+            geo_tokens = self.train_geo_tokens if on_train else self.test_geo_tokens
+            geo_np = None
+            if geo_tokens is not None:
+                geo_np = geo_tokens.to_numpy(dtype=np.float32, copy=False)
+            predict_fn = lambda df, geo=geo_np: self.ft_best.predict(df, geo_tokens=geo)
+        elif model_key == "xgb":
+            if self.xgb_best is None:
+                raise RuntimeError("XGB model not trained.")
+            X = data[self.factor_nmes]
+            predict_fn = lambda df: self.xgb_best.predict(df)
+        else:
+            raise ValueError("Unsupported model_key for permutation importance.")
+        return explain_permutation.permutation_importance(
+            predict_fn,
+            X,
+            y,
+            sample_weight=w,
+            metric=metric,
+            task_type=self.task_type,
+            n_repeats=n_repeats,
+            random_state=random_state,
+            max_rows=max_rows,
+        )
+    # ========= Deep explainability: Integrated Gradients =========
+    def compute_integrated_gradients_resn(self,
+                                          on_train: bool = True,
+                                          baseline: Any = None,
+                                          steps: int = 50,
+                                          batch_size: int = 256,
+                                          target: Optional[int] = None):
+        if explain_gradients is None:
+            raise RuntimeError("explain.gradients is not available.")
+        if self.resn_best is None:
+            raise RuntimeError("ResNet model not trained.")
+        X = self.train_oht_scl_data if on_train else self.test_oht_scl_data
+        if X is None:
+            raise RuntimeError("Missing standardized features for ResNet.")
+        X = X[self.var_nmes]
+        return explain_gradients.resnet_integrated_gradients(
+            self.resn_best,
+            X,
+            baseline=baseline,
+            steps=steps,
+            batch_size=batch_size,
+            target=target,
+        )
+    def compute_integrated_gradients_ft(self,
+                                        on_train: bool = True,
+                                        geo_tokens: Optional[np.ndarray] = None,
+                                        baseline_num: Any = None,
+                                        baseline_geo: Any = None,
+                                        steps: int = 50,
+                                        batch_size: int = 256,
+                                        target: Optional[int] = None):
+        if explain_gradients is None:
+            raise RuntimeError("explain.gradients is not available.")
+        if self.ft_best is None:
+            raise RuntimeError("FT model not trained.")
+        if str(self.config.ft_role) != "model":
+            raise RuntimeError("FT role is not 'model'; FT explanations unavailable.")
+        data = self.train_data if on_train else self.test_data
+        X = data[self.factor_nmes]
+        if geo_tokens is None and getattr(self.ft_best, "num_geo", 0) > 0:
+            tokens_df = self.train_geo_tokens if on_train else self.test_geo_tokens
+            if tokens_df is not None:
+                geo_tokens = tokens_df.to_numpy(dtype=np.float32, copy=False)
+        return explain_gradients.ft_integrated_gradients(
+            self.ft_best,
+            X,
+            geo_tokens=geo_tokens,
+            baseline_num=baseline_num,
+            baseline_geo=baseline_geo,
+            steps=steps,
+            batch_size=batch_size,
+            target=target,
+        )
+    def _sample_rows(self, data: pd.DataFrame, n: int) -> pd.DataFrame:
+        if len(data) == 0:
+            return data
+        return data.sample(min(len(data), n), random_state=self.rand_seed)
+    @staticmethod
+    def _shap_nsamples(arr: np.ndarray, max_nsamples: int = 300) -> int:
+        min_needed = arr.shape[1] + 2
+        return max(min_needed, min(max_nsamples, arr.shape[0] * arr.shape[1]))
+    def _build_ft_shap_matrix(self, data: pd.DataFrame) -> np.ndarray:
+        matrices = []
+        for col in self.factor_nmes:
+            s = data[col]
+            if col in self.cate_list:
+                cats = pd.Categorical(
+                    s,
+                    categories=self.cat_categories_for_shap[col]
+                )
+                codes = np.asarray(cats.codes, dtype=np.float64).reshape(-1, 1)
+                matrices.append(codes)
+            else:
+                vals = pd.to_numeric(s, errors="coerce")
+                arr = vals.to_numpy(dtype=np.float64, copy=True).reshape(-1, 1)
+                matrices.append(arr)
+        X_mat = np.concatenate(matrices, axis=1)  # Result shape (N, F)
+        return X_mat
+    def _decode_ft_shap_matrix_to_df(self, X_mat: np.ndarray) -> pd.DataFrame:
+        data_dict = {}
+        for j, col in enumerate(self.factor_nmes):
+            col_vals = X_mat[:, j]
+            if col in self.cate_list:
+                cats = self.cat_categories_for_shap[col]
+                codes = np.round(col_vals).astype(int)
+                codes = np.clip(codes, -1, len(cats) - 1)
+                cat_series = pd.Categorical.from_codes(
+                    codes,
+                    categories=cats
+                )
+                data_dict[col] = cat_series
+            else:
+                data_dict[col] = col_vals.astype(float)
+        df = pd.DataFrame(data_dict, columns=self.factor_nmes)
+        for col in self.cate_list:
+            if col in df.columns:
+                df[col] = df[col].astype("category")
+        return df
+    def _build_glm_design(self, data: pd.DataFrame) -> pd.DataFrame:
+        X = data[self.var_nmes]
+        return sm.add_constant(X, has_constant='add')
+    def _compute_shap_core(self,
+                           model_key: str,
+                           n_background: int,
+                           n_samples: int,
+                           on_train: bool,
+                           X_df: pd.DataFrame,
+                           prep_fn,
+                           predict_fn,
+                           cleanup_fn=None):
+        if explain_shap is None:
+            raise RuntimeError("explain.shap_utils is not available.")
+        return explain_shap.compute_shap_core(
+            self,
+            model_key,
+            n_background,
+            n_samples,
+            on_train,
+            X_df=X_df,
+            prep_fn=prep_fn,
+            predict_fn=predict_fn,
+            cleanup_fn=cleanup_fn,
+        )
+    # ========= GLM SHAP explainability =========
+    def compute_shap_glm(self, n_background: int = 500,
+                         n_samples: int = 200,
+                         on_train: bool = True):
+        if explain_shap is None:
+            raise RuntimeError("explain.shap_utils is not available.")
+        self.shap_glm = explain_shap.compute_shap_glm(
+            self,
+            n_background=n_background,
+            n_samples=n_samples,
+            on_train=on_train,
+        )
+        return self.shap_glm
+    # ========= XGBoost SHAP explainability =========
+    def compute_shap_xgb(self, n_background: int = 500,
+                         n_samples: int = 200,
+                         on_train: bool = True):
+        if explain_shap is None:
+            raise RuntimeError("explain.shap_utils is not available.")
+        self.shap_xgb = explain_shap.compute_shap_xgb(
+            self,
+            n_background=n_background,
+            n_samples=n_samples,
+            on_train=on_train,
+        )
+        return self.shap_xgb
+    # ========= ResNet SHAP explainability =========
+    def _resn_predict_wrapper(self, X_np):
+        model = self.resn_best.resnet.to("cpu")
+        with torch.no_grad():
+            X_tensor = torch.tensor(X_np, dtype=torch.float32)
+            y_pred = model(X_tensor).cpu().numpy()
+        y_pred = np.clip(y_pred, 1e-6, None)
+        return y_pred.reshape(-1)
+    def compute_shap_resn(self, n_background: int = 500,
+                          n_samples: int = 200,
+                          on_train: bool = True):
+        if explain_shap is None:
+            raise RuntimeError("explain.shap_utils is not available.")
+        self.shap_resn = explain_shap.compute_shap_resn(
+            self,
+            n_background=n_background,
+            n_samples=n_samples,
+            on_train=on_train,
+        )
+        return self.shap_resn
+    # ========= FT-Transformer SHAP explainability =========
+    def _ft_shap_predict_wrapper(self, X_mat: np.ndarray) -> np.ndarray:
+        df_input = self._decode_ft_shap_matrix_to_df(X_mat)
+        y_pred = self.ft_best.predict(df_input)
+        return np.asarray(y_pred, dtype=np.float64).reshape(-1)
+    def compute_shap_ft(self, n_background: int = 500,
+                        n_samples: int = 200,
+                        on_train: bool = True):
+        if explain_shap is None:
+            raise RuntimeError("explain.shap_utils is not available.")
+        self.shap_ft = explain_shap.compute_shap_ft(
+            self,
+            n_background=n_background,
+            n_samples=n_samples,
+            on_train=on_train,
+        )
+        return self.shap_ft

ins-pricing 0.4.5__py3-none-any.whl → 0.5.1__py3-none-any.whl

ins-pricing 0.4.5py3-none-any.whl → 0.5.1py3-none-any.whl