PyPI - wavetrainer - Versions diffs - 0.1.7__tar.gz → 0.1.9__tar.gz - Mend

wavetrainer 0.1.7tar.gz → 0.1.9tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (68) hide show

{wavetrainer-0.1.7/wavetrainer.egg-info → wavetrainer-0.1.9}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: wavetrainer
-Version: 0.1.7
+Version: 0.1.9
 Summary: A library for automatically finding the optimal model within feature and hyperparameter space.
 Home-page: https://github.com/8W9aG/wavetrainer
 Author: Will Sackfield
@@ -28,6 +28,7 @@ Requires-Dist: xgboost>=3.0.0
 Requires-Dist: jax>=0.6.1
 Requires-Dist: tabpfn_extensions>=0.0.4
 Requires-Dist: hyperopt>=0.2.7
+Requires-Dist: pycaleva>=0.8.2
 # wavetrainer
@@ -62,6 +63,7 @@ Python 3.11.6:
 - [jax](https://github.com/jax-ml/jax)
 - [tabpfn_extensions](https://github.com/PriorLabs/tabpfn-extensions)
 - [hyperopt](https://github.com/hyperopt/hyperopt)
+- [pycaleva](https://github.com/MartinWeigl/pycaleva)
 ## Raison D'être :thought_balloon:

{wavetrainer-0.1.7 → wavetrainer-0.1.9}/README.md RENAMED Viewed

@@ -31,6 +31,7 @@ Python 3.11.6:
 - [jax](https://github.com/jax-ml/jax)
 - [tabpfn_extensions](https://github.com/PriorLabs/tabpfn-extensions)
 - [hyperopt](https://github.com/hyperopt/hyperopt)
+- [pycaleva](https://github.com/MartinWeigl/pycaleva)
 ## Raison D'être :thought_balloon:

wavetrainer-0.1.7/wavetrainer.egg-info/requires.txt → wavetrainer-0.1.9/requirements.txt RENAMED Viewed

@@ -15,3 +15,4 @@ xgboost>=3.0.0
 jax>=0.6.1
 tabpfn_extensions>=0.0.4
 hyperopt>=0.2.7
+pycaleva>=0.8.2

{wavetrainer-0.1.7 → wavetrainer-0.1.9}/setup.py RENAMED Viewed

@@ -23,7 +23,7 @@ def install_requires() -> typing.List[str]:
 setup(
     name='wavetrainer',
-    version='0.1.7',
+    version='0.1.9',
     description='A library for automatically finding the optimal model within feature and hyperparameter space.',
     long_description=long_description,
     long_description_content_type='text/markdown',

{wavetrainer-0.1.7 → wavetrainer-0.1.9}/wavetrainer/__init__.py RENAMED Viewed

@@ -2,5 +2,5 @@
 from .create import create
-__VERSION__ = "0.1.7"
+__VERSION__ = "0.1.9"
 __all__ = ("create",)

{wavetrainer-0.1.7 → wavetrainer-0.1.9}/wavetrainer/calibrator/calibrator_router.py RENAMED Viewed

@@ -5,10 +5,12 @@ import logging
 import os
 from typing import Self
+import numpy as np
 import optuna
 import pandas as pd
+from pycaleva import CalibrationEvaluator  # type: ignore
-from ..model.model import Model
+from ..model.model import PROBABILITY_COLUMN_PREFIX, Model
 from ..model_type import ModelType, determine_model_type
 from .calibrator import Calibrator
 from .vennabers_calibrator import VennabersCalibrator
@@ -26,10 +28,12 @@ class CalibratorRouter(Calibrator):
     # pylint: disable=too-many-positional-arguments,too-many-arguments
     _calibrator: Calibrator | None
+    _ce: CalibrationEvaluator | None
     def __init__(self, model: Model):
         super().__init__(model)
         self._calibrator = None
+        self._ce = None
     @classmethod
     def name(cls) -> str:
@@ -75,6 +79,14 @@ class CalibratorRouter(Calibrator):
                 },
                 handle,
             )
+        ce = self._ce
+        if ce is not None:
+            try:
+                ce.calibration_report(
+                    os.path.join(folder, "calibration.pdf"), "binary-classifier"
+                )
+            except ValueError as exc:
+                logging.warning(str(exc))
     def fit(
         self,
@@ -94,6 +106,25 @@ class CalibratorRouter(Calibrator):
             calibrator = VennabersCalibrator(self._model)
         calibrator.fit(df, y=y, w=w)
         self._calibrator = calibrator
+        pred_prob = calibrator.transform(df)
+        pred_prob = pred_prob.drop(
+            columns=[
+                x
+                for x in pred_prob.columns.values.tolist()
+                if not x.startswith(PROBABILITY_COLUMN_PREFIX)
+            ],
+            errors="ignore",
+        )
+        ce = CalibrationEvaluator(
+            y.to_numpy(),
+            np.max(pred_prob.to_numpy(), axis=1),
+            outsample=True,
+            n_groups="auto",
+        )
+        print(f"Hosmer Lemeshow: {ce.hosmerlemeshow()}")
+        self._ce = ce
         return self
     def transform(self, df: pd.DataFrame) -> pd.DataFrame:

{wavetrainer-0.1.7 → wavetrainer-0.1.9}/wavetrainer/create.py RENAMED Viewed

@@ -16,6 +16,7 @@ def create(
     max_train_timeout: datetime.timedelta | None = None,
     cutoff_dt: datetime.datetime | None = None,
     embedding_cols: list[list[str]] | None = None,
+    allowed_models: set[str] | None = None,
 ) -> Trainer:
     """Create a trainer."""
     return Trainer(
@@ -27,4 +28,5 @@ def create(
         max_train_timeout=max_train_timeout,
         cutoff_dt=cutoff_dt,
         embedding_cols=embedding_cols,
+        allowed_models=allowed_models,
     )

{wavetrainer-0.1.7 → wavetrainer-0.1.9}/wavetrainer/model/model_router.py RENAMED Viewed

@@ -33,10 +33,13 @@ class ModelRouter(Model):
     _model: Model | None
     _false_positive_reduction_steps: int | None
-    def __init__(self) -> None:
+    def __init__(self, allowed_models: set[str] | None) -> None:
         super().__init__()
         self._model = None
         self._false_positive_reduction_steps = None
+        self._allowed_models = (
+            allowed_models if allowed_models is not None else set(_MODELS.keys())
+        )
     @classmethod
     def name(cls) -> str:
@@ -91,7 +94,12 @@ class ModelRouter(Model):
             _FALSE_POSITIVE_REDUCTION_STEPS_KEY, 0, 5
         )
         model_name = trial.suggest_categorical(
-            "model", [k for k, v in _MODELS.items() if v.supports_x(df)]
+            "model",
+            [
+                k
+                for k, v in _MODELS.items()
+                if v.supports_x(df) and k in self._allowed_models
+            ],
         )
         print(f"Using {model_name} model")
         model = _MODELS[model_name]()

{wavetrainer-0.1.7 → wavetrainer-0.1.9}/wavetrainer/trainer.py RENAMED Viewed

@@ -64,6 +64,7 @@ class Trainer(Fit):
         max_train_timeout: datetime.timedelta | None = None,
         cutoff_dt: datetime.datetime | None = None,
         embedding_cols: list[list[str]] | None = None,
+        allowed_models: set[str] | None = None,
     ):
         tqdm.tqdm.pandas()
@@ -155,6 +156,7 @@ class Trainer(Fit):
         self._max_train_timeout = max_train_timeout
         self._cutoff_dt = cutoff_dt
         self.embedding_cols = embedding_cols
+        self._allowed_models = allowed_models
     def _provide_study(self, column: str) -> optuna.Study:
         storage_name = f"sqlite:///{self._folder}/{column}/{_STUDYDB_FILENAME}"
@@ -265,7 +267,7 @@ class Trainer(Fit):
                     print(f"Row weights took {time.time() - start_row_weights}")
                     # Create model
-                    model = ModelRouter()
+                    model = ModelRouter(self._allowed_models)
                     model.set_options(trial, x)
                     # Train
@@ -517,7 +519,7 @@ class Trainer(Fit):
                 reducer = CombinedReducer(self.embedding_cols)
                 reducer.load(folder)
-                model = ModelRouter()
+                model = ModelRouter(None)
                 model.load(folder)
                 selector = Selector(model)
@@ -570,7 +572,7 @@ class Trainer(Fit):
                 if not os.path.isdir(date_path):
                     continue
                 try:
-                    model = ModelRouter()
+                    model = ModelRouter(None)
                     model.load(date_path)
                     feature_importances[date_str] = model.feature_importances
                 except FileNotFoundError as exc:

{wavetrainer-0.1.7 → wavetrainer-0.1.9/wavetrainer.egg-info}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: wavetrainer
-Version: 0.1.7
+Version: 0.1.9
 Summary: A library for automatically finding the optimal model within feature and hyperparameter space.
 Home-page: https://github.com/8W9aG/wavetrainer
 Author: Will Sackfield
@@ -28,6 +28,7 @@ Requires-Dist: xgboost>=3.0.0
 Requires-Dist: jax>=0.6.1
 Requires-Dist: tabpfn_extensions>=0.0.4
 Requires-Dist: hyperopt>=0.2.7
+Requires-Dist: pycaleva>=0.8.2
 # wavetrainer
@@ -62,6 +63,7 @@ Python 3.11.6:
 - [jax](https://github.com/jax-ml/jax)
 - [tabpfn_extensions](https://github.com/PriorLabs/tabpfn-extensions)
 - [hyperopt](https://github.com/hyperopt/hyperopt)
+- [pycaleva](https://github.com/MartinWeigl/pycaleva)
 ## Raison D'être :thought_balloon: