PyPI - skfolio - Versions diffs - 0.6.0__py3-none-any.whl → 0.8.0__py3-none-any.whl - Mend

skfolio 0.6.0py3-none-any.whl → 0.8.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (118) hide show

skfolio/__init__.py +7 -7
skfolio/cluster/__init__.py +2 -2
skfolio/cluster/_hierarchical.py +2 -2
skfolio/datasets/__init__.py +3 -3
skfolio/datasets/_base.py +2 -2
skfolio/datasets/data/__init__.py +1 -0
skfolio/distance/__init__.py +4 -4
skfolio/distance/_base.py +2 -2
skfolio/distance/_distance.py +11 -10
skfolio/distribution/__init__.py +56 -0
skfolio/distribution/_base.py +203 -0
skfolio/distribution/copula/__init__.py +35 -0
skfolio/distribution/copula/_base.py +456 -0
skfolio/distribution/copula/_clayton.py +539 -0
skfolio/distribution/copula/_gaussian.py +407 -0
skfolio/distribution/copula/_gumbel.py +560 -0
skfolio/distribution/copula/_independent.py +196 -0
skfolio/distribution/copula/_joe.py +609 -0
skfolio/distribution/copula/_selection.py +111 -0
skfolio/distribution/copula/_student_t.py +486 -0
skfolio/distribution/copula/_utils.py +509 -0
skfolio/distribution/multivariate/__init__.py +11 -0
skfolio/distribution/multivariate/_base.py +241 -0
skfolio/distribution/multivariate/_utils.py +632 -0
skfolio/distribution/multivariate/_vine_copula.py +1254 -0
skfolio/distribution/univariate/__init__.py +19 -0
skfolio/distribution/univariate/_base.py +308 -0
skfolio/distribution/univariate/_gaussian.py +136 -0
skfolio/distribution/univariate/_johnson_su.py +152 -0
skfolio/distribution/univariate/_normal_inverse_gaussian.py +153 -0
skfolio/distribution/univariate/_selection.py +85 -0
skfolio/distribution/univariate/_student_t.py +144 -0
skfolio/exceptions.py +8 -8
skfolio/measures/__init__.py +24 -24
skfolio/measures/_enums.py +7 -7
skfolio/measures/_measures.py +4 -7
skfolio/metrics/__init__.py +2 -0
skfolio/metrics/_scorer.py +4 -4
skfolio/model_selection/__init__.py +4 -4
skfolio/model_selection/_combinatorial.py +15 -12
skfolio/model_selection/_validation.py +2 -2
skfolio/model_selection/_walk_forward.py +3 -3
skfolio/moments/__init__.py +11 -11
skfolio/moments/covariance/__init__.py +6 -6
skfolio/moments/covariance/_base.py +1 -1
skfolio/moments/covariance/_denoise_covariance.py +3 -2
skfolio/moments/covariance/_detone_covariance.py +3 -2
skfolio/moments/covariance/_empirical_covariance.py +3 -2
skfolio/moments/covariance/_ew_covariance.py +3 -2
skfolio/moments/covariance/_gerber_covariance.py +3 -2
skfolio/moments/covariance/_graphical_lasso_cv.py +1 -1
skfolio/moments/covariance/_implied_covariance.py +3 -8
skfolio/moments/covariance/_ledoit_wolf.py +1 -1
skfolio/moments/covariance/_oas.py +1 -1
skfolio/moments/covariance/_shrunk_covariance.py +1 -1
skfolio/moments/expected_returns/__init__.py +2 -2
skfolio/moments/expected_returns/_base.py +1 -1
skfolio/moments/expected_returns/_empirical_mu.py +3 -2
skfolio/moments/expected_returns/_equilibrium_mu.py +3 -2
skfolio/moments/expected_returns/_ew_mu.py +3 -2
skfolio/moments/expected_returns/_shrunk_mu.py +4 -3
skfolio/optimization/__init__.py +12 -10
skfolio/optimization/_base.py +2 -2
skfolio/optimization/cluster/__init__.py +3 -1
skfolio/optimization/cluster/_nco.py +10 -9
skfolio/optimization/cluster/hierarchical/__init__.py +3 -1
skfolio/optimization/cluster/hierarchical/_base.py +1 -2
skfolio/optimization/cluster/hierarchical/_herc.py +4 -3
skfolio/optimization/cluster/hierarchical/_hrp.py +4 -3
skfolio/optimization/convex/__init__.py +5 -3
skfolio/optimization/convex/_base.py +10 -9
skfolio/optimization/convex/_distributionally_robust.py +8 -5
skfolio/optimization/convex/_maximum_diversification.py +8 -6
skfolio/optimization/convex/_mean_risk.py +10 -8
skfolio/optimization/convex/_risk_budgeting.py +6 -4
skfolio/optimization/ensemble/__init__.py +2 -0
skfolio/optimization/ensemble/_base.py +2 -2
skfolio/optimization/ensemble/_stacking.py +3 -3
skfolio/optimization/naive/__init__.py +3 -1
skfolio/optimization/naive/_naive.py +4 -3
skfolio/population/__init__.py +2 -0
skfolio/population/_population.py +34 -7
skfolio/portfolio/__init__.py +1 -1
skfolio/portfolio/_base.py +43 -8
skfolio/portfolio/_multi_period_portfolio.py +3 -2
skfolio/portfolio/_portfolio.py +5 -4
skfolio/pre_selection/__init__.py +3 -1
skfolio/pre_selection/_drop_correlated.py +3 -3
skfolio/pre_selection/_select_complete.py +31 -30
skfolio/pre_selection/_select_k_extremes.py +3 -3
skfolio/pre_selection/_select_non_dominated.py +3 -3
skfolio/pre_selection/_select_non_expiring.py +8 -6
skfolio/preprocessing/__init__.py +2 -0
skfolio/preprocessing/_returns.py +2 -2
skfolio/prior/__init__.py +7 -3
skfolio/prior/_base.py +2 -2
skfolio/prior/_black_litterman.py +7 -4
skfolio/prior/_empirical.py +5 -2
skfolio/prior/_factor_model.py +10 -5
skfolio/prior/_synthetic_data.py +239 -0
skfolio/synthetic_returns/__init__.py +1 -0
skfolio/typing.py +7 -7
skfolio/uncertainty_set/__init__.py +7 -5
skfolio/uncertainty_set/_base.py +5 -4
skfolio/uncertainty_set/_bootstrap.py +1 -1
skfolio/uncertainty_set/_empirical.py +1 -1
skfolio/utils/__init__.py +1 -0
skfolio/utils/bootstrap.py +2 -2
skfolio/utils/equations.py +13 -10
skfolio/utils/sorting.py +2 -2
skfolio/utils/stats.py +15 -15
skfolio/utils/tools.py +86 -22
{skfolio-0.6.0.dist-info → skfolio-0.8.0.dist-info}/METADATA +122 -46
skfolio-0.8.0.dist-info/RECORD +120 -0
{skfolio-0.6.0.dist-info → skfolio-0.8.0.dist-info}/WHEEL +1 -1
skfolio-0.6.0.dist-info/RECORD +0 -95
{skfolio-0.6.0.dist-info → skfolio-0.8.0.dist-info/licenses}/LICENSE +0 -0
{skfolio-0.6.0.dist-info → skfolio-0.8.0.dist-info}/top_level.txt +0 -0

skfolio/__init__.py CHANGED Viewed

@@ -1,7 +1,7 @@
-"""skfolio package"""
+"""skfolio package."""
 # Author: Hugo Delatte <delatte.hugo@gmail.com>
-# License: BSD 3 clause
+# SPDX-License-Identifier: BSD-3-Clause
 import importlib.metadata
 from skfolio.measures import (
@@ -18,12 +18,12 @@ __version__ = importlib.metadata.version("skfolio")
 __all__ = [
     "BaseMeasure",
-    "PerfMeasure",
-    "RiskMeasure",
-    "ExtraRiskMeasure",
-    "RatioMeasure",
     "BasePortfolio",
-    "Portfolio",
+    "ExtraRiskMeasure",
     "MultiPeriodPortfolio",
+    "PerfMeasure",
     "Population",
+    "Portfolio",
+    "RatioMeasure",
+    "RiskMeasure",
 ]

skfolio/cluster/__init__.py CHANGED Viewed

@@ -1,8 +1,8 @@
 """Hierarchical Clustering estimators."""
 # Author: Hugo Delatte <delatte.hugo@gmail.com>
-# License: BSD 3 clause
+# SPDX-License-Identifier: BSD-3-Clause
 from skfolio.cluster._hierarchical import HierarchicalClustering, LinkageMethod
-__all__ = ["LinkageMethod", "HierarchicalClustering"]
+__all__ = ["HierarchicalClustering", "LinkageMethod"]

skfolio/cluster/_hierarchical.py CHANGED Viewed

@@ -2,7 +2,7 @@
 # Copyright (c) 2023
 # Author: Hugo Delatte <delatte.hugo@gmail.com>
-# License: BSD 3 clause
+# SPDX-License-Identifier: BSD-3-Clause
 from enum import auto
@@ -180,7 +180,7 @@ class HierarchicalClustering(skb.ClusterMixin, skb.BaseEstimator):
         self : HierarchicalClustering
             Fitted estimator.
         """
-        X = self._validate_data(X)
+        X = skv.validate_data(self, X)
         assert_is_distance(X)
         self.condensed_distance_ = scd.squareform(X, checks=False)
         self.linkage_matrix_ = sch.linkage(

skfolio/datasets/__init__.py CHANGED Viewed

@@ -1,7 +1,7 @@
 """Datasets module."""
 # Author: Hugo Delatte <delatte.hugo@gmail.com>
-# License: BSD 3 clause
+# SPDX-License-Identifier: BSD-3-Clause
 from skfolio.datasets._base import (
     load_factors_dataset,
@@ -13,10 +13,10 @@ from skfolio.datasets._base import (
 )
 __all__ = [
-    "load_nasdaq_dataset",
     "load_factors_dataset",
     "load_ftse100_dataset",
+    "load_nasdaq_dataset",
     "load_sp500_dataset",
-    "load_sp500_index",
     "load_sp500_implied_vol_dataset",
+    "load_sp500_index",
 ]

skfolio/datasets/_base.py CHANGED Viewed

@@ -2,7 +2,7 @@
 # Copyright (c) 2023
 # Author: Hugo Delatte <delatte.hugo@gmail.com>
-# License: BSD 3 clause
+# SPDX-License-Identifier: BSD-3-Clause
 # Implementation derived from:
 # scikit-portfolio, Copyright (c) 2022, Carlo Nicolini, Licensed under MIT Licence.
 # scikit-learn, Copyright (c) 2007-2010 David Cournapeau, Fabian Pedregosa, Olivier
@@ -74,7 +74,7 @@ def load_gzip_compressed_csv_data(
     encoding="utf-8",
     datetime_index: bool = True,
 ) -> pd.DataFrame:
-    """Loads gzip-compressed csv files with `importlib.resources`.
+    """Load gzip-compressed csv files with `importlib.resources`.
     1) Open resource file with `importlib.resources.open_binary`
     2) Decompress csv file with `gzip.open`

skfolio/datasets/data/__init__.py CHANGED Viewed

	@@ -0,0 +1 @@
1	+ """Dataset Data module."""

skfolio/distance/__init__.py CHANGED Viewed

@@ -1,7 +1,7 @@
 """Distance Estimators."""
 # Author: Hugo Delatte <delatte.hugo@gmail.com>
-# License: BSD 3 clause
+# SPDX-License-Identifier: BSD-3-Clause
 from skfolio.distance._base import BaseDistance
 from skfolio.distance._distance import (
@@ -16,11 +16,11 @@ from skfolio.distance._distance import (
 __all__ = [
     "BaseDistance",
-    "PearsonDistance",
-    "KendallDistance",
-    "SpearmanDistance",
     "CovarianceDistance",
     "DistanceCorrelation",
+    "KendallDistance",
     "MutualInformation",
     "NBinsMethod",
+    "PearsonDistance",
+    "SpearmanDistance",
 ]

skfolio/distance/_base.py CHANGED Viewed

@@ -1,8 +1,8 @@
-"""Base Distance Estimators"""
+"""Base Distance Estimators."""
 # Copyright (c) 2023
 # Author: Hugo Delatte <delatte.hugo@gmail.com>
-# License: BSD 3 clause
+# SPDX-License-Identifier: BSD-3-Clause
 from abc import ABC, abstractmethod

skfolio/distance/_distance.py CHANGED Viewed

@@ -1,8 +1,8 @@
-"""Distance Estimators"""
+"""Distance Estimators."""
 # Copyright (c) 2023
 # Author: Hugo Delatte <delatte.hugo@gmail.com>
-# License: BSD 3 clause
+# SPDX-License-Identifier: BSD-3-Clause
 import numpy as np
 import numpy.typing as npt
@@ -11,6 +11,7 @@ import scipy.spatial.distance as scd
 import scipy.stats as sct
 import sklearn.metrics as skmc
 import sklearn.utils.metadata_routing as skm
+import sklearn.utils.validation as skv
 from skfolio.distance._base import BaseDistance
 from skfolio.moments import BaseCovariance, GerberCovariance
@@ -85,7 +86,7 @@ class PearsonDistance(BaseDistance):
         self : PearsonDistance
             Fitted estimator.
         """
-        X = self._validate_data(X)
+        X = skv.validate_data(self, X)
         corr = np.corrcoef(X.T)
         self.codependence_, self.distance_ = _corr_to_distance(
             corr, absolute=self.absolute, power=self.power
@@ -157,7 +158,7 @@ class KendallDistance(BaseDistance):
         self : KendallDistance
             Fitted estimator.
         """
-        X = self._validate_data(X)
+        X = skv.validate_data(self, X)
         corr = pd.DataFrame(X).corr(method="kendall").to_numpy()
         self.codependence_, self.distance_ = _corr_to_distance(
             corr, absolute=self.absolute, power=self.power
@@ -214,7 +215,7 @@ class SpearmanDistance(BaseDistance):
         self.power = power
     def fit(self, X: npt.ArrayLike, y=None) -> "SpearmanDistance":
-        """Fit the Spearman Kendall estimator.
+        """Fit the Spearman estimator.
         Parameters
         ----------
@@ -229,7 +230,7 @@ class SpearmanDistance(BaseDistance):
         self : SpearmanDistance
             Fitted estimator.
         """
-        X = self._validate_data(X)
+        X = skv.validate_data(self, X)
         corr = pd.DataFrame(X).corr(method="spearman").to_numpy()
         self.codependence_, self.distance_ = _corr_to_distance(
             corr, absolute=self.absolute, power=self.power
@@ -337,7 +338,7 @@ class CovarianceDistance(BaseDistance):
         # we validate and convert to numpy after all models have been fitted to keep the
         # features names information.
-        _ = self._validate_data(X)
+        _ = skv.validate_data(self, X)
         corr, _ = cov_to_corr(self.covariance_estimator_.covariance_)
         self.codependence_, self.distance_ = _corr_to_distance(
@@ -383,7 +384,7 @@ class DistanceCorrelation(BaseDistance):
     @staticmethod
     def _dcorr(x: np.ndarray, y: np.ndarray):
-        """Calculate the distance correlation between two variables"""
+        """Calculate the distance correlation between two variables."""
         x = scd.squareform(scd.pdist(x.reshape(-1, 1)))
         y = scd.squareform(scd.pdist(y.reshape(-1, 1)))
         x = x - x.mean(axis=0)[np.newaxis, :] - x.mean(axis=1)[:, np.newaxis] + x.mean()
@@ -409,7 +410,7 @@ class DistanceCorrelation(BaseDistance):
         self : DistanceCorrelation
             Fitted estimator.
         """
-        X = self._validate_data(X)
+        X = skv.validate_data(self, X)
         n_assets = X.shape[1]
         corr = np.ones((n_assets, n_assets))
         # TODO: parallelize
@@ -502,7 +503,7 @@ class MutualInformation(BaseDistance):
         self : MutualInformation
             Fitted estimator.
         """
-        X = self._validate_data(X)
+        X = skv.validate_data(self, X)
         n_assets = X.shape[1]
         if self.n_bins is None:
             match self.n_bins_method:

skfolio/distribution/__init__.py ADDED Viewed

@@ -0,0 +1,56 @@
+"""Distribution module."""
+from skfolio.distribution._base import BaseDistribution, SelectionCriterion
+from skfolio.distribution.copula import (
+    BaseBivariateCopula,
+    ClaytonCopula,
+    CopulaRotation,
+    GaussianCopula,
+    GumbelCopula,
+    IndependentCopula,
+    JoeCopula,
+    StudentTCopula,
+    compute_pseudo_observations,
+    empirical_tail_concentration,
+    plot_tail_concentration,
+    select_bivariate_copula,
+)
+from skfolio.distribution.multivariate import (
+    BaseMultivariateDist,
+    DependenceMethod,
+    VineCopula,
+)
+from skfolio.distribution.univariate import (
+    BaseUnivariateDist,
+    Gaussian,
+    JohnsonSU,
+    NormalInverseGaussian,
+    StudentT,
+    select_univariate_dist,
+)
+__all__ = [
+    "BaseBivariateCopula",
+    "BaseDistribution",
+    "BaseMultivariateDist",
+    "BaseUnivariateDist",
+    "ClaytonCopula",
+    "CopulaRotation",
+    "DependenceMethod",
+    "Gaussian",
+    "GaussianCopula",
+    "GumbelCopula",
+    "IndependentCopula",
+    "JoeCopula",
+    "JohnsonSU",
+    "NormalInverseGaussian",
+    "SelectionCriterion",
+    "StudentT",
+    "StudentTCopula",
+    "VineCopula",
+    "compute_pseudo_observations",
+    "empirical_tail_concentration",
+    "plot_tail_concentration",
+    "select_bivariate_copula",
+    "select_univariate_dist",
+]

skfolio/distribution/_base.py ADDED Viewed

@@ -0,0 +1,203 @@
+"""Base Distribution Estimator."""
+# Copyright (c) 2025
+# Authors: The skfolio developers
+# Credits: Matteo Manzi, Vincent Maladière, Carlo Nicolini
+# SPDX-License-Identifier: BSD-3-Clause
+from abc import ABC, abstractmethod
+from enum import auto
+import numpy as np
+import numpy.typing as npt
+import sklearn.base as skb
+from skfolio.utils.tools import AutoEnum
+class SelectionCriterion(AutoEnum):
+    """Enum representing the selection criteria.
+    Attributes
+    ----------
+    AIC : str
+        Akaike Information Criterion (AIC)
+    BIC : str
+        Bayesian Information Criterion (BIC)
+    """
+    AIC = auto()
+    BIC = auto()
+class BaseDistribution(skb.BaseEstimator, ABC):
+    """Base Distribution Estimator.
+    This abstract class serves as a foundation for distribution models in skfolio.
+    random_state : int, RandomState instance or None, default=None
+        Seed or random state to ensure reproducibility.
+    """
+    def __init__(self, random_state: int | None = None):
+        self.random_state = random_state
+    @property
+    @abstractmethod
+    def n_params(self) -> int:
+        """Number of model parameters."""
+        pass
+    @property
+    @abstractmethod
+    def fitted_repr(self) -> str:
+        """String representation of the fitted model."""
+        pass
+    @abstractmethod
+    def fit(self, X: npt.ArrayLike, y=None) -> "BaseDistribution":
+        """Fit the univariate distribution model.
+        Parameters
+        ----------
+        X : array-like of shape (n_observations, n_features)
+            The input data.
+        y : None
+            Ignored. Provided for compatibility with scikit-learn's API.
+        Returns
+        -------
+        self : BaseDistribution
+            Returns the instance itself.
+        """
+        pass
+    @abstractmethod
+    def score_samples(self, X: npt.ArrayLike) -> np.ndarray:
+        """Compute the log-likelihood of each sample (log-pdf) under the model.
+        Parameters
+        ----------
+        X : array-like of shape (n_observations, n_features)
+            The input data.
+        Returns
+        -------
+        density : ndarray of shape (n_observations,)
+            Log-likelihood values for each observation in X.
+        """
+        pass
+    def sample(self, n_samples: int = 1):
+        """Generate random samples from the fitted model.
+        Parameters
+        ----------
+        n_samples : int, default=1
+            Number of samples to generate.
+        Returns
+        -------
+        X : array-like of shape (n_samples, 1)
+            List of samples.
+        """
+        pass
+    def score(self, X: npt.ArrayLike, y=None):
+        """Compute the total log-likelihood under the model.
+        Parameters
+        ----------
+        X : array-like of shape (n_observations, n_features)
+            An array of data points for which the total log-likelihood is computed.
+        y : None
+            Ignored. Provided for compatibility with scikit-learn's API.
+        Returns
+        -------
+        logprob : float
+            The total log-likelihood (sum of log-pdf values).
+        """
+        return np.sum(self.score_samples(X))
+    def aic(self, X: npt.ArrayLike) -> float:
+        r"""Compute the Akaike Information Criterion (AIC) for the model given data X.
+        The AIC is defined as:
+        .. math::
+            \mathrm{AIC} = -2 \, \log L \;+\; 2 k,
+        where
+        - :math:`\log L` is the total log-likelihood
+        - :math:`k` is the number of parameters in the model
+        A lower AIC value indicates a better trade-off between model fit and complexity.
+        Parameters
+        ----------
+        X : array-like of shape (n_observations, n_features)
+            The input data on which to compute the AIC.
+        Notes
+        -----
+        In practice, both AIC and BIC measure the trade-off between model fit and
+        complexity, but BIC tends to prefer simpler models for large :math:`n`
+        because of the :math:`\ln(n)` term.
+        Returns
+        -------
+        aic : float
+            The AIC of the fitted model on the given data.
+        References
+        ----------
+        .. [1] "A new look at the statistical model identification", Akaike (1974).
+        """
+        log_likelihood = self.score(X)
+        return 2 * (self.n_params - log_likelihood)
+    def bic(self, X: npt.ArrayLike) -> float:
+        r"""Compute the Bayesian Information Criterion (BIC) for the model given data X.
+        The BIC is defined as:
+        .. math::
+           \mathrm{BIC} = -2 \, \log L \;+\; k \,\ln(n),
+        where
+        - :math:`\log L` is the (maximized) total log-likelihood
+        - :math:`k` is the number of parameters in the model
+        - :math:`n` is the number of observations
+        A lower BIC value suggests a better fit while imposing a stronger penalty
+        for model complexity than the AIC.
+        Parameters
+        ----------
+        X : array-like of shape (n_observations, n_features)
+            The input data on which to compute the BIC.
+        Returns
+        -------
+        bic : float
+           The BIC of the fitted model on the given data.
+        Notes
+        -----
+        In practice, both AIC and BIC measure the trade-off between model fit and
+        complexity, but BIC tends to prefer simpler models for large :math:`n`
+        because of the :math:`\ln(n)` term.
+        References
+        ----------
+        .. [1]  "Estimating the dimension of a model", Schwarz, G. (1978).
+        """
+        log_likelihood = self.score(X)
+        n = X.shape[0]
+        return -2 * log_likelihood + self.n_params * np.log(n)

skfolio/distribution/copula/__init__.py ADDED Viewed

@@ -0,0 +1,35 @@
+"""Copula module."""
+from skfolio.distribution.copula._base import (
+    UNIFORM_MARGINAL_EPSILON,
+    BaseBivariateCopula,
+)
+from skfolio.distribution.copula._clayton import ClaytonCopula
+from skfolio.distribution.copula._gaussian import GaussianCopula
+from skfolio.distribution.copula._gumbel import GumbelCopula
+from skfolio.distribution.copula._independent import IndependentCopula
+from skfolio.distribution.copula._joe import JoeCopula
+from skfolio.distribution.copula._selection import select_bivariate_copula
+from skfolio.distribution.copula._student_t import StudentTCopula
+from skfolio.distribution.copula._utils import (
+    CopulaRotation,
+    compute_pseudo_observations,
+    empirical_tail_concentration,
+    plot_tail_concentration,
+)
+__all__ = [
+    "UNIFORM_MARGINAL_EPSILON",
+    "BaseBivariateCopula",
+    "ClaytonCopula",
+    "CopulaRotation",
+    "GaussianCopula",
+    "GumbelCopula",
+    "IndependentCopula",
+    "JoeCopula",
+    "StudentTCopula",
+    "compute_pseudo_observations",
+    "empirical_tail_concentration",
+    "plot_tail_concentration",
+    "select_bivariate_copula",
+]

skfolio 0.6.0__py3-none-any.whl → 0.8.0__py3-none-any.whl

skfolio 0.6.0py3-none-any.whl → 0.8.0py3-none-any.whl