PyPI - ml4t-diagnostic - Versions diffs - 0.1.0a1__py3-none-any.whl - Mend

ml4t-diagnostic 0.1.0a1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

ml4t/diagnostic/AGENT.md +25 -0
ml4t/diagnostic/__init__.py +166 -0
ml4t/diagnostic/backends/__init__.py +10 -0
ml4t/diagnostic/backends/adapter.py +192 -0
ml4t/diagnostic/backends/polars_backend.py +899 -0
ml4t/diagnostic/caching/__init__.py +40 -0
ml4t/diagnostic/caching/cache.py +331 -0
ml4t/diagnostic/caching/decorators.py +131 -0
ml4t/diagnostic/caching/smart_cache.py +339 -0
ml4t/diagnostic/config/AGENT.md +24 -0
ml4t/diagnostic/config/README.md +267 -0
ml4t/diagnostic/config/__init__.py +219 -0
ml4t/diagnostic/config/barrier_config.py +277 -0
ml4t/diagnostic/config/base.py +301 -0
ml4t/diagnostic/config/event_config.py +148 -0
ml4t/diagnostic/config/feature_config.py +404 -0
ml4t/diagnostic/config/multi_signal_config.py +55 -0
ml4t/diagnostic/config/portfolio_config.py +215 -0
ml4t/diagnostic/config/report_config.py +391 -0
ml4t/diagnostic/config/sharpe_config.py +202 -0
ml4t/diagnostic/config/signal_config.py +206 -0
ml4t/diagnostic/config/trade_analysis_config.py +310 -0
ml4t/diagnostic/config/validation.py +279 -0
ml4t/diagnostic/core/__init__.py +29 -0
ml4t/diagnostic/core/numba_utils.py +315 -0
ml4t/diagnostic/core/purging.py +372 -0
ml4t/diagnostic/core/sampling.py +471 -0
ml4t/diagnostic/errors/__init__.py +205 -0
ml4t/diagnostic/evaluation/AGENT.md +26 -0
ml4t/diagnostic/evaluation/__init__.py +437 -0
ml4t/diagnostic/evaluation/autocorrelation.py +531 -0
ml4t/diagnostic/evaluation/barrier_analysis.py +1050 -0
ml4t/diagnostic/evaluation/binary_metrics.py +910 -0
ml4t/diagnostic/evaluation/dashboard.py +715 -0
ml4t/diagnostic/evaluation/diagnostic_plots.py +1037 -0
ml4t/diagnostic/evaluation/distribution/__init__.py +499 -0
ml4t/diagnostic/evaluation/distribution/moments.py +299 -0
ml4t/diagnostic/evaluation/distribution/tails.py +777 -0
ml4t/diagnostic/evaluation/distribution/tests.py +470 -0
ml4t/diagnostic/evaluation/drift/__init__.py +139 -0
ml4t/diagnostic/evaluation/drift/analysis.py +432 -0
ml4t/diagnostic/evaluation/drift/domain_classifier.py +517 -0
ml4t/diagnostic/evaluation/drift/population_stability_index.py +310 -0
ml4t/diagnostic/evaluation/drift/wasserstein.py +388 -0
ml4t/diagnostic/evaluation/event_analysis.py +647 -0
ml4t/diagnostic/evaluation/excursion.py +390 -0
ml4t/diagnostic/evaluation/feature_diagnostics.py +873 -0
ml4t/diagnostic/evaluation/feature_outcome.py +666 -0
ml4t/diagnostic/evaluation/framework.py +935 -0
ml4t/diagnostic/evaluation/metric_registry.py +255 -0
ml4t/diagnostic/evaluation/metrics/AGENT.md +23 -0
ml4t/diagnostic/evaluation/metrics/__init__.py +133 -0
ml4t/diagnostic/evaluation/metrics/basic.py +160 -0
ml4t/diagnostic/evaluation/metrics/conditional_ic.py +469 -0
ml4t/diagnostic/evaluation/metrics/feature_outcome.py +475 -0
ml4t/diagnostic/evaluation/metrics/ic_statistics.py +446 -0
ml4t/diagnostic/evaluation/metrics/importance_analysis.py +338 -0
ml4t/diagnostic/evaluation/metrics/importance_classical.py +375 -0
ml4t/diagnostic/evaluation/metrics/importance_mda.py +371 -0
ml4t/diagnostic/evaluation/metrics/importance_shap.py +715 -0
ml4t/diagnostic/evaluation/metrics/information_coefficient.py +527 -0
ml4t/diagnostic/evaluation/metrics/interactions.py +772 -0
ml4t/diagnostic/evaluation/metrics/monotonicity.py +226 -0
ml4t/diagnostic/evaluation/metrics/risk_adjusted.py +324 -0
ml4t/diagnostic/evaluation/multi_signal.py +550 -0
ml4t/diagnostic/evaluation/portfolio_analysis/__init__.py +83 -0
ml4t/diagnostic/evaluation/portfolio_analysis/analysis.py +734 -0
ml4t/diagnostic/evaluation/portfolio_analysis/metrics.py +589 -0
ml4t/diagnostic/evaluation/portfolio_analysis/results.py +334 -0
ml4t/diagnostic/evaluation/report_generation.py +824 -0
ml4t/diagnostic/evaluation/signal_selector.py +452 -0
ml4t/diagnostic/evaluation/stat_registry.py +139 -0
ml4t/diagnostic/evaluation/stationarity/__init__.py +97 -0
ml4t/diagnostic/evaluation/stationarity/analysis.py +518 -0
ml4t/diagnostic/evaluation/stationarity/augmented_dickey_fuller.py +296 -0
ml4t/diagnostic/evaluation/stationarity/kpss_test.py +308 -0
ml4t/diagnostic/evaluation/stationarity/phillips_perron.py +365 -0
ml4t/diagnostic/evaluation/stats/AGENT.md +43 -0
ml4t/diagnostic/evaluation/stats/__init__.py +191 -0
ml4t/diagnostic/evaluation/stats/backtest_overfitting.py +219 -0
ml4t/diagnostic/evaluation/stats/bootstrap.py +228 -0
ml4t/diagnostic/evaluation/stats/deflated_sharpe_ratio.py +591 -0
ml4t/diagnostic/evaluation/stats/false_discovery_rate.py +295 -0
ml4t/diagnostic/evaluation/stats/hac_standard_errors.py +108 -0
ml4t/diagnostic/evaluation/stats/minimum_track_record.py +408 -0
ml4t/diagnostic/evaluation/stats/moments.py +164 -0
ml4t/diagnostic/evaluation/stats/rademacher_adjustment.py +436 -0
ml4t/diagnostic/evaluation/stats/reality_check.py +155 -0
ml4t/diagnostic/evaluation/stats/sharpe_inference.py +219 -0
ml4t/diagnostic/evaluation/themes.py +330 -0
ml4t/diagnostic/evaluation/threshold_analysis.py +957 -0
ml4t/diagnostic/evaluation/trade_analysis.py +1136 -0
ml4t/diagnostic/evaluation/trade_dashboard/__init__.py +32 -0
ml4t/diagnostic/evaluation/trade_dashboard/app.py +315 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/__init__.py +18 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/csv.py +82 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/html.py +276 -0
ml4t/diagnostic/evaluation/trade_dashboard/io.py +166 -0
ml4t/diagnostic/evaluation/trade_dashboard/normalize.py +304 -0
ml4t/diagnostic/evaluation/trade_dashboard/stats.py +386 -0
ml4t/diagnostic/evaluation/trade_dashboard/style.py +79 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/__init__.py +21 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/patterns.py +354 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/shap_analysis.py +280 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/stat_validation.py +186 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/worst_trades.py +236 -0
ml4t/diagnostic/evaluation/trade_dashboard/types.py +129 -0
ml4t/diagnostic/evaluation/trade_shap/__init__.py +102 -0
ml4t/diagnostic/evaluation/trade_shap/alignment.py +188 -0
ml4t/diagnostic/evaluation/trade_shap/characterize.py +413 -0
ml4t/diagnostic/evaluation/trade_shap/cluster.py +302 -0
ml4t/diagnostic/evaluation/trade_shap/explain.py +208 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/__init__.py +23 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/generator.py +290 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/matcher.py +251 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/templates.yaml +467 -0
ml4t/diagnostic/evaluation/trade_shap/models.py +386 -0
ml4t/diagnostic/evaluation/trade_shap/normalize.py +116 -0
ml4t/diagnostic/evaluation/trade_shap/pipeline.py +263 -0
ml4t/diagnostic/evaluation/trade_shap_dashboard.py +283 -0
ml4t/diagnostic/evaluation/trade_shap_diagnostics.py +588 -0
ml4t/diagnostic/evaluation/validated_cv.py +535 -0
ml4t/diagnostic/evaluation/visualization.py +1050 -0
ml4t/diagnostic/evaluation/volatility/__init__.py +45 -0
ml4t/diagnostic/evaluation/volatility/analysis.py +351 -0
ml4t/diagnostic/evaluation/volatility/arch.py +258 -0
ml4t/diagnostic/evaluation/volatility/garch.py +460 -0
ml4t/diagnostic/integration/__init__.py +48 -0
ml4t/diagnostic/integration/backtest_contract.py +671 -0
ml4t/diagnostic/integration/data_contract.py +316 -0
ml4t/diagnostic/integration/engineer_contract.py +226 -0
ml4t/diagnostic/logging/__init__.py +77 -0
ml4t/diagnostic/logging/logger.py +245 -0
ml4t/diagnostic/logging/performance.py +234 -0
ml4t/diagnostic/logging/progress.py +234 -0
ml4t/diagnostic/logging/wandb.py +412 -0
ml4t/diagnostic/metrics/__init__.py +9 -0
ml4t/diagnostic/metrics/percentiles.py +128 -0
ml4t/diagnostic/py.typed +1 -0
ml4t/diagnostic/reporting/__init__.py +43 -0
ml4t/diagnostic/reporting/base.py +130 -0
ml4t/diagnostic/reporting/html_renderer.py +275 -0
ml4t/diagnostic/reporting/json_renderer.py +51 -0
ml4t/diagnostic/reporting/markdown_renderer.py +117 -0
ml4t/diagnostic/results/AGENT.md +24 -0
ml4t/diagnostic/results/__init__.py +105 -0
ml4t/diagnostic/results/barrier_results/__init__.py +36 -0
ml4t/diagnostic/results/barrier_results/hit_rate.py +304 -0
ml4t/diagnostic/results/barrier_results/precision_recall.py +266 -0
ml4t/diagnostic/results/barrier_results/profit_factor.py +297 -0
ml4t/diagnostic/results/barrier_results/tearsheet.py +397 -0
ml4t/diagnostic/results/barrier_results/time_to_target.py +305 -0
ml4t/diagnostic/results/barrier_results/validation.py +38 -0
ml4t/diagnostic/results/base.py +177 -0
ml4t/diagnostic/results/event_results.py +349 -0
ml4t/diagnostic/results/feature_results.py +787 -0
ml4t/diagnostic/results/multi_signal_results.py +431 -0
ml4t/diagnostic/results/portfolio_results.py +281 -0
ml4t/diagnostic/results/sharpe_results.py +448 -0
ml4t/diagnostic/results/signal_results/__init__.py +74 -0
ml4t/diagnostic/results/signal_results/ic.py +581 -0
ml4t/diagnostic/results/signal_results/irtc.py +110 -0
ml4t/diagnostic/results/signal_results/quantile.py +392 -0
ml4t/diagnostic/results/signal_results/tearsheet.py +456 -0
ml4t/diagnostic/results/signal_results/turnover.py +213 -0
ml4t/diagnostic/results/signal_results/validation.py +147 -0
ml4t/diagnostic/signal/AGENT.md +17 -0
ml4t/diagnostic/signal/__init__.py +69 -0
ml4t/diagnostic/signal/_report.py +152 -0
ml4t/diagnostic/signal/_utils.py +261 -0
ml4t/diagnostic/signal/core.py +275 -0
ml4t/diagnostic/signal/quantile.py +148 -0
ml4t/diagnostic/signal/result.py +214 -0
ml4t/diagnostic/signal/signal_ic.py +129 -0
ml4t/diagnostic/signal/turnover.py +182 -0
ml4t/diagnostic/splitters/AGENT.md +19 -0
ml4t/diagnostic/splitters/__init__.py +36 -0
ml4t/diagnostic/splitters/base.py +501 -0
ml4t/diagnostic/splitters/calendar.py +421 -0
ml4t/diagnostic/splitters/calendar_config.py +91 -0
ml4t/diagnostic/splitters/combinatorial.py +1064 -0
ml4t/diagnostic/splitters/config.py +322 -0
ml4t/diagnostic/splitters/cpcv/__init__.py +57 -0
ml4t/diagnostic/splitters/cpcv/combinations.py +119 -0
ml4t/diagnostic/splitters/cpcv/partitioning.py +263 -0
ml4t/diagnostic/splitters/cpcv/purge_engine.py +379 -0
ml4t/diagnostic/splitters/cpcv/windows.py +190 -0
ml4t/diagnostic/splitters/group_isolation.py +329 -0
ml4t/diagnostic/splitters/persistence.py +316 -0
ml4t/diagnostic/splitters/utils.py +207 -0
ml4t/diagnostic/splitters/walk_forward.py +757 -0
ml4t/diagnostic/utils/__init__.py +42 -0
ml4t/diagnostic/utils/config.py +542 -0
ml4t/diagnostic/utils/dependencies.py +318 -0
ml4t/diagnostic/utils/sessions.py +127 -0
ml4t/diagnostic/validation/__init__.py +54 -0
ml4t/diagnostic/validation/dataframe.py +274 -0
ml4t/diagnostic/validation/returns.py +280 -0
ml4t/diagnostic/validation/timeseries.py +299 -0
ml4t/diagnostic/visualization/AGENT.md +19 -0
ml4t/diagnostic/visualization/__init__.py +223 -0
ml4t/diagnostic/visualization/backtest/__init__.py +98 -0
ml4t/diagnostic/visualization/backtest/cost_attribution.py +762 -0
ml4t/diagnostic/visualization/backtest/executive_summary.py +895 -0
ml4t/diagnostic/visualization/backtest/interactive_controls.py +673 -0
ml4t/diagnostic/visualization/backtest/statistical_validity.py +874 -0
ml4t/diagnostic/visualization/backtest/tearsheet.py +565 -0
ml4t/diagnostic/visualization/backtest/template_system.py +373 -0
ml4t/diagnostic/visualization/backtest/trade_plots.py +1172 -0
ml4t/diagnostic/visualization/barrier_plots.py +782 -0
ml4t/diagnostic/visualization/core.py +1060 -0
ml4t/diagnostic/visualization/dashboards/__init__.py +36 -0
ml4t/diagnostic/visualization/dashboards/base.py +582 -0
ml4t/diagnostic/visualization/dashboards/importance.py +801 -0
ml4t/diagnostic/visualization/dashboards/interaction.py +263 -0
ml4t/diagnostic/visualization/dashboards.py +43 -0
ml4t/diagnostic/visualization/data_extraction/__init__.py +48 -0
ml4t/diagnostic/visualization/data_extraction/importance.py +649 -0
ml4t/diagnostic/visualization/data_extraction/interaction.py +504 -0
ml4t/diagnostic/visualization/data_extraction/types.py +113 -0
ml4t/diagnostic/visualization/data_extraction/validation.py +66 -0
ml4t/diagnostic/visualization/feature_plots.py +888 -0
ml4t/diagnostic/visualization/interaction_plots.py +618 -0
ml4t/diagnostic/visualization/portfolio/__init__.py +41 -0
ml4t/diagnostic/visualization/portfolio/dashboard.py +514 -0
ml4t/diagnostic/visualization/portfolio/drawdown_plots.py +341 -0
ml4t/diagnostic/visualization/portfolio/returns_plots.py +487 -0
ml4t/diagnostic/visualization/portfolio/risk_plots.py +301 -0
ml4t/diagnostic/visualization/report_generation.py +1343 -0
ml4t/diagnostic/visualization/signal/__init__.py +103 -0
ml4t/diagnostic/visualization/signal/dashboard.py +911 -0
ml4t/diagnostic/visualization/signal/event_plots.py +514 -0
ml4t/diagnostic/visualization/signal/ic_plots.py +635 -0
ml4t/diagnostic/visualization/signal/multi_signal_dashboard.py +974 -0
ml4t/diagnostic/visualization/signal/multi_signal_plots.py +603 -0
ml4t/diagnostic/visualization/signal/quantile_plots.py +625 -0
ml4t/diagnostic/visualization/signal/turnover_plots.py +400 -0
ml4t/diagnostic/visualization/trade_shap/__init__.py +90 -0
ml4t_diagnostic-0.1.0a1.dist-info/METADATA +1044 -0
ml4t_diagnostic-0.1.0a1.dist-info/RECORD +242 -0
ml4t_diagnostic-0.1.0a1.dist-info/WHEEL +4 -0
ml4t_diagnostic-0.1.0a1.dist-info/licenses/LICENSE +21 -0

ml4t/diagnostic/evaluation/stats/minimum_track_record.py ADDED Viewed

@@ -0,0 +1,408 @@
+"""Minimum Track Record Length (MinTRL) calculation.
+MinTRL is the minimum number of observations required to reject the null
+hypothesis (SR ≤ target) at the specified confidence level.
+References
+----------
+López de Prado, M., Lipton, A., & Zoonekynd, V. (2025).
+"How to Use the Sharpe Ratio." ADIA Lab Research Paper Series, No. 19.
+Equation 11, page 9.
+"""
+from __future__ import annotations
+import math
+from dataclasses import dataclass
+from typing import Literal
+import numpy as np
+from numpy.typing import ArrayLike
+from scipy.stats import norm
+from ml4t.diagnostic.evaluation.stats.moments import compute_return_statistics
+from ml4t.diagnostic.evaluation.stats.sharpe_inference import compute_expected_max_sharpe
+# Type alias
+Frequency = Literal["daily", "weekly", "monthly"]
+# Default trading periods per year
+DEFAULT_PERIODS_PER_YEAR: dict[str, int] = {
+    "daily": 252,
+    "weekly": 52,
+    "monthly": 12,
+}
+@dataclass
+class MinTRLResult:
+    """Result of Minimum Track Record Length calculation.
+    Attributes
+    ----------
+    min_trl : float
+        Minimum observations needed to reject null at specified confidence.
+        Can be math.inf if observed SR <= target SR.
+    min_trl_years : float
+        Minimum track record in calendar years. Can be math.inf.
+    current_samples : int
+        Current number of observations.
+    has_adequate_sample : bool
+        Whether current_samples >= min_trl.
+    deficit : float
+        Additional observations needed (0 if adequate). Can be math.inf.
+    deficit_years : float
+        Additional years needed (0 if adequate). Can be math.inf.
+    observed_sharpe : float
+        The observed Sharpe ratio used in calculation.
+    target_sharpe : float
+        The target Sharpe ratio (null hypothesis).
+    confidence_level : float
+        Confidence level for the test (e.g., 0.95).
+    skewness : float
+        Skewness of returns (0 for normal).
+    excess_kurtosis : float
+        Excess kurtosis of returns (Fisher convention: 0 for normal).
+    autocorrelation : float
+        Lag-1 autocorrelation of returns.
+    frequency : str
+        Return frequency ('daily', 'weekly', etc.).
+    periods_per_year : int
+        Periods per year for annualization.
+    """
+    min_trl: float
+    min_trl_years: float
+    current_samples: int
+    has_adequate_sample: bool
+    deficit: float
+    deficit_years: float
+    # Parameters used
+    observed_sharpe: float
+    target_sharpe: float
+    confidence_level: float
+    skewness: float
+    excess_kurtosis: float
+    autocorrelation: float
+    frequency: str
+    periods_per_year: int
+    def interpret(self) -> str:
+        """Generate human-readable interpretation."""
+        if math.isinf(self.min_trl):
+            return (
+                f"Minimum Track Record Length (MinTRL)\n"
+                f"  Observed Sharpe: {self.observed_sharpe:.4f}\n"
+                f"  Target Sharpe: {self.target_sharpe:.4f}\n"
+                f"  Confidence: {self.confidence_level:.0%}\n"
+                f"\n"
+                f"  MinTRL: INFINITE (observed SR <= target SR)\n"
+                f"  Status: Cannot reject null hypothesis at any sample size"
+            )
+        if self.has_adequate_sample:
+            status = f"ADEQUATE: {self.current_samples} >= {int(self.min_trl)} observations"
+        else:
+            status = (
+                f"INSUFFICIENT: Need {int(self.deficit)} more observations "
+                f"({self.deficit_years:.1f} more years)"
+            )
+        return (
+            f"Minimum Track Record Length (MinTRL)\n"
+            f"  Observed Sharpe: {self.observed_sharpe:.4f}\n"
+            f"  Target Sharpe: {self.target_sharpe:.4f}\n"
+            f"  Confidence: {self.confidence_level:.0%}\n"
+            f"\n"
+            f"  MinTRL: {int(self.min_trl)} observations ({self.min_trl_years:.1f} years)\n"
+            f"  Current: {self.current_samples} observations\n"
+            f"  Status: {status}"
+        )
+def _compute_min_trl_core(
+    observed_sharpe: float,
+    target_sharpe: float,
+    confidence_level: float,
+    skewness: float,
+    kurtosis: float,
+    autocorrelation: float,
+) -> float:
+    """Core MinTRL formula (internal).
+    Parameters
+    ----------
+    observed_sharpe : float
+        Observed Sharpe ratio at native frequency
+    target_sharpe : float
+        Null hypothesis threshold (SR₀)
+    confidence_level : float
+        Required confidence level (e.g., 0.95)
+    skewness : float
+        Return skewness (γ₃)
+    kurtosis : float
+        Return kurtosis (γ₄), Pearson convention (normal = 3)
+    autocorrelation : float
+        First-order autocorrelation (ρ)
+    Returns
+    -------
+    float
+        Minimum number of observations. Returns math.inf if
+        observed SR <= target SR.
+    """
+    rho = autocorrelation
+    sr_diff = observed_sharpe - target_sharpe
+    # If observed SR <= target SR, MinTRL is infinite
+    if sr_diff <= 1e-10:
+        return float("inf")
+    # z-score for confidence level
+    z_alpha = norm.ppf(confidence_level)
+    # Coefficients (same as variance formula)
+    coef_a = 1.0
+    if rho != 0 and abs(rho) < 1:
+        coef_b = rho / (1 - rho)
+        coef_c = rho**2 / (1 - rho**2)
+    else:
+        coef_b = 0.0
+        coef_c = 0.0
+    a = coef_a + 2 * coef_b
+    b = coef_a + coef_b + coef_c
+    c = coef_a + 2 * coef_c
+    # Variance term (without 1/T factor)
+    var_term = a - b * skewness * target_sharpe + c * (kurtosis - 1) / 4 * target_sharpe**2
+    # MinTRL formula (Equation 11)
+    try:
+        min_trl = var_term * (z_alpha / sr_diff) ** 2
+        if np.isinf(min_trl):
+            return float("inf")
+        return float(np.ceil(max(min_trl, 1)))
+    except (OverflowError, FloatingPointError):
+        return float("inf")
+def compute_min_trl(
+    returns: ArrayLike | None = None,
+    observed_sharpe: float | None = None,
+    target_sharpe: float = 0.0,
+    confidence_level: float = 0.95,
+    frequency: Frequency = "daily",
+    periods_per_year: int | None = None,
+    *,
+    skewness: float | None = None,
+    excess_kurtosis: float | None = None,
+    autocorrelation: float | None = None,
+) -> MinTRLResult:
+    """Compute Minimum Track Record Length (MinTRL).
+    MinTRL is the minimum number of observations required to reject the null
+    hypothesis (SR <= target) at the specified confidence level.
+    Parameters
+    ----------
+    returns : array-like, optional
+        Return series. If provided, statistics are computed from it.
+    observed_sharpe : float, optional
+        Observed Sharpe ratio. Required if returns not provided.
+    target_sharpe : float, default 0.0
+        Null hypothesis threshold (SR₀).
+    confidence_level : float, default 0.95
+        Required confidence level (1 - α).
+    frequency : {"daily", "weekly", "monthly"}, default "daily"
+        Return frequency.
+    periods_per_year : int, optional
+        Periods per year (for converting to calendar time).
+    skewness : float, optional
+        Override computed skewness.
+    excess_kurtosis : float, optional
+        Override computed excess kurtosis (Fisher convention, normal=0).
+    autocorrelation : float, optional
+        Override computed autocorrelation.
+    Returns
+    -------
+    MinTRLResult
+        Results including min_trl, min_trl_years, and adequacy assessment.
+        min_trl can be math.inf if observed SR <= target SR.
+    Examples
+    --------
+    From returns:
+    >>> result = compute_min_trl(daily_returns, frequency="daily")
+    >>> print(f"Need {result.min_trl_years:.1f} years of data")
+    From statistics:
+    >>> result = compute_min_trl(
+    ...     observed_sharpe=0.5,
+    ...     target_sharpe=0.0,
+    ...     confidence_level=0.95,
+    ...     skewness=-1.0,
+    ...     excess_kurtosis=2.0,
+    ...     autocorrelation=0.1,
+    ... )
+    """
+    # Resolve periods per year
+    if periods_per_year is None:
+        periods_per_year = DEFAULT_PERIODS_PER_YEAR[frequency]
+    # Get statistics from returns or use provided values
+    if returns is not None:
+        ret_arr = np.asarray(returns).flatten()
+        ret_arr = ret_arr[~np.isnan(ret_arr)]
+        obs_sr, comp_skew, comp_kurt, comp_rho, n_samples = compute_return_statistics(ret_arr)
+        if observed_sharpe is None:
+            observed_sharpe = obs_sr
+    else:
+        if observed_sharpe is None:
+            raise ValueError("Either returns or observed_sharpe must be provided")
+        n_samples = 0  # Unknown
+        comp_skew = 0.0
+        comp_kurt = 3.0  # Pearson
+        comp_rho = 0.0
+    # Use provided or computed statistics
+    skew = skewness if skewness is not None else comp_skew
+    if excess_kurtosis is not None:
+        kurt = excess_kurtosis + 3.0  # Fisher -> Pearson
+    else:
+        kurt = comp_kurt
+    rho = autocorrelation if autocorrelation is not None else comp_rho
+    # Compute MinTRL
+    min_trl = _compute_min_trl_core(
+        observed_sharpe=observed_sharpe,
+        target_sharpe=target_sharpe,
+        confidence_level=confidence_level,
+        skewness=skew,
+        kurtosis=kurt,
+        autocorrelation=rho,
+    )
+    is_inf = math.isinf(min_trl)
+    min_trl_years = float("inf") if is_inf else min_trl / periods_per_year
+    has_adequate = False if is_inf or n_samples == 0 else n_samples >= min_trl
+    deficit = (
+        float("inf") if is_inf else max(0.0, min_trl - n_samples) if n_samples > 0 else min_trl
+    )
+    deficit_years = float("inf") if is_inf else deficit / periods_per_year
+    return MinTRLResult(
+        min_trl=min_trl,
+        min_trl_years=float(min_trl_years),
+        current_samples=n_samples,
+        has_adequate_sample=has_adequate,
+        deficit=deficit,
+        deficit_years=float(deficit_years),
+        observed_sharpe=float(observed_sharpe),
+        target_sharpe=target_sharpe,
+        confidence_level=confidence_level,
+        skewness=float(skew),
+        excess_kurtosis=float(kurt - 3.0),
+        autocorrelation=float(rho),
+        frequency=frequency,
+        periods_per_year=periods_per_year,
+    )
+def min_trl_fwer(
+    observed_sharpe: float,
+    n_trials: int,
+    variance_trials: float,
+    target_sharpe: float = 0.0,
+    confidence_level: float = 0.95,
+    frequency: Frequency = "daily",
+    periods_per_year: int | None = None,
+    *,
+    skewness: float = 0.0,
+    excess_kurtosis: float = 0.0,
+    autocorrelation: float = 0.0,
+) -> MinTRLResult:
+    """Compute MinTRL under FWER multiple testing adjustment.
+    When selecting the best strategy from K trials, the MinTRL must be adjusted
+    to account for the selection bias.
+    Parameters
+    ----------
+    observed_sharpe : float
+        Observed Sharpe ratio of the best strategy.
+    n_trials : int
+        Number of strategies tested (K).
+    variance_trials : float
+        Cross-sectional variance of Sharpe ratios.
+    target_sharpe : float, default 0.0
+        Original null hypothesis threshold.
+    confidence_level : float, default 0.95
+        Required confidence level.
+    frequency : {"daily", "weekly", "monthly"}, default "daily"
+        Return frequency.
+    periods_per_year : int, optional
+        Periods per year.
+    skewness : float, default 0.0
+        Return skewness.
+    excess_kurtosis : float, default 0.0
+        Return excess kurtosis (Fisher, normal=0).
+    autocorrelation : float, default 0.0
+        Return autocorrelation.
+    Returns
+    -------
+    MinTRLResult
+        Results with min_trl adjusted for multiple testing.
+    """
+    if periods_per_year is None:
+        periods_per_year = DEFAULT_PERIODS_PER_YEAR[frequency]
+    kurtosis = excess_kurtosis + 3.0
+    # Compute expected max Sharpe (selection bias adjustment)
+    expected_max = compute_expected_max_sharpe(n_trials, variance_trials)
+    adjusted_target = target_sharpe + expected_max
+    # Compute MinTRL with adjusted target
+    min_trl = _compute_min_trl_core(
+        observed_sharpe=observed_sharpe,
+        target_sharpe=adjusted_target,
+        confidence_level=confidence_level,
+        skewness=skewness,
+        kurtosis=kurtosis,
+        autocorrelation=autocorrelation,
+    )
+    is_inf = math.isinf(min_trl)
+    min_trl_years = float("inf") if is_inf else min_trl / periods_per_year
+    return MinTRLResult(
+        min_trl=min_trl,
+        min_trl_years=float(min_trl_years),
+        current_samples=0,
+        has_adequate_sample=False,
+        deficit=min_trl,
+        deficit_years=float(min_trl_years),
+        observed_sharpe=float(observed_sharpe),
+        target_sharpe=float(adjusted_target),
+        confidence_level=confidence_level,
+        skewness=float(skewness),
+        excess_kurtosis=float(excess_kurtosis),
+        autocorrelation=float(autocorrelation),
+        frequency=frequency,
+        periods_per_year=periods_per_year,
+    )
+__all__ = [
+    "MinTRLResult",
+    "compute_min_trl",
+    "min_trl_fwer",
+    "DEFAULT_PERIODS_PER_YEAR",
+]

ml4t/diagnostic/evaluation/stats/moments.py ADDED Viewed

@@ -0,0 +1,164 @@
+"""Return statistics computation for Sharpe ratio analysis.
+This module provides functions for computing the statistical moments
+needed for Sharpe ratio inference: mean, std, skewness, kurtosis,
+and autocorrelation.
+These are the building blocks for DSR/PSR calculations.
+"""
+from __future__ import annotations
+import numpy as np
+from numpy.typing import ArrayLike
+def compute_return_statistics(
+    returns: ArrayLike,
+) -> tuple[float, float, float, float, int]:
+    """Compute Sharpe ratio and distribution statistics from returns.
+    Parameters
+    ----------
+    returns : array-like
+        Array of returns (not prices). NaN values are removed.
+    Returns
+    -------
+    tuple of (sharpe, skewness, kurtosis, autocorrelation, n_samples)
+        - sharpe: Sharpe ratio (mean/std) at native frequency
+        - skewness: Fisher's skewness (γ₃)
+        - kurtosis: Pearson kurtosis (γ₄), normal = 3
+        - autocorrelation: Lag-1 autocorrelation (ρ)
+        - n_samples: Number of valid observations
+    Raises
+    ------
+    ValueError
+        If fewer than 2 observations or zero variance.
+    Notes
+    -----
+    Kurtosis is returned in Pearson convention (normal=3) for internal use.
+    Convert to Fisher (normal=0) for public API: excess_kurtosis = kurtosis - 3.
+    """
+    returns = np.asarray(returns).flatten()
+    returns = returns[~np.isnan(returns)]
+    n = len(returns)
+    if n < 2:
+        raise ValueError("Need at least 2 return observations")
+    mean = np.mean(returns)
+    std = np.std(returns, ddof=1)
+    if std == 0:
+        raise ValueError("Return series has zero variance")
+    sharpe = mean / std
+    # Skewness (γ₃) - Fisher's definition
+    skewness = float(((returns - mean) ** 3).mean() / std**3)
+    # Kurtosis (γ₄) - Pearson (normal = 3)
+    kurtosis = float(((returns - mean) ** 4).mean() / std**4)
+    # First-order autocorrelation (ρ)
+    if n > 2:
+        autocorr = np.corrcoef(returns[:-1], returns[1:])[0, 1]
+        if np.isnan(autocorr):
+            autocorr = 0.0
+    else:
+        autocorr = 0.0
+    return float(sharpe), skewness, kurtosis, float(autocorr), n
+def compute_sharpe(returns: ArrayLike) -> float:
+    """Compute Sharpe ratio from returns.
+    Parameters
+    ----------
+    returns : array-like
+        Array of returns.
+    Returns
+    -------
+    float
+        Sharpe ratio (mean/std) at native frequency.
+    """
+    sharpe, _, _, _, _ = compute_return_statistics(returns)
+    return sharpe
+def compute_skewness(returns: ArrayLike) -> float:
+    """Compute skewness from returns.
+    Parameters
+    ----------
+    returns : array-like
+        Array of returns.
+    Returns
+    -------
+    float
+        Fisher's skewness (γ₃).
+    """
+    _, skewness, _, _, _ = compute_return_statistics(returns)
+    return skewness
+def compute_kurtosis(returns: ArrayLike, excess: bool = True) -> float:
+    """Compute kurtosis from returns.
+    Parameters
+    ----------
+    returns : array-like
+        Array of returns.
+    excess : bool, default True
+        If True, return Fisher/excess kurtosis (normal=0).
+        If False, return Pearson kurtosis (normal=3).
+    Returns
+    -------
+    float
+        Kurtosis value.
+    """
+    _, _, kurtosis, _, _ = compute_return_statistics(returns)
+    return kurtosis - 3.0 if excess else kurtosis
+def compute_autocorrelation(returns: ArrayLike, lag: int = 1) -> float:
+    """Compute autocorrelation from returns.
+    Parameters
+    ----------
+    returns : array-like
+        Array of returns.
+    lag : int, default 1
+        Lag for autocorrelation. Currently only lag=1 is supported.
+    Returns
+    -------
+    float
+        Autocorrelation at specified lag.
+    Raises
+    ------
+    ValueError
+        If lag != 1 (not yet implemented).
+    """
+    if lag != 1:
+        raise ValueError("Only lag=1 autocorrelation is currently supported")
+    _, _, _, autocorr, _ = compute_return_statistics(returns)
+    return autocorr
+__all__ = [
+    "compute_return_statistics",
+    "compute_sharpe",
+    "compute_skewness",
+    "compute_kurtosis",
+    "compute_autocorrelation",
+]