PyPI - ml4t-diagnostic - Versions diffs - 0.1.0a1__py3-none-any.whl - Mend

ml4t-diagnostic 0.1.0a1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

ml4t/diagnostic/AGENT.md +25 -0
ml4t/diagnostic/__init__.py +166 -0
ml4t/diagnostic/backends/__init__.py +10 -0
ml4t/diagnostic/backends/adapter.py +192 -0
ml4t/diagnostic/backends/polars_backend.py +899 -0
ml4t/diagnostic/caching/__init__.py +40 -0
ml4t/diagnostic/caching/cache.py +331 -0
ml4t/diagnostic/caching/decorators.py +131 -0
ml4t/diagnostic/caching/smart_cache.py +339 -0
ml4t/diagnostic/config/AGENT.md +24 -0
ml4t/diagnostic/config/README.md +267 -0
ml4t/diagnostic/config/__init__.py +219 -0
ml4t/diagnostic/config/barrier_config.py +277 -0
ml4t/diagnostic/config/base.py +301 -0
ml4t/diagnostic/config/event_config.py +148 -0
ml4t/diagnostic/config/feature_config.py +404 -0
ml4t/diagnostic/config/multi_signal_config.py +55 -0
ml4t/diagnostic/config/portfolio_config.py +215 -0
ml4t/diagnostic/config/report_config.py +391 -0
ml4t/diagnostic/config/sharpe_config.py +202 -0
ml4t/diagnostic/config/signal_config.py +206 -0
ml4t/diagnostic/config/trade_analysis_config.py +310 -0
ml4t/diagnostic/config/validation.py +279 -0
ml4t/diagnostic/core/__init__.py +29 -0
ml4t/diagnostic/core/numba_utils.py +315 -0
ml4t/diagnostic/core/purging.py +372 -0
ml4t/diagnostic/core/sampling.py +471 -0
ml4t/diagnostic/errors/__init__.py +205 -0
ml4t/diagnostic/evaluation/AGENT.md +26 -0
ml4t/diagnostic/evaluation/__init__.py +437 -0
ml4t/diagnostic/evaluation/autocorrelation.py +531 -0
ml4t/diagnostic/evaluation/barrier_analysis.py +1050 -0
ml4t/diagnostic/evaluation/binary_metrics.py +910 -0
ml4t/diagnostic/evaluation/dashboard.py +715 -0
ml4t/diagnostic/evaluation/diagnostic_plots.py +1037 -0
ml4t/diagnostic/evaluation/distribution/__init__.py +499 -0
ml4t/diagnostic/evaluation/distribution/moments.py +299 -0
ml4t/diagnostic/evaluation/distribution/tails.py +777 -0
ml4t/diagnostic/evaluation/distribution/tests.py +470 -0
ml4t/diagnostic/evaluation/drift/__init__.py +139 -0
ml4t/diagnostic/evaluation/drift/analysis.py +432 -0
ml4t/diagnostic/evaluation/drift/domain_classifier.py +517 -0
ml4t/diagnostic/evaluation/drift/population_stability_index.py +310 -0
ml4t/diagnostic/evaluation/drift/wasserstein.py +388 -0
ml4t/diagnostic/evaluation/event_analysis.py +647 -0
ml4t/diagnostic/evaluation/excursion.py +390 -0
ml4t/diagnostic/evaluation/feature_diagnostics.py +873 -0
ml4t/diagnostic/evaluation/feature_outcome.py +666 -0
ml4t/diagnostic/evaluation/framework.py +935 -0
ml4t/diagnostic/evaluation/metric_registry.py +255 -0
ml4t/diagnostic/evaluation/metrics/AGENT.md +23 -0
ml4t/diagnostic/evaluation/metrics/__init__.py +133 -0
ml4t/diagnostic/evaluation/metrics/basic.py +160 -0
ml4t/diagnostic/evaluation/metrics/conditional_ic.py +469 -0
ml4t/diagnostic/evaluation/metrics/feature_outcome.py +475 -0
ml4t/diagnostic/evaluation/metrics/ic_statistics.py +446 -0
ml4t/diagnostic/evaluation/metrics/importance_analysis.py +338 -0
ml4t/diagnostic/evaluation/metrics/importance_classical.py +375 -0
ml4t/diagnostic/evaluation/metrics/importance_mda.py +371 -0
ml4t/diagnostic/evaluation/metrics/importance_shap.py +715 -0
ml4t/diagnostic/evaluation/metrics/information_coefficient.py +527 -0
ml4t/diagnostic/evaluation/metrics/interactions.py +772 -0
ml4t/diagnostic/evaluation/metrics/monotonicity.py +226 -0
ml4t/diagnostic/evaluation/metrics/risk_adjusted.py +324 -0
ml4t/diagnostic/evaluation/multi_signal.py +550 -0
ml4t/diagnostic/evaluation/portfolio_analysis/__init__.py +83 -0
ml4t/diagnostic/evaluation/portfolio_analysis/analysis.py +734 -0
ml4t/diagnostic/evaluation/portfolio_analysis/metrics.py +589 -0
ml4t/diagnostic/evaluation/portfolio_analysis/results.py +334 -0
ml4t/diagnostic/evaluation/report_generation.py +824 -0
ml4t/diagnostic/evaluation/signal_selector.py +452 -0
ml4t/diagnostic/evaluation/stat_registry.py +139 -0
ml4t/diagnostic/evaluation/stationarity/__init__.py +97 -0
ml4t/diagnostic/evaluation/stationarity/analysis.py +518 -0
ml4t/diagnostic/evaluation/stationarity/augmented_dickey_fuller.py +296 -0
ml4t/diagnostic/evaluation/stationarity/kpss_test.py +308 -0
ml4t/diagnostic/evaluation/stationarity/phillips_perron.py +365 -0
ml4t/diagnostic/evaluation/stats/AGENT.md +43 -0
ml4t/diagnostic/evaluation/stats/__init__.py +191 -0
ml4t/diagnostic/evaluation/stats/backtest_overfitting.py +219 -0
ml4t/diagnostic/evaluation/stats/bootstrap.py +228 -0
ml4t/diagnostic/evaluation/stats/deflated_sharpe_ratio.py +591 -0
ml4t/diagnostic/evaluation/stats/false_discovery_rate.py +295 -0
ml4t/diagnostic/evaluation/stats/hac_standard_errors.py +108 -0
ml4t/diagnostic/evaluation/stats/minimum_track_record.py +408 -0
ml4t/diagnostic/evaluation/stats/moments.py +164 -0
ml4t/diagnostic/evaluation/stats/rademacher_adjustment.py +436 -0
ml4t/diagnostic/evaluation/stats/reality_check.py +155 -0
ml4t/diagnostic/evaluation/stats/sharpe_inference.py +219 -0
ml4t/diagnostic/evaluation/themes.py +330 -0
ml4t/diagnostic/evaluation/threshold_analysis.py +957 -0
ml4t/diagnostic/evaluation/trade_analysis.py +1136 -0
ml4t/diagnostic/evaluation/trade_dashboard/__init__.py +32 -0
ml4t/diagnostic/evaluation/trade_dashboard/app.py +315 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/__init__.py +18 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/csv.py +82 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/html.py +276 -0
ml4t/diagnostic/evaluation/trade_dashboard/io.py +166 -0
ml4t/diagnostic/evaluation/trade_dashboard/normalize.py +304 -0
ml4t/diagnostic/evaluation/trade_dashboard/stats.py +386 -0
ml4t/diagnostic/evaluation/trade_dashboard/style.py +79 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/__init__.py +21 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/patterns.py +354 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/shap_analysis.py +280 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/stat_validation.py +186 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/worst_trades.py +236 -0
ml4t/diagnostic/evaluation/trade_dashboard/types.py +129 -0
ml4t/diagnostic/evaluation/trade_shap/__init__.py +102 -0
ml4t/diagnostic/evaluation/trade_shap/alignment.py +188 -0
ml4t/diagnostic/evaluation/trade_shap/characterize.py +413 -0
ml4t/diagnostic/evaluation/trade_shap/cluster.py +302 -0
ml4t/diagnostic/evaluation/trade_shap/explain.py +208 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/__init__.py +23 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/generator.py +290 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/matcher.py +251 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/templates.yaml +467 -0
ml4t/diagnostic/evaluation/trade_shap/models.py +386 -0
ml4t/diagnostic/evaluation/trade_shap/normalize.py +116 -0
ml4t/diagnostic/evaluation/trade_shap/pipeline.py +263 -0
ml4t/diagnostic/evaluation/trade_shap_dashboard.py +283 -0
ml4t/diagnostic/evaluation/trade_shap_diagnostics.py +588 -0
ml4t/diagnostic/evaluation/validated_cv.py +535 -0
ml4t/diagnostic/evaluation/visualization.py +1050 -0
ml4t/diagnostic/evaluation/volatility/__init__.py +45 -0
ml4t/diagnostic/evaluation/volatility/analysis.py +351 -0
ml4t/diagnostic/evaluation/volatility/arch.py +258 -0
ml4t/diagnostic/evaluation/volatility/garch.py +460 -0
ml4t/diagnostic/integration/__init__.py +48 -0
ml4t/diagnostic/integration/backtest_contract.py +671 -0
ml4t/diagnostic/integration/data_contract.py +316 -0
ml4t/diagnostic/integration/engineer_contract.py +226 -0
ml4t/diagnostic/logging/__init__.py +77 -0
ml4t/diagnostic/logging/logger.py +245 -0
ml4t/diagnostic/logging/performance.py +234 -0
ml4t/diagnostic/logging/progress.py +234 -0
ml4t/diagnostic/logging/wandb.py +412 -0
ml4t/diagnostic/metrics/__init__.py +9 -0
ml4t/diagnostic/metrics/percentiles.py +128 -0
ml4t/diagnostic/py.typed +1 -0
ml4t/diagnostic/reporting/__init__.py +43 -0
ml4t/diagnostic/reporting/base.py +130 -0
ml4t/diagnostic/reporting/html_renderer.py +275 -0
ml4t/diagnostic/reporting/json_renderer.py +51 -0
ml4t/diagnostic/reporting/markdown_renderer.py +117 -0
ml4t/diagnostic/results/AGENT.md +24 -0
ml4t/diagnostic/results/__init__.py +105 -0
ml4t/diagnostic/results/barrier_results/__init__.py +36 -0
ml4t/diagnostic/results/barrier_results/hit_rate.py +304 -0
ml4t/diagnostic/results/barrier_results/precision_recall.py +266 -0
ml4t/diagnostic/results/barrier_results/profit_factor.py +297 -0
ml4t/diagnostic/results/barrier_results/tearsheet.py +397 -0
ml4t/diagnostic/results/barrier_results/time_to_target.py +305 -0
ml4t/diagnostic/results/barrier_results/validation.py +38 -0
ml4t/diagnostic/results/base.py +177 -0
ml4t/diagnostic/results/event_results.py +349 -0
ml4t/diagnostic/results/feature_results.py +787 -0
ml4t/diagnostic/results/multi_signal_results.py +431 -0
ml4t/diagnostic/results/portfolio_results.py +281 -0
ml4t/diagnostic/results/sharpe_results.py +448 -0
ml4t/diagnostic/results/signal_results/__init__.py +74 -0
ml4t/diagnostic/results/signal_results/ic.py +581 -0
ml4t/diagnostic/results/signal_results/irtc.py +110 -0
ml4t/diagnostic/results/signal_results/quantile.py +392 -0
ml4t/diagnostic/results/signal_results/tearsheet.py +456 -0
ml4t/diagnostic/results/signal_results/turnover.py +213 -0
ml4t/diagnostic/results/signal_results/validation.py +147 -0
ml4t/diagnostic/signal/AGENT.md +17 -0
ml4t/diagnostic/signal/__init__.py +69 -0
ml4t/diagnostic/signal/_report.py +152 -0
ml4t/diagnostic/signal/_utils.py +261 -0
ml4t/diagnostic/signal/core.py +275 -0
ml4t/diagnostic/signal/quantile.py +148 -0
ml4t/diagnostic/signal/result.py +214 -0
ml4t/diagnostic/signal/signal_ic.py +129 -0
ml4t/diagnostic/signal/turnover.py +182 -0
ml4t/diagnostic/splitters/AGENT.md +19 -0
ml4t/diagnostic/splitters/__init__.py +36 -0
ml4t/diagnostic/splitters/base.py +501 -0
ml4t/diagnostic/splitters/calendar.py +421 -0
ml4t/diagnostic/splitters/calendar_config.py +91 -0
ml4t/diagnostic/splitters/combinatorial.py +1064 -0
ml4t/diagnostic/splitters/config.py +322 -0
ml4t/diagnostic/splitters/cpcv/__init__.py +57 -0
ml4t/diagnostic/splitters/cpcv/combinations.py +119 -0
ml4t/diagnostic/splitters/cpcv/partitioning.py +263 -0
ml4t/diagnostic/splitters/cpcv/purge_engine.py +379 -0
ml4t/diagnostic/splitters/cpcv/windows.py +190 -0
ml4t/diagnostic/splitters/group_isolation.py +329 -0
ml4t/diagnostic/splitters/persistence.py +316 -0
ml4t/diagnostic/splitters/utils.py +207 -0
ml4t/diagnostic/splitters/walk_forward.py +757 -0
ml4t/diagnostic/utils/__init__.py +42 -0
ml4t/diagnostic/utils/config.py +542 -0
ml4t/diagnostic/utils/dependencies.py +318 -0
ml4t/diagnostic/utils/sessions.py +127 -0
ml4t/diagnostic/validation/__init__.py +54 -0
ml4t/diagnostic/validation/dataframe.py +274 -0
ml4t/diagnostic/validation/returns.py +280 -0
ml4t/diagnostic/validation/timeseries.py +299 -0
ml4t/diagnostic/visualization/AGENT.md +19 -0
ml4t/diagnostic/visualization/__init__.py +223 -0
ml4t/diagnostic/visualization/backtest/__init__.py +98 -0
ml4t/diagnostic/visualization/backtest/cost_attribution.py +762 -0
ml4t/diagnostic/visualization/backtest/executive_summary.py +895 -0
ml4t/diagnostic/visualization/backtest/interactive_controls.py +673 -0
ml4t/diagnostic/visualization/backtest/statistical_validity.py +874 -0
ml4t/diagnostic/visualization/backtest/tearsheet.py +565 -0
ml4t/diagnostic/visualization/backtest/template_system.py +373 -0
ml4t/diagnostic/visualization/backtest/trade_plots.py +1172 -0
ml4t/diagnostic/visualization/barrier_plots.py +782 -0
ml4t/diagnostic/visualization/core.py +1060 -0
ml4t/diagnostic/visualization/dashboards/__init__.py +36 -0
ml4t/diagnostic/visualization/dashboards/base.py +582 -0
ml4t/diagnostic/visualization/dashboards/importance.py +801 -0
ml4t/diagnostic/visualization/dashboards/interaction.py +263 -0
ml4t/diagnostic/visualization/dashboards.py +43 -0
ml4t/diagnostic/visualization/data_extraction/__init__.py +48 -0
ml4t/diagnostic/visualization/data_extraction/importance.py +649 -0
ml4t/diagnostic/visualization/data_extraction/interaction.py +504 -0
ml4t/diagnostic/visualization/data_extraction/types.py +113 -0
ml4t/diagnostic/visualization/data_extraction/validation.py +66 -0
ml4t/diagnostic/visualization/feature_plots.py +888 -0
ml4t/diagnostic/visualization/interaction_plots.py +618 -0
ml4t/diagnostic/visualization/portfolio/__init__.py +41 -0
ml4t/diagnostic/visualization/portfolio/dashboard.py +514 -0
ml4t/diagnostic/visualization/portfolio/drawdown_plots.py +341 -0
ml4t/diagnostic/visualization/portfolio/returns_plots.py +487 -0
ml4t/diagnostic/visualization/portfolio/risk_plots.py +301 -0
ml4t/diagnostic/visualization/report_generation.py +1343 -0
ml4t/diagnostic/visualization/signal/__init__.py +103 -0
ml4t/diagnostic/visualization/signal/dashboard.py +911 -0
ml4t/diagnostic/visualization/signal/event_plots.py +514 -0
ml4t/diagnostic/visualization/signal/ic_plots.py +635 -0
ml4t/diagnostic/visualization/signal/multi_signal_dashboard.py +974 -0
ml4t/diagnostic/visualization/signal/multi_signal_plots.py +603 -0
ml4t/diagnostic/visualization/signal/quantile_plots.py +625 -0
ml4t/diagnostic/visualization/signal/turnover_plots.py +400 -0
ml4t/diagnostic/visualization/trade_shap/__init__.py +90 -0
ml4t_diagnostic-0.1.0a1.dist-info/METADATA +1044 -0
ml4t_diagnostic-0.1.0a1.dist-info/RECORD +242 -0
ml4t_diagnostic-0.1.0a1.dist-info/WHEEL +4 -0
ml4t_diagnostic-0.1.0a1.dist-info/licenses/LICENSE +21 -0

ml4t/diagnostic/evaluation/stats/deflated_sharpe_ratio.py ADDED Viewed

@@ -0,0 +1,591 @@
+"""Deflated Sharpe Ratio (DSR) and Probabilistic Sharpe Ratio (PSR).
+This module provides the main entry points for Sharpe ratio inference:
+- deflated_sharpe_ratio: Compute DSR/PSR from raw returns (recommended)
+- deflated_sharpe_ratio_from_statistics: Compute DSR from pre-computed statistics
+The underlying components are in separate modules:
+- moments.py: Return statistics computation
+- sharpe_inference.py: Variance estimation and expected max
+- min_trl.py: Minimum Track Record Length
+- pbo.py: Probability of Backtest Overfitting
+References
+----------
+López de Prado, M., Lipton, A., & Zoonekynd, V. (2025).
+"How to Use the Sharpe Ratio." ADIA Lab Research Paper Series, No. 19.
+Bailey, D. H., & López de Prado, M. (2014).
+"The Deflated Sharpe Ratio." Journal of Portfolio Management.
+"""
+from __future__ import annotations
+import math
+from collections.abc import Sequence
+from dataclasses import dataclass
+from typing import Any, Literal
+import numpy as np
+from numpy.typing import ArrayLike
+from scipy.stats import norm
+from ml4t.diagnostic.evaluation.stats.backtest_overfitting import PBOResult, compute_pbo
+# Import from decomposed modules
+from ml4t.diagnostic.evaluation.stats.minimum_track_record import (
+    DEFAULT_PERIODS_PER_YEAR,
+    MinTRLResult,
+    _compute_min_trl_core,
+    compute_min_trl,
+    min_trl_fwer,
+)
+from ml4t.diagnostic.evaluation.stats.moments import compute_return_statistics
+from ml4t.diagnostic.evaluation.stats.sharpe_inference import (
+    VARIANCE_RESCALING_FACTORS,
+    compute_expected_max_sharpe,
+    compute_sharpe_variance,
+    get_variance_rescaling_factor,
+)
+# Type alias
+Frequency = Literal["daily", "weekly", "monthly"]
+@dataclass
+class DSRResult:
+    """Result of Deflated/Probabilistic Sharpe Ratio analysis.
+    Attributes
+    ----------
+    probability : float
+        Probability that the true Sharpe ratio exceeds the benchmark,
+        after correcting for multiple testing (if applicable).
+        Range: [0, 1]. Higher is better.
+    is_significant : bool
+        Whether the result is significant at the specified confidence level.
+    z_score : float
+        Test statistic (z-score) for the hypothesis test.
+    p_value : float
+        P-value for the null hypothesis that true SR <= benchmark.
+    sharpe_ratio : float
+        Observed Sharpe ratio at native frequency.
+    sharpe_ratio_annualized : float
+        Annualized Sharpe ratio (for interpretation).
+    benchmark_sharpe : float
+        Null hypothesis threshold (default 0).
+    n_samples : int
+        Number of return observations (T).
+    n_trials : int
+        Number of strategies tested (K). K=1 means PSR, K>1 means DSR.
+    frequency : str
+        Return frequency ("daily", "weekly", "monthly").
+    skewness : float
+        Return distribution skewness (gamma_3).
+    excess_kurtosis : float
+        Return distribution excess kurtosis (gamma_4 - 3). Normal = 0.
+        This is what scipy.stats.kurtosis() returns by default.
+    autocorrelation : float
+        First-order return autocorrelation (rho).
+    expected_max_sharpe : float
+        Expected maximum Sharpe from noise under multiple testing.
+        E[max{SR}] from Equation 26. Zero for single strategy (PSR).
+    deflated_sharpe : float
+        Observed Sharpe minus expected max: SR - E[max{SR}].
+    variance_trials : float
+        Cross-sectional variance of Sharpe ratios across trials.
+    min_trl : float
+        Minimum Track Record Length in observations.
+        Can be math.inf if observed SR <= target SR.
+    min_trl_years : float
+        Minimum Track Record Length in calendar years.
+        Can be math.inf if observed SR <= target SR.
+    has_adequate_sample : bool
+        Whether n_samples >= min_trl.
+    confidence_level : float
+        Confidence level used for significance testing.
+    """
+    # Core inference results
+    probability: float
+    is_significant: bool
+    z_score: float
+    p_value: float
+    # Sharpe ratios
+    sharpe_ratio: float
+    sharpe_ratio_annualized: float
+    benchmark_sharpe: float
+    # Sample information
+    n_samples: int
+    n_trials: int
+    frequency: str
+    periods_per_year: int
+    # Computed statistics
+    skewness: float
+    excess_kurtosis: float  # Fisher convention: normal = 0
+    autocorrelation: float
+    # Multiple testing adjustment
+    expected_max_sharpe: float
+    deflated_sharpe: float
+    variance_trials: float
+    # Minimum track record
+    min_trl: float  # Can be inf
+    min_trl_years: float  # Can be inf
+    has_adequate_sample: bool
+    # Configuration
+    confidence_level: float
+    def interpret(self) -> str:
+        """Generate human-readable interpretation of results."""
+        if self.n_trials == 1:
+            test_type = "Probabilistic Sharpe Ratio (PSR)"
+            selection_note = ""
+        else:
+            test_type = f"Deflated Sharpe Ratio (DSR) - best of {self.n_trials} strategies"
+            selection_note = (
+                f"\n  Expected max from noise: {self.expected_max_sharpe:.4f}"
+                f"\n  Deflated Sharpe: {self.deflated_sharpe:.4f}"
+            )
+        significance = "Yes" if self.is_significant else "No"
+        confidence_pct = self.confidence_level * 100
+        lines = [
+            f"{test_type}",
+            f"  Frequency: {self.frequency} ({self.periods_per_year} periods/year)",
+            f"  Sample size: {self.n_samples} observations",
+            "",
+            f"  Sharpe ratio: {self.sharpe_ratio:.4f} "
+            f"({self.sharpe_ratio_annualized:.2f} annualized)",
+            f"  Benchmark: {self.benchmark_sharpe:.4f}",
+            selection_note,
+            "",
+            f"  Probability of skill: {self.probability:.1%}",
+            f"  Significant at {confidence_pct:.0f}%: {significance}",
+            f"  P-value: {self.p_value:.4f}",
+            "",
+            "  Statistics used:",
+            f"    Skewness (gamma_3): {self.skewness:.3f}",
+            f"    Excess kurtosis (gamma_4-3): {self.excess_kurtosis:.3f}",
+            f"    Autocorrelation (rho): {self.autocorrelation:.3f}",
+        ]
+        if math.isinf(self.min_trl):
+            lines.extend(
+                [
+                    "",
+                    "  WARNING: MinTRL is infinite (observed SR <= target SR)",
+                    "    Cannot reject null hypothesis at any sample size",
+                ]
+            )
+        elif not self.has_adequate_sample:
+            deficit = self.min_trl - self.n_samples
+            lines.extend(
+                [
+                    "",
+                    "  WARNING: Insufficient sample size",
+                    f"    Need {deficit:.0f} more observations ({self.min_trl_years:.1f} years total)",
+                ]
+            )
+        return "\n".join(lines)
+    def to_dict(self) -> dict[str, Any]:
+        """Convert to dictionary."""
+        return {
+            "probability": self.probability,
+            "is_significant": self.is_significant,
+            "z_score": self.z_score,
+            "p_value": self.p_value,
+            "sharpe_ratio": self.sharpe_ratio,
+            "sharpe_ratio_annualized": self.sharpe_ratio_annualized,
+            "benchmark_sharpe": self.benchmark_sharpe,
+            "n_samples": self.n_samples,
+            "n_trials": self.n_trials,
+            "frequency": self.frequency,
+            "periods_per_year": self.periods_per_year,
+            "skewness": self.skewness,
+            "excess_kurtosis": self.excess_kurtosis,
+            "autocorrelation": self.autocorrelation,
+            "expected_max_sharpe": self.expected_max_sharpe,
+            "deflated_sharpe": self.deflated_sharpe,
+            "variance_trials": self.variance_trials,
+            "min_trl": self.min_trl,
+            "min_trl_years": self.min_trl_years,
+            "has_adequate_sample": self.has_adequate_sample,
+            "confidence_level": self.confidence_level,
+        }
+def deflated_sharpe_ratio(
+    returns: ArrayLike | Sequence[ArrayLike],
+    frequency: Frequency = "daily",
+    benchmark_sharpe: float = 0.0,
+    confidence_level: float = 0.95,
+    periods_per_year: int | None = None,
+    *,
+    skewness: float | None = None,
+    excess_kurtosis: float | None = None,
+    autocorrelation: float | None = None,
+) -> DSRResult:
+    """Compute Deflated Sharpe Ratio (DSR) or Probabilistic Sharpe Ratio (PSR).
+    This function computes the probability that the true Sharpe ratio exceeds
+    a benchmark threshold, correcting for:
+    - **Non-normality**: Skewness and excess kurtosis of returns
+    - **Serial correlation**: First-order autocorrelation of returns
+    - **Multiple testing**: Selection bias when choosing the best of K strategies
+    **Single strategy (PSR)**: Pass a single returns array.
+    **Multiple strategies (DSR)**: Pass a list of returns arrays.
+    Parameters
+    ----------
+    returns : array-like or Sequence[array-like]
+        Strategy returns at the specified frequency.
+        - Single array: Computes PSR (no multiple testing adjustment)
+        - Sequence of K arrays: Computes DSR for the best strategy
+    frequency : {"daily", "weekly", "monthly"}, default "daily"
+        Return frequency. Affects annualization for display.
+    benchmark_sharpe : float, default 0.0
+        Null hypothesis threshold (SR_0) at native frequency.
+    confidence_level : float, default 0.95
+        Confidence level for significance testing.
+    periods_per_year : int, optional
+        Trading periods per year. Defaults: daily=252, weekly=52, monthly=12.
+    skewness : float, optional
+        Override computed skewness.
+    excess_kurtosis : float, optional
+        Override computed excess kurtosis (Fisher convention, normal=0).
+    autocorrelation : float, optional
+        Override computed autocorrelation.
+    Returns
+    -------
+    DSRResult
+        Comprehensive results. Use `.interpret()` for human-readable summary.
+    Examples
+    --------
+    Single strategy (PSR):
+    >>> result = deflated_sharpe_ratio(daily_returns, frequency="daily")
+    >>> print(f"Probability of skill: {result.probability:.1%}")
+    Multiple strategies (DSR):
+    >>> strategies = [strat1_returns, strat2_returns, strat3_returns]
+    >>> result = deflated_sharpe_ratio(strategies, frequency="daily")
+    >>> print(f"Probability after deflation: {result.probability:.1%}")
+    References
+    ----------
+    Lopez de Prado et al. (2025). "How to Use the Sharpe Ratio."
+    """
+    # Resolve periods per year
+    if periods_per_year is None:
+        periods_per_year = DEFAULT_PERIODS_PER_YEAR[frequency]
+    annualization_factor = np.sqrt(periods_per_year)
+    # Detect multiple strategies
+    is_multiple = (
+        isinstance(returns, list | tuple)
+        and len(returns) > 1
+        and not isinstance(returns[0], int | float)
+    )
+    if is_multiple:
+        # Multiple strategies - DSR
+        returns_seq = list(returns)  # type: ignore[arg-type]
+        n_trials = len(returns_seq)
+        # Compute Sharpe ratio for each strategy
+        sharpe_ratios = []
+        for ret in returns_seq:
+            ret_arr = np.asarray(ret).flatten()
+            ret_arr = ret_arr[~np.isnan(ret_arr)]
+            sr, _, _, _, _ = compute_return_statistics(ret_arr)
+            sharpe_ratios.append(sr)
+        # Best strategy
+        best_idx = int(np.argmax(sharpe_ratios))
+        best_returns = np.asarray(returns_seq[best_idx]).flatten()
+        best_returns = best_returns[~np.isnan(best_returns)]
+        observed_sharpe, comp_skew, comp_kurt, comp_rho, n_samples = compute_return_statistics(
+            best_returns
+        )
+        # Cross-sectional variance
+        variance_trials = float(np.var(sharpe_ratios, ddof=1)) if n_trials > 1 else 0.0
+    else:
+        # Single strategy - PSR
+        n_trials = 1
+        variance_trials = 0.0
+        if isinstance(returns, list | tuple) and len(returns) == 1:
+            ret_arr = np.asarray(returns[0]).flatten()
+        else:
+            ret_arr = np.asarray(returns).flatten()
+        observed_sharpe, comp_skew, comp_kurt, comp_rho, n_samples = compute_return_statistics(
+            ret_arr
+        )
+    # Use provided statistics or computed ones
+    skew = skewness if skewness is not None else comp_skew
+    if excess_kurtosis is not None:
+        kurt = excess_kurtosis + 3.0  # Fisher -> Pearson
+    else:
+        kurt = comp_kurt
+    rho = autocorrelation if autocorrelation is not None else comp_rho
+    # Expected max Sharpe (multiple testing adjustment)
+    expected_max = compute_expected_max_sharpe(n_trials, variance_trials)
+    adjusted_threshold = benchmark_sharpe + expected_max
+    # Variance of Sharpe estimator
+    variance_sr = compute_sharpe_variance(
+        sharpe=adjusted_threshold,
+        n_samples=n_samples,
+        skewness=skew,
+        kurtosis=kurt,
+        autocorrelation=rho,
+        n_trials=n_trials,
+    )
+    std_sr = np.sqrt(variance_sr)
+    # Z-score
+    if std_sr > 0:
+        z_score = (observed_sharpe - adjusted_threshold) / std_sr
+    else:
+        z_score = np.inf if observed_sharpe > adjusted_threshold else -np.inf
+    # Probability and p-value
+    probability = float(norm.cdf(z_score))
+    p_value = float(1 - probability)
+    is_significant = probability >= confidence_level
+    # Annualized Sharpe
+    sharpe_annualized = observed_sharpe * annualization_factor
+    deflated = observed_sharpe - expected_max
+    # MinTRL
+    min_trl = _compute_min_trl_core(
+        observed_sharpe=observed_sharpe,
+        target_sharpe=benchmark_sharpe,
+        confidence_level=confidence_level,
+        skewness=skew,
+        kurtosis=kurt,
+        autocorrelation=rho,
+    )
+    min_trl_years = min_trl / periods_per_year
+    has_adequate = n_samples >= min_trl
+    return DSRResult(
+        probability=probability,
+        is_significant=is_significant,
+        z_score=float(z_score),
+        p_value=p_value,
+        sharpe_ratio=float(observed_sharpe),
+        sharpe_ratio_annualized=float(sharpe_annualized),
+        benchmark_sharpe=benchmark_sharpe,
+        n_samples=n_samples,
+        n_trials=n_trials,
+        frequency=frequency,
+        periods_per_year=periods_per_year,
+        skewness=float(skew),
+        excess_kurtosis=float(kurt - 3.0),
+        autocorrelation=float(rho),
+        expected_max_sharpe=float(expected_max),
+        deflated_sharpe=float(deflated),
+        variance_trials=float(variance_trials),
+        min_trl=min_trl,
+        min_trl_years=float(min_trl_years),
+        has_adequate_sample=has_adequate,
+        confidence_level=confidence_level,
+    )
+def deflated_sharpe_ratio_from_statistics(
+    observed_sharpe: float,
+    n_samples: int,
+    n_trials: int = 1,
+    variance_trials: float = 0.0,
+    benchmark_sharpe: float = 0.0,
+    skewness: float = 0.0,
+    excess_kurtosis: float = 0.0,
+    autocorrelation: float = 0.0,
+    confidence_level: float = 0.95,
+    frequency: Frequency = "daily",
+    periods_per_year: int | None = None,
+) -> DSRResult:
+    """Compute DSR/PSR from pre-computed statistics.
+    Use this when you have already computed the required statistics.
+    For most users, `deflated_sharpe_ratio()` with raw returns is recommended.
+    Parameters
+    ----------
+    observed_sharpe : float
+        Observed Sharpe ratio at native frequency.
+    n_samples : int
+        Number of return observations (T).
+    n_trials : int, default 1
+        Number of strategies tested (K).
+    variance_trials : float, default 0.0
+        Cross-sectional variance of Sharpe ratios.
+    benchmark_sharpe : float, default 0.0
+        Null hypothesis threshold.
+    skewness : float, default 0.0
+        Return skewness.
+    excess_kurtosis : float, default 0.0
+        Return excess kurtosis (Fisher, normal=0).
+    autocorrelation : float, default 0.0
+        First-order autocorrelation.
+    confidence_level : float, default 0.95
+        Confidence level for testing.
+    frequency : {"daily", "weekly", "monthly"}, default "daily"
+        Return frequency.
+    periods_per_year : int, optional
+        Periods per year.
+    Returns
+    -------
+    DSRResult
+        Same as `deflated_sharpe_ratio()`.
+    """
+    # Validate inputs
+    if n_samples < 1:
+        raise ValueError("n_samples must be positive")
+    if n_trials < 1:
+        raise ValueError("n_trials must be positive")
+    if n_trials > 1 and variance_trials <= 0:
+        raise ValueError("variance_trials must be positive when n_trials > 1")
+    if abs(autocorrelation) >= 1:
+        raise ValueError("autocorrelation must be in (-1, 1)")
+    kurtosis = excess_kurtosis + 3.0
+    if periods_per_year is None:
+        periods_per_year = DEFAULT_PERIODS_PER_YEAR[frequency]
+    annualization_factor = np.sqrt(periods_per_year)
+    # Expected max Sharpe
+    expected_max = compute_expected_max_sharpe(n_trials, variance_trials)
+    adjusted_threshold = benchmark_sharpe + expected_max
+    # Variance
+    variance_sr = compute_sharpe_variance(
+        sharpe=adjusted_threshold,
+        n_samples=n_samples,
+        skewness=skewness,
+        kurtosis=kurtosis,
+        autocorrelation=autocorrelation,
+        n_trials=n_trials,
+    )
+    std_sr = np.sqrt(variance_sr)
+    # Z-score
+    if std_sr > 0:
+        z_score = (observed_sharpe - adjusted_threshold) / std_sr
+    else:
+        z_score = np.inf if observed_sharpe > adjusted_threshold else -np.inf
+    probability = float(norm.cdf(z_score))
+    p_value = float(1 - probability)
+    is_significant = probability >= confidence_level
+    sharpe_annualized = observed_sharpe * annualization_factor
+    deflated = observed_sharpe - expected_max
+    # MinTRL
+    min_trl = _compute_min_trl_core(
+        observed_sharpe=observed_sharpe,
+        target_sharpe=benchmark_sharpe,
+        confidence_level=confidence_level,
+        skewness=skewness,
+        kurtosis=kurtosis,
+        autocorrelation=autocorrelation,
+    )
+    min_trl_years = min_trl / periods_per_year
+    has_adequate = n_samples >= min_trl
+    return DSRResult(
+        probability=probability,
+        is_significant=is_significant,
+        z_score=float(z_score),
+        p_value=p_value,
+        sharpe_ratio=float(observed_sharpe),
+        sharpe_ratio_annualized=float(sharpe_annualized),
+        benchmark_sharpe=benchmark_sharpe,
+        n_samples=n_samples,
+        n_trials=n_trials,
+        frequency=frequency,
+        periods_per_year=periods_per_year,
+        skewness=float(skewness),
+        excess_kurtosis=float(excess_kurtosis),
+        autocorrelation=float(autocorrelation),
+        expected_max_sharpe=float(expected_max),
+        deflated_sharpe=float(deflated),
+        variance_trials=float(variance_trials),
+        min_trl=min_trl,
+        min_trl_years=float(min_trl_years),
+        has_adequate_sample=has_adequate,
+        confidence_level=confidence_level,
+    )
+# =============================================================================
+# BACKWARD COMPATIBILITY RE-EXPORTS
+# =============================================================================
+# These were previously defined in dsr.py but are now in separate modules.
+# Re-export for backward compatibility.
+_VARIANCE_RESCALING_FACTORS = VARIANCE_RESCALING_FACTORS
+_get_variance_rescaling_factor = get_variance_rescaling_factor
+_compute_return_statistics = compute_return_statistics
+_compute_sharpe_variance = compute_sharpe_variance
+_compute_expected_max_sharpe = compute_expected_max_sharpe
+_compute_min_trl = _compute_min_trl_core
+__all__ = [
+    # Result classes
+    "DSRResult",
+    # Main functions
+    "deflated_sharpe_ratio",
+    "deflated_sharpe_ratio_from_statistics",
+    # Re-exports from other modules (for backward compat)
+    "MinTRLResult",
+    "PBOResult",
+    "compute_min_trl",
+    "min_trl_fwer",
+    "compute_pbo",
+    "DEFAULT_PERIODS_PER_YEAR",
+    # Type aliases
+    "Frequency",
+    # Private backward compat
+    "_VARIANCE_RESCALING_FACTORS",
+    "_get_variance_rescaling_factor",
+    "_compute_return_statistics",
+    "_compute_sharpe_variance",
+    "_compute_expected_max_sharpe",
+    "_compute_min_trl",
+]