PyPI - ml4t-diagnostic - Versions diffs - 0.1.0a1__py3-none-any.whl - Mend

ml4t-diagnostic 0.1.0a1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

ml4t/diagnostic/AGENT.md +25 -0
ml4t/diagnostic/__init__.py +166 -0
ml4t/diagnostic/backends/__init__.py +10 -0
ml4t/diagnostic/backends/adapter.py +192 -0
ml4t/diagnostic/backends/polars_backend.py +899 -0
ml4t/diagnostic/caching/__init__.py +40 -0
ml4t/diagnostic/caching/cache.py +331 -0
ml4t/diagnostic/caching/decorators.py +131 -0
ml4t/diagnostic/caching/smart_cache.py +339 -0
ml4t/diagnostic/config/AGENT.md +24 -0
ml4t/diagnostic/config/README.md +267 -0
ml4t/diagnostic/config/__init__.py +219 -0
ml4t/diagnostic/config/barrier_config.py +277 -0
ml4t/diagnostic/config/base.py +301 -0
ml4t/diagnostic/config/event_config.py +148 -0
ml4t/diagnostic/config/feature_config.py +404 -0
ml4t/diagnostic/config/multi_signal_config.py +55 -0
ml4t/diagnostic/config/portfolio_config.py +215 -0
ml4t/diagnostic/config/report_config.py +391 -0
ml4t/diagnostic/config/sharpe_config.py +202 -0
ml4t/diagnostic/config/signal_config.py +206 -0
ml4t/diagnostic/config/trade_analysis_config.py +310 -0
ml4t/diagnostic/config/validation.py +279 -0
ml4t/diagnostic/core/__init__.py +29 -0
ml4t/diagnostic/core/numba_utils.py +315 -0
ml4t/diagnostic/core/purging.py +372 -0
ml4t/diagnostic/core/sampling.py +471 -0
ml4t/diagnostic/errors/__init__.py +205 -0
ml4t/diagnostic/evaluation/AGENT.md +26 -0
ml4t/diagnostic/evaluation/__init__.py +437 -0
ml4t/diagnostic/evaluation/autocorrelation.py +531 -0
ml4t/diagnostic/evaluation/barrier_analysis.py +1050 -0
ml4t/diagnostic/evaluation/binary_metrics.py +910 -0
ml4t/diagnostic/evaluation/dashboard.py +715 -0
ml4t/diagnostic/evaluation/diagnostic_plots.py +1037 -0
ml4t/diagnostic/evaluation/distribution/__init__.py +499 -0
ml4t/diagnostic/evaluation/distribution/moments.py +299 -0
ml4t/diagnostic/evaluation/distribution/tails.py +777 -0
ml4t/diagnostic/evaluation/distribution/tests.py +470 -0
ml4t/diagnostic/evaluation/drift/__init__.py +139 -0
ml4t/diagnostic/evaluation/drift/analysis.py +432 -0
ml4t/diagnostic/evaluation/drift/domain_classifier.py +517 -0
ml4t/diagnostic/evaluation/drift/population_stability_index.py +310 -0
ml4t/diagnostic/evaluation/drift/wasserstein.py +388 -0
ml4t/diagnostic/evaluation/event_analysis.py +647 -0
ml4t/diagnostic/evaluation/excursion.py +390 -0
ml4t/diagnostic/evaluation/feature_diagnostics.py +873 -0
ml4t/diagnostic/evaluation/feature_outcome.py +666 -0
ml4t/diagnostic/evaluation/framework.py +935 -0
ml4t/diagnostic/evaluation/metric_registry.py +255 -0
ml4t/diagnostic/evaluation/metrics/AGENT.md +23 -0
ml4t/diagnostic/evaluation/metrics/__init__.py +133 -0
ml4t/diagnostic/evaluation/metrics/basic.py +160 -0
ml4t/diagnostic/evaluation/metrics/conditional_ic.py +469 -0
ml4t/diagnostic/evaluation/metrics/feature_outcome.py +475 -0
ml4t/diagnostic/evaluation/metrics/ic_statistics.py +446 -0
ml4t/diagnostic/evaluation/metrics/importance_analysis.py +338 -0
ml4t/diagnostic/evaluation/metrics/importance_classical.py +375 -0
ml4t/diagnostic/evaluation/metrics/importance_mda.py +371 -0
ml4t/diagnostic/evaluation/metrics/importance_shap.py +715 -0
ml4t/diagnostic/evaluation/metrics/information_coefficient.py +527 -0
ml4t/diagnostic/evaluation/metrics/interactions.py +772 -0
ml4t/diagnostic/evaluation/metrics/monotonicity.py +226 -0
ml4t/diagnostic/evaluation/metrics/risk_adjusted.py +324 -0
ml4t/diagnostic/evaluation/multi_signal.py +550 -0
ml4t/diagnostic/evaluation/portfolio_analysis/__init__.py +83 -0
ml4t/diagnostic/evaluation/portfolio_analysis/analysis.py +734 -0
ml4t/diagnostic/evaluation/portfolio_analysis/metrics.py +589 -0
ml4t/diagnostic/evaluation/portfolio_analysis/results.py +334 -0
ml4t/diagnostic/evaluation/report_generation.py +824 -0
ml4t/diagnostic/evaluation/signal_selector.py +452 -0
ml4t/diagnostic/evaluation/stat_registry.py +139 -0
ml4t/diagnostic/evaluation/stationarity/__init__.py +97 -0
ml4t/diagnostic/evaluation/stationarity/analysis.py +518 -0
ml4t/diagnostic/evaluation/stationarity/augmented_dickey_fuller.py +296 -0
ml4t/diagnostic/evaluation/stationarity/kpss_test.py +308 -0
ml4t/diagnostic/evaluation/stationarity/phillips_perron.py +365 -0
ml4t/diagnostic/evaluation/stats/AGENT.md +43 -0
ml4t/diagnostic/evaluation/stats/__init__.py +191 -0
ml4t/diagnostic/evaluation/stats/backtest_overfitting.py +219 -0
ml4t/diagnostic/evaluation/stats/bootstrap.py +228 -0
ml4t/diagnostic/evaluation/stats/deflated_sharpe_ratio.py +591 -0
ml4t/diagnostic/evaluation/stats/false_discovery_rate.py +295 -0
ml4t/diagnostic/evaluation/stats/hac_standard_errors.py +108 -0
ml4t/diagnostic/evaluation/stats/minimum_track_record.py +408 -0
ml4t/diagnostic/evaluation/stats/moments.py +164 -0
ml4t/diagnostic/evaluation/stats/rademacher_adjustment.py +436 -0
ml4t/diagnostic/evaluation/stats/reality_check.py +155 -0
ml4t/diagnostic/evaluation/stats/sharpe_inference.py +219 -0
ml4t/diagnostic/evaluation/themes.py +330 -0
ml4t/diagnostic/evaluation/threshold_analysis.py +957 -0
ml4t/diagnostic/evaluation/trade_analysis.py +1136 -0
ml4t/diagnostic/evaluation/trade_dashboard/__init__.py +32 -0
ml4t/diagnostic/evaluation/trade_dashboard/app.py +315 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/__init__.py +18 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/csv.py +82 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/html.py +276 -0
ml4t/diagnostic/evaluation/trade_dashboard/io.py +166 -0
ml4t/diagnostic/evaluation/trade_dashboard/normalize.py +304 -0
ml4t/diagnostic/evaluation/trade_dashboard/stats.py +386 -0
ml4t/diagnostic/evaluation/trade_dashboard/style.py +79 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/__init__.py +21 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/patterns.py +354 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/shap_analysis.py +280 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/stat_validation.py +186 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/worst_trades.py +236 -0
ml4t/diagnostic/evaluation/trade_dashboard/types.py +129 -0
ml4t/diagnostic/evaluation/trade_shap/__init__.py +102 -0
ml4t/diagnostic/evaluation/trade_shap/alignment.py +188 -0
ml4t/diagnostic/evaluation/trade_shap/characterize.py +413 -0
ml4t/diagnostic/evaluation/trade_shap/cluster.py +302 -0
ml4t/diagnostic/evaluation/trade_shap/explain.py +208 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/__init__.py +23 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/generator.py +290 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/matcher.py +251 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/templates.yaml +467 -0
ml4t/diagnostic/evaluation/trade_shap/models.py +386 -0
ml4t/diagnostic/evaluation/trade_shap/normalize.py +116 -0
ml4t/diagnostic/evaluation/trade_shap/pipeline.py +263 -0
ml4t/diagnostic/evaluation/trade_shap_dashboard.py +283 -0
ml4t/diagnostic/evaluation/trade_shap_diagnostics.py +588 -0
ml4t/diagnostic/evaluation/validated_cv.py +535 -0
ml4t/diagnostic/evaluation/visualization.py +1050 -0
ml4t/diagnostic/evaluation/volatility/__init__.py +45 -0
ml4t/diagnostic/evaluation/volatility/analysis.py +351 -0
ml4t/diagnostic/evaluation/volatility/arch.py +258 -0
ml4t/diagnostic/evaluation/volatility/garch.py +460 -0
ml4t/diagnostic/integration/__init__.py +48 -0
ml4t/diagnostic/integration/backtest_contract.py +671 -0
ml4t/diagnostic/integration/data_contract.py +316 -0
ml4t/diagnostic/integration/engineer_contract.py +226 -0
ml4t/diagnostic/logging/__init__.py +77 -0
ml4t/diagnostic/logging/logger.py +245 -0
ml4t/diagnostic/logging/performance.py +234 -0
ml4t/diagnostic/logging/progress.py +234 -0
ml4t/diagnostic/logging/wandb.py +412 -0
ml4t/diagnostic/metrics/__init__.py +9 -0
ml4t/diagnostic/metrics/percentiles.py +128 -0
ml4t/diagnostic/py.typed +1 -0
ml4t/diagnostic/reporting/__init__.py +43 -0
ml4t/diagnostic/reporting/base.py +130 -0
ml4t/diagnostic/reporting/html_renderer.py +275 -0
ml4t/diagnostic/reporting/json_renderer.py +51 -0
ml4t/diagnostic/reporting/markdown_renderer.py +117 -0
ml4t/diagnostic/results/AGENT.md +24 -0
ml4t/diagnostic/results/__init__.py +105 -0
ml4t/diagnostic/results/barrier_results/__init__.py +36 -0
ml4t/diagnostic/results/barrier_results/hit_rate.py +304 -0
ml4t/diagnostic/results/barrier_results/precision_recall.py +266 -0
ml4t/diagnostic/results/barrier_results/profit_factor.py +297 -0
ml4t/diagnostic/results/barrier_results/tearsheet.py +397 -0
ml4t/diagnostic/results/barrier_results/time_to_target.py +305 -0
ml4t/diagnostic/results/barrier_results/validation.py +38 -0
ml4t/diagnostic/results/base.py +177 -0
ml4t/diagnostic/results/event_results.py +349 -0
ml4t/diagnostic/results/feature_results.py +787 -0
ml4t/diagnostic/results/multi_signal_results.py +431 -0
ml4t/diagnostic/results/portfolio_results.py +281 -0
ml4t/diagnostic/results/sharpe_results.py +448 -0
ml4t/diagnostic/results/signal_results/__init__.py +74 -0
ml4t/diagnostic/results/signal_results/ic.py +581 -0
ml4t/diagnostic/results/signal_results/irtc.py +110 -0
ml4t/diagnostic/results/signal_results/quantile.py +392 -0
ml4t/diagnostic/results/signal_results/tearsheet.py +456 -0
ml4t/diagnostic/results/signal_results/turnover.py +213 -0
ml4t/diagnostic/results/signal_results/validation.py +147 -0
ml4t/diagnostic/signal/AGENT.md +17 -0
ml4t/diagnostic/signal/__init__.py +69 -0
ml4t/diagnostic/signal/_report.py +152 -0
ml4t/diagnostic/signal/_utils.py +261 -0
ml4t/diagnostic/signal/core.py +275 -0
ml4t/diagnostic/signal/quantile.py +148 -0
ml4t/diagnostic/signal/result.py +214 -0
ml4t/diagnostic/signal/signal_ic.py +129 -0
ml4t/diagnostic/signal/turnover.py +182 -0
ml4t/diagnostic/splitters/AGENT.md +19 -0
ml4t/diagnostic/splitters/__init__.py +36 -0
ml4t/diagnostic/splitters/base.py +501 -0
ml4t/diagnostic/splitters/calendar.py +421 -0
ml4t/diagnostic/splitters/calendar_config.py +91 -0
ml4t/diagnostic/splitters/combinatorial.py +1064 -0
ml4t/diagnostic/splitters/config.py +322 -0
ml4t/diagnostic/splitters/cpcv/__init__.py +57 -0
ml4t/diagnostic/splitters/cpcv/combinations.py +119 -0
ml4t/diagnostic/splitters/cpcv/partitioning.py +263 -0
ml4t/diagnostic/splitters/cpcv/purge_engine.py +379 -0
ml4t/diagnostic/splitters/cpcv/windows.py +190 -0
ml4t/diagnostic/splitters/group_isolation.py +329 -0
ml4t/diagnostic/splitters/persistence.py +316 -0
ml4t/diagnostic/splitters/utils.py +207 -0
ml4t/diagnostic/splitters/walk_forward.py +757 -0
ml4t/diagnostic/utils/__init__.py +42 -0
ml4t/diagnostic/utils/config.py +542 -0
ml4t/diagnostic/utils/dependencies.py +318 -0
ml4t/diagnostic/utils/sessions.py +127 -0
ml4t/diagnostic/validation/__init__.py +54 -0
ml4t/diagnostic/validation/dataframe.py +274 -0
ml4t/diagnostic/validation/returns.py +280 -0
ml4t/diagnostic/validation/timeseries.py +299 -0
ml4t/diagnostic/visualization/AGENT.md +19 -0
ml4t/diagnostic/visualization/__init__.py +223 -0
ml4t/diagnostic/visualization/backtest/__init__.py +98 -0
ml4t/diagnostic/visualization/backtest/cost_attribution.py +762 -0
ml4t/diagnostic/visualization/backtest/executive_summary.py +895 -0
ml4t/diagnostic/visualization/backtest/interactive_controls.py +673 -0
ml4t/diagnostic/visualization/backtest/statistical_validity.py +874 -0
ml4t/diagnostic/visualization/backtest/tearsheet.py +565 -0
ml4t/diagnostic/visualization/backtest/template_system.py +373 -0
ml4t/diagnostic/visualization/backtest/trade_plots.py +1172 -0
ml4t/diagnostic/visualization/barrier_plots.py +782 -0
ml4t/diagnostic/visualization/core.py +1060 -0
ml4t/diagnostic/visualization/dashboards/__init__.py +36 -0
ml4t/diagnostic/visualization/dashboards/base.py +582 -0
ml4t/diagnostic/visualization/dashboards/importance.py +801 -0
ml4t/diagnostic/visualization/dashboards/interaction.py +263 -0
ml4t/diagnostic/visualization/dashboards.py +43 -0
ml4t/diagnostic/visualization/data_extraction/__init__.py +48 -0
ml4t/diagnostic/visualization/data_extraction/importance.py +649 -0
ml4t/diagnostic/visualization/data_extraction/interaction.py +504 -0
ml4t/diagnostic/visualization/data_extraction/types.py +113 -0
ml4t/diagnostic/visualization/data_extraction/validation.py +66 -0
ml4t/diagnostic/visualization/feature_plots.py +888 -0
ml4t/diagnostic/visualization/interaction_plots.py +618 -0
ml4t/diagnostic/visualization/portfolio/__init__.py +41 -0
ml4t/diagnostic/visualization/portfolio/dashboard.py +514 -0
ml4t/diagnostic/visualization/portfolio/drawdown_plots.py +341 -0
ml4t/diagnostic/visualization/portfolio/returns_plots.py +487 -0
ml4t/diagnostic/visualization/portfolio/risk_plots.py +301 -0
ml4t/diagnostic/visualization/report_generation.py +1343 -0
ml4t/diagnostic/visualization/signal/__init__.py +103 -0
ml4t/diagnostic/visualization/signal/dashboard.py +911 -0
ml4t/diagnostic/visualization/signal/event_plots.py +514 -0
ml4t/diagnostic/visualization/signal/ic_plots.py +635 -0
ml4t/diagnostic/visualization/signal/multi_signal_dashboard.py +974 -0
ml4t/diagnostic/visualization/signal/multi_signal_plots.py +603 -0
ml4t/diagnostic/visualization/signal/quantile_plots.py +625 -0
ml4t/diagnostic/visualization/signal/turnover_plots.py +400 -0
ml4t/diagnostic/visualization/trade_shap/__init__.py +90 -0
ml4t_diagnostic-0.1.0a1.dist-info/METADATA +1044 -0
ml4t_diagnostic-0.1.0a1.dist-info/RECORD +242 -0
ml4t_diagnostic-0.1.0a1.dist-info/WHEEL +4 -0
ml4t_diagnostic-0.1.0a1.dist-info/licenses/LICENSE +21 -0

ml4t/diagnostic/results/barrier_results/profit_factor.py ADDED Viewed

@@ -0,0 +1,297 @@
+"""Profit factor analysis results for barrier outcomes.
+This module provides the ProfitFactorResult class for storing profit factor
+metrics (Sum(TP returns) / |Sum(SL returns)|) by signal quantile.
+"""
+from __future__ import annotations
+import polars as pl
+from pydantic import Field, model_validator
+from ml4t.diagnostic.results.barrier_results.validation import _validate_quantile_dict_keys
+from ml4t.diagnostic.results.base import BaseResult
+class ProfitFactorResult(BaseResult):
+    """Results from profit factor analysis by signal decile.
+    Profit Factor = Sum(TP returns) / |Sum(SL returns)|
+    A profit factor > 1 indicates net profitable trading in that decile.
+    Examples
+    --------
+    >>> result = profit_factor_result
+    >>> print(result.summary())
+    >>> df = result.get_dataframe()
+    """
+    analysis_type: str = Field(default="barrier_profit_factor", frozen=True)
+    # ==========================================================================
+    # Configuration
+    # ==========================================================================
+    n_quantiles: int = Field(
+        ...,
+        description="Number of quantiles used",
+    )
+    quantile_labels: list[str] = Field(
+        ...,
+        description="Labels for each quantile (e.g., ['D1', 'D2', ..., 'D10'])",
+    )
+    # ==========================================================================
+    # Profit Factor by Quantile
+    # ==========================================================================
+    profit_factor: dict[str, float] = Field(
+        ...,
+        description="Profit factor per quantile: Sum(TP returns) / |Sum(SL returns)|",
+    )
+    # ==========================================================================
+    # Component Sums
+    # ==========================================================================
+    sum_tp_returns: dict[str, float] = Field(
+        ...,
+        description="Sum of returns from TP outcomes per quantile",
+    )
+    sum_sl_returns: dict[str, float] = Field(
+        ...,
+        description="Sum of returns from SL outcomes per quantile (negative values)",
+    )
+    sum_timeout_returns: dict[str, float] = Field(
+        ...,
+        description="Sum of returns from timeout outcomes per quantile",
+    )
+    sum_all_returns: dict[str, float] = Field(
+        ...,
+        description="Sum of all returns per quantile",
+    )
+    # ==========================================================================
+    # Average Returns
+    # ==========================================================================
+    avg_tp_return: dict[str, float] = Field(
+        ...,
+        description="Average return per TP outcome per quantile",
+    )
+    avg_sl_return: dict[str, float] = Field(
+        ...,
+        description="Average return per SL outcome per quantile",
+    )
+    avg_return: dict[str, float] = Field(
+        ...,
+        description="Average return per quantile (all outcomes)",
+    )
+    # ==========================================================================
+    # Counts
+    # ==========================================================================
+    count_tp: dict[str, int] = Field(
+        ...,
+        description="Number of TP outcomes per quantile",
+    )
+    count_sl: dict[str, int] = Field(
+        ...,
+        description="Number of SL outcomes per quantile",
+    )
+    count_total: dict[str, int] = Field(
+        ...,
+        description="Total count per quantile",
+    )
+    # ==========================================================================
+    # Aggregates
+    # ==========================================================================
+    overall_profit_factor: float = Field(
+        ...,
+        description="Overall profit factor across all observations",
+    )
+    overall_sum_returns: float = Field(
+        ...,
+        description="Total sum of all returns",
+    )
+    overall_avg_return: float = Field(
+        ...,
+        description="Average return across all observations",
+    )
+    n_observations: int = Field(
+        ...,
+        description="Total number of observations analyzed",
+    )
+    # ==========================================================================
+    # Monotonicity
+    # ==========================================================================
+    pf_monotonic: bool = Field(
+        ...,
+        description="Whether profit factor is monotonic across quantiles",
+    )
+    pf_direction: str = Field(
+        ...,
+        description="Direction of PF change: 'increasing', 'decreasing', or 'none'",
+    )
+    pf_spearman: float = Field(
+        ...,
+        description="Spearman correlation between quantile rank and profit factor",
+    )
+    # ==========================================================================
+    # Validation
+    # ==========================================================================
+    @model_validator(mode="after")
+    def _validate_quantile_keys(self) -> ProfitFactorResult:
+        """Validate that all quantile-keyed dicts have consistent keys."""
+        if self.n_quantiles != len(self.quantile_labels):
+            raise ValueError(
+                f"n_quantiles ({self.n_quantiles}) != len(quantile_labels) ({len(self.quantile_labels)})"
+            )
+        _validate_quantile_dict_keys(
+            self.quantile_labels,
+            [
+                ("profit_factor", self.profit_factor),
+                ("sum_tp_returns", self.sum_tp_returns),
+                ("sum_sl_returns", self.sum_sl_returns),
+                ("sum_timeout_returns", self.sum_timeout_returns),
+                ("sum_all_returns", self.sum_all_returns),
+                ("avg_tp_return", self.avg_tp_return),
+                ("avg_sl_return", self.avg_sl_return),
+                ("avg_return", self.avg_return),
+                ("count_tp", self.count_tp),
+                ("count_sl", self.count_sl),
+                ("count_total", self.count_total),
+            ],
+        )
+        return self
+    def get_dataframe(self, name: str | None = None) -> pl.DataFrame:
+        """Get results as Polars DataFrame.
+        Parameters
+        ----------
+        name : str | None
+            DataFrame to retrieve:
+            - None or "profit_factor": Profit factor by quantile
+            - "returns": Detailed returns breakdown by quantile
+            - "summary": Single-row summary statistics
+        Returns
+        -------
+        pl.DataFrame
+            Requested DataFrame
+        """
+        if name is None or name == "profit_factor":
+            return pl.DataFrame(
+                {
+                    "quantile": self.quantile_labels,
+                    "profit_factor": [self.profit_factor[q] for q in self.quantile_labels],
+                    "avg_return": [self.avg_return[q] for q in self.quantile_labels],
+                    "sum_returns": [self.sum_all_returns[q] for q in self.quantile_labels],
+                    "count_total": [self.count_total[q] for q in self.quantile_labels],
+                }
+            )
+        if name == "returns":
+            return pl.DataFrame(
+                {
+                    "quantile": self.quantile_labels,
+                    "sum_tp_returns": [self.sum_tp_returns[q] for q in self.quantile_labels],
+                    "sum_sl_returns": [self.sum_sl_returns[q] for q in self.quantile_labels],
+                    "sum_timeout_returns": [
+                        self.sum_timeout_returns[q] for q in self.quantile_labels
+                    ],
+                    "avg_tp_return": [self.avg_tp_return[q] for q in self.quantile_labels],
+                    "avg_sl_return": [self.avg_sl_return[q] for q in self.quantile_labels],
+                    "count_tp": [self.count_tp[q] for q in self.quantile_labels],
+                    "count_sl": [self.count_sl[q] for q in self.quantile_labels],
+                }
+            )
+        if name == "summary":
+            return pl.DataFrame(
+                {
+                    "metric": [
+                        "n_observations",
+                        "n_quantiles",
+                        "overall_profit_factor",
+                        "overall_sum_returns",
+                        "overall_avg_return",
+                        "pf_monotonic",
+                        "pf_spearman",
+                    ],
+                    "value": [
+                        float(self.n_observations),
+                        float(self.n_quantiles),
+                        self.overall_profit_factor,
+                        self.overall_sum_returns,
+                        self.overall_avg_return,
+                        float(self.pf_monotonic),
+                        self.pf_spearman,
+                    ],
+                }
+            )
+        raise ValueError(
+            f"Unknown DataFrame name: {name}. Available: 'profit_factor', 'returns', 'summary'"
+        )
+    def list_available_dataframes(self) -> list[str]:
+        """List available DataFrame views."""
+        return ["profit_factor", "returns", "summary"]
+    def summary(self) -> str:
+        """Get human-readable summary of profit factor results."""
+        lines = [
+            "=" * 60,
+            "Barrier Profit Factor Analysis",
+            "=" * 60,
+            "",
+            f"Observations:         {self.n_observations:>12,}",
+            f"Quantiles:            {self.n_quantiles:>12}",
+            "",
+            "Overall Metrics:",
+            f"  Profit Factor:      {self.overall_profit_factor:>12.2f}",
+            f"  Sum Returns:        {self.overall_sum_returns:>12.4f}",
+            f"  Avg Return:         {self.overall_avg_return:>12.4%}",
+            "",
+            "Monotonicity (PF vs Signal Strength):",
+            f"  Monotonic:          {'Yes' if self.pf_monotonic else 'No':>12}",
+            f"  Direction:          {self.pf_direction:>12}",
+            f"  Spearman rho:       {self.pf_spearman:>12.4f}",
+            "",
+            "-" * 60,
+            "Profit Factor by Quantile:",
+            "-" * 60,
+            f"{'Quantile':<10} {'PF':>8} {'Avg Ret':>10} {'Sum Ret':>12} {'Count':>8}",
+        ]
+        for q in self.quantile_labels:
+            pf = self.profit_factor[q]
+            avg = self.avg_return[q]
+            total = self.sum_all_returns[q]
+            count = self.count_total[q]
+            lines.append(f"{q:<10} {pf:>8.2f} {avg:>10.4%} {total:>12.4f} {count:>8,}")
+        return "\n".join(lines)

ml4t/diagnostic/results/barrier_results/tearsheet.py ADDED Viewed

@@ -0,0 +1,397 @@
+"""Barrier tear sheet containing all barrier analysis results.
+This module provides the BarrierTearSheet class that aggregates all barrier
+analysis results (hit rates, profit factor, precision/recall, time-to-target)
+into a single exportable result object.
+"""
+from __future__ import annotations
+from pathlib import Path
+from typing import Any
+import polars as pl
+from pydantic import Field
+from ml4t.diagnostic.results.barrier_results.hit_rate import HitRateResult
+from ml4t.diagnostic.results.barrier_results.precision_recall import PrecisionRecallResult
+from ml4t.diagnostic.results.barrier_results.profit_factor import ProfitFactorResult
+from ml4t.diagnostic.results.barrier_results.time_to_target import TimeToTargetResult
+from ml4t.diagnostic.results.base import BaseResult
+class BarrierTearSheet(BaseResult):
+    """Complete tear sheet containing all barrier analysis results.
+    Aggregates hit rates, profit factor, and visualization data into
+    a single exportable result object.
+    Examples
+    --------
+    >>> tear_sheet = barrier_analysis.create_tear_sheet()
+    >>> tear_sheet.show()  # Display in Jupyter
+    >>> tear_sheet.save_html("barrier_report.html")
+    """
+    analysis_type: str = Field(default="barrier_tear_sheet", frozen=True)
+    # ==========================================================================
+    # Component Results
+    # ==========================================================================
+    hit_rate_result: HitRateResult | None = Field(
+        default=None,
+        description="Hit rate analysis results",
+    )
+    profit_factor_result: ProfitFactorResult | None = Field(
+        default=None,
+        description="Profit factor analysis results",
+    )
+    precision_recall_result: PrecisionRecallResult | None = Field(
+        default=None,
+        description="Precision/recall analysis results",
+    )
+    time_to_target_result: TimeToTargetResult | None = Field(
+        default=None,
+        description="Time-to-target analysis results",
+    )
+    # ==========================================================================
+    # Metadata
+    # ==========================================================================
+    signal_name: str = Field(
+        default="signal",
+        description="Name of the signal analyzed",
+    )
+    n_assets: int = Field(
+        ...,
+        description="Number of unique assets",
+    )
+    n_dates: int = Field(
+        ...,
+        description="Number of unique dates",
+    )
+    n_observations: int = Field(
+        ...,
+        description="Total number of observations analyzed",
+    )
+    date_range: tuple[str, str] = Field(
+        ...,
+        description="Date range (start, end) in ISO format",
+    )
+    # ==========================================================================
+    # Figures (stored as JSON for serialization)
+    # ==========================================================================
+    figures: dict[str, Any] = Field(
+        default_factory=dict,
+        description="Plotly figures as JSON (for HTML export)",
+    )
+    def get_dataframe(self, name: str | None = None) -> pl.DataFrame:
+        """Get results as Polars DataFrame.
+        Parameters
+        ----------
+        name : str | None
+            DataFrame to retrieve - routes to component results
+        Returns
+        -------
+        pl.DataFrame
+            Requested DataFrame
+        """
+        if name is None or name == "summary":
+            return self._build_summary_df()
+        # Route to component results
+        if name.startswith("hit_rate_"):
+            if self.hit_rate_result is None:
+                raise ValueError("Hit rate analysis not available")
+            component_name = name[9:] if name != "hit_rate_result" else None
+            return self.hit_rate_result.get_dataframe(component_name)
+        if name.startswith("profit_factor_"):
+            if self.profit_factor_result is None:
+                raise ValueError("Profit factor analysis not available")
+            component_name = name[14:] if name != "profit_factor_result" else None
+            return self.profit_factor_result.get_dataframe(component_name)
+        if name.startswith("precision_recall_"):
+            if self.precision_recall_result is None:
+                raise ValueError("Precision/recall analysis not available")
+            component_name = name[17:] if name != "precision_recall_result" else None
+            return self.precision_recall_result.get_dataframe(component_name)
+        if name.startswith("time_to_target_"):
+            if self.time_to_target_result is None:
+                raise ValueError("Time-to-target analysis not available")
+            component_name = name[15:] if name != "time_to_target_result" else None
+            return self.time_to_target_result.get_dataframe(component_name)
+        raise ValueError(
+            f"Unknown DataFrame name: {name}. Use 'summary' or prefix with "
+            "'hit_rate_', 'profit_factor_', 'precision_recall_', 'time_to_target_'"
+        )
+    def list_available_dataframes(self) -> list[str]:
+        """List available DataFrame views."""
+        available = ["summary"]
+        if self.hit_rate_result:
+            available.extend(
+                [f"hit_rate_{n}" for n in self.hit_rate_result.list_available_dataframes()]
+            )
+        if self.profit_factor_result:
+            available.extend(
+                [
+                    f"profit_factor_{n}"
+                    for n in self.profit_factor_result.list_available_dataframes()
+                ]
+            )
+        if self.precision_recall_result:
+            available.extend(
+                [
+                    f"precision_recall_{n}"
+                    for n in self.precision_recall_result.list_available_dataframes()
+                ]
+            )
+        if self.time_to_target_result:
+            available.extend(
+                [
+                    f"time_to_target_{n}"
+                    for n in self.time_to_target_result.list_available_dataframes()
+                ]
+            )
+        return available
+    def _build_summary_df(self) -> pl.DataFrame:
+        """Build summary DataFrame with key metrics."""
+        rows: list[dict[str, str]] = [
+            {"metric": "signal_name", "value": self.signal_name},
+            {"metric": "n_assets", "value": str(self.n_assets)},
+            {"metric": "n_dates", "value": str(self.n_dates)},
+            {"metric": "n_observations", "value": str(self.n_observations)},
+            {"metric": "date_range_start", "value": self.date_range[0]},
+            {"metric": "date_range_end", "value": self.date_range[1]},
+        ]
+        if self.hit_rate_result:
+            rows.append(
+                {
+                    "metric": "overall_hit_rate_tp",
+                    "value": f"{self.hit_rate_result.overall_hit_rate_tp:.4f}",
+                }
+            )
+            rows.append(
+                {"metric": "chi2_significant", "value": str(self.hit_rate_result.is_significant)}
+            )
+        if self.profit_factor_result:
+            rows.append(
+                {
+                    "metric": "overall_profit_factor",
+                    "value": f"{self.profit_factor_result.overall_profit_factor:.4f}",
+                }
+            )
+        if self.precision_recall_result:
+            rows.append(
+                {
+                    "metric": "baseline_tp_rate",
+                    "value": f"{self.precision_recall_result.baseline_tp_rate:.4f}",
+                }
+            )
+            rows.append(
+                {
+                    "metric": "best_f1_score",
+                    "value": f"{self.precision_recall_result.best_f1_score:.4f}",
+                }
+            )
+            rows.append(
+                {
+                    "metric": "best_f1_quantile",
+                    "value": self.precision_recall_result.best_f1_quantile,
+                }
+            )
+        if self.time_to_target_result:
+            rows.append(
+                {
+                    "metric": "overall_mean_bars",
+                    "value": f"{self.time_to_target_result.overall_mean_bars:.1f}",
+                }
+            )
+            rows.append(
+                {
+                    "metric": "overall_mean_bars_tp",
+                    "value": f"{self.time_to_target_result.overall_mean_bars_tp:.1f}",
+                }
+            )
+        return pl.DataFrame(rows)
+    def summary(self) -> str:
+        """Get human-readable summary of complete tear sheet."""
+        lines = [
+            "=" * 60,
+            f"Barrier Analysis Tear Sheet: {self.signal_name}",
+            "=" * 60,
+            "",
+            f"Assets:       {self.n_assets:>10,}",
+            f"Dates:        {self.n_dates:>10,}",
+            f"Observations: {self.n_observations:>10,}",
+            f"Range:        {self.date_range[0]} to {self.date_range[1]}",
+            f"Created:      {self.created_at}",
+            "",
+        ]
+        if self.hit_rate_result:
+            lines.append("--- Hit Rate Analysis ---")
+            lines.append(self.hit_rate_result.summary())
+            lines.append("")
+        if self.profit_factor_result:
+            lines.append("--- Profit Factor Analysis ---")
+            lines.append(self.profit_factor_result.summary())
+            lines.append("")
+        if self.precision_recall_result:
+            lines.append("--- Precision/Recall Analysis ---")
+            lines.append(self.precision_recall_result.summary())
+            lines.append("")
+        if self.time_to_target_result:
+            lines.append("--- Time-to-Target Analysis ---")
+            lines.append(self.time_to_target_result.summary())
+        return "\n".join(lines)
+    def show(self) -> None:
+        """Display tear sheet in Jupyter notebook."""
+        try:
+            from IPython.display import HTML, display
+            display(HTML(f"<h2>Barrier Analysis: {self.signal_name}</h2>"))
+            display(
+                HTML(
+                    f"<p>{self.n_assets} assets, {self.n_dates} dates, {self.n_observations} observations</p>"
+                )
+            )
+            for _name, fig_json in self.figures.items():
+                import plotly.io as pio
+                fig = pio.from_json(fig_json)
+                fig.show()
+        except ImportError:
+            print("IPython not available. Use save_html() instead.")
+            print(self.summary())
+    def save_html(
+        self,
+        path: str | Path,
+        include_plotlyjs: str | bool = "cdn",
+    ) -> Path:
+        """Save tear sheet as self-contained HTML file.
+        Parameters
+        ----------
+        path : str | Path
+            Output file path
+        include_plotlyjs : str | bool
+            How to include plotly.js: 'cdn', 'directory', True (embed), False
+        Returns
+        -------
+        Path
+            Path to saved file
+        """
+        import plotly.io as pio
+        path = Path(path)
+        path.parent.mkdir(parents=True, exist_ok=True)
+        # NOTE: Plotly.js is included via pio.to_html with include_plotlyjs parameter
+        # Do NOT add hardcoded CDN script here - it would duplicate the inclusion
+        html_parts = [
+            "<!DOCTYPE html>",
+            "<html>",
+            "<head>",
+            f"<title>Barrier Analysis: {self.signal_name}</title>",
+            "<style>",
+            "body { font-family: -apple-system, system-ui, sans-serif; margin: 40px; }",
+            "h1 { color: #2C3E50; }",
+            ".summary { background: #f8f9fa; padding: 20px; border-radius: 8px; margin-bottom: 30px; }",
+            ".plot-container { margin-bottom: 40px; }",
+            "</style>",
+            "</head>",
+            "<body>",
+            f"<h1>Barrier Analysis: {self.signal_name}</h1>",
+            "<div class='summary'>",
+            f"<p><strong>Assets:</strong> {self.n_assets:,}</p>",
+            f"<p><strong>Dates:</strong> {self.n_dates:,}</p>",
+            f"<p><strong>Observations:</strong> {self.n_observations:,}</p>",
+            f"<p><strong>Range:</strong> {self.date_range[0]} to {self.date_range[1]}</p>",
+            f"<p><strong>Generated:</strong> {self.created_at}</p>",
+            "</div>",
+        ]
+        # Add figures
+        plotlyjs_included = False
+        for name, fig_json in self.figures.items():
+            fig = pio.from_json(fig_json)
+            fig_html = pio.to_html(
+                fig,
+                include_plotlyjs=include_plotlyjs if not plotlyjs_included else False,
+                full_html=False,
+            )
+            html_parts.append("<div class='plot-container'>")
+            html_parts.append(f"<h2>{name.replace('_', ' ').title()}</h2>")
+            html_parts.append(fig_html)
+            html_parts.append("</div>")
+            plotlyjs_included = True
+        html_parts.extend(["</body>", "</html>"])
+        path.write_text("\n".join(html_parts))
+        return path
+    def save_json(self, path: str | Path, exclude_figures: bool = False) -> Path:
+        """Export all metrics as structured JSON.
+        Parameters
+        ----------
+        path : str | Path
+            Output file path
+        exclude_figures : bool, default=False
+            If True, exclude figure JSON data to reduce file size
+        Returns
+        -------
+        Path
+            Path to saved file
+        """
+        import json
+        path = Path(path)
+        path.parent.mkdir(parents=True, exist_ok=True)
+        data = self.to_dict(exclude_none=True)
+        if exclude_figures:
+            data.pop("figures", None)
+        with open(path, "w", encoding="utf-8") as f:
+            json.dump(data, f, indent=2, default=str)
+        return path