PyPI - ml4t-diagnostic - Versions diffs - 0.1.0a1__py3-none-any.whl - Mend

ml4t-diagnostic 0.1.0a1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

ml4t/diagnostic/AGENT.md +25 -0
ml4t/diagnostic/__init__.py +166 -0
ml4t/diagnostic/backends/__init__.py +10 -0
ml4t/diagnostic/backends/adapter.py +192 -0
ml4t/diagnostic/backends/polars_backend.py +899 -0
ml4t/diagnostic/caching/__init__.py +40 -0
ml4t/diagnostic/caching/cache.py +331 -0
ml4t/diagnostic/caching/decorators.py +131 -0
ml4t/diagnostic/caching/smart_cache.py +339 -0
ml4t/diagnostic/config/AGENT.md +24 -0
ml4t/diagnostic/config/README.md +267 -0
ml4t/diagnostic/config/__init__.py +219 -0
ml4t/diagnostic/config/barrier_config.py +277 -0
ml4t/diagnostic/config/base.py +301 -0
ml4t/diagnostic/config/event_config.py +148 -0
ml4t/diagnostic/config/feature_config.py +404 -0
ml4t/diagnostic/config/multi_signal_config.py +55 -0
ml4t/diagnostic/config/portfolio_config.py +215 -0
ml4t/diagnostic/config/report_config.py +391 -0
ml4t/diagnostic/config/sharpe_config.py +202 -0
ml4t/diagnostic/config/signal_config.py +206 -0
ml4t/diagnostic/config/trade_analysis_config.py +310 -0
ml4t/diagnostic/config/validation.py +279 -0
ml4t/diagnostic/core/__init__.py +29 -0
ml4t/diagnostic/core/numba_utils.py +315 -0
ml4t/diagnostic/core/purging.py +372 -0
ml4t/diagnostic/core/sampling.py +471 -0
ml4t/diagnostic/errors/__init__.py +205 -0
ml4t/diagnostic/evaluation/AGENT.md +26 -0
ml4t/diagnostic/evaluation/__init__.py +437 -0
ml4t/diagnostic/evaluation/autocorrelation.py +531 -0
ml4t/diagnostic/evaluation/barrier_analysis.py +1050 -0
ml4t/diagnostic/evaluation/binary_metrics.py +910 -0
ml4t/diagnostic/evaluation/dashboard.py +715 -0
ml4t/diagnostic/evaluation/diagnostic_plots.py +1037 -0
ml4t/diagnostic/evaluation/distribution/__init__.py +499 -0
ml4t/diagnostic/evaluation/distribution/moments.py +299 -0
ml4t/diagnostic/evaluation/distribution/tails.py +777 -0
ml4t/diagnostic/evaluation/distribution/tests.py +470 -0
ml4t/diagnostic/evaluation/drift/__init__.py +139 -0
ml4t/diagnostic/evaluation/drift/analysis.py +432 -0
ml4t/diagnostic/evaluation/drift/domain_classifier.py +517 -0
ml4t/diagnostic/evaluation/drift/population_stability_index.py +310 -0
ml4t/diagnostic/evaluation/drift/wasserstein.py +388 -0
ml4t/diagnostic/evaluation/event_analysis.py +647 -0
ml4t/diagnostic/evaluation/excursion.py +390 -0
ml4t/diagnostic/evaluation/feature_diagnostics.py +873 -0
ml4t/diagnostic/evaluation/feature_outcome.py +666 -0
ml4t/diagnostic/evaluation/framework.py +935 -0
ml4t/diagnostic/evaluation/metric_registry.py +255 -0
ml4t/diagnostic/evaluation/metrics/AGENT.md +23 -0
ml4t/diagnostic/evaluation/metrics/__init__.py +133 -0
ml4t/diagnostic/evaluation/metrics/basic.py +160 -0
ml4t/diagnostic/evaluation/metrics/conditional_ic.py +469 -0
ml4t/diagnostic/evaluation/metrics/feature_outcome.py +475 -0
ml4t/diagnostic/evaluation/metrics/ic_statistics.py +446 -0
ml4t/diagnostic/evaluation/metrics/importance_analysis.py +338 -0
ml4t/diagnostic/evaluation/metrics/importance_classical.py +375 -0
ml4t/diagnostic/evaluation/metrics/importance_mda.py +371 -0
ml4t/diagnostic/evaluation/metrics/importance_shap.py +715 -0
ml4t/diagnostic/evaluation/metrics/information_coefficient.py +527 -0
ml4t/diagnostic/evaluation/metrics/interactions.py +772 -0
ml4t/diagnostic/evaluation/metrics/monotonicity.py +226 -0
ml4t/diagnostic/evaluation/metrics/risk_adjusted.py +324 -0
ml4t/diagnostic/evaluation/multi_signal.py +550 -0
ml4t/diagnostic/evaluation/portfolio_analysis/__init__.py +83 -0
ml4t/diagnostic/evaluation/portfolio_analysis/analysis.py +734 -0
ml4t/diagnostic/evaluation/portfolio_analysis/metrics.py +589 -0
ml4t/diagnostic/evaluation/portfolio_analysis/results.py +334 -0
ml4t/diagnostic/evaluation/report_generation.py +824 -0
ml4t/diagnostic/evaluation/signal_selector.py +452 -0
ml4t/diagnostic/evaluation/stat_registry.py +139 -0
ml4t/diagnostic/evaluation/stationarity/__init__.py +97 -0
ml4t/diagnostic/evaluation/stationarity/analysis.py +518 -0
ml4t/diagnostic/evaluation/stationarity/augmented_dickey_fuller.py +296 -0
ml4t/diagnostic/evaluation/stationarity/kpss_test.py +308 -0
ml4t/diagnostic/evaluation/stationarity/phillips_perron.py +365 -0
ml4t/diagnostic/evaluation/stats/AGENT.md +43 -0
ml4t/diagnostic/evaluation/stats/__init__.py +191 -0
ml4t/diagnostic/evaluation/stats/backtest_overfitting.py +219 -0
ml4t/diagnostic/evaluation/stats/bootstrap.py +228 -0
ml4t/diagnostic/evaluation/stats/deflated_sharpe_ratio.py +591 -0
ml4t/diagnostic/evaluation/stats/false_discovery_rate.py +295 -0
ml4t/diagnostic/evaluation/stats/hac_standard_errors.py +108 -0
ml4t/diagnostic/evaluation/stats/minimum_track_record.py +408 -0
ml4t/diagnostic/evaluation/stats/moments.py +164 -0
ml4t/diagnostic/evaluation/stats/rademacher_adjustment.py +436 -0
ml4t/diagnostic/evaluation/stats/reality_check.py +155 -0
ml4t/diagnostic/evaluation/stats/sharpe_inference.py +219 -0
ml4t/diagnostic/evaluation/themes.py +330 -0
ml4t/diagnostic/evaluation/threshold_analysis.py +957 -0
ml4t/diagnostic/evaluation/trade_analysis.py +1136 -0
ml4t/diagnostic/evaluation/trade_dashboard/__init__.py +32 -0
ml4t/diagnostic/evaluation/trade_dashboard/app.py +315 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/__init__.py +18 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/csv.py +82 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/html.py +276 -0
ml4t/diagnostic/evaluation/trade_dashboard/io.py +166 -0
ml4t/diagnostic/evaluation/trade_dashboard/normalize.py +304 -0
ml4t/diagnostic/evaluation/trade_dashboard/stats.py +386 -0
ml4t/diagnostic/evaluation/trade_dashboard/style.py +79 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/__init__.py +21 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/patterns.py +354 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/shap_analysis.py +280 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/stat_validation.py +186 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/worst_trades.py +236 -0
ml4t/diagnostic/evaluation/trade_dashboard/types.py +129 -0
ml4t/diagnostic/evaluation/trade_shap/__init__.py +102 -0
ml4t/diagnostic/evaluation/trade_shap/alignment.py +188 -0
ml4t/diagnostic/evaluation/trade_shap/characterize.py +413 -0
ml4t/diagnostic/evaluation/trade_shap/cluster.py +302 -0
ml4t/diagnostic/evaluation/trade_shap/explain.py +208 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/__init__.py +23 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/generator.py +290 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/matcher.py +251 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/templates.yaml +467 -0
ml4t/diagnostic/evaluation/trade_shap/models.py +386 -0
ml4t/diagnostic/evaluation/trade_shap/normalize.py +116 -0
ml4t/diagnostic/evaluation/trade_shap/pipeline.py +263 -0
ml4t/diagnostic/evaluation/trade_shap_dashboard.py +283 -0
ml4t/diagnostic/evaluation/trade_shap_diagnostics.py +588 -0
ml4t/diagnostic/evaluation/validated_cv.py +535 -0
ml4t/diagnostic/evaluation/visualization.py +1050 -0
ml4t/diagnostic/evaluation/volatility/__init__.py +45 -0
ml4t/diagnostic/evaluation/volatility/analysis.py +351 -0
ml4t/diagnostic/evaluation/volatility/arch.py +258 -0
ml4t/diagnostic/evaluation/volatility/garch.py +460 -0
ml4t/diagnostic/integration/__init__.py +48 -0
ml4t/diagnostic/integration/backtest_contract.py +671 -0
ml4t/diagnostic/integration/data_contract.py +316 -0
ml4t/diagnostic/integration/engineer_contract.py +226 -0
ml4t/diagnostic/logging/__init__.py +77 -0
ml4t/diagnostic/logging/logger.py +245 -0
ml4t/diagnostic/logging/performance.py +234 -0
ml4t/diagnostic/logging/progress.py +234 -0
ml4t/diagnostic/logging/wandb.py +412 -0
ml4t/diagnostic/metrics/__init__.py +9 -0
ml4t/diagnostic/metrics/percentiles.py +128 -0
ml4t/diagnostic/py.typed +1 -0
ml4t/diagnostic/reporting/__init__.py +43 -0
ml4t/diagnostic/reporting/base.py +130 -0
ml4t/diagnostic/reporting/html_renderer.py +275 -0
ml4t/diagnostic/reporting/json_renderer.py +51 -0
ml4t/diagnostic/reporting/markdown_renderer.py +117 -0
ml4t/diagnostic/results/AGENT.md +24 -0
ml4t/diagnostic/results/__init__.py +105 -0
ml4t/diagnostic/results/barrier_results/__init__.py +36 -0
ml4t/diagnostic/results/barrier_results/hit_rate.py +304 -0
ml4t/diagnostic/results/barrier_results/precision_recall.py +266 -0
ml4t/diagnostic/results/barrier_results/profit_factor.py +297 -0
ml4t/diagnostic/results/barrier_results/tearsheet.py +397 -0
ml4t/diagnostic/results/barrier_results/time_to_target.py +305 -0
ml4t/diagnostic/results/barrier_results/validation.py +38 -0
ml4t/diagnostic/results/base.py +177 -0
ml4t/diagnostic/results/event_results.py +349 -0
ml4t/diagnostic/results/feature_results.py +787 -0
ml4t/diagnostic/results/multi_signal_results.py +431 -0
ml4t/diagnostic/results/portfolio_results.py +281 -0
ml4t/diagnostic/results/sharpe_results.py +448 -0
ml4t/diagnostic/results/signal_results/__init__.py +74 -0
ml4t/diagnostic/results/signal_results/ic.py +581 -0
ml4t/diagnostic/results/signal_results/irtc.py +110 -0
ml4t/diagnostic/results/signal_results/quantile.py +392 -0
ml4t/diagnostic/results/signal_results/tearsheet.py +456 -0
ml4t/diagnostic/results/signal_results/turnover.py +213 -0
ml4t/diagnostic/results/signal_results/validation.py +147 -0
ml4t/diagnostic/signal/AGENT.md +17 -0
ml4t/diagnostic/signal/__init__.py +69 -0
ml4t/diagnostic/signal/_report.py +152 -0
ml4t/diagnostic/signal/_utils.py +261 -0
ml4t/diagnostic/signal/core.py +275 -0
ml4t/diagnostic/signal/quantile.py +148 -0
ml4t/diagnostic/signal/result.py +214 -0
ml4t/diagnostic/signal/signal_ic.py +129 -0
ml4t/diagnostic/signal/turnover.py +182 -0
ml4t/diagnostic/splitters/AGENT.md +19 -0
ml4t/diagnostic/splitters/__init__.py +36 -0
ml4t/diagnostic/splitters/base.py +501 -0
ml4t/diagnostic/splitters/calendar.py +421 -0
ml4t/diagnostic/splitters/calendar_config.py +91 -0
ml4t/diagnostic/splitters/combinatorial.py +1064 -0
ml4t/diagnostic/splitters/config.py +322 -0
ml4t/diagnostic/splitters/cpcv/__init__.py +57 -0
ml4t/diagnostic/splitters/cpcv/combinations.py +119 -0
ml4t/diagnostic/splitters/cpcv/partitioning.py +263 -0
ml4t/diagnostic/splitters/cpcv/purge_engine.py +379 -0
ml4t/diagnostic/splitters/cpcv/windows.py +190 -0
ml4t/diagnostic/splitters/group_isolation.py +329 -0
ml4t/diagnostic/splitters/persistence.py +316 -0
ml4t/diagnostic/splitters/utils.py +207 -0
ml4t/diagnostic/splitters/walk_forward.py +757 -0
ml4t/diagnostic/utils/__init__.py +42 -0
ml4t/diagnostic/utils/config.py +542 -0
ml4t/diagnostic/utils/dependencies.py +318 -0
ml4t/diagnostic/utils/sessions.py +127 -0
ml4t/diagnostic/validation/__init__.py +54 -0
ml4t/diagnostic/validation/dataframe.py +274 -0
ml4t/diagnostic/validation/returns.py +280 -0
ml4t/diagnostic/validation/timeseries.py +299 -0
ml4t/diagnostic/visualization/AGENT.md +19 -0
ml4t/diagnostic/visualization/__init__.py +223 -0
ml4t/diagnostic/visualization/backtest/__init__.py +98 -0
ml4t/diagnostic/visualization/backtest/cost_attribution.py +762 -0
ml4t/diagnostic/visualization/backtest/executive_summary.py +895 -0
ml4t/diagnostic/visualization/backtest/interactive_controls.py +673 -0
ml4t/diagnostic/visualization/backtest/statistical_validity.py +874 -0
ml4t/diagnostic/visualization/backtest/tearsheet.py +565 -0
ml4t/diagnostic/visualization/backtest/template_system.py +373 -0
ml4t/diagnostic/visualization/backtest/trade_plots.py +1172 -0
ml4t/diagnostic/visualization/barrier_plots.py +782 -0
ml4t/diagnostic/visualization/core.py +1060 -0
ml4t/diagnostic/visualization/dashboards/__init__.py +36 -0
ml4t/diagnostic/visualization/dashboards/base.py +582 -0
ml4t/diagnostic/visualization/dashboards/importance.py +801 -0
ml4t/diagnostic/visualization/dashboards/interaction.py +263 -0
ml4t/diagnostic/visualization/dashboards.py +43 -0
ml4t/diagnostic/visualization/data_extraction/__init__.py +48 -0
ml4t/diagnostic/visualization/data_extraction/importance.py +649 -0
ml4t/diagnostic/visualization/data_extraction/interaction.py +504 -0
ml4t/diagnostic/visualization/data_extraction/types.py +113 -0
ml4t/diagnostic/visualization/data_extraction/validation.py +66 -0
ml4t/diagnostic/visualization/feature_plots.py +888 -0
ml4t/diagnostic/visualization/interaction_plots.py +618 -0
ml4t/diagnostic/visualization/portfolio/__init__.py +41 -0
ml4t/diagnostic/visualization/portfolio/dashboard.py +514 -0
ml4t/diagnostic/visualization/portfolio/drawdown_plots.py +341 -0
ml4t/diagnostic/visualization/portfolio/returns_plots.py +487 -0
ml4t/diagnostic/visualization/portfolio/risk_plots.py +301 -0
ml4t/diagnostic/visualization/report_generation.py +1343 -0
ml4t/diagnostic/visualization/signal/__init__.py +103 -0
ml4t/diagnostic/visualization/signal/dashboard.py +911 -0
ml4t/diagnostic/visualization/signal/event_plots.py +514 -0
ml4t/diagnostic/visualization/signal/ic_plots.py +635 -0
ml4t/diagnostic/visualization/signal/multi_signal_dashboard.py +974 -0
ml4t/diagnostic/visualization/signal/multi_signal_plots.py +603 -0
ml4t/diagnostic/visualization/signal/quantile_plots.py +625 -0
ml4t/diagnostic/visualization/signal/turnover_plots.py +400 -0
ml4t/diagnostic/visualization/trade_shap/__init__.py +90 -0
ml4t_diagnostic-0.1.0a1.dist-info/METADATA +1044 -0
ml4t_diagnostic-0.1.0a1.dist-info/RECORD +242 -0
ml4t_diagnostic-0.1.0a1.dist-info/WHEEL +4 -0
ml4t_diagnostic-0.1.0a1.dist-info/licenses/LICENSE +21 -0

ml4t/diagnostic/results/signal_results/tearsheet.py ADDED Viewed

@@ -0,0 +1,456 @@
+"""SignalTearSheet class for complete signal analysis results.
+This module provides the SignalTearSheet class that aggregates all signal
+analysis components (IC, quantile, turnover, IR_tc) into a single exportable
+result object with visualization and export capabilities.
+References
+----------
+Lopez de Prado, M. (2018). "Advances in Financial Machine Learning"
+"""
+from __future__ import annotations
+from pathlib import Path
+from typing import Any, Literal
+import polars as pl
+from pydantic import Field
+from ml4t.diagnostic.results.base import BaseResult
+from ml4t.diagnostic.results.signal_results.ic import SignalICResult
+from ml4t.diagnostic.results.signal_results.irtc import IRtcResult
+from ml4t.diagnostic.results.signal_results.quantile import QuantileAnalysisResult
+from ml4t.diagnostic.results.signal_results.turnover import TurnoverAnalysisResult
+from ml4t.diagnostic.results.signal_results.validation import _figure_from_data
+class SignalTearSheet(BaseResult):
+    """Complete tear sheet containing all signal analysis results.
+    Aggregates IC, quantile, turnover, and visualization data into
+    a single exportable result object.
+    Examples
+    --------
+    >>> tear_sheet = signal_analysis.create_tear_sheet()
+    >>> tear_sheet.show()  # Display in Jupyter
+    >>> tear_sheet.save_html("signal_report.html")
+    """
+    analysis_type: str = Field(default="signal_tear_sheet", frozen=True)
+    # ==========================================================================
+    # Component Results
+    # ==========================================================================
+    ic_analysis: SignalICResult | None = Field(
+        default=None,
+        description="Signal IC analysis results",
+    )
+    quantile_analysis: QuantileAnalysisResult | None = Field(
+        default=None,
+        description="Quantile analysis results",
+    )
+    turnover_analysis: TurnoverAnalysisResult | None = Field(
+        default=None,
+        description="Turnover analysis results",
+    )
+    ir_tc_analysis: IRtcResult | None = Field(
+        default=None,
+        description="IR_tc analysis results",
+    )
+    # ==========================================================================
+    # Metadata
+    # ==========================================================================
+    signal_name: str = Field(
+        default="signal",
+        description="Name of the signal analyzed",
+    )
+    n_assets: int = Field(
+        ...,
+        description="Number of unique assets",
+    )
+    n_dates: int = Field(
+        ...,
+        description="Number of unique dates",
+    )
+    date_range: tuple[str, str] = Field(
+        ...,
+        description="Date range (start, end) in ISO format",
+    )
+    # ==========================================================================
+    # Figures (stored as JSON for serialization)
+    # ==========================================================================
+    figures: dict[str, Any] = Field(
+        default_factory=dict,
+        description="Plotly figures as JSON (for HTML export)",
+    )
+    def get_dataframe(self, name: str | None = None) -> pl.DataFrame:
+        """Get results as Polars DataFrame.
+        Parameters
+        ----------
+        name : str | None
+            DataFrame to retrieve - routes to component results
+        Returns
+        -------
+        pl.DataFrame
+            Requested DataFrame
+        """
+        if name is None or name == "summary":
+            return self._build_summary_df()
+        # Route to component results
+        if name.startswith("ic_"):
+            if self.ic_analysis is None:
+                raise ValueError("IC analysis not available")
+            component_name = name[3:] if name != "ic_analysis" else None
+            return self.ic_analysis.get_dataframe(component_name)
+        if name.startswith("quantile_"):
+            if self.quantile_analysis is None:
+                raise ValueError("Quantile analysis not available")
+            component_name = name[9:] if name != "quantile_analysis" else None
+            return self.quantile_analysis.get_dataframe(component_name)
+        if name.startswith("turnover_"):
+            if self.turnover_analysis is None:
+                raise ValueError("Turnover analysis not available")
+            component_name = name[9:] if name != "turnover_analysis" else None
+            return self.turnover_analysis.get_dataframe(component_name)
+        raise ValueError(
+            f"Unknown DataFrame name: {name}. Use 'summary' or prefix with "
+            "'ic_', 'quantile_', 'turnover_'"
+        )
+    def list_available_dataframes(self) -> list[str]:
+        """List available DataFrame views."""
+        available = ["summary"]
+        if self.ic_analysis:
+            available.extend([f"ic_{n}" for n in self.ic_analysis.list_available_dataframes()])
+        if self.quantile_analysis:
+            available.extend(
+                [f"quantile_{n}" for n in self.quantile_analysis.list_available_dataframes()]
+            )
+        if self.turnover_analysis:
+            available.extend(
+                [f"turnover_{n}" for n in self.turnover_analysis.list_available_dataframes()]
+            )
+        return available
+    def _build_summary_df(self) -> pl.DataFrame:
+        """Build summary DataFrame with key metrics."""
+        rows = [
+            {"metric": "signal_name", "value": self.signal_name},
+            {"metric": "n_assets", "value": str(self.n_assets)},
+            {"metric": "n_dates", "value": str(self.n_dates)},
+            {"metric": "date_range_start", "value": self.date_range[0]},
+            {"metric": "date_range_end", "value": self.date_range[1]},
+        ]
+        if self.ic_analysis:
+            for period, ic in self.ic_analysis.ic_mean.items():
+                rows.append({"metric": f"ic_mean_{period}", "value": f"{ic:.4f}"})
+        return pl.DataFrame(rows)
+    def summary(self) -> str:
+        """Get human-readable summary of complete tear sheet."""
+        lines = [
+            "=" * 60,
+            f"Signal Analysis Tear Sheet: {self.signal_name}",
+            "=" * 60,
+            "",
+            f"Assets:     {self.n_assets:>10}",
+            f"Dates:      {self.n_dates:>10}",
+            f"Range:      {self.date_range[0]} to {self.date_range[1]}",
+            f"Created:    {self.created_at}",
+            "",
+        ]
+        if self.ic_analysis:
+            lines.append("--- IC Analysis ---")
+            lines.append(self.ic_analysis.summary())
+        if self.quantile_analysis:
+            lines.append("--- Quantile Analysis ---")
+            lines.append(self.quantile_analysis.summary())
+        if self.turnover_analysis:
+            lines.append("--- Turnover Analysis ---")
+            lines.append(self.turnover_analysis.summary())
+        if self.ir_tc_analysis:
+            lines.append("--- IR_tc Analysis ---")
+            lines.append(self.ir_tc_analysis.summary())
+        return "\n".join(lines)
+    def show(self) -> None:
+        """Display tear sheet in Jupyter notebook.
+        Renders all figures inline using IPython display.
+        """
+        try:
+            from IPython.display import HTML, display
+            # Display summary
+            display(HTML(f"<h2>Signal Analysis: {self.signal_name}</h2>"))
+            display(HTML(f"<p>{self.n_assets} assets, {self.n_dates} dates</p>"))
+            # Display figures
+            for _name, fig_json in self.figures.items():
+                fig = _figure_from_data(fig_json)
+                fig.show()
+        except ImportError:
+            print("IPython not available. Use save_html() instead.")
+            print(self.summary())
+    def save_html(
+        self,
+        path: str | Path,
+        use_dashboard: bool = True,
+        include_plotlyjs: str | bool = "cdn",
+        theme: Literal["light", "dark"] = "light",
+    ) -> Path:
+        """Save tear sheet as self-contained HTML file.
+        Parameters
+        ----------
+        path : str | Path
+            Output file path
+        use_dashboard : bool, default=True
+            If True, use multi-tab SignalDashboard format.
+            If False, use simple stacked plot layout.
+        include_plotlyjs : str | bool
+            How to include plotly.js: 'cdn', 'directory', True (embed), False
+        theme : str, default='light'
+            Theme for dashboard: 'light' or 'dark' (only used if use_dashboard=True)
+        Returns
+        -------
+        Path
+            Path to saved file
+        """
+        path = Path(path)
+        path.parent.mkdir(parents=True, exist_ok=True)
+        if use_dashboard:
+            # Use multi-tab dashboard format
+            from ml4t.diagnostic.visualization.signal.dashboard import SignalDashboard
+            dashboard = SignalDashboard(
+                title=f"Signal Analysis: {self.signal_name}",
+                theme=theme,
+            )
+            html = dashboard.generate(self)
+            path.write_text(html)
+        else:
+            # Use simple stacked layout (legacy behavior)
+            import plotly.io as pio
+            # NOTE: Plotly.js is included via pio.to_html with include_plotlyjs parameter
+            # Do NOT add hardcoded CDN script here - it would duplicate the inclusion
+            html_parts = [
+                "<!DOCTYPE html>",
+                "<html>",
+                "<head>",
+                f"<title>Signal Analysis: {self.signal_name}</title>",
+                "<style>",
+                "body { font-family: -apple-system, system-ui, sans-serif; margin: 40px; }",
+                "h1 { color: #2C3E50; }",
+                ".summary { background: #f8f9fa; padding: 20px; border-radius: 8px; margin-bottom: 30px; }",
+                ".plot-container { margin-bottom: 40px; }",
+                "</style>",
+                "</head>",
+                "<body>",
+                f"<h1>Signal Analysis: {self.signal_name}</h1>",
+                "<div class='summary'>",
+                f"<p><strong>Assets:</strong> {self.n_assets}</p>",
+                f"<p><strong>Dates:</strong> {self.n_dates}</p>",
+                f"<p><strong>Range:</strong> {self.date_range[0]} to {self.date_range[1]}</p>",
+                f"<p><strong>Generated:</strong> {self.created_at}</p>",
+                "</div>",
+            ]
+            # Add figures
+            plotlyjs_included = False
+            for name, fig_json in self.figures.items():
+                fig = _figure_from_data(fig_json)
+                fig_html = pio.to_html(
+                    fig,
+                    include_plotlyjs=include_plotlyjs if not plotlyjs_included else False,
+                    full_html=False,
+                )
+                html_parts.append("<div class='plot-container'>")
+                html_parts.append(f"<h2>{name.replace('_', ' ').title()}</h2>")
+                html_parts.append(fig_html)
+                html_parts.append("</div>")
+                plotlyjs_included = True
+            html_parts.extend(["</body>", "</html>"])
+            path.write_text("\n".join(html_parts))
+        return path
+    def save_json(self, path: str | Path, exclude_figures: bool = False) -> Path:
+        """Export all metrics as structured JSON.
+        Parameters
+        ----------
+        path : str | Path
+            Output file path
+        exclude_figures : bool, default=False
+            If True, exclude figure JSON data to reduce file size
+        Returns
+        -------
+        Path
+            Path to saved file
+        Examples
+        --------
+        >>> tear_sheet.save_json("signal_metrics.json")
+        >>> tear_sheet.save_json("signal_compact.json", exclude_figures=True)
+        """
+        import json
+        path = Path(path)
+        path.parent.mkdir(parents=True, exist_ok=True)
+        data = self.to_dict(exclude_none=True)
+        if exclude_figures:
+            data.pop("figures", None)
+        with open(path, "w", encoding="utf-8") as f:
+            json.dump(data, f, indent=2, default=str)
+        return path
+    def save_png(
+        self,
+        output_dir: str | Path,
+        figures: list[str] | None = None,
+        width: int = 1200,
+        height: int = 600,
+        scale: float = 2.0,
+    ) -> list[Path]:
+        """Export figures as PNG images.
+        Requires the `kaleido` package for static image export.
+        Install with: pip install kaleido
+        Parameters
+        ----------
+        output_dir : str | Path
+            Output directory for PNG files
+        figures : list[str] | None
+            List of figure names to export. If None, exports all figures.
+        width : int, default=1200
+            Image width in pixels
+        height : int, default=600
+            Image height in pixels
+        scale : float, default=2.0
+            Scale factor for resolution (2.0 = 2x resolution)
+        Returns
+        -------
+        list[Path]
+            Paths to saved PNG files
+        Raises
+        ------
+        ImportError
+            If kaleido is not installed
+        Examples
+        --------
+        >>> paths = tear_sheet.save_png("./images/")
+        >>> paths = tear_sheet.save_png("./images/", figures=["ic_time_series"])
+        """
+        try:
+            import plotly.io as pio
+            # Check if kaleido is available
+            pio.kaleido.scope  # noqa: B018 - Check if kaleido is installed
+        except (ImportError, AttributeError) as e:
+            raise ImportError(
+                "kaleido is required for PNG export. Install with: pip install kaleido"
+            ) from e
+        output_dir = Path(output_dir)
+        output_dir.mkdir(parents=True, exist_ok=True)
+        saved_paths: list[Path] = []
+        figure_names = figures if figures is not None else list(self.figures.keys())
+        for name in figure_names:
+            if name not in self.figures:
+                continue
+            fig_json = self.figures[name]
+            fig = _figure_from_data(fig_json)
+            output_path = output_dir / f"{name}.png"
+            fig.write_image(
+                str(output_path),
+                width=width,
+                height=height,
+                scale=scale,
+            )
+            saved_paths.append(output_path)
+        return saved_paths
+    def to_dashboard(self, theme: Literal["light", "dark"] = "light") -> Any:
+        """Convert to SignalDashboard for customization.
+        Returns a SignalDashboard instance that can be further customized
+        before generating HTML output.
+        Parameters
+        ----------
+        theme : Literal["light", "dark"], default='light'
+            Dashboard theme: 'light' or 'dark'
+        Returns
+        -------
+        SignalDashboard
+            Dashboard instance ready for customization
+        Examples
+        --------
+        >>> dashboard = tear_sheet.to_dashboard(theme="dark")
+        >>> dashboard.title = "Custom Title"
+        >>> html = dashboard.generate(tear_sheet)
+        """
+        from ml4t.diagnostic.visualization.signal.dashboard import SignalDashboard
+        return SignalDashboard(
+            title=f"Signal Analysis: {self.signal_name}",
+            theme=theme,
+        )
+    def to_dict(self, *, exclude_none: bool = False) -> dict[str, Any]:
+        """Export to dictionary, excluding large figure data by default."""
+        data = super().to_dict(exclude_none=exclude_none)
+        # Optionally exclude figures to reduce size
+        if exclude_none and not self.figures:
+            data.pop("figures", None)
+        return data

ml4t/diagnostic/results/signal_results/turnover.py ADDED Viewed

@@ -0,0 +1,213 @@
+"""Turnover analysis result classes for signal analysis.
+This module provides result classes for storing turnover analysis outputs including
+quantile turnover rates, signal autocorrelation, and stability metrics.
+References
+----------
+Lopez de Prado, M. (2018). "Advances in Financial Machine Learning"
+"""
+from __future__ import annotations
+from typing import Any
+import polars as pl
+from pydantic import Field, model_validator
+from ml4t.diagnostic.results.base import BaseResult
+class TurnoverAnalysisResult(BaseResult):
+    """Results from turnover analysis.
+    Contains quantile turnover rates, signal autocorrelation,
+    and stability metrics.
+    Examples
+    --------
+    >>> result = turnover_result
+    >>> print(result.summary())
+    >>> df = result.get_dataframe("turnover")
+    """
+    analysis_type: str = Field(default="turnover_analysis", frozen=True)
+    # ==========================================================================
+    # Quantile Turnover
+    # ==========================================================================
+    quantile_turnover: dict[str, dict[str, float]] = Field(
+        ...,
+        description="Turnover rate by quantile and period: {period: {quantile: turnover}}",
+    )
+    mean_turnover: dict[str, float] = Field(
+        ...,
+        description="Mean turnover across all quantiles per period",
+    )
+    top_quantile_turnover: dict[str, float] = Field(
+        ...,
+        description="Turnover for top quantile (long positions)",
+    )
+    bottom_quantile_turnover: dict[str, float] = Field(
+        ...,
+        description="Turnover for bottom quantile (short positions)",
+    )
+    # ==========================================================================
+    # Signal Autocorrelation
+    # ==========================================================================
+    autocorrelation: dict[str, list[float]] = Field(
+        ...,
+        description="Autocorrelation by lag: {period: [ac_lag1, ac_lag2, ...]}",
+    )
+    autocorrelation_lags: list[int] = Field(
+        ...,
+        description="Lag values used",
+    )
+    mean_autocorrelation: dict[str, float] = Field(
+        ...,
+        description="Mean autocorrelation (average across first 5 lags)",
+    )
+    # ==========================================================================
+    # Stability Metrics
+    # ==========================================================================
+    half_life: dict[str, float | None] = Field(
+        ...,
+        description="Signal half-life in periods (time for AC to decay by 50%)",
+    )
+    # ==========================================================================
+    # Validation
+    # ==========================================================================
+    @model_validator(mode="after")
+    def _validate_keys(self) -> TurnoverAnalysisResult:
+        """Validate that all period-keyed dicts share the same keys and list lengths match."""
+        # Get reference period set from quantile_turnover
+        period_set = set(self.quantile_turnover.keys())
+        # Validate period-keyed dicts
+        period_dicts: list[tuple[str, dict[str, Any]]] = [
+            ("mean_turnover", self.mean_turnover),
+            ("top_quantile_turnover", self.top_quantile_turnover),
+            ("bottom_quantile_turnover", self.bottom_quantile_turnover),
+            ("autocorrelation", self.autocorrelation),
+            ("mean_autocorrelation", self.mean_autocorrelation),
+            ("half_life", self.half_life),
+        ]
+        for name, d in period_dicts:
+            if set(d.keys()) != period_set:
+                raise ValueError(
+                    f"Key mismatch in '{name}': expected {period_set}, got {set(d.keys())}"
+                )
+        # Validate autocorrelation list lengths match autocorrelation_lags
+        n_lags = len(self.autocorrelation_lags)
+        for period, ac_values in self.autocorrelation.items():
+            if len(ac_values) != n_lags:
+                raise ValueError(
+                    f"Length mismatch in autocorrelation['{period}']: "
+                    f"expected {n_lags} (len(autocorrelation_lags)), got {len(ac_values)}"
+                )
+        return self
+    # ==========================================================================
+    # Methods
+    # ==========================================================================
+    def get_dataframe(self, name: str | None = None) -> pl.DataFrame:
+        """Get results as Polars DataFrame.
+        Parameters
+        ----------
+        name : str | None
+            DataFrame to retrieve:
+            - None or "turnover": Turnover by quantile
+            - "autocorrelation": Autocorrelation by lag
+            - "summary": Summary statistics
+        Returns
+        -------
+        pl.DataFrame
+            Requested DataFrame
+        """
+        if name is None or name == "turnover":
+            periods = list(self.quantile_turnover.keys())
+            if not periods:
+                return pl.DataFrame()
+            quantiles = list(self.quantile_turnover[periods[0]].keys())
+            rows = []
+            for period in periods:
+                for q in quantiles:
+                    rows.append(
+                        {
+                            "period": period,
+                            "quantile": q,
+                            "turnover": self.quantile_turnover[period][q],
+                        }
+                    )
+            return pl.DataFrame(rows)
+        if name == "autocorrelation":
+            periods = list(self.autocorrelation.keys())
+            rows = []
+            for period in periods:
+                for i, lag in enumerate(self.autocorrelation_lags):
+                    rows.append(
+                        {
+                            "period": period,
+                            "lag": lag,
+                            "autocorrelation": self.autocorrelation[period][i],
+                        }
+                    )
+            return pl.DataFrame(rows)
+        if name == "summary":
+            periods = list(self.mean_turnover.keys())
+            return pl.DataFrame(
+                {
+                    "period": periods,
+                    "mean_turnover": [self.mean_turnover[p] for p in periods],
+                    "top_turnover": [self.top_quantile_turnover[p] for p in periods],
+                    "bottom_turnover": [self.bottom_quantile_turnover[p] for p in periods],
+                    "mean_autocorrelation": [self.mean_autocorrelation[p] for p in periods],
+                    "half_life": [self.half_life[p] for p in periods],
+                }
+            )
+        raise ValueError(
+            f"Unknown DataFrame name: {name}. Available: 'turnover', 'autocorrelation', 'summary'"
+        )
+    def list_available_dataframes(self) -> list[str]:
+        """List available DataFrame views."""
+        return ["turnover", "autocorrelation", "summary"]
+    def summary(self) -> str:
+        """Get human-readable summary of turnover analysis results."""
+        lines = ["=" * 60, "Turnover Analysis Summary", "=" * 60, ""]
+        for period in self.mean_turnover:
+            lines.append(f"Period: {period}")
+            lines.append("-" * 40)
+            lines.append(f"  Mean Turnover:        {self.mean_turnover[period]:>8.2%}")
+            lines.append(f"  Top Quantile:         {self.top_quantile_turnover[period]:>8.2%}")
+            lines.append(f"  Bottom Quantile:      {self.bottom_quantile_turnover[period]:>8.2%}")
+            lines.append(f"  Mean Autocorrelation: {self.mean_autocorrelation[period]:>8.4f}")
+            if self.half_life[period] is not None:
+                lines.append(f"  Signal Half-Life:     {self.half_life[period]:>8.1f} periods")
+            lines.append("")
+        return "\n".join(lines)