PyPI - ml4t-diagnostic - Versions diffs - 0.1.0a1__py3-none-any.whl - Mend

ml4t-diagnostic 0.1.0a1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

ml4t/diagnostic/AGENT.md +25 -0
ml4t/diagnostic/__init__.py +166 -0
ml4t/diagnostic/backends/__init__.py +10 -0
ml4t/diagnostic/backends/adapter.py +192 -0
ml4t/diagnostic/backends/polars_backend.py +899 -0
ml4t/diagnostic/caching/__init__.py +40 -0
ml4t/diagnostic/caching/cache.py +331 -0
ml4t/diagnostic/caching/decorators.py +131 -0
ml4t/diagnostic/caching/smart_cache.py +339 -0
ml4t/diagnostic/config/AGENT.md +24 -0
ml4t/diagnostic/config/README.md +267 -0
ml4t/diagnostic/config/__init__.py +219 -0
ml4t/diagnostic/config/barrier_config.py +277 -0
ml4t/diagnostic/config/base.py +301 -0
ml4t/diagnostic/config/event_config.py +148 -0
ml4t/diagnostic/config/feature_config.py +404 -0
ml4t/diagnostic/config/multi_signal_config.py +55 -0
ml4t/diagnostic/config/portfolio_config.py +215 -0
ml4t/diagnostic/config/report_config.py +391 -0
ml4t/diagnostic/config/sharpe_config.py +202 -0
ml4t/diagnostic/config/signal_config.py +206 -0
ml4t/diagnostic/config/trade_analysis_config.py +310 -0
ml4t/diagnostic/config/validation.py +279 -0
ml4t/diagnostic/core/__init__.py +29 -0
ml4t/diagnostic/core/numba_utils.py +315 -0
ml4t/diagnostic/core/purging.py +372 -0
ml4t/diagnostic/core/sampling.py +471 -0
ml4t/diagnostic/errors/__init__.py +205 -0
ml4t/diagnostic/evaluation/AGENT.md +26 -0
ml4t/diagnostic/evaluation/__init__.py +437 -0
ml4t/diagnostic/evaluation/autocorrelation.py +531 -0
ml4t/diagnostic/evaluation/barrier_analysis.py +1050 -0
ml4t/diagnostic/evaluation/binary_metrics.py +910 -0
ml4t/diagnostic/evaluation/dashboard.py +715 -0
ml4t/diagnostic/evaluation/diagnostic_plots.py +1037 -0
ml4t/diagnostic/evaluation/distribution/__init__.py +499 -0
ml4t/diagnostic/evaluation/distribution/moments.py +299 -0
ml4t/diagnostic/evaluation/distribution/tails.py +777 -0
ml4t/diagnostic/evaluation/distribution/tests.py +470 -0
ml4t/diagnostic/evaluation/drift/__init__.py +139 -0
ml4t/diagnostic/evaluation/drift/analysis.py +432 -0
ml4t/diagnostic/evaluation/drift/domain_classifier.py +517 -0
ml4t/diagnostic/evaluation/drift/population_stability_index.py +310 -0
ml4t/diagnostic/evaluation/drift/wasserstein.py +388 -0
ml4t/diagnostic/evaluation/event_analysis.py +647 -0
ml4t/diagnostic/evaluation/excursion.py +390 -0
ml4t/diagnostic/evaluation/feature_diagnostics.py +873 -0
ml4t/diagnostic/evaluation/feature_outcome.py +666 -0
ml4t/diagnostic/evaluation/framework.py +935 -0
ml4t/diagnostic/evaluation/metric_registry.py +255 -0
ml4t/diagnostic/evaluation/metrics/AGENT.md +23 -0
ml4t/diagnostic/evaluation/metrics/__init__.py +133 -0
ml4t/diagnostic/evaluation/metrics/basic.py +160 -0
ml4t/diagnostic/evaluation/metrics/conditional_ic.py +469 -0
ml4t/diagnostic/evaluation/metrics/feature_outcome.py +475 -0
ml4t/diagnostic/evaluation/metrics/ic_statistics.py +446 -0
ml4t/diagnostic/evaluation/metrics/importance_analysis.py +338 -0
ml4t/diagnostic/evaluation/metrics/importance_classical.py +375 -0
ml4t/diagnostic/evaluation/metrics/importance_mda.py +371 -0
ml4t/diagnostic/evaluation/metrics/importance_shap.py +715 -0
ml4t/diagnostic/evaluation/metrics/information_coefficient.py +527 -0
ml4t/diagnostic/evaluation/metrics/interactions.py +772 -0
ml4t/diagnostic/evaluation/metrics/monotonicity.py +226 -0
ml4t/diagnostic/evaluation/metrics/risk_adjusted.py +324 -0
ml4t/diagnostic/evaluation/multi_signal.py +550 -0
ml4t/diagnostic/evaluation/portfolio_analysis/__init__.py +83 -0
ml4t/diagnostic/evaluation/portfolio_analysis/analysis.py +734 -0
ml4t/diagnostic/evaluation/portfolio_analysis/metrics.py +589 -0
ml4t/diagnostic/evaluation/portfolio_analysis/results.py +334 -0
ml4t/diagnostic/evaluation/report_generation.py +824 -0
ml4t/diagnostic/evaluation/signal_selector.py +452 -0
ml4t/diagnostic/evaluation/stat_registry.py +139 -0
ml4t/diagnostic/evaluation/stationarity/__init__.py +97 -0
ml4t/diagnostic/evaluation/stationarity/analysis.py +518 -0
ml4t/diagnostic/evaluation/stationarity/augmented_dickey_fuller.py +296 -0
ml4t/diagnostic/evaluation/stationarity/kpss_test.py +308 -0
ml4t/diagnostic/evaluation/stationarity/phillips_perron.py +365 -0
ml4t/diagnostic/evaluation/stats/AGENT.md +43 -0
ml4t/diagnostic/evaluation/stats/__init__.py +191 -0
ml4t/diagnostic/evaluation/stats/backtest_overfitting.py +219 -0
ml4t/diagnostic/evaluation/stats/bootstrap.py +228 -0
ml4t/diagnostic/evaluation/stats/deflated_sharpe_ratio.py +591 -0
ml4t/diagnostic/evaluation/stats/false_discovery_rate.py +295 -0
ml4t/diagnostic/evaluation/stats/hac_standard_errors.py +108 -0
ml4t/diagnostic/evaluation/stats/minimum_track_record.py +408 -0
ml4t/diagnostic/evaluation/stats/moments.py +164 -0
ml4t/diagnostic/evaluation/stats/rademacher_adjustment.py +436 -0
ml4t/diagnostic/evaluation/stats/reality_check.py +155 -0
ml4t/diagnostic/evaluation/stats/sharpe_inference.py +219 -0
ml4t/diagnostic/evaluation/themes.py +330 -0
ml4t/diagnostic/evaluation/threshold_analysis.py +957 -0
ml4t/diagnostic/evaluation/trade_analysis.py +1136 -0
ml4t/diagnostic/evaluation/trade_dashboard/__init__.py +32 -0
ml4t/diagnostic/evaluation/trade_dashboard/app.py +315 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/__init__.py +18 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/csv.py +82 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/html.py +276 -0
ml4t/diagnostic/evaluation/trade_dashboard/io.py +166 -0
ml4t/diagnostic/evaluation/trade_dashboard/normalize.py +304 -0
ml4t/diagnostic/evaluation/trade_dashboard/stats.py +386 -0
ml4t/diagnostic/evaluation/trade_dashboard/style.py +79 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/__init__.py +21 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/patterns.py +354 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/shap_analysis.py +280 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/stat_validation.py +186 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/worst_trades.py +236 -0
ml4t/diagnostic/evaluation/trade_dashboard/types.py +129 -0
ml4t/diagnostic/evaluation/trade_shap/__init__.py +102 -0
ml4t/diagnostic/evaluation/trade_shap/alignment.py +188 -0
ml4t/diagnostic/evaluation/trade_shap/characterize.py +413 -0
ml4t/diagnostic/evaluation/trade_shap/cluster.py +302 -0
ml4t/diagnostic/evaluation/trade_shap/explain.py +208 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/__init__.py +23 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/generator.py +290 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/matcher.py +251 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/templates.yaml +467 -0
ml4t/diagnostic/evaluation/trade_shap/models.py +386 -0
ml4t/diagnostic/evaluation/trade_shap/normalize.py +116 -0
ml4t/diagnostic/evaluation/trade_shap/pipeline.py +263 -0
ml4t/diagnostic/evaluation/trade_shap_dashboard.py +283 -0
ml4t/diagnostic/evaluation/trade_shap_diagnostics.py +588 -0
ml4t/diagnostic/evaluation/validated_cv.py +535 -0
ml4t/diagnostic/evaluation/visualization.py +1050 -0
ml4t/diagnostic/evaluation/volatility/__init__.py +45 -0
ml4t/diagnostic/evaluation/volatility/analysis.py +351 -0
ml4t/diagnostic/evaluation/volatility/arch.py +258 -0
ml4t/diagnostic/evaluation/volatility/garch.py +460 -0
ml4t/diagnostic/integration/__init__.py +48 -0
ml4t/diagnostic/integration/backtest_contract.py +671 -0
ml4t/diagnostic/integration/data_contract.py +316 -0
ml4t/diagnostic/integration/engineer_contract.py +226 -0
ml4t/diagnostic/logging/__init__.py +77 -0
ml4t/diagnostic/logging/logger.py +245 -0
ml4t/diagnostic/logging/performance.py +234 -0
ml4t/diagnostic/logging/progress.py +234 -0
ml4t/diagnostic/logging/wandb.py +412 -0
ml4t/diagnostic/metrics/__init__.py +9 -0
ml4t/diagnostic/metrics/percentiles.py +128 -0
ml4t/diagnostic/py.typed +1 -0
ml4t/diagnostic/reporting/__init__.py +43 -0
ml4t/diagnostic/reporting/base.py +130 -0
ml4t/diagnostic/reporting/html_renderer.py +275 -0
ml4t/diagnostic/reporting/json_renderer.py +51 -0
ml4t/diagnostic/reporting/markdown_renderer.py +117 -0
ml4t/diagnostic/results/AGENT.md +24 -0
ml4t/diagnostic/results/__init__.py +105 -0
ml4t/diagnostic/results/barrier_results/__init__.py +36 -0
ml4t/diagnostic/results/barrier_results/hit_rate.py +304 -0
ml4t/diagnostic/results/barrier_results/precision_recall.py +266 -0
ml4t/diagnostic/results/barrier_results/profit_factor.py +297 -0
ml4t/diagnostic/results/barrier_results/tearsheet.py +397 -0
ml4t/diagnostic/results/barrier_results/time_to_target.py +305 -0
ml4t/diagnostic/results/barrier_results/validation.py +38 -0
ml4t/diagnostic/results/base.py +177 -0
ml4t/diagnostic/results/event_results.py +349 -0
ml4t/diagnostic/results/feature_results.py +787 -0
ml4t/diagnostic/results/multi_signal_results.py +431 -0
ml4t/diagnostic/results/portfolio_results.py +281 -0
ml4t/diagnostic/results/sharpe_results.py +448 -0
ml4t/diagnostic/results/signal_results/__init__.py +74 -0
ml4t/diagnostic/results/signal_results/ic.py +581 -0
ml4t/diagnostic/results/signal_results/irtc.py +110 -0
ml4t/diagnostic/results/signal_results/quantile.py +392 -0
ml4t/diagnostic/results/signal_results/tearsheet.py +456 -0
ml4t/diagnostic/results/signal_results/turnover.py +213 -0
ml4t/diagnostic/results/signal_results/validation.py +147 -0
ml4t/diagnostic/signal/AGENT.md +17 -0
ml4t/diagnostic/signal/__init__.py +69 -0
ml4t/diagnostic/signal/_report.py +152 -0
ml4t/diagnostic/signal/_utils.py +261 -0
ml4t/diagnostic/signal/core.py +275 -0
ml4t/diagnostic/signal/quantile.py +148 -0
ml4t/diagnostic/signal/result.py +214 -0
ml4t/diagnostic/signal/signal_ic.py +129 -0
ml4t/diagnostic/signal/turnover.py +182 -0
ml4t/diagnostic/splitters/AGENT.md +19 -0
ml4t/diagnostic/splitters/__init__.py +36 -0
ml4t/diagnostic/splitters/base.py +501 -0
ml4t/diagnostic/splitters/calendar.py +421 -0
ml4t/diagnostic/splitters/calendar_config.py +91 -0
ml4t/diagnostic/splitters/combinatorial.py +1064 -0
ml4t/diagnostic/splitters/config.py +322 -0
ml4t/diagnostic/splitters/cpcv/__init__.py +57 -0
ml4t/diagnostic/splitters/cpcv/combinations.py +119 -0
ml4t/diagnostic/splitters/cpcv/partitioning.py +263 -0
ml4t/diagnostic/splitters/cpcv/purge_engine.py +379 -0
ml4t/diagnostic/splitters/cpcv/windows.py +190 -0
ml4t/diagnostic/splitters/group_isolation.py +329 -0
ml4t/diagnostic/splitters/persistence.py +316 -0
ml4t/diagnostic/splitters/utils.py +207 -0
ml4t/diagnostic/splitters/walk_forward.py +757 -0
ml4t/diagnostic/utils/__init__.py +42 -0
ml4t/diagnostic/utils/config.py +542 -0
ml4t/diagnostic/utils/dependencies.py +318 -0
ml4t/diagnostic/utils/sessions.py +127 -0
ml4t/diagnostic/validation/__init__.py +54 -0
ml4t/diagnostic/validation/dataframe.py +274 -0
ml4t/diagnostic/validation/returns.py +280 -0
ml4t/diagnostic/validation/timeseries.py +299 -0
ml4t/diagnostic/visualization/AGENT.md +19 -0
ml4t/diagnostic/visualization/__init__.py +223 -0
ml4t/diagnostic/visualization/backtest/__init__.py +98 -0
ml4t/diagnostic/visualization/backtest/cost_attribution.py +762 -0
ml4t/diagnostic/visualization/backtest/executive_summary.py +895 -0
ml4t/diagnostic/visualization/backtest/interactive_controls.py +673 -0
ml4t/diagnostic/visualization/backtest/statistical_validity.py +874 -0
ml4t/diagnostic/visualization/backtest/tearsheet.py +565 -0
ml4t/diagnostic/visualization/backtest/template_system.py +373 -0
ml4t/diagnostic/visualization/backtest/trade_plots.py +1172 -0
ml4t/diagnostic/visualization/barrier_plots.py +782 -0
ml4t/diagnostic/visualization/core.py +1060 -0
ml4t/diagnostic/visualization/dashboards/__init__.py +36 -0
ml4t/diagnostic/visualization/dashboards/base.py +582 -0
ml4t/diagnostic/visualization/dashboards/importance.py +801 -0
ml4t/diagnostic/visualization/dashboards/interaction.py +263 -0
ml4t/diagnostic/visualization/dashboards.py +43 -0
ml4t/diagnostic/visualization/data_extraction/__init__.py +48 -0
ml4t/diagnostic/visualization/data_extraction/importance.py +649 -0
ml4t/diagnostic/visualization/data_extraction/interaction.py +504 -0
ml4t/diagnostic/visualization/data_extraction/types.py +113 -0
ml4t/diagnostic/visualization/data_extraction/validation.py +66 -0
ml4t/diagnostic/visualization/feature_plots.py +888 -0
ml4t/diagnostic/visualization/interaction_plots.py +618 -0
ml4t/diagnostic/visualization/portfolio/__init__.py +41 -0
ml4t/diagnostic/visualization/portfolio/dashboard.py +514 -0
ml4t/diagnostic/visualization/portfolio/drawdown_plots.py +341 -0
ml4t/diagnostic/visualization/portfolio/returns_plots.py +487 -0
ml4t/diagnostic/visualization/portfolio/risk_plots.py +301 -0
ml4t/diagnostic/visualization/report_generation.py +1343 -0
ml4t/diagnostic/visualization/signal/__init__.py +103 -0
ml4t/diagnostic/visualization/signal/dashboard.py +911 -0
ml4t/diagnostic/visualization/signal/event_plots.py +514 -0
ml4t/diagnostic/visualization/signal/ic_plots.py +635 -0
ml4t/diagnostic/visualization/signal/multi_signal_dashboard.py +974 -0
ml4t/diagnostic/visualization/signal/multi_signal_plots.py +603 -0
ml4t/diagnostic/visualization/signal/quantile_plots.py +625 -0
ml4t/diagnostic/visualization/signal/turnover_plots.py +400 -0
ml4t/diagnostic/visualization/trade_shap/__init__.py +90 -0
ml4t_diagnostic-0.1.0a1.dist-info/METADATA +1044 -0
ml4t_diagnostic-0.1.0a1.dist-info/RECORD +242 -0
ml4t_diagnostic-0.1.0a1.dist-info/WHEEL +4 -0
ml4t_diagnostic-0.1.0a1.dist-info/licenses/LICENSE +21 -0

ml4t/diagnostic/config/report_config.py ADDED Viewed

@@ -0,0 +1,391 @@
+"""Reporting configuration (Module E).
+This module defines configuration for report generation:
+- Output formats (HTML, JSON, PDF)
+- HTML report settings (templates, themes, tables)
+- Visualization settings (plots, colors, interactivity)
+- JSON output structure
+"""
+from __future__ import annotations
+from pathlib import Path
+from typing import Any
+from pydantic import Field, field_validator
+from ml4t.diagnostic.config.base import BaseConfig
+from ml4t.diagnostic.config.validation import (
+    DataFrameExportFormat,
+    PositiveInt,
+    ReportFormat,
+    ReportTemplate,
+    ReportTheme,
+    TableFormat,
+)
+class OutputFormatConfig(BaseConfig):
+    """Configuration for output formats and file management.
+    Attributes:
+        formats: Output formats to generate
+        output_dir: Output directory
+        filename_template: Filename template with placeholders
+        compress: Create .zip if multiple outputs
+        overwrite_existing: Overwrite existing files
+    Examples:
+        >>> # Default: HTML + JSON
+        >>> config = OutputFormatConfig()
+        >>> # Custom: Only HTML with custom filename
+        >>> config = OutputFormatConfig(
+        ...     formats=[ReportFormat.HTML],
+        ...     filename_template="report_{strategy_name}_{date}.html"
+        ... )
+    """
+    formats: list[ReportFormat] = Field(
+        default_factory=lambda: [ReportFormat.HTML, ReportFormat.JSON],
+        description="Output formats to generate",
+    )
+    output_dir: Path = Field(
+        default_factory=lambda: Path.cwd() / "diagnostic_reports",
+        description="Output directory",
+    )
+    filename_template: str = Field(
+        "qeval_report_{date}",
+        description="Filename template (placeholders: {date}, {strategy_name}, {timestamp})",
+    )
+    compress: bool = Field(False, description="Create .zip if multiple outputs")
+    overwrite_existing: bool = Field(True, description="Overwrite existing files")
+    @field_validator("formats")
+    @classmethod
+    def check_formats(cls, v: list[ReportFormat]) -> list[ReportFormat]:
+        """Ensure at least one format specified."""
+        if not v:
+            raise ValueError("Must specify at least one output format")
+        return v
+    def model_post_init(self, __context: Any) -> None:
+        """Create output directory if it doesn't exist."""
+        self.output_dir.mkdir(parents=True, exist_ok=True)
+class HTMLConfig(BaseConfig):
+    """Configuration for HTML report generation.
+    Attributes:
+        template: HTML template to use
+        theme: Visual theme
+        color_scheme: Color scheme for plots
+        interactive_plots: Use Plotly (True) or matplotlib (False)
+        include_sections: Which module sections to include
+        table_format: Table styling
+        include_toc: Include table of contents
+        include_summary: Include executive summary
+        custom_css: Path to custom CSS file
+    Examples:
+        >>> # Default: Full report with dark theme
+        >>> config = HTMLConfig()
+        >>> # Custom: Summary report with professional theme
+        >>> config = HTMLConfig(
+        ...     template=ReportTemplate.SUMMARY,
+        ...     theme=ReportTheme.PROFESSIONAL,
+        ...     include_sections=["module_a", "module_c"]
+        ... )
+    """
+    template: ReportTemplate = Field(
+        ReportTemplate.FULL, description="HTML template: full, summary, or diagnostic"
+    )
+    theme: ReportTheme = Field(
+        ReportTheme.LIGHT, description="Visual theme: light, dark, or professional"
+    )
+    color_scheme: str = Field(
+        "viridis", description="Color scheme for plots (matplotlib/plotly colormap)"
+    )
+    interactive_plots: bool = Field(
+        True, description="Use Plotly (interactive) vs matplotlib (static)"
+    )
+    include_sections: list[str] = Field(
+        default_factory=lambda: [
+            "stationarity",
+            "acf",
+            "volatility",
+            "distribution",
+            "correlation",
+            "ic",
+            "sharpe",
+        ],
+        description="Which sections to include (stationarity, acf, volatility, distribution, correlation, pca, clustering, redundancy, ic, binary_classification, threshold_analysis, ml_diagnostics, sharpe, summary)",
+    )
+    table_format: TableFormat = Field(
+        TableFormat.STYLED, description="Table format: styled, plain, or datatables"
+    )
+    include_toc: bool = Field(True, description="Include table of contents")
+    include_summary: bool = Field(True, description="Include executive summary")
+    custom_css: Path | None = Field(None, description="Path to custom CSS file")
+    @field_validator("include_sections")
+    @classmethod
+    def check_sections(cls, v: list[str]) -> list[str]:
+        """Validate section names."""
+        valid_sections = {
+            "stationarity",
+            "acf",
+            "volatility",
+            "distribution",
+            "correlation",
+            "pca",
+            "clustering",
+            "redundancy",
+            "ic",
+            "binary_classification",
+            "threshold_analysis",
+            "ml_diagnostics",
+            "sharpe",
+            "summary",
+        }
+        invalid = set(v) - valid_sections
+        if invalid:
+            raise ValueError(f"Invalid sections: {invalid}. Valid: {valid_sections}")
+        return v
+    @field_validator("custom_css")
+    @classmethod
+    def check_custom_css(cls, v: Path | None) -> Path | None:
+        """Validate custom CSS exists if specified."""
+        if v is not None and not v.exists():
+            raise ValueError(f"Custom CSS file not found: {v}")
+        return v
+class VisualizationConfig(BaseConfig):
+    """Configuration for visualization settings.
+    Attributes:
+        plot_dpi: DPI for static plots (matplotlib)
+        plot_width: Plot width in pixels
+        plot_height: Plot height in pixels
+        max_features_plot: Maximum features to plot (avoid clutter)
+        max_points_plot: Maximum points per plot (subsample if needed)
+        correlation_heatmap: Include correlation heatmap
+        time_series_plots: Include time series plots
+        distribution_plots: Include distribution plots (histograms, QQ)
+        scatter_plots: Include scatter plots (IC, etc.)
+        save_plots: Save plots as separate files
+        plot_format: Plot file format (png, svg, pdf)
+    Examples:
+        >>> # Default: All plots, moderate resolution
+        >>> config = VisualizationConfig()
+        >>> # Custom: High-res plots for publication
+        >>> config = VisualizationConfig(
+        ...     plot_dpi=300,
+        ...     plot_format="pdf",
+        ...     save_plots=True
+        ... )
+    """
+    plot_dpi: PositiveInt = Field(100, description="DPI for static plots")
+    plot_width: PositiveInt = Field(800, description="Plot width in pixels")
+    plot_height: PositiveInt = Field(600, description="Plot height in pixels")
+    max_features_plot: PositiveInt = Field(50, description="Max features to plot (avoid clutter)")
+    max_points_plot: PositiveInt | None = Field(
+        10000, description="Max points per plot (subsample if needed, None = no limit)"
+    )
+    correlation_heatmap: bool = Field(True, description="Include correlation heatmap")
+    time_series_plots: bool = Field(True, description="Include time series plots")
+    distribution_plots: bool = Field(True, description="Include distribution plots")
+    scatter_plots: bool = Field(True, description="Include scatter plots")
+    save_plots: bool = Field(False, description="Save plots as separate files")
+    plot_format: str = Field("png", description="Plot file format (png, svg, pdf)")
+    @field_validator("plot_format")
+    @classmethod
+    def check_plot_format(cls, v: str) -> str:
+        """Validate plot format."""
+        valid_formats = {"png", "svg", "pdf", "jpg", "jpeg"}
+        if v.lower() not in valid_formats:
+            raise ValueError(f"Invalid plot format: {v}. Valid: {valid_formats}")
+        return v.lower()
+class JSONConfig(BaseConfig):
+    """Configuration for JSON output.
+    Attributes:
+        pretty_print: Pretty-print JSON (vs compact)
+        include_metadata: Include metadata (timestamp, config, versions)
+        export_dataframes: DataFrame serialization format
+        include_raw_data: Include raw data (features, returns) in output
+        indent: JSON indentation (if pretty_print=True)
+    Examples:
+        >>> # Default: Pretty JSON with metadata
+        >>> config = JSONConfig()
+        >>> # Custom: Compact JSON without raw data
+        >>> config = JSONConfig(
+        ...     pretty_print=False,
+        ...     include_raw_data=False
+        ... )
+    """
+    pretty_print: bool = Field(True, description="Pretty-print JSON (vs compact)")
+    include_metadata: bool = Field(
+        True, description="Include metadata (timestamp, config, versions)"
+    )
+    export_dataframes: DataFrameExportFormat = Field(
+        DataFrameExportFormat.RECORDS, description="DataFrame serialization format"
+    )
+    include_raw_data: bool = Field(
+        False, description="Include raw data (features, returns) in output"
+    )
+    indent: PositiveInt = Field(2, description="JSON indentation (if pretty_print=True)")
+class ReportConfig(BaseConfig):
+    """Top-level configuration for reporting (Module E).
+    Orchestrates report generation:
+    - Output formats (HTML, JSON, PDF)
+    - HTML settings (templates, themes, tables)
+    - Visualization (plots, colors, interactivity)
+    - JSON structure
+    Attributes:
+        output_format: Output format configuration
+        html: HTML report configuration
+        visualization: Visualization configuration
+        json: JSON output configuration
+        lazy_rendering: Don't generate plots until accessed
+        cache_plots: Cache generated plots
+        parallel_plotting: Generate plots in parallel
+        n_jobs: Parallel jobs for plotting
+    Examples:
+        >>> # Quick start with defaults
+        >>> config = ReportConfig()
+        >>> reporter = Reporter(config)
+        >>> reporter.generate(results, output_name="my_strategy")
+        >>> # Load from YAML
+        >>> config = ReportConfig.from_yaml("report_config.yaml")
+        >>> # Custom configuration
+        >>> config = ReportConfig(
+        ...     output_format=OutputFormatConfig(
+        ...         formats=[ReportFormat.HTML, ReportFormat.PDF]
+        ...     ),
+        ...     html=HTMLConfig(
+        ...         template=ReportTemplate.SUMMARY,
+        ...         theme=ReportTheme.PROFESSIONAL
+        ...     ),
+        ...     visualization=VisualizationConfig(
+        ...         plot_dpi=300,
+        ...         save_plots=True
+        ...     )
+        ... )
+    """
+    output_format: OutputFormatConfig = Field(
+        default_factory=OutputFormatConfig, description="Output format configuration"
+    )
+    html: HTMLConfig = Field(default_factory=HTMLConfig, description="HTML report configuration")
+    visualization: VisualizationConfig = Field(
+        default_factory=VisualizationConfig, description="Visualization configuration"
+    )
+    json_config: JSONConfig = Field(
+        default_factory=JSONConfig, description="JSON output configuration"
+    )
+    # Performance settings
+    lazy_rendering: bool = Field(
+        False, description="Don't generate plots until accessed (saves time)"
+    )
+    cache_plots: bool = Field(True, description="Cache generated plots")
+    parallel_plotting: bool = Field(False, description="Generate plots in parallel")
+    n_jobs: int = Field(-1, ge=-1, description="Parallel jobs for plotting (-1 = all cores)")
+    @classmethod
+    def for_quick_report(cls) -> ReportConfig:
+        """Preset for quick HTML-only report (minimal plots).
+        Returns:
+            Config optimized for speed
+        """
+        return cls(
+            output_format=OutputFormatConfig(formats=[ReportFormat.HTML]),
+            html=HTMLConfig(
+                template=ReportTemplate.SUMMARY,
+                interactive_plots=False,  # Faster static plots
+            ),
+            visualization=VisualizationConfig(
+                correlation_heatmap=True,
+                time_series_plots=False,
+                distribution_plots=False,
+                scatter_plots=False,
+            ),
+            lazy_rendering=True,
+        )
+    @classmethod
+    def for_publication(cls) -> ReportConfig:
+        """Preset for publication-quality reports (high-res, all plots).
+        Returns:
+            Config optimized for publication
+        """
+        return cls(
+            output_format=OutputFormatConfig(
+                formats=[ReportFormat.HTML, ReportFormat.PDF],
+                compress=True,
+            ),
+            html=HTMLConfig(
+                template=ReportTemplate.FULL,
+                theme=ReportTheme.PROFESSIONAL,
+                table_format=TableFormat.STYLED,
+            ),
+            visualization=VisualizationConfig(
+                plot_dpi=300,
+                plot_format="pdf",
+                save_plots=True,
+                correlation_heatmap=True,
+                time_series_plots=True,
+                distribution_plots=True,
+                scatter_plots=True,
+            ),
+            json_config=JSONConfig(pretty_print=True, include_metadata=True),
+            cache_plots=True,
+            parallel_plotting=True,
+        )
+    @classmethod
+    def for_programmatic_access(cls) -> ReportConfig:
+        """Preset for programmatic access (JSON only, no plots).
+        Returns:
+            Config optimized for API/programmatic use
+        """
+        return cls(
+            output_format=OutputFormatConfig(formats=[ReportFormat.JSON]),
+            visualization=VisualizationConfig(
+                correlation_heatmap=False,
+                time_series_plots=False,
+                distribution_plots=False,
+                scatter_plots=False,
+            ),
+            json_config=JSONConfig(
+                pretty_print=False,  # Compact for parsing
+                include_raw_data=True,  # Include data for downstream processing
+                export_dataframes=DataFrameExportFormat.SPLIT,  # Efficient format
+            ),
+            lazy_rendering=True,
+        )

ml4t/diagnostic/config/sharpe_config.py ADDED Viewed

@@ -0,0 +1,202 @@
+"""Statistical Testing Configuration.
+This module provides configuration for advanced statistical testing:
+- **PSR**: Probabilistic Sharpe Ratio (confidence in positive Sharpe)
+- **MinTRL**: Minimum Track Record Length (required sample size)
+- **DSR**: Deflated Sharpe Ratio (correction for multiple testing)
+- **FDR**: False Discovery Rate control (family-wise error rate)
+These methods address the critical problem of overfitting and false discoveries
+in quantitative strategy research.
+Consolidated Config:
+- StatisticalConfig: Single config with all statistical test settings
+"""
+from __future__ import annotations
+from pathlib import Path
+from typing import Literal
+from pydantic import Field, field_validator, model_validator
+from ml4t.diagnostic.config.base import BaseConfig
+from ml4t.diagnostic.config.validation import (
+    FDRMethod,
+    NonNegativeFloat,
+    PositiveFloat,
+    PositiveInt,
+    Probability,
+)
+# =============================================================================
+# Settings Classes (Single-Level Nesting)
+# =============================================================================
+class PSRSettings(BaseConfig):
+    """Settings for Probabilistic Sharpe Ratio.
+    PSR computes the probability that the true Sharpe ratio exceeds a threshold,
+    accounting for higher moments (skewness, kurtosis) and estimation uncertainty.
+    """
+    enabled: bool = Field(True, description="Compute PSR")
+    confidence_level: Probability = Field(0.95, description="Confidence level")
+    target_sharpe: NonNegativeFloat = Field(0.0, description="Target SR to test against")
+    adjustment_factor: PositiveFloat | Literal["auto"] = Field(
+        "auto", description="Higher moment adjustment"
+    )
+    compute_for_thresholds: list[float] | None = Field(None, description="Multiple target values")
+class MinTRLSettings(BaseConfig):
+    """Settings for Minimum Track Record Length.
+    MinTRL computes the minimum sample size required to be confident
+    that the true Sharpe ratio exceeds a target value.
+    """
+    enabled: bool = Field(True, description="Compute MinTRL")
+    confidence_level: Probability = Field(0.95, description="Confidence level")
+    target_sharpe: NonNegativeFloat = Field(0.0, description="Target SR to detect")
+    compute_for_thresholds: list[float] | None = Field(None, description="Multiple target values")
+class DSRSettings(BaseConfig):
+    """Settings for Deflated Sharpe Ratio.
+    DSR corrects for multiple testing bias when evaluating many strategies.
+    """
+    enabled: bool = Field(True, description="Compute DSR")
+    n_trials: PositiveInt = Field(100, description="Number of strategies tested")
+    prob_zero_sharpe: Probability = Field(0.5, description="Prior probability SR=0")
+    variance_inflation: PositiveFloat = Field(1.0, description="Variance inflation factor")
+    expected_max_sharpe: float | Literal["auto"] = Field(
+        "auto", description="Expected max SR under null"
+    )
+    @field_validator("n_trials")
+    @classmethod
+    def check_n_trials(cls, v: int) -> int:
+        """Warn if n_trials is suspiciously low."""
+        if v < 10:
+            import warnings
+            warnings.warn(
+                f"n_trials={v} seems low. Include ALL strategies tested.",
+                stacklevel=2,
+            )
+        return v
+class FDRSettings(BaseConfig):
+    """Settings for False Discovery Rate control.
+    FDR controls the expected proportion of false discoveries among all
+    rejected hypotheses.
+    """
+    enabled: bool = Field(True, description="Apply FDR control")
+    alpha: Probability = Field(0.05, description="Family-wise error rate")
+    method: FDRMethod = Field(FDRMethod.BENJAMINI_HOCHBERG, description="FDR method")
+    independent_tests: bool = Field(False, description="Are tests independent?")
+    @model_validator(mode="after")
+    def validate_method_independence(self) -> FDRSettings:
+        """Warn if using BH with correlated tests."""
+        if self.method == FDRMethod.BENJAMINI_HOCHBERG and not self.independent_tests:
+            import warnings
+            warnings.warn(
+                "Benjamini-Hochberg assumes independence. Consider BY method.",
+                stacklevel=2,
+            )
+        return self
+# =============================================================================
+# Consolidated Config
+# =============================================================================
+class StatisticalConfig(BaseConfig):
+    """Consolidated configuration for statistical testing.
+    Orchestrates advanced Sharpe ratio analysis with multiple testing correction.
+    Examples
+    --------
+    >>> config = StatisticalConfig(
+    ...     psr=PSRSettings(target_sharpe=1.0),
+    ...     dsr=DSRSettings(n_trials=500),
+    ... )
+    >>> # Or use presets
+    >>> config = StatisticalConfig.for_research()
+    """
+    psr: PSRSettings = Field(default_factory=PSRSettings, description="PSR settings")
+    mintrl: MinTRLSettings = Field(default_factory=MinTRLSettings, description="MinTRL settings")
+    dsr: DSRSettings = Field(default_factory=DSRSettings, description="DSR settings")
+    fdr: FDRSettings = Field(default_factory=FDRSettings, description="FDR settings")
+    # Output settings
+    return_dataframes: bool = Field(True, description="Return as DataFrames")
+    cache_enabled: bool = Field(True, description="Enable caching")
+    cache_dir: Path = Field(
+        default_factory=lambda: Path.home() / ".cache" / "ml4t-diagnostic" / "sharpe",
+        description="Cache directory",
+    )
+    verbose: bool = Field(False, description="Verbose output")
+    @classmethod
+    def for_quick_check(cls) -> StatisticalConfig:
+        """Preset for quick overfitting check (PSR + DSR only)."""
+        return cls(
+            psr=PSRSettings(compute_for_thresholds=None),
+            mintrl=MinTRLSettings(enabled=False),
+            dsr=DSRSettings(n_trials=100),
+            fdr=FDRSettings(enabled=False),
+        )
+    @classmethod
+    def for_research(cls) -> StatisticalConfig:
+        """Preset for academic research (comprehensive analysis)."""
+        return cls(
+            psr=PSRSettings(
+                compute_for_thresholds=[0.0, 0.5, 1.0, 1.5, 2.0],
+                confidence_level=0.99,
+            ),
+            mintrl=MinTRLSettings(compute_for_thresholds=[0.0, 0.5, 1.0]),
+            dsr=DSRSettings(n_trials=500, prob_zero_sharpe=0.5),
+            fdr=FDRSettings(
+                method=FDRMethod.BENJAMINI_YEKUTIELI,
+                alpha=0.05,
+            ),
+        )
+    @classmethod
+    def for_publication(cls) -> StatisticalConfig:
+        """Preset for academic publication (very conservative)."""
+        return cls(
+            psr=PSRSettings(confidence_level=0.99, target_sharpe=0.5),
+            mintrl=MinTRLSettings(confidence_level=0.99, target_sharpe=0.5),
+            dsr=DSRSettings(
+                n_trials=1000,
+                prob_zero_sharpe=0.8,
+                variance_inflation=1.5,
+            ),
+            fdr=FDRSettings(
+                method=FDRMethod.BONFERRONI,
+                alpha=0.01,
+            ),
+        )
+# Rebuild models
+PSRSettings.model_rebuild()
+MinTRLSettings.model_rebuild()
+DSRSettings.model_rebuild()
+FDRSettings.model_rebuild()
+StatisticalConfig.model_rebuild()