PyPI - ml4t-diagnostic - Versions diffs - 0.1.0a1__py3-none-any.whl - Mend

ml4t-diagnostic 0.1.0a1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

ml4t/diagnostic/AGENT.md +25 -0
ml4t/diagnostic/__init__.py +166 -0
ml4t/diagnostic/backends/__init__.py +10 -0
ml4t/diagnostic/backends/adapter.py +192 -0
ml4t/diagnostic/backends/polars_backend.py +899 -0
ml4t/diagnostic/caching/__init__.py +40 -0
ml4t/diagnostic/caching/cache.py +331 -0
ml4t/diagnostic/caching/decorators.py +131 -0
ml4t/diagnostic/caching/smart_cache.py +339 -0
ml4t/diagnostic/config/AGENT.md +24 -0
ml4t/diagnostic/config/README.md +267 -0
ml4t/diagnostic/config/__init__.py +219 -0
ml4t/diagnostic/config/barrier_config.py +277 -0
ml4t/diagnostic/config/base.py +301 -0
ml4t/diagnostic/config/event_config.py +148 -0
ml4t/diagnostic/config/feature_config.py +404 -0
ml4t/diagnostic/config/multi_signal_config.py +55 -0
ml4t/diagnostic/config/portfolio_config.py +215 -0
ml4t/diagnostic/config/report_config.py +391 -0
ml4t/diagnostic/config/sharpe_config.py +202 -0
ml4t/diagnostic/config/signal_config.py +206 -0
ml4t/diagnostic/config/trade_analysis_config.py +310 -0
ml4t/diagnostic/config/validation.py +279 -0
ml4t/diagnostic/core/__init__.py +29 -0
ml4t/diagnostic/core/numba_utils.py +315 -0
ml4t/diagnostic/core/purging.py +372 -0
ml4t/diagnostic/core/sampling.py +471 -0
ml4t/diagnostic/errors/__init__.py +205 -0
ml4t/diagnostic/evaluation/AGENT.md +26 -0
ml4t/diagnostic/evaluation/__init__.py +437 -0
ml4t/diagnostic/evaluation/autocorrelation.py +531 -0
ml4t/diagnostic/evaluation/barrier_analysis.py +1050 -0
ml4t/diagnostic/evaluation/binary_metrics.py +910 -0
ml4t/diagnostic/evaluation/dashboard.py +715 -0
ml4t/diagnostic/evaluation/diagnostic_plots.py +1037 -0
ml4t/diagnostic/evaluation/distribution/__init__.py +499 -0
ml4t/diagnostic/evaluation/distribution/moments.py +299 -0
ml4t/diagnostic/evaluation/distribution/tails.py +777 -0
ml4t/diagnostic/evaluation/distribution/tests.py +470 -0
ml4t/diagnostic/evaluation/drift/__init__.py +139 -0
ml4t/diagnostic/evaluation/drift/analysis.py +432 -0
ml4t/diagnostic/evaluation/drift/domain_classifier.py +517 -0
ml4t/diagnostic/evaluation/drift/population_stability_index.py +310 -0
ml4t/diagnostic/evaluation/drift/wasserstein.py +388 -0
ml4t/diagnostic/evaluation/event_analysis.py +647 -0
ml4t/diagnostic/evaluation/excursion.py +390 -0
ml4t/diagnostic/evaluation/feature_diagnostics.py +873 -0
ml4t/diagnostic/evaluation/feature_outcome.py +666 -0
ml4t/diagnostic/evaluation/framework.py +935 -0
ml4t/diagnostic/evaluation/metric_registry.py +255 -0
ml4t/diagnostic/evaluation/metrics/AGENT.md +23 -0
ml4t/diagnostic/evaluation/metrics/__init__.py +133 -0
ml4t/diagnostic/evaluation/metrics/basic.py +160 -0
ml4t/diagnostic/evaluation/metrics/conditional_ic.py +469 -0
ml4t/diagnostic/evaluation/metrics/feature_outcome.py +475 -0
ml4t/diagnostic/evaluation/metrics/ic_statistics.py +446 -0
ml4t/diagnostic/evaluation/metrics/importance_analysis.py +338 -0
ml4t/diagnostic/evaluation/metrics/importance_classical.py +375 -0
ml4t/diagnostic/evaluation/metrics/importance_mda.py +371 -0
ml4t/diagnostic/evaluation/metrics/importance_shap.py +715 -0
ml4t/diagnostic/evaluation/metrics/information_coefficient.py +527 -0
ml4t/diagnostic/evaluation/metrics/interactions.py +772 -0
ml4t/diagnostic/evaluation/metrics/monotonicity.py +226 -0
ml4t/diagnostic/evaluation/metrics/risk_adjusted.py +324 -0
ml4t/diagnostic/evaluation/multi_signal.py +550 -0
ml4t/diagnostic/evaluation/portfolio_analysis/__init__.py +83 -0
ml4t/diagnostic/evaluation/portfolio_analysis/analysis.py +734 -0
ml4t/diagnostic/evaluation/portfolio_analysis/metrics.py +589 -0
ml4t/diagnostic/evaluation/portfolio_analysis/results.py +334 -0
ml4t/diagnostic/evaluation/report_generation.py +824 -0
ml4t/diagnostic/evaluation/signal_selector.py +452 -0
ml4t/diagnostic/evaluation/stat_registry.py +139 -0
ml4t/diagnostic/evaluation/stationarity/__init__.py +97 -0
ml4t/diagnostic/evaluation/stationarity/analysis.py +518 -0
ml4t/diagnostic/evaluation/stationarity/augmented_dickey_fuller.py +296 -0
ml4t/diagnostic/evaluation/stationarity/kpss_test.py +308 -0
ml4t/diagnostic/evaluation/stationarity/phillips_perron.py +365 -0
ml4t/diagnostic/evaluation/stats/AGENT.md +43 -0
ml4t/diagnostic/evaluation/stats/__init__.py +191 -0
ml4t/diagnostic/evaluation/stats/backtest_overfitting.py +219 -0
ml4t/diagnostic/evaluation/stats/bootstrap.py +228 -0
ml4t/diagnostic/evaluation/stats/deflated_sharpe_ratio.py +591 -0
ml4t/diagnostic/evaluation/stats/false_discovery_rate.py +295 -0
ml4t/diagnostic/evaluation/stats/hac_standard_errors.py +108 -0
ml4t/diagnostic/evaluation/stats/minimum_track_record.py +408 -0
ml4t/diagnostic/evaluation/stats/moments.py +164 -0
ml4t/diagnostic/evaluation/stats/rademacher_adjustment.py +436 -0
ml4t/diagnostic/evaluation/stats/reality_check.py +155 -0
ml4t/diagnostic/evaluation/stats/sharpe_inference.py +219 -0
ml4t/diagnostic/evaluation/themes.py +330 -0
ml4t/diagnostic/evaluation/threshold_analysis.py +957 -0
ml4t/diagnostic/evaluation/trade_analysis.py +1136 -0
ml4t/diagnostic/evaluation/trade_dashboard/__init__.py +32 -0
ml4t/diagnostic/evaluation/trade_dashboard/app.py +315 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/__init__.py +18 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/csv.py +82 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/html.py +276 -0
ml4t/diagnostic/evaluation/trade_dashboard/io.py +166 -0
ml4t/diagnostic/evaluation/trade_dashboard/normalize.py +304 -0
ml4t/diagnostic/evaluation/trade_dashboard/stats.py +386 -0
ml4t/diagnostic/evaluation/trade_dashboard/style.py +79 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/__init__.py +21 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/patterns.py +354 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/shap_analysis.py +280 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/stat_validation.py +186 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/worst_trades.py +236 -0
ml4t/diagnostic/evaluation/trade_dashboard/types.py +129 -0
ml4t/diagnostic/evaluation/trade_shap/__init__.py +102 -0
ml4t/diagnostic/evaluation/trade_shap/alignment.py +188 -0
ml4t/diagnostic/evaluation/trade_shap/characterize.py +413 -0
ml4t/diagnostic/evaluation/trade_shap/cluster.py +302 -0
ml4t/diagnostic/evaluation/trade_shap/explain.py +208 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/__init__.py +23 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/generator.py +290 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/matcher.py +251 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/templates.yaml +467 -0
ml4t/diagnostic/evaluation/trade_shap/models.py +386 -0
ml4t/diagnostic/evaluation/trade_shap/normalize.py +116 -0
ml4t/diagnostic/evaluation/trade_shap/pipeline.py +263 -0
ml4t/diagnostic/evaluation/trade_shap_dashboard.py +283 -0
ml4t/diagnostic/evaluation/trade_shap_diagnostics.py +588 -0
ml4t/diagnostic/evaluation/validated_cv.py +535 -0
ml4t/diagnostic/evaluation/visualization.py +1050 -0
ml4t/diagnostic/evaluation/volatility/__init__.py +45 -0
ml4t/diagnostic/evaluation/volatility/analysis.py +351 -0
ml4t/diagnostic/evaluation/volatility/arch.py +258 -0
ml4t/diagnostic/evaluation/volatility/garch.py +460 -0
ml4t/diagnostic/integration/__init__.py +48 -0
ml4t/diagnostic/integration/backtest_contract.py +671 -0
ml4t/diagnostic/integration/data_contract.py +316 -0
ml4t/diagnostic/integration/engineer_contract.py +226 -0
ml4t/diagnostic/logging/__init__.py +77 -0
ml4t/diagnostic/logging/logger.py +245 -0
ml4t/diagnostic/logging/performance.py +234 -0
ml4t/diagnostic/logging/progress.py +234 -0
ml4t/diagnostic/logging/wandb.py +412 -0
ml4t/diagnostic/metrics/__init__.py +9 -0
ml4t/diagnostic/metrics/percentiles.py +128 -0
ml4t/diagnostic/py.typed +1 -0
ml4t/diagnostic/reporting/__init__.py +43 -0
ml4t/diagnostic/reporting/base.py +130 -0
ml4t/diagnostic/reporting/html_renderer.py +275 -0
ml4t/diagnostic/reporting/json_renderer.py +51 -0
ml4t/diagnostic/reporting/markdown_renderer.py +117 -0
ml4t/diagnostic/results/AGENT.md +24 -0
ml4t/diagnostic/results/__init__.py +105 -0
ml4t/diagnostic/results/barrier_results/__init__.py +36 -0
ml4t/diagnostic/results/barrier_results/hit_rate.py +304 -0
ml4t/diagnostic/results/barrier_results/precision_recall.py +266 -0
ml4t/diagnostic/results/barrier_results/profit_factor.py +297 -0
ml4t/diagnostic/results/barrier_results/tearsheet.py +397 -0
ml4t/diagnostic/results/barrier_results/time_to_target.py +305 -0
ml4t/diagnostic/results/barrier_results/validation.py +38 -0
ml4t/diagnostic/results/base.py +177 -0
ml4t/diagnostic/results/event_results.py +349 -0
ml4t/diagnostic/results/feature_results.py +787 -0
ml4t/diagnostic/results/multi_signal_results.py +431 -0
ml4t/diagnostic/results/portfolio_results.py +281 -0
ml4t/diagnostic/results/sharpe_results.py +448 -0
ml4t/diagnostic/results/signal_results/__init__.py +74 -0
ml4t/diagnostic/results/signal_results/ic.py +581 -0
ml4t/diagnostic/results/signal_results/irtc.py +110 -0
ml4t/diagnostic/results/signal_results/quantile.py +392 -0
ml4t/diagnostic/results/signal_results/tearsheet.py +456 -0
ml4t/diagnostic/results/signal_results/turnover.py +213 -0
ml4t/diagnostic/results/signal_results/validation.py +147 -0
ml4t/diagnostic/signal/AGENT.md +17 -0
ml4t/diagnostic/signal/__init__.py +69 -0
ml4t/diagnostic/signal/_report.py +152 -0
ml4t/diagnostic/signal/_utils.py +261 -0
ml4t/diagnostic/signal/core.py +275 -0
ml4t/diagnostic/signal/quantile.py +148 -0
ml4t/diagnostic/signal/result.py +214 -0
ml4t/diagnostic/signal/signal_ic.py +129 -0
ml4t/diagnostic/signal/turnover.py +182 -0
ml4t/diagnostic/splitters/AGENT.md +19 -0
ml4t/diagnostic/splitters/__init__.py +36 -0
ml4t/diagnostic/splitters/base.py +501 -0
ml4t/diagnostic/splitters/calendar.py +421 -0
ml4t/diagnostic/splitters/calendar_config.py +91 -0
ml4t/diagnostic/splitters/combinatorial.py +1064 -0
ml4t/diagnostic/splitters/config.py +322 -0
ml4t/diagnostic/splitters/cpcv/__init__.py +57 -0
ml4t/diagnostic/splitters/cpcv/combinations.py +119 -0
ml4t/diagnostic/splitters/cpcv/partitioning.py +263 -0
ml4t/diagnostic/splitters/cpcv/purge_engine.py +379 -0
ml4t/diagnostic/splitters/cpcv/windows.py +190 -0
ml4t/diagnostic/splitters/group_isolation.py +329 -0
ml4t/diagnostic/splitters/persistence.py +316 -0
ml4t/diagnostic/splitters/utils.py +207 -0
ml4t/diagnostic/splitters/walk_forward.py +757 -0
ml4t/diagnostic/utils/__init__.py +42 -0
ml4t/diagnostic/utils/config.py +542 -0
ml4t/diagnostic/utils/dependencies.py +318 -0
ml4t/diagnostic/utils/sessions.py +127 -0
ml4t/diagnostic/validation/__init__.py +54 -0
ml4t/diagnostic/validation/dataframe.py +274 -0
ml4t/diagnostic/validation/returns.py +280 -0
ml4t/diagnostic/validation/timeseries.py +299 -0
ml4t/diagnostic/visualization/AGENT.md +19 -0
ml4t/diagnostic/visualization/__init__.py +223 -0
ml4t/diagnostic/visualization/backtest/__init__.py +98 -0
ml4t/diagnostic/visualization/backtest/cost_attribution.py +762 -0
ml4t/diagnostic/visualization/backtest/executive_summary.py +895 -0
ml4t/diagnostic/visualization/backtest/interactive_controls.py +673 -0
ml4t/diagnostic/visualization/backtest/statistical_validity.py +874 -0
ml4t/diagnostic/visualization/backtest/tearsheet.py +565 -0
ml4t/diagnostic/visualization/backtest/template_system.py +373 -0
ml4t/diagnostic/visualization/backtest/trade_plots.py +1172 -0
ml4t/diagnostic/visualization/barrier_plots.py +782 -0
ml4t/diagnostic/visualization/core.py +1060 -0
ml4t/diagnostic/visualization/dashboards/__init__.py +36 -0
ml4t/diagnostic/visualization/dashboards/base.py +582 -0
ml4t/diagnostic/visualization/dashboards/importance.py +801 -0
ml4t/diagnostic/visualization/dashboards/interaction.py +263 -0
ml4t/diagnostic/visualization/dashboards.py +43 -0
ml4t/diagnostic/visualization/data_extraction/__init__.py +48 -0
ml4t/diagnostic/visualization/data_extraction/importance.py +649 -0
ml4t/diagnostic/visualization/data_extraction/interaction.py +504 -0
ml4t/diagnostic/visualization/data_extraction/types.py +113 -0
ml4t/diagnostic/visualization/data_extraction/validation.py +66 -0
ml4t/diagnostic/visualization/feature_plots.py +888 -0
ml4t/diagnostic/visualization/interaction_plots.py +618 -0
ml4t/diagnostic/visualization/portfolio/__init__.py +41 -0
ml4t/diagnostic/visualization/portfolio/dashboard.py +514 -0
ml4t/diagnostic/visualization/portfolio/drawdown_plots.py +341 -0
ml4t/diagnostic/visualization/portfolio/returns_plots.py +487 -0
ml4t/diagnostic/visualization/portfolio/risk_plots.py +301 -0
ml4t/diagnostic/visualization/report_generation.py +1343 -0
ml4t/diagnostic/visualization/signal/__init__.py +103 -0
ml4t/diagnostic/visualization/signal/dashboard.py +911 -0
ml4t/diagnostic/visualization/signal/event_plots.py +514 -0
ml4t/diagnostic/visualization/signal/ic_plots.py +635 -0
ml4t/diagnostic/visualization/signal/multi_signal_dashboard.py +974 -0
ml4t/diagnostic/visualization/signal/multi_signal_plots.py +603 -0
ml4t/diagnostic/visualization/signal/quantile_plots.py +625 -0
ml4t/diagnostic/visualization/signal/turnover_plots.py +400 -0
ml4t/diagnostic/visualization/trade_shap/__init__.py +90 -0
ml4t_diagnostic-0.1.0a1.dist-info/METADATA +1044 -0
ml4t_diagnostic-0.1.0a1.dist-info/RECORD +242 -0
ml4t_diagnostic-0.1.0a1.dist-info/WHEEL +4 -0
ml4t_diagnostic-0.1.0a1.dist-info/licenses/LICENSE +21 -0

ml4t/diagnostic/visualization/feature_plots.py ADDED Viewed

@@ -0,0 +1,888 @@
+"""Feature importance visualization functions.
+This module provides functions for visualizing ML feature importance analysis results
+from analyze_ml_importance() and related functions.
+All plot functions follow the standard API defined in docs/plot_api_standards.md:
+- Consume results dicts from analyze_*() functions
+- Return plotly.graph_objects.Figure instances
+- Support theme customization via global or per-plot settings
+- Use keyword-only arguments (after results)
+- Provide comprehensive hover information and interactivity
+Example workflow:
+    >>> from ml4t.diagnostic.evaluation import analyze_ml_importance
+    >>> from ml4t.diagnostic.visualization import plot_importance_bar, set_plot_theme
+    >>>
+    >>> # Analyze feature importance
+    >>> results = analyze_ml_importance(model, X, y, methods=["mdi", "pfi"])
+    >>>
+    >>> # Set global theme
+    >>> set_plot_theme("dark")
+    >>>
+    >>> # Create visualizations
+    >>> fig_bar = plot_importance_bar(results, top_n=15)
+    >>> fig_heatmap = plot_importance_heatmap(results)
+    >>> fig_dist = plot_importance_distribution(results)
+    >>> fig_summary = plot_importance_summary(results)
+    >>>
+    >>> # Display or save
+    >>> fig_bar.show()
+    >>> fig_summary.write_html("importance_report.html")
+"""
+from typing import Any
+import numpy as np
+import plotly.graph_objects as go
+from plotly.subplots import make_subplots
+from ml4t.diagnostic.visualization.core import (
+    apply_responsive_layout,
+    format_number,
+    get_color_scheme,
+    get_colorscale,
+    get_theme_config,
+    validate_plot_results,
+    validate_positive_int,
+    validate_theme,
+)
+__all__ = [
+    "plot_importance_bar",
+    "plot_importance_heatmap",
+    "plot_importance_distribution",
+    "plot_importance_summary",
+]
+def plot_importance_bar(
+    results: dict[str, Any],
+    *,
+    title: str | None = None,
+    top_n: int | None = 20,
+    theme: str | None = None,
+    color_scheme: str | None = None,
+    width: int | None = None,
+    height: int | None = None,
+    show_values: bool = True,
+) -> go.Figure:
+    """Plot horizontal bar chart of consensus feature importance rankings.
+    Creates an interactive bar chart showing features ranked by consensus importance
+    (average rank across all methods). Bars are color-coded by importance score using
+    a continuous colorscale.
+    Parameters
+    ----------
+    results : dict[str, Any]
+        Results from analyze_ml_importance() containing:
+        - "consensus_ranking": list[str] - Features in order of importance
+        - "method_results": dict - Individual method results with importances
+    title : str | None, optional
+        Plot title. If None, uses "Feature Importance - Consensus Ranking"
+    top_n : int | None, optional
+        Number of top features to display. If None, shows all features.
+        Default is 20 to avoid overcrowding.
+    theme : str | None, optional
+        Theme name ("default", "dark", "print", "presentation").
+        If None, uses current global theme.
+    color_scheme : str | None, optional
+        Color scheme for bars. If None, uses "viridis".
+        Recommended: "viridis", "cividis", "plasma", "blues", "greens"
+    width : int | None, optional
+        Figure width in pixels. If None, uses theme default (typically 1000).
+    height : int | None, optional
+        Figure height in pixels. If None, auto-sizes based on feature count
+        (25px per feature + 100px padding).
+    show_values : bool, optional
+        Whether to show importance values on bars. Default is True.
+    Returns
+    -------
+    go.Figure
+        Interactive Plotly figure with:
+        - Horizontal bars sorted by consensus importance
+        - Continuous color gradient indicating importance scores
+        - Hover info showing exact importance values
+        - Responsive layout for different screen sizes
+    Raises
+    ------
+    ValueError
+        If results dict is missing required keys or has invalid structure.
+    TypeError
+        If parameters have incorrect types.
+    Examples
+    --------
+    >>> from ml4t.diagnostic.evaluation import analyze_ml_importance
+    >>> from ml4t.diagnostic.visualization import plot_importance_bar
+    >>>
+    >>> # Analyze importance
+    >>> results = analyze_ml_importance(model, X, y)
+    >>>
+    >>> # Plot top 10 features
+    >>> fig = plot_importance_bar(results, top_n=10)
+    >>> fig.show()
+    >>>
+    >>> # Custom styling for print
+    >>> fig = plot_importance_bar(
+    ...     results,
+    ...     title="Key Predictive Features",
+    ...     top_n=15,
+    ...     theme="print",
+    ...     color_scheme="blues",
+    ...     height=600
+    ... )
+    >>> fig.write_image("feature_importance.pdf")
+    Notes
+    -----
+    - Importance scores are computed as the mean importance across all methods
+    - Features are ranked by consensus (average rank), not absolute importance
+    - Use top_n to focus on most important features and improve readability
+    - For very long feature names, consider increasing width parameter
+    """
+    # Validate inputs
+    validate_plot_results(
+        results,
+        required_keys=["consensus_ranking", "method_results"],
+        function_name="plot_importance_bar",
+    )
+    theme = validate_theme(theme)
+    if top_n is not None:
+        validate_positive_int(top_n, "top_n")
+    # Note: color_scheme validation happens in get_colorscale()
+    # Extract data
+    all_features = results["consensus_ranking"]
+    features = all_features[:top_n] if top_n is not None else all_features
+    # Calculate average importance across methods for each feature
+    method_results = results["method_results"]
+    importance_scores = []
+    for feat in features:
+        scores = []
+        for method_name, method_result in method_results.items():
+            # Get feature importances from method result
+            if method_name == "pfi":
+                # PFI uses importances_mean
+                importances = method_result["importances_mean"]
+            else:
+                # MDI, MDA, SHAP use importances
+                importances = method_result["importances"]
+            # Get feature names for this method
+            method_features = method_result["feature_names"]
+            # Find this feature's importance
+            if feat in method_features:
+                idx = method_features.index(feat)
+                scores.append(importances[idx])
+        # Average importance across methods
+        if scores:
+            importance_scores.append(float(np.mean(scores)))
+        else:
+            importance_scores.append(0.0)
+    # Get theme configuration
+    theme_config = get_theme_config(theme)
+    # Get colors
+    colors = get_colorscale(color_scheme or "viridis")
+    # Create figure
+    fig = go.Figure()
+    # Add bar trace
+    fig.add_trace(
+        go.Bar(
+            x=importance_scores,
+            y=features,
+            orientation="h",
+            marker={
+                "color": importance_scores,
+                "colorscale": colors,
+                "showscale": True,
+                "colorbar": {
+                    "title": "Importance",
+                    "tickformat": ".3f",
+                },
+            },
+            text=[format_number(v, precision=3) for v in importance_scores]
+            if show_values
+            else None,
+            textposition="outside",
+            hovertemplate="<b>%{y}</b><br>Importance: %{x:.4f}<extra></extra>",
+        )
+    )
+    # Update layout
+    fig.update_layout(
+        title=title or "Feature Importance - Consensus Ranking",
+        xaxis_title="Consensus Importance Score",
+        yaxis_title="Features",
+        **theme_config["layout"],
+        width=width or 1000,
+        height=height or max(400, len(features) * 25 + 100),
+        showlegend=False,
+    )
+    # Apply responsive layout
+    apply_responsive_layout(fig)
+    return fig
+def plot_importance_heatmap(
+    results: dict[str, Any],
+    *,
+    title: str | None = None,
+    theme: str | None = None,
+    color_scheme: str | None = None,
+    width: int | None = None,
+    height: int | None = None,
+    show_values: bool = True,
+) -> go.Figure:
+    """Plot heatmap showing correlation between importance ranking methods.
+    Creates a symmetric correlation matrix showing Spearman rank correlations between
+    different feature importance methods (MDI, PFI, MDA, SHAP). High correlations
+    indicate method agreement; low correlations suggest different aspects being measured.
+    Parameters
+    ----------
+    results : dict[str, Any]
+        Results from analyze_ml_importance() containing:
+        - "method_agreement": dict - Pairwise Spearman correlations
+        - "methods_run": list[str] - Names of methods that ran successfully
+    title : str | None, optional
+        Plot title. If None, uses "Method Agreement - Ranking Correlations"
+    theme : str | None, optional
+        Theme name ("default", "dark", "print", "presentation").
+        If None, uses current global theme.
+    color_scheme : str | None, optional
+        Diverging color scheme for correlation values. If None, uses "rdbu".
+        Recommended: "rdbu", "rdylgn", "brbg", "blues_oranges"
+    width : int | None, optional
+        Figure width in pixels. If None, uses 800.
+    height : int | None, optional
+        Figure height in pixels. If None, uses 800.
+    show_values : bool, optional
+        Whether to show correlation values in cells. Default is True.
+    Returns
+    -------
+    go.Figure
+        Interactive Plotly heatmap with:
+        - Symmetric correlation matrix
+        - Diverging colorscale (red = negative, blue = positive)
+        - Annotated cells with correlation coefficients
+        - Hover showing method pairs and correlation
+    Raises
+    ------
+    ValueError
+        If results dict is missing required keys or has invalid structure.
+        If fewer than 2 methods were run (can't compute correlations).
+    TypeError
+        If parameters have incorrect types.
+    Examples
+    --------
+    >>> from ml4t.diagnostic.evaluation import analyze_ml_importance
+    >>> from ml4t.diagnostic.visualization import plot_importance_heatmap
+    >>>
+    >>> # Analyze with multiple methods
+    >>> results = analyze_ml_importance(
+    ...     model, X, y,
+    ...     methods=["mdi", "pfi", "shap"]
+    ... )
+    >>>
+    >>> # Plot method agreement
+    >>> fig = plot_importance_heatmap(results)
+    >>> fig.show()
+    >>>
+    >>> # Custom styling
+    >>> fig = plot_importance_heatmap(
+    ...     results,
+    ...     title="Feature Ranking Method Correlations",
+    ...     theme="presentation",
+    ...     color_scheme="rdylgn"
+    ... )
+    Notes
+    -----
+    - Correlations range from -1 (perfect disagreement) to +1 (perfect agreement)
+    - High correlations (>0.7) indicate methods are measuring similar aspects
+    - Low correlations (<0.5) suggest methods capture different information
+    - Diagonal is always 1.0 (perfect self-correlation)
+    - Matrix is symmetric (corr(A,B) = corr(B,A))
+    """
+    # Validate inputs
+    validate_plot_results(
+        results,
+        required_keys=["method_agreement", "methods_run"],
+        function_name="plot_importance_heatmap",
+    )
+    theme = validate_theme(theme)
+    # Note: color_scheme validation happens in get_colorscale()
+    methods = results["methods_run"]
+    if len(methods) < 2:
+        raise ValueError(f"plot_importance_heatmap requires at least 2 methods, got {len(methods)}")
+    # Build correlation matrix from pairwise comparisons
+    n_methods = len(methods)
+    correlation_matrix = np.eye(n_methods)  # Diagonal = 1.0
+    method_agreement = results["method_agreement"]
+    for i, method1 in enumerate(methods):
+        for j, method2 in enumerate(methods):
+            if i < j:  # Upper triangle
+                key1 = f"{method1}_vs_{method2}"
+                key2 = f"{method2}_vs_{method1}"
+                # Try both key orders
+                if key1 in method_agreement:
+                    corr = method_agreement[key1]
+                elif key2 in method_agreement:
+                    corr = method_agreement[key2]
+                else:
+                    # Shouldn't happen, but handle gracefully
+                    corr = 0.0
+                correlation_matrix[i, j] = corr
+                correlation_matrix[j, i] = corr  # Symmetric
+    # Get theme configuration
+    theme_config = get_theme_config(theme)
+    # Get colors (diverging colorscale for correlations)
+    colors = get_colorscale(color_scheme or "rdbu")
+    # Create figure
+    fig = go.Figure()
+    # Create hover text
+    hover_text = []
+    for i, method1 in enumerate(methods):
+        row = []
+        for j, method2 in enumerate(methods):
+            corr = correlation_matrix[i, j]
+            row.append(
+                f"<b>{method1.upper()}</b> vs <b>{method2.upper()}</b><br>Correlation: {corr:.3f}"
+            )
+        hover_text.append(row)
+    # Add heatmap trace
+    fig.add_trace(
+        go.Heatmap(
+            z=correlation_matrix,
+            x=[m.upper() for m in methods],
+            y=[m.upper() for m in methods],
+            colorscale=colors,
+            zmid=0,  # Center diverging scale at 0
+            zmin=-1,
+            zmax=1,
+            colorbar={
+                "title": "Correlation",
+                "tickmode": "linear",
+                "tick0": -1,
+                "dtick": 0.5,
+            },
+            text=np.round(correlation_matrix, 3) if show_values else None,
+            texttemplate="%{text}" if show_values else None,
+            textfont={"size": 12},
+            hovertext=hover_text,
+            hovertemplate="%{hovertext}<extra></extra>",
+        )
+    )
+    # Update layout
+    fig.update_layout(
+        title=title or "Method Agreement - Ranking Correlations",
+        xaxis={
+            "title": "",
+            "side": "bottom",
+        },
+        yaxis={
+            "title": "",
+            "autorange": "reversed",  # Top to bottom
+        },
+        **theme_config["layout"],
+        width=width or 800,
+        height=height or 800,
+    )
+    # Apply responsive layout
+    apply_responsive_layout(fig)
+    return fig
+def plot_importance_distribution(
+    results: dict[str, Any],
+    *,
+    title: str | None = None,
+    method: str | None = None,
+    theme: str | None = None,
+    color_scheme: str | None = None,
+    width: int | None = None,
+    height: int | None = None,
+    bins: int = 30,
+    overlay: bool = False,
+) -> go.Figure:
+    """Plot distribution of feature importance scores across methods.
+    Creates histogram(s) showing the distribution of importance scores. Can either
+    overlay all methods in a single plot or show them separately in subplots.
+    Useful for understanding the spread and concentration of importance values.
+    Parameters
+    ----------
+    results : dict[str, Any]
+        Results from analyze_ml_importance() containing:
+        - "method_results": dict - Individual method results with importances
+        - "methods_run": list[str] - Names of methods that ran successfully
+    title : str | None, optional
+        Plot title. If None, uses "Feature Importance Distribution"
+    method : str | None, optional
+        Show distribution for a single method only. If None, shows all methods.
+        Valid values: "mdi", "pfi", "mda", "shap" (must be in methods_run)
+    theme : str | None, optional
+        Theme name ("default", "dark", "print", "presentation").
+        If None, uses current global theme.
+    color_scheme : str | None, optional
+        Color scheme for histogram bars. If None, uses "set2".
+        Recommended: "set2", "set3", "pastel" for qualitative
+    width : int | None, optional
+        Figure width in pixels. If None, uses 1000.
+    height : int | None, optional
+        Figure height in pixels. If None, uses 600 (overlay) or 400 per method.
+    bins : int, optional
+        Number of histogram bins. Default is 30.
+    overlay : bool, optional
+        If True and method is None, overlay all methods in single plot.
+        If False and method is None, create subplot for each method.
+        Default is False (subplots).
+    Returns
+    -------
+    go.Figure
+        Interactive Plotly histogram with:
+        - Distribution of importance scores
+        - Optional multiple methods overlaid or in subplots
+        - Statistics annotations (mean, median, quartiles)
+        - Hover showing bin ranges and counts
+    Raises
+    ------
+    ValueError
+        If results dict is missing required keys or has invalid structure.
+        If specified method was not run or doesn't exist.
+    TypeError
+        If parameters have incorrect types.
+    Examples
+    --------
+    >>> from ml4t.diagnostic.evaluation import analyze_ml_importance
+    >>> from ml4t.diagnostic.visualization import plot_importance_distribution
+    >>>
+    >>> # Analyze importance
+    >>> results = analyze_ml_importance(model, X, y)
+    >>>
+    >>> # Show all methods (subplots)
+    >>> fig = plot_importance_distribution(results)
+    >>> fig.show()
+    >>>
+    >>> # Overlay for comparison
+    >>> fig = plot_importance_distribution(results, overlay=True)
+    >>> fig.show()
+    >>>
+    >>> # Single method with custom bins
+    >>> fig = plot_importance_distribution(
+    ...     results,
+    ...     method="pfi",
+    ...     bins=50,
+    ...     theme="dark"
+    ... )
+    Notes
+    -----
+    - Distributions reveal whether importance is concentrated or spread out
+    - Overlay mode is best for comparing 2-3 methods; use subplots for more
+    - Very skewed distributions may benefit from log scale (not implemented yet)
+    - Consider binning strategy for features with very different importance ranges
+    """
+    # Validate inputs
+    validate_plot_results(
+        results,
+        required_keys=["method_results", "methods_run"],
+        function_name="plot_importance_distribution",
+    )
+    theme = validate_theme(theme)
+    validate_positive_int(bins, "bins")
+    # Note: color_scheme validation happens in get_color_scheme()
+    methods_run = results["methods_run"]
+    method_results = results["method_results"]
+    # Determine which methods to plot
+    if method is not None:
+        if method not in methods_run:
+            raise ValueError(
+                f"Method '{method}' not found in results. Available methods: {methods_run}"
+            )
+        methods_to_plot = [method]
+    else:
+        methods_to_plot = methods_run
+    # Get theme configuration
+    theme_config = get_theme_config(theme)
+    # Get colors (get full scheme and use first N colors)
+    color_list = get_color_scheme(color_scheme or "set2")
+    colors = (
+        color_list[: len(methods_to_plot)]
+        if len(methods_to_plot) <= len(color_list)
+        else color_list
+    )
+    # Extract importance scores for each method
+    method_scores = {}
+    for method_name in methods_to_plot:
+        result = method_results[method_name]
+        scores = result["importances_mean"] if method_name == "pfi" else result["importances"]
+        method_scores[method_name] = scores
+    # Create figure
+    if overlay or len(methods_to_plot) == 1:
+        # Single plot with overlaid histograms
+        fig = go.Figure()
+        for i, (method_name, scores) in enumerate(method_scores.items()):
+            fig.add_trace(
+                go.Histogram(
+                    x=scores,
+                    name=method_name.upper(),
+                    nbinsx=bins,
+                    marker_color=colors[i],
+                    opacity=0.7 if overlay else 1.0,
+                    hovertemplate=(
+                        f"<b>{method_name.upper()}</b><br>Importance: %{{x:.4f}}<br>Count: %{{y}}<extra></extra>"
+                    ),
+                )
+            )
+        fig.update_layout(
+            title=title or "Feature Importance Distribution",
+            xaxis_title="Importance Score",
+            yaxis_title="Frequency",
+            barmode="overlay" if overlay else "stack",
+            **theme_config["layout"],
+            width=width or 1000,
+            height=height or 600,
+        )
+    else:
+        # Subplots for each method
+        n_methods = len(methods_to_plot)
+        fig = make_subplots(
+            rows=n_methods,
+            cols=1,
+            subplot_titles=[m.upper() for m in methods_to_plot],
+            vertical_spacing=0.1,
+        )
+        for i, (method_name, scores) in enumerate(method_scores.items(), start=1):
+            fig.add_trace(
+                go.Histogram(
+                    x=scores,
+                    nbinsx=bins,
+                    marker_color=colors[i - 1],
+                    name=method_name.upper(),
+                    showlegend=False,
+                    hovertemplate=(
+                        f"<b>{method_name.upper()}</b><br>Importance: %{{x:.4f}}<br>Count: %{{y}}<extra></extra>"
+                    ),
+                ),
+                row=i,
+                col=1,
+            )
+            # Update subplot axes
+            fig.update_xaxes(title_text="Importance Score", row=i, col=1)
+            fig.update_yaxes(title_text="Frequency", row=i, col=1)
+        fig.update_layout(
+            title=title or "Feature Importance Distribution by Method",
+            **theme_config["layout"],
+            width=width or 1000,
+            height=height or (400 * n_methods),
+        )
+    # Apply responsive layout
+    apply_responsive_layout(fig)
+    return fig
+def plot_importance_summary(
+    results: dict[str, Any],
+    *,
+    title: str | None = None,
+    top_n: int = 15,
+    theme: str | None = None,
+    width: int | None = None,
+    height: int | None = None,
+) -> go.Figure:
+    """Create comprehensive multi-panel feature importance summary visualization.
+    Combines multiple views into a single figure:
+    - Top-left: Bar chart of consensus rankings
+    - Top-right: Method agreement heatmap
+    - Bottom: Distribution of importance scores
+    This provides a complete overview of feature importance analysis in one plot,
+    ideal for reports and presentations.
+    Parameters
+    ----------
+    results : dict[str, Any]
+        Results from analyze_ml_importance() containing all required data
+    title : str | None, optional
+        Overall figure title. If None, uses "Feature Importance Analysis - Summary"
+    top_n : int, optional
+        Number of top features to show in bar chart. Default is 15.
+    theme : str | None, optional
+        Theme name ("default", "dark", "print", "presentation").
+        If None, uses current global theme.
+    width : int | None, optional
+        Figure width in pixels. If None, uses 1400.
+    height : int | None, optional
+        Figure height in pixels. If None, uses 1000.
+    Returns
+    -------
+    go.Figure
+        Multi-panel Plotly figure with comprehensive importance summary
+    Raises
+    ------
+    ValueError
+        If results dict is missing required keys or has invalid structure.
+    TypeError
+        If parameters have incorrect types.
+    Examples
+    --------
+    >>> from ml4t.diagnostic.evaluation import analyze_ml_importance
+    >>> from ml4t.diagnostic.visualization import plot_importance_summary
+    >>>
+    >>> # Analyze importance
+    >>> results = analyze_ml_importance(model, X, y)
+    >>>
+    >>> # Create comprehensive summary
+    >>> fig = plot_importance_summary(results)
+    >>> fig.show()
+    >>>
+    >>> # Save for report
+    >>> fig = plot_importance_summary(
+    ...     results,
+    ...     title="Model Feature Importance Analysis",
+    ...     theme="print",
+    ...     top_n=20
+    ... )
+    >>> fig.write_html("importance_summary.html")
+    >>> fig.write_image("importance_summary.pdf")
+    Notes
+    -----
+    - This is the recommended visualization for comprehensive reports
+    - All panels use consistent theming and color schemes
+    - Interactive hover works independently for each panel
+    - May require large display or high resolution for optimal viewing
+    - Consider using individual plot functions for more customization
+    """
+    # Validate inputs
+    validate_plot_results(
+        results,
+        required_keys=["consensus_ranking", "method_results", "method_agreement", "methods_run"],
+        function_name="plot_importance_summary",
+    )
+    theme = validate_theme(theme)
+    validate_positive_int(top_n, "top_n")
+    # Get theme configuration
+    theme_config = get_theme_config(theme)
+    # Create subplots: 2x2 layout
+    # Row 1: Bar chart (left), Heatmap (right)
+    # Row 2: Distribution (spans both columns)
+    fig = make_subplots(
+        rows=2,
+        cols=2,
+        subplot_titles=(
+            "Consensus Rankings (Top Features)",
+            "Method Agreement",
+            "Importance Score Distributions",
+            "",  # Empty subtitle for merged cell
+        ),
+        specs=[
+            [{"type": "bar"}, {"type": "heatmap"}],
+            [{"type": "histogram", "colspan": 2}, None],
+        ],
+        vertical_spacing=0.15,
+        horizontal_spacing=0.12,
+    )
+    # === Panel 1: Bar chart ===
+    all_features = results["consensus_ranking"]
+    features = all_features[:top_n]
+    method_results = results["method_results"]
+    # Calculate average importance
+    importance_scores = []
+    for feat in features:
+        scores = []
+        for method_name, method_result in method_results.items():
+            importances = (
+                method_result["importances_mean"]
+                if method_name == "pfi"
+                else method_result["importances"]
+            )
+            method_features = method_result["feature_names"]
+            if feat in method_features:
+                idx = method_features.index(feat)
+                scores.append(importances[idx])
+        if scores:
+            importance_scores.append(float(np.mean(scores)))
+        else:
+            importance_scores.append(0.0)
+    colors_bar = get_colorscale("viridis")
+    fig.add_trace(
+        go.Bar(
+            x=importance_scores,
+            y=features,
+            orientation="h",
+            marker={
+                "color": importance_scores,
+                "colorscale": colors_bar,
+                "showscale": False,
+            },
+            hovertemplate="<b>%{y}</b><br>Importance: %{x:.4f}<extra></extra>",
+            showlegend=False,
+        ),
+        row=1,
+        col=1,
+    )
+    # === Panel 2: Heatmap ===
+    methods = results["methods_run"]
+    n_methods = len(methods)
+    correlation_matrix = np.eye(n_methods)
+    method_agreement = results["method_agreement"]
+    for i, method1 in enumerate(methods):
+        for j, method2 in enumerate(methods):
+            if i < j:
+                key1 = f"{method1}_vs_{method2}"
+                key2 = f"{method2}_vs_{method1}"
+                corr = method_agreement.get(key1, method_agreement.get(key2, 0.0))
+                correlation_matrix[i, j] = corr
+                correlation_matrix[j, i] = corr
+    colors_heatmap = get_colorscale("rdbu")
+    fig.add_trace(
+        go.Heatmap(
+            z=correlation_matrix,
+            x=[m.upper() for m in methods],
+            y=[m.upper() for m in methods],
+            colorscale=colors_heatmap,
+            zmid=0,
+            zmin=-1,
+            zmax=1,
+            showscale=True,
+            colorbar={
+                "title": "Correlation",
+                "x": 1.15,  # Position to right of subplot
+                "len": 0.4,
+            },
+            text=np.round(correlation_matrix, 2),
+            texttemplate="%{text}",
+            textfont={"size": 10},
+            hovertemplate=("<b>%{x}</b> vs <b>%{y}</b><br>Correlation: %{z:.3f}<extra></extra>"),
+        ),
+        row=1,
+        col=2,
+    )
+    # === Panel 3: Distribution (overlay) ===
+    color_list_dist = get_color_scheme("set2")
+    colors_dist = (
+        color_list_dist[: len(methods)] if len(methods) <= len(color_list_dist) else color_list_dist
+    )
+    for i, method_name in enumerate(methods):
+        result = method_results[method_name]
+        scores = result["importances_mean"] if method_name == "pfi" else result["importances"]
+        fig.add_trace(
+            go.Histogram(
+                x=scores,
+                name=method_name.upper(),
+                nbinsx=30,
+                marker_color=colors_dist[i],
+                opacity=0.7,
+                hovertemplate=(
+                    f"<b>{method_name.upper()}</b><br>Importance: %{{x:.4f}}<br>Count: %{{y}}<extra></extra>"
+                ),
+            ),
+            row=2,
+            col=1,
+        )
+    # Update axes
+    fig.update_xaxes(title_text="Importance Score", row=1, col=1)
+    fig.update_yaxes(title_text="Features", row=1, col=1)
+    fig.update_xaxes(title_text="", row=1, col=2)
+    fig.update_yaxes(title_text="", autorange="reversed", row=1, col=2)
+    fig.update_xaxes(title_text="Importance Score", row=2, col=1)
+    fig.update_yaxes(title_text="Frequency", row=2, col=1)
+    # Update layout
+    fig.update_layout(
+        title={
+            "text": title or "Feature Importance Analysis - Summary",
+            "x": 0.5,
+            "xanchor": "center",
+        },
+        barmode="overlay",
+        **theme_config["layout"],
+        width=width or 1400,
+        height=height or 1000,
+        showlegend=True,
+        legend={
+            "orientation": "h",
+            "yanchor": "bottom",
+            "y": 1.02,
+            "xanchor": "right",
+            "x": 1,
+        },
+    )
+    # Apply responsive layout
+    apply_responsive_layout(fig)
+    return fig