PyPI - ml4t-diagnostic - Versions diffs - 0.1.0a1__py3-none-any.whl - Mend

ml4t-diagnostic 0.1.0a1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

ml4t/diagnostic/AGENT.md +25 -0
ml4t/diagnostic/__init__.py +166 -0
ml4t/diagnostic/backends/__init__.py +10 -0
ml4t/diagnostic/backends/adapter.py +192 -0
ml4t/diagnostic/backends/polars_backend.py +899 -0
ml4t/diagnostic/caching/__init__.py +40 -0
ml4t/diagnostic/caching/cache.py +331 -0
ml4t/diagnostic/caching/decorators.py +131 -0
ml4t/diagnostic/caching/smart_cache.py +339 -0
ml4t/diagnostic/config/AGENT.md +24 -0
ml4t/diagnostic/config/README.md +267 -0
ml4t/diagnostic/config/__init__.py +219 -0
ml4t/diagnostic/config/barrier_config.py +277 -0
ml4t/diagnostic/config/base.py +301 -0
ml4t/diagnostic/config/event_config.py +148 -0
ml4t/diagnostic/config/feature_config.py +404 -0
ml4t/diagnostic/config/multi_signal_config.py +55 -0
ml4t/diagnostic/config/portfolio_config.py +215 -0
ml4t/diagnostic/config/report_config.py +391 -0
ml4t/diagnostic/config/sharpe_config.py +202 -0
ml4t/diagnostic/config/signal_config.py +206 -0
ml4t/diagnostic/config/trade_analysis_config.py +310 -0
ml4t/diagnostic/config/validation.py +279 -0
ml4t/diagnostic/core/__init__.py +29 -0
ml4t/diagnostic/core/numba_utils.py +315 -0
ml4t/diagnostic/core/purging.py +372 -0
ml4t/diagnostic/core/sampling.py +471 -0
ml4t/diagnostic/errors/__init__.py +205 -0
ml4t/diagnostic/evaluation/AGENT.md +26 -0
ml4t/diagnostic/evaluation/__init__.py +437 -0
ml4t/diagnostic/evaluation/autocorrelation.py +531 -0
ml4t/diagnostic/evaluation/barrier_analysis.py +1050 -0
ml4t/diagnostic/evaluation/binary_metrics.py +910 -0
ml4t/diagnostic/evaluation/dashboard.py +715 -0
ml4t/diagnostic/evaluation/diagnostic_plots.py +1037 -0
ml4t/diagnostic/evaluation/distribution/__init__.py +499 -0
ml4t/diagnostic/evaluation/distribution/moments.py +299 -0
ml4t/diagnostic/evaluation/distribution/tails.py +777 -0
ml4t/diagnostic/evaluation/distribution/tests.py +470 -0
ml4t/diagnostic/evaluation/drift/__init__.py +139 -0
ml4t/diagnostic/evaluation/drift/analysis.py +432 -0
ml4t/diagnostic/evaluation/drift/domain_classifier.py +517 -0
ml4t/diagnostic/evaluation/drift/population_stability_index.py +310 -0
ml4t/diagnostic/evaluation/drift/wasserstein.py +388 -0
ml4t/diagnostic/evaluation/event_analysis.py +647 -0
ml4t/diagnostic/evaluation/excursion.py +390 -0
ml4t/diagnostic/evaluation/feature_diagnostics.py +873 -0
ml4t/diagnostic/evaluation/feature_outcome.py +666 -0
ml4t/diagnostic/evaluation/framework.py +935 -0
ml4t/diagnostic/evaluation/metric_registry.py +255 -0
ml4t/diagnostic/evaluation/metrics/AGENT.md +23 -0
ml4t/diagnostic/evaluation/metrics/__init__.py +133 -0
ml4t/diagnostic/evaluation/metrics/basic.py +160 -0
ml4t/diagnostic/evaluation/metrics/conditional_ic.py +469 -0
ml4t/diagnostic/evaluation/metrics/feature_outcome.py +475 -0
ml4t/diagnostic/evaluation/metrics/ic_statistics.py +446 -0
ml4t/diagnostic/evaluation/metrics/importance_analysis.py +338 -0
ml4t/diagnostic/evaluation/metrics/importance_classical.py +375 -0
ml4t/diagnostic/evaluation/metrics/importance_mda.py +371 -0
ml4t/diagnostic/evaluation/metrics/importance_shap.py +715 -0
ml4t/diagnostic/evaluation/metrics/information_coefficient.py +527 -0
ml4t/diagnostic/evaluation/metrics/interactions.py +772 -0
ml4t/diagnostic/evaluation/metrics/monotonicity.py +226 -0
ml4t/diagnostic/evaluation/metrics/risk_adjusted.py +324 -0
ml4t/diagnostic/evaluation/multi_signal.py +550 -0
ml4t/diagnostic/evaluation/portfolio_analysis/__init__.py +83 -0
ml4t/diagnostic/evaluation/portfolio_analysis/analysis.py +734 -0
ml4t/diagnostic/evaluation/portfolio_analysis/metrics.py +589 -0
ml4t/diagnostic/evaluation/portfolio_analysis/results.py +334 -0
ml4t/diagnostic/evaluation/report_generation.py +824 -0
ml4t/diagnostic/evaluation/signal_selector.py +452 -0
ml4t/diagnostic/evaluation/stat_registry.py +139 -0
ml4t/diagnostic/evaluation/stationarity/__init__.py +97 -0
ml4t/diagnostic/evaluation/stationarity/analysis.py +518 -0
ml4t/diagnostic/evaluation/stationarity/augmented_dickey_fuller.py +296 -0
ml4t/diagnostic/evaluation/stationarity/kpss_test.py +308 -0
ml4t/diagnostic/evaluation/stationarity/phillips_perron.py +365 -0
ml4t/diagnostic/evaluation/stats/AGENT.md +43 -0
ml4t/diagnostic/evaluation/stats/__init__.py +191 -0
ml4t/diagnostic/evaluation/stats/backtest_overfitting.py +219 -0
ml4t/diagnostic/evaluation/stats/bootstrap.py +228 -0
ml4t/diagnostic/evaluation/stats/deflated_sharpe_ratio.py +591 -0
ml4t/diagnostic/evaluation/stats/false_discovery_rate.py +295 -0
ml4t/diagnostic/evaluation/stats/hac_standard_errors.py +108 -0
ml4t/diagnostic/evaluation/stats/minimum_track_record.py +408 -0
ml4t/diagnostic/evaluation/stats/moments.py +164 -0
ml4t/diagnostic/evaluation/stats/rademacher_adjustment.py +436 -0
ml4t/diagnostic/evaluation/stats/reality_check.py +155 -0
ml4t/diagnostic/evaluation/stats/sharpe_inference.py +219 -0
ml4t/diagnostic/evaluation/themes.py +330 -0
ml4t/diagnostic/evaluation/threshold_analysis.py +957 -0
ml4t/diagnostic/evaluation/trade_analysis.py +1136 -0
ml4t/diagnostic/evaluation/trade_dashboard/__init__.py +32 -0
ml4t/diagnostic/evaluation/trade_dashboard/app.py +315 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/__init__.py +18 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/csv.py +82 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/html.py +276 -0
ml4t/diagnostic/evaluation/trade_dashboard/io.py +166 -0
ml4t/diagnostic/evaluation/trade_dashboard/normalize.py +304 -0
ml4t/diagnostic/evaluation/trade_dashboard/stats.py +386 -0
ml4t/diagnostic/evaluation/trade_dashboard/style.py +79 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/__init__.py +21 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/patterns.py +354 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/shap_analysis.py +280 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/stat_validation.py +186 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/worst_trades.py +236 -0
ml4t/diagnostic/evaluation/trade_dashboard/types.py +129 -0
ml4t/diagnostic/evaluation/trade_shap/__init__.py +102 -0
ml4t/diagnostic/evaluation/trade_shap/alignment.py +188 -0
ml4t/diagnostic/evaluation/trade_shap/characterize.py +413 -0
ml4t/diagnostic/evaluation/trade_shap/cluster.py +302 -0
ml4t/diagnostic/evaluation/trade_shap/explain.py +208 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/__init__.py +23 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/generator.py +290 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/matcher.py +251 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/templates.yaml +467 -0
ml4t/diagnostic/evaluation/trade_shap/models.py +386 -0
ml4t/diagnostic/evaluation/trade_shap/normalize.py +116 -0
ml4t/diagnostic/evaluation/trade_shap/pipeline.py +263 -0
ml4t/diagnostic/evaluation/trade_shap_dashboard.py +283 -0
ml4t/diagnostic/evaluation/trade_shap_diagnostics.py +588 -0
ml4t/diagnostic/evaluation/validated_cv.py +535 -0
ml4t/diagnostic/evaluation/visualization.py +1050 -0
ml4t/diagnostic/evaluation/volatility/__init__.py +45 -0
ml4t/diagnostic/evaluation/volatility/analysis.py +351 -0
ml4t/diagnostic/evaluation/volatility/arch.py +258 -0
ml4t/diagnostic/evaluation/volatility/garch.py +460 -0
ml4t/diagnostic/integration/__init__.py +48 -0
ml4t/diagnostic/integration/backtest_contract.py +671 -0
ml4t/diagnostic/integration/data_contract.py +316 -0
ml4t/diagnostic/integration/engineer_contract.py +226 -0
ml4t/diagnostic/logging/__init__.py +77 -0
ml4t/diagnostic/logging/logger.py +245 -0
ml4t/diagnostic/logging/performance.py +234 -0
ml4t/diagnostic/logging/progress.py +234 -0
ml4t/diagnostic/logging/wandb.py +412 -0
ml4t/diagnostic/metrics/__init__.py +9 -0
ml4t/diagnostic/metrics/percentiles.py +128 -0
ml4t/diagnostic/py.typed +1 -0
ml4t/diagnostic/reporting/__init__.py +43 -0
ml4t/diagnostic/reporting/base.py +130 -0
ml4t/diagnostic/reporting/html_renderer.py +275 -0
ml4t/diagnostic/reporting/json_renderer.py +51 -0
ml4t/diagnostic/reporting/markdown_renderer.py +117 -0
ml4t/diagnostic/results/AGENT.md +24 -0
ml4t/diagnostic/results/__init__.py +105 -0
ml4t/diagnostic/results/barrier_results/__init__.py +36 -0
ml4t/diagnostic/results/barrier_results/hit_rate.py +304 -0
ml4t/diagnostic/results/barrier_results/precision_recall.py +266 -0
ml4t/diagnostic/results/barrier_results/profit_factor.py +297 -0
ml4t/diagnostic/results/barrier_results/tearsheet.py +397 -0
ml4t/diagnostic/results/barrier_results/time_to_target.py +305 -0
ml4t/diagnostic/results/barrier_results/validation.py +38 -0
ml4t/diagnostic/results/base.py +177 -0
ml4t/diagnostic/results/event_results.py +349 -0
ml4t/diagnostic/results/feature_results.py +787 -0
ml4t/diagnostic/results/multi_signal_results.py +431 -0
ml4t/diagnostic/results/portfolio_results.py +281 -0
ml4t/diagnostic/results/sharpe_results.py +448 -0
ml4t/diagnostic/results/signal_results/__init__.py +74 -0
ml4t/diagnostic/results/signal_results/ic.py +581 -0
ml4t/diagnostic/results/signal_results/irtc.py +110 -0
ml4t/diagnostic/results/signal_results/quantile.py +392 -0
ml4t/diagnostic/results/signal_results/tearsheet.py +456 -0
ml4t/diagnostic/results/signal_results/turnover.py +213 -0
ml4t/diagnostic/results/signal_results/validation.py +147 -0
ml4t/diagnostic/signal/AGENT.md +17 -0
ml4t/diagnostic/signal/__init__.py +69 -0
ml4t/diagnostic/signal/_report.py +152 -0
ml4t/diagnostic/signal/_utils.py +261 -0
ml4t/diagnostic/signal/core.py +275 -0
ml4t/diagnostic/signal/quantile.py +148 -0
ml4t/diagnostic/signal/result.py +214 -0
ml4t/diagnostic/signal/signal_ic.py +129 -0
ml4t/diagnostic/signal/turnover.py +182 -0
ml4t/diagnostic/splitters/AGENT.md +19 -0
ml4t/diagnostic/splitters/__init__.py +36 -0
ml4t/diagnostic/splitters/base.py +501 -0
ml4t/diagnostic/splitters/calendar.py +421 -0
ml4t/diagnostic/splitters/calendar_config.py +91 -0
ml4t/diagnostic/splitters/combinatorial.py +1064 -0
ml4t/diagnostic/splitters/config.py +322 -0
ml4t/diagnostic/splitters/cpcv/__init__.py +57 -0
ml4t/diagnostic/splitters/cpcv/combinations.py +119 -0
ml4t/diagnostic/splitters/cpcv/partitioning.py +263 -0
ml4t/diagnostic/splitters/cpcv/purge_engine.py +379 -0
ml4t/diagnostic/splitters/cpcv/windows.py +190 -0
ml4t/diagnostic/splitters/group_isolation.py +329 -0
ml4t/diagnostic/splitters/persistence.py +316 -0
ml4t/diagnostic/splitters/utils.py +207 -0
ml4t/diagnostic/splitters/walk_forward.py +757 -0
ml4t/diagnostic/utils/__init__.py +42 -0
ml4t/diagnostic/utils/config.py +542 -0
ml4t/diagnostic/utils/dependencies.py +318 -0
ml4t/diagnostic/utils/sessions.py +127 -0
ml4t/diagnostic/validation/__init__.py +54 -0
ml4t/diagnostic/validation/dataframe.py +274 -0
ml4t/diagnostic/validation/returns.py +280 -0
ml4t/diagnostic/validation/timeseries.py +299 -0
ml4t/diagnostic/visualization/AGENT.md +19 -0
ml4t/diagnostic/visualization/__init__.py +223 -0
ml4t/diagnostic/visualization/backtest/__init__.py +98 -0
ml4t/diagnostic/visualization/backtest/cost_attribution.py +762 -0
ml4t/diagnostic/visualization/backtest/executive_summary.py +895 -0
ml4t/diagnostic/visualization/backtest/interactive_controls.py +673 -0
ml4t/diagnostic/visualization/backtest/statistical_validity.py +874 -0
ml4t/diagnostic/visualization/backtest/tearsheet.py +565 -0
ml4t/diagnostic/visualization/backtest/template_system.py +373 -0
ml4t/diagnostic/visualization/backtest/trade_plots.py +1172 -0
ml4t/diagnostic/visualization/barrier_plots.py +782 -0
ml4t/diagnostic/visualization/core.py +1060 -0
ml4t/diagnostic/visualization/dashboards/__init__.py +36 -0
ml4t/diagnostic/visualization/dashboards/base.py +582 -0
ml4t/diagnostic/visualization/dashboards/importance.py +801 -0
ml4t/diagnostic/visualization/dashboards/interaction.py +263 -0
ml4t/diagnostic/visualization/dashboards.py +43 -0
ml4t/diagnostic/visualization/data_extraction/__init__.py +48 -0
ml4t/diagnostic/visualization/data_extraction/importance.py +649 -0
ml4t/diagnostic/visualization/data_extraction/interaction.py +504 -0
ml4t/diagnostic/visualization/data_extraction/types.py +113 -0
ml4t/diagnostic/visualization/data_extraction/validation.py +66 -0
ml4t/diagnostic/visualization/feature_plots.py +888 -0
ml4t/diagnostic/visualization/interaction_plots.py +618 -0
ml4t/diagnostic/visualization/portfolio/__init__.py +41 -0
ml4t/diagnostic/visualization/portfolio/dashboard.py +514 -0
ml4t/diagnostic/visualization/portfolio/drawdown_plots.py +341 -0
ml4t/diagnostic/visualization/portfolio/returns_plots.py +487 -0
ml4t/diagnostic/visualization/portfolio/risk_plots.py +301 -0
ml4t/diagnostic/visualization/report_generation.py +1343 -0
ml4t/diagnostic/visualization/signal/__init__.py +103 -0
ml4t/diagnostic/visualization/signal/dashboard.py +911 -0
ml4t/diagnostic/visualization/signal/event_plots.py +514 -0
ml4t/diagnostic/visualization/signal/ic_plots.py +635 -0
ml4t/diagnostic/visualization/signal/multi_signal_dashboard.py +974 -0
ml4t/diagnostic/visualization/signal/multi_signal_plots.py +603 -0
ml4t/diagnostic/visualization/signal/quantile_plots.py +625 -0
ml4t/diagnostic/visualization/signal/turnover_plots.py +400 -0
ml4t/diagnostic/visualization/trade_shap/__init__.py +90 -0
ml4t_diagnostic-0.1.0a1.dist-info/METADATA +1044 -0
ml4t_diagnostic-0.1.0a1.dist-info/RECORD +242 -0
ml4t_diagnostic-0.1.0a1.dist-info/WHEEL +4 -0
ml4t_diagnostic-0.1.0a1.dist-info/licenses/LICENSE +21 -0

ml4t/diagnostic/evaluation/trade_dashboard/tabs/shap_analysis.py ADDED Viewed

@@ -0,0 +1,280 @@
+"""SHAP Analysis tab.
+Displays individual trade SHAP explanations and global feature importance.
+"""
+from __future__ import annotations
+from typing import TYPE_CHECKING, Any, cast
+import numpy as np
+import pandas as pd
+if TYPE_CHECKING:
+    from ml4t.diagnostic.evaluation.trade_dashboard.types import DashboardBundle
+def render_tab(st: Any, bundle: DashboardBundle) -> None:
+    """Render the SHAP Analysis tab.
+    Parameters
+    ----------
+    st : streamlit
+        Streamlit module instance.
+    bundle : DashboardBundle
+        Normalized dashboard data.
+    """
+    st.header("SHAP Analysis")
+    st.info(
+        "Explore SHAP (SHapley Additive exPlanations) values for individual trades "
+        "to understand which features drove model predictions."
+    )
+    explanations = bundle.explanations
+    if not explanations:
+        st.warning("No trade explanations available.")
+        return
+    # Check for trade selected from worst trades tab
+    selected_from_tab2 = st.session_state.get("selected_trade_for_shap")
+    selected_trade_idx = 0
+    if selected_from_tab2:
+        for i, exp in enumerate(explanations):
+            if exp.get("trade_id") == selected_from_tab2:
+                selected_trade_idx = i
+                break
+    # Trade selector
+    st.subheader("Trade Selection")
+    if selected_from_tab2:
+        st.success(f"Currently viewing: **{selected_from_tab2}** (selected in Worst Trades tab)")
+    trade_options = [exp.get("trade_id", f"Trade_{i}") for i, exp in enumerate(explanations)]
+    selected_trade_idx = st.selectbox(
+        "Select trade to view SHAP explanation:",
+        range(len(trade_options)),
+        index=selected_trade_idx,
+        format_func=lambda x: trade_options[x],
+    )
+    if selected_trade_idx is not None:
+        _render_trade_shap(st, explanations[selected_trade_idx])
+    # Global feature importance
+    st.divider()
+    _render_global_importance(st, explanations)
+def _render_trade_shap(st: Any, explanation: dict[str, Any]) -> None:
+    """Render SHAP explanation for a single trade."""
+    trade_id = explanation.get("trade_id", "Unknown")
+    timestamp = explanation.get("timestamp")
+    top_features = explanation.get("top_features", [])
+    st.divider()
+    st.subheader(f"Trade: {trade_id}")
+    if timestamp:
+        st.caption(f"Timestamp: {timestamp}")
+    # Note: Renamed from "Waterfall" - this is actually a bar chart
+    st.subheader("Top SHAP Contributions")
+    if not top_features:
+        st.warning("No SHAP features available for this trade.")
+        return
+    # Prepare data for visualization
+    features_data = []
+    cumulative = 0.0
+    for item in top_features[:15]:
+        if len(item) >= 2:
+            feature, shap_val = item[0], item[1]
+            cumulative += shap_val
+            features_data.append(
+                {
+                    "Feature": feature,
+                    "SHAP Value": shap_val,
+                    "Cumulative": cumulative,
+                    "Impact": "Positive" if shap_val > 0 else "Negative",
+                }
+            )
+    if not features_data:
+        st.warning("Could not parse SHAP features.")
+        return
+    df_shap = pd.DataFrame(features_data)
+    # Create bar chart
+    import plotly.graph_objects as go
+    colors = ["#FF6B6B" if val < 0 else "#51CF66" for val in df_shap["SHAP Value"]]
+    fig = go.Figure()
+    fig.add_trace(
+        go.Bar(
+            x=df_shap["SHAP Value"],
+            y=df_shap["Feature"],
+            orientation="h",
+            marker={"color": colors},
+            text=[f"{val:.4f}" for val in df_shap["SHAP Value"]],
+            textposition="auto",
+            hovertemplate="<b>%{y}</b><br>SHAP: %{x:.4f}<extra></extra>",
+        )
+    )
+    fig.update_layout(
+        title="SHAP Feature Contributions (Top 15 Features)",
+        xaxis_title="SHAP Value",
+        yaxis_title="Feature",
+        height=max(400, len(df_shap) * 30),
+        yaxis={"autorange": "reversed"},
+        showlegend=False,
+    )
+    st.plotly_chart(fig, use_container_width=True)
+    # Feature values table
+    st.subheader("Feature Values")
+    display_df = df_shap[["Feature", "SHAP Value", "Impact"]].copy()
+    display_df["SHAP Value"] = display_df["SHAP Value"].apply(lambda x: f"{x:.4f}")
+    st.dataframe(
+        display_df,
+        hide_index=True,
+        use_container_width=True,
+        column_config={
+            "Feature": st.column_config.TextColumn("Feature Name", width="medium"),
+            "SHAP Value": st.column_config.TextColumn("SHAP Value", width="small"),
+            "Impact": st.column_config.TextColumn("Impact", width="small"),
+        },
+    )
+    # Interpretation guide
+    with st.expander("How to Interpret SHAP Values"):
+        st.markdown(
+            """
+            **SHAP Value Interpretation:**
+            - **Positive SHAP value (green)**: Feature pushed prediction higher
+            - **Negative SHAP value (red)**: Feature pushed prediction lower
+            - **Magnitude**: Larger absolute values indicate stronger influence
+            **For a losing trade:**
+            - Large positive values contributed to an incorrect bullish prediction
+            - Large negative values contributed to an incorrect bearish prediction
+            **Actionable insights:**
+            - Identify which features consistently mislead the model
+            - Look for patterns across multiple losing trades (see Patterns tab)
+            """
+        )
+    # Summary statistics
+    st.divider()
+    st.subheader("SHAP Summary Statistics")
+    shap_values = [item[1] for item in top_features if len(item) >= 2]
+    col1, col2, col3, col4 = st.columns(4)
+    with col1:
+        total_shap = sum(shap_values)
+        st.metric("Total SHAP", f"{total_shap:.4f}")
+    with col2:
+        positive_shap = sum(v for v in shap_values if v > 0)
+        st.metric("Positive Contrib.", f"{positive_shap:.4f}")
+    with col3:
+        negative_shap = sum(v for v in shap_values if v < 0)
+        st.metric("Negative Contrib.", f"{negative_shap:.4f}")
+    with col4:
+        mean_abs_shap = float(np.mean([abs(v) for v in shap_values])) if shap_values else 0.0
+        st.metric("Mean Abs. SHAP", f"{mean_abs_shap:.4f}")
+def _render_global_importance(st: Any, explanations: list[dict[str, Any]]) -> None:
+    """Render global feature importance across all trades."""
+    st.subheader("Global Feature Importance")
+    st.markdown(
+        "Aggregate SHAP importance across all analyzed trades to identify "
+        "which features are most influential overall."
+    )
+    # Calculate global importance
+    all_features: dict[str, list[float]] = {}
+    for exp in explanations:
+        top_features = exp.get("top_features", [])
+        for item in top_features:
+            if len(item) >= 2:
+                feature, shap_val = item[0], item[1]
+                if feature not in all_features:
+                    all_features[feature] = []
+                all_features[feature].append(abs(shap_val))
+    if not all_features:
+        st.warning("No feature importance data available.")
+        return
+    # Calculate mean absolute SHAP for each feature
+    feature_importance = [
+        {
+            "Feature": feature,
+            "Mean Abs SHAP": float(np.mean(values)),
+            "Frequency": len(values),
+            "Total Impact": sum(values),
+        }
+        for feature, values in all_features.items()
+    ]
+    # Sort by mean absolute SHAP
+    feature_importance.sort(key=lambda x: cast(float, x["Mean Abs SHAP"]), reverse=True)
+    # Display top 20
+    df_importance = pd.DataFrame(feature_importance[:20])
+    # Create bar chart
+    import plotly.express as px
+    fig = px.bar(
+        df_importance,
+        x="Mean Abs SHAP",
+        y="Feature",
+        orientation="h",
+        title="Top 20 Most Important Features (Mean Absolute SHAP)",
+        color="Mean Abs SHAP",
+        color_continuous_scale="Blues",
+    )
+    fig.update_layout(
+        yaxis={"autorange": "reversed"},
+        height=600,
+    )
+    st.plotly_chart(fig, use_container_width=True)
+    # Display table
+    st.subheader("Feature Importance Table")
+    display_importance = df_importance.copy()
+    display_importance["Mean Abs SHAP"] = display_importance["Mean Abs SHAP"].apply(
+        lambda x: f"{x:.4f}"
+    )
+    display_importance["Total Impact"] = display_importance["Total Impact"].apply(
+        lambda x: f"{x:.4f}"
+    )
+    st.dataframe(display_importance, hide_index=True, use_container_width=True)

ml4t/diagnostic/evaluation/trade_dashboard/tabs/stat_validation.py ADDED Viewed

@@ -0,0 +1,186 @@
+"""Statistical Validation tab.
+Displays PSR (Probabilistic Sharpe Ratio), distribution tests, and time-series tests.
+Uses PSR instead of DSR because this dashboard analyzes a single strategy.
+"""
+from __future__ import annotations
+from typing import TYPE_CHECKING, Any
+if TYPE_CHECKING:
+    from ml4t.diagnostic.evaluation.trade_dashboard.types import DashboardBundle
+def render_tab(st: Any, bundle: DashboardBundle) -> None:
+    """Render the Statistical Validation tab.
+    Parameters
+    ----------
+    st : streamlit
+        Streamlit module instance.
+    bundle : DashboardBundle
+        Normalized dashboard data.
+    """
+    from ml4t.diagnostic.evaluation.trade_dashboard.stats import (
+        compute_distribution_tests,
+        compute_return_summary,
+        compute_time_series_tests,
+        probabilistic_sharpe_ratio,
+    )
+    st.header("Statistical Validation")
+    st.info(
+        "Statistical validation ensures that identified patterns are "
+        "statistically significant and not due to random chance."
+    )
+    # Check if we have returns data
+    if bundle.returns is None or len(bundle.returns) == 0:
+        st.warning(
+            "No trade returns available for statistical analysis. "
+            "Ensure trade_metrics are attached to explanations."
+        )
+        return
+    returns = bundle.returns
+    summary = compute_return_summary(returns)
+    # Show warning if using PnL instead of return_pct
+    if bundle.returns_label == "pnl":
+        st.caption(
+            "Using PnL (dollar amounts) instead of normalized returns. "
+            "Sharpe ratio interpretation is limited."
+        )
+    # PSR section (replaces incorrect DSR usage)
+    st.subheader("Probabilistic Sharpe Ratio (PSR)")
+    st.markdown(
+        """
+        **What is PSR?**
+        The Probabilistic Sharpe Ratio (PSR) gives the probability that the true
+        Sharpe ratio exceeds a benchmark (typically 0), accounting for sample size
+        and return distribution characteristics.
+        *Note: DSR (Deflated Sharpe Ratio) was previously shown here but is not
+        applicable to single-strategy analysis. DSR requires K independent strategies
+        to compute the variance across trials.*
+        **Reference:** Bailey & Lopez de Prado (2012). "The Sharpe Ratio Efficient Frontier"
+        """
+    )
+    # Calculate PSR
+    psr_result = probabilistic_sharpe_ratio(
+        observed_sharpe=summary.sharpe,
+        benchmark_sharpe=0.0,
+        n_samples=summary.n_samples,
+        skewness=summary.skewness,
+        kurtosis=summary.kurtosis,
+        return_components=True,
+    )
+    # Display metrics
+    col1, col2, col3, col4 = st.columns(4)
+    with col1:
+        st.metric(
+            "Sharpe Ratio",
+            f"{summary.sharpe:.3f}",
+            help="Observed Sharpe ratio (mean / std)",
+        )
+    with col2:
+        st.metric(
+            "PSR (vs SR=0)",
+            f"{psr_result['psr']:.3f}",
+            help="Probability that true SR > 0",
+        )
+    with col3:
+        p_value = 1 - psr_result["psr"]
+        st.metric(
+            "P-Value",
+            f"{p_value:.4f}",
+            help="1 - PSR: probability true SR <= 0",
+        )
+    with col4:
+        st.metric("N Trades", summary.n_samples, help="Number of trades analyzed")
+    # Interpretation
+    psr = psr_result["psr"]
+    if psr >= 0.99:
+        st.success(f"Strong evidence SR > 0 (PSR = {psr:.3f} >= 0.99)")
+    elif psr >= 0.95:
+        st.success(f"Significant performance (PSR = {psr:.3f} >= 0.95)")
+    elif psr >= 0.90:
+        st.warning(f"Marginally significant (PSR = {psr:.3f} >= 0.90)")
+    elif psr >= 0.50:
+        st.warning(f"Weak evidence SR > 0 (PSR = {psr:.3f})")
+    else:
+        st.error(f"Evidence suggests SR <= 0 (PSR = {psr:.3f} < 0.50)")
+    # Return statistics
+    st.divider()
+    st.subheader("Return Statistics")
+    col1, col2, col3, col4 = st.columns(4)
+    with col1:
+        st.metric("Mean", f"{summary.mean:.4f}")
+    with col2:
+        st.metric("Std Dev", f"{summary.std:.4f}")
+    with col3:
+        st.metric("Win Rate", f"{summary.win_rate:.1%}")
+    with col4:
+        st.metric("Skewness", f"{summary.skewness:.3f}")
+    col1, col2, col3, col4 = st.columns(4)
+    with col1:
+        st.metric("Kurtosis", f"{summary.kurtosis:.3f}")
+    with col2:
+        st.metric("Min", f"{summary.min_val:.4f}")
+    with col3:
+        st.metric("Max", f"{summary.max_val:.4f}")
+    with col4:
+        pass  # Empty column for alignment
+    # Distribution tests
+    st.divider()
+    st.subheader("Distribution Tests")
+    dist_tests = compute_distribution_tests(returns)
+    if not dist_tests.empty:
+        st.dataframe(
+            dist_tests,
+            hide_index=True,
+            use_container_width=True,
+        )
+    else:
+        st.caption("Insufficient data for distribution tests.")
+    # Time-series tests
+    st.divider()
+    st.subheader("Time-Series Tests")
+    st.caption("These tests require chronologically ordered data. Trades are sorted by entry_time.")
+    ts_tests = compute_time_series_tests(returns)
+    if not ts_tests.empty:
+        st.dataframe(
+            ts_tests,
+            hide_index=True,
+            use_container_width=True,
+        )
+    else:
+        st.caption("Insufficient data for time-series tests (need 20+ observations).")

ml4t/diagnostic/evaluation/trade_dashboard/tabs/worst_trades.py ADDED Viewed

@@ -0,0 +1,236 @@
+"""Worst Trades tab.
+Displays a table of trades with sorting/filtering and detailed view.
+"""
+from __future__ import annotations
+from typing import TYPE_CHECKING, Any
+import pandas as pd
+if TYPE_CHECKING:
+    from ml4t.diagnostic.evaluation.trade_dashboard.types import DashboardBundle
+def render_tab(st: Any, bundle: DashboardBundle) -> None:
+    """Render the Worst Trades tab.
+    Parameters
+    ----------
+    st : streamlit
+        Streamlit module instance.
+    bundle : DashboardBundle
+        Normalized dashboard data.
+    """
+    st.header("Worst Trades Analysis")
+    st.info(
+        "This tab shows the trades analyzed for error patterns. "
+        "Select a trade to see detailed SHAP explanations."
+    )
+    trades_df = bundle.trades_df
+    if trades_df.empty:
+        st.warning("No trade data available.")
+        return
+    # Sidebar filters
+    with st.sidebar:
+        st.divider()
+        st.subheader("Trade Filters")
+        # Sort options
+        sort_options = ["PnL (Low to High)", "PnL (High to Low)", "Entry Time", "Return %"]
+        sort_by = st.selectbox("Sort by", options=sort_options, index=0)
+        # Max trades slider
+        max_trades = st.slider("Max trades to display", min_value=5, max_value=100, value=20)
+    # Apply sorting
+    sorted_df = trades_df.copy()
+    if sort_by == "PnL (Low to High)" and "pnl" in sorted_df.columns:
+        sorted_df = sorted_df.sort_values("pnl", ascending=True, na_position="last")
+    elif sort_by == "PnL (High to Low)" and "pnl" in sorted_df.columns:
+        sorted_df = sorted_df.sort_values("pnl", ascending=False, na_position="last")
+    elif sort_by == "Entry Time" and "entry_time" in sorted_df.columns:
+        sorted_df = sorted_df.sort_values("entry_time", ascending=True, na_position="last")
+    elif sort_by == "Return %" and "return_pct" in sorted_df.columns:
+        sorted_df = sorted_df.sort_values("return_pct", ascending=True, na_position="last")
+    # Limit display
+    sorted_df = sorted_df.head(max_trades)
+    # Build display DataFrame
+    display_columns = {
+        "trade_id": "Trade ID",
+        "symbol": "Symbol",
+        "entry_time": "Entry Time",
+        "pnl": "PnL",
+        "return_pct": "Return %",
+        "duration_days": "Duration (days)",
+        "top_feature": "Top Feature",
+        "top_shap_value": "Top SHAP",
+    }
+    display_df = sorted_df[[c for c in display_columns if c in sorted_df.columns]].copy()
+    display_df = display_df.rename(
+        columns={k: v for k, v in display_columns.items() if k in display_df.columns}
+    )
+    # Format timestamp for display
+    if "Entry Time" in display_df.columns:
+        display_df["Entry Time"] = display_df["Entry Time"].apply(
+            lambda x: x.strftime("%Y-%m-%d %H:%M") if pd.notna(x) else "N/A"
+        )
+    # Configure column formatting
+    column_config = {
+        "Trade ID": st.column_config.TextColumn("Trade ID", width="medium"),
+        "Symbol": st.column_config.TextColumn("Symbol", width="small"),
+        "Entry Time": st.column_config.TextColumn("Entry Time", width="medium"),
+        "PnL": st.column_config.NumberColumn(
+            "PnL",
+            format="%.2f",
+            help="Profit/Loss for this trade",
+        ),
+        "Return %": st.column_config.NumberColumn(
+            "Return %",
+            format="%.2f%%",
+            help="Return as percentage",
+        ),
+        "Duration (days)": st.column_config.NumberColumn(
+            "Duration (days)",
+            format="%.1f",
+            help="Trade duration in days",
+        ),
+        "Top Feature": st.column_config.TextColumn(
+            "Top Feature",
+            help="Feature with highest absolute SHAP value",
+        ),
+        "Top SHAP": st.column_config.NumberColumn(
+            "Top SHAP",
+            format="%.4f",
+            help="SHAP value for top feature",
+        ),
+    }
+    # Display table with selection
+    st.subheader("Trade Table")
+    # Initialize session state for selected trade
+    if "selected_trade_idx" not in st.session_state:
+        st.session_state.selected_trade_idx = None
+    # Use dataframe with on_select callback
+    event = st.dataframe(
+        display_df,
+        hide_index=True,
+        use_container_width=True,
+        column_config={k: v for k, v in column_config.items() if k in display_df.columns},
+        on_select="rerun",
+        selection_mode="single-row",
+    )
+    # Handle row selection
+    selection = getattr(event, "selection", None)
+    if selection is not None:
+        rows = getattr(selection, "rows", [])
+        if rows:
+            st.session_state.selected_trade_idx = rows[0]
+    # Display trade details if selected
+    if (
+        st.session_state.selected_trade_idx is not None
+        and st.session_state.selected_trade_idx < len(sorted_df)
+    ):
+        _render_trade_details(st, sorted_df, bundle, st.session_state.selected_trade_idx)
+def _render_trade_details(
+    st: Any,
+    sorted_df: pd.DataFrame,
+    bundle: DashboardBundle,
+    selected_idx: int,
+) -> None:
+    """Render detailed view of selected trade."""
+    st.divider()
+    st.subheader("Trade Details")
+    row = sorted_df.iloc[selected_idx]
+    trade_id = row.get("trade_id", "")
+    # Find corresponding explanation
+    explanation = next(
+        (exp for exp in bundle.explanations if exp.get("trade_id") == trade_id),
+        None,
+    )
+    # Basic metrics
+    col1, col2, col3, col4 = st.columns(4)
+    with col1:
+        st.metric("Trade ID", trade_id)
+        if pd.notna(row.get("symbol")):
+            st.metric("Symbol", row["symbol"])
+    with col2:
+        pnl = row.get("pnl")
+        if pd.notna(pnl):
+            st.metric("PnL", f"${pnl:.2f}")
+        else:
+            st.metric("PnL", "N/A")
+    with col3:
+        return_pct = row.get("return_pct")
+        if pd.notna(return_pct):
+            st.metric("Return", f"{return_pct:.2f}%")
+        else:
+            st.metric("Return", "N/A")
+    with col4:
+        duration = row.get("duration_days")
+        if pd.notna(duration):
+            st.metric("Duration", f"{duration:.1f} days")
+        else:
+            st.metric("Duration", "N/A")
+    # Entry/Exit prices
+    col1, col2 = st.columns(2)
+    with col1:
+        entry_price = row.get("entry_price")
+        if pd.notna(entry_price):
+            st.metric("Entry Price", f"${entry_price:.4f}")
+        else:
+            st.caption("Entry price not available")
+    with col2:
+        exit_price = row.get("exit_price")
+        if pd.notna(exit_price):
+            st.metric("Exit Price", f"${exit_price:.4f}")
+        else:
+            st.caption("Exit price not available")
+    # Top features from explanation
+    if explanation and explanation.get("top_features"):
+        st.subheader("Top SHAP Contributions")
+        top_features = explanation["top_features"]
+        feature_data = [
+            {"Feature": f[0], "SHAP Value": f[1]}
+            for f in top_features[:10]  # Limit to top 10
+        ]
+        if feature_data:
+            st.dataframe(
+                pd.DataFrame(feature_data),
+                hide_index=True,
+                use_container_width=True,
+                column_config={
+                    "Feature": st.column_config.TextColumn("Feature"),
+                    "SHAP Value": st.column_config.NumberColumn("SHAP Value", format="%.4f"),
+                },
+            )