PyPI - ml4t-diagnostic - Versions diffs - 0.1.0a1__py3-none-any.whl - Mend

ml4t-diagnostic 0.1.0a1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

ml4t/diagnostic/AGENT.md +25 -0
ml4t/diagnostic/__init__.py +166 -0
ml4t/diagnostic/backends/__init__.py +10 -0
ml4t/diagnostic/backends/adapter.py +192 -0
ml4t/diagnostic/backends/polars_backend.py +899 -0
ml4t/diagnostic/caching/__init__.py +40 -0
ml4t/diagnostic/caching/cache.py +331 -0
ml4t/diagnostic/caching/decorators.py +131 -0
ml4t/diagnostic/caching/smart_cache.py +339 -0
ml4t/diagnostic/config/AGENT.md +24 -0
ml4t/diagnostic/config/README.md +267 -0
ml4t/diagnostic/config/__init__.py +219 -0
ml4t/diagnostic/config/barrier_config.py +277 -0
ml4t/diagnostic/config/base.py +301 -0
ml4t/diagnostic/config/event_config.py +148 -0
ml4t/diagnostic/config/feature_config.py +404 -0
ml4t/diagnostic/config/multi_signal_config.py +55 -0
ml4t/diagnostic/config/portfolio_config.py +215 -0
ml4t/diagnostic/config/report_config.py +391 -0
ml4t/diagnostic/config/sharpe_config.py +202 -0
ml4t/diagnostic/config/signal_config.py +206 -0
ml4t/diagnostic/config/trade_analysis_config.py +310 -0
ml4t/diagnostic/config/validation.py +279 -0
ml4t/diagnostic/core/__init__.py +29 -0
ml4t/diagnostic/core/numba_utils.py +315 -0
ml4t/diagnostic/core/purging.py +372 -0
ml4t/diagnostic/core/sampling.py +471 -0
ml4t/diagnostic/errors/__init__.py +205 -0
ml4t/diagnostic/evaluation/AGENT.md +26 -0
ml4t/diagnostic/evaluation/__init__.py +437 -0
ml4t/diagnostic/evaluation/autocorrelation.py +531 -0
ml4t/diagnostic/evaluation/barrier_analysis.py +1050 -0
ml4t/diagnostic/evaluation/binary_metrics.py +910 -0
ml4t/diagnostic/evaluation/dashboard.py +715 -0
ml4t/diagnostic/evaluation/diagnostic_plots.py +1037 -0
ml4t/diagnostic/evaluation/distribution/__init__.py +499 -0
ml4t/diagnostic/evaluation/distribution/moments.py +299 -0
ml4t/diagnostic/evaluation/distribution/tails.py +777 -0
ml4t/diagnostic/evaluation/distribution/tests.py +470 -0
ml4t/diagnostic/evaluation/drift/__init__.py +139 -0
ml4t/diagnostic/evaluation/drift/analysis.py +432 -0
ml4t/diagnostic/evaluation/drift/domain_classifier.py +517 -0
ml4t/diagnostic/evaluation/drift/population_stability_index.py +310 -0
ml4t/diagnostic/evaluation/drift/wasserstein.py +388 -0
ml4t/diagnostic/evaluation/event_analysis.py +647 -0
ml4t/diagnostic/evaluation/excursion.py +390 -0
ml4t/diagnostic/evaluation/feature_diagnostics.py +873 -0
ml4t/diagnostic/evaluation/feature_outcome.py +666 -0
ml4t/diagnostic/evaluation/framework.py +935 -0
ml4t/diagnostic/evaluation/metric_registry.py +255 -0
ml4t/diagnostic/evaluation/metrics/AGENT.md +23 -0
ml4t/diagnostic/evaluation/metrics/__init__.py +133 -0
ml4t/diagnostic/evaluation/metrics/basic.py +160 -0
ml4t/diagnostic/evaluation/metrics/conditional_ic.py +469 -0
ml4t/diagnostic/evaluation/metrics/feature_outcome.py +475 -0
ml4t/diagnostic/evaluation/metrics/ic_statistics.py +446 -0
ml4t/diagnostic/evaluation/metrics/importance_analysis.py +338 -0
ml4t/diagnostic/evaluation/metrics/importance_classical.py +375 -0
ml4t/diagnostic/evaluation/metrics/importance_mda.py +371 -0
ml4t/diagnostic/evaluation/metrics/importance_shap.py +715 -0
ml4t/diagnostic/evaluation/metrics/information_coefficient.py +527 -0
ml4t/diagnostic/evaluation/metrics/interactions.py +772 -0
ml4t/diagnostic/evaluation/metrics/monotonicity.py +226 -0
ml4t/diagnostic/evaluation/metrics/risk_adjusted.py +324 -0
ml4t/diagnostic/evaluation/multi_signal.py +550 -0
ml4t/diagnostic/evaluation/portfolio_analysis/__init__.py +83 -0
ml4t/diagnostic/evaluation/portfolio_analysis/analysis.py +734 -0
ml4t/diagnostic/evaluation/portfolio_analysis/metrics.py +589 -0
ml4t/diagnostic/evaluation/portfolio_analysis/results.py +334 -0
ml4t/diagnostic/evaluation/report_generation.py +824 -0
ml4t/diagnostic/evaluation/signal_selector.py +452 -0
ml4t/diagnostic/evaluation/stat_registry.py +139 -0
ml4t/diagnostic/evaluation/stationarity/__init__.py +97 -0
ml4t/diagnostic/evaluation/stationarity/analysis.py +518 -0
ml4t/diagnostic/evaluation/stationarity/augmented_dickey_fuller.py +296 -0
ml4t/diagnostic/evaluation/stationarity/kpss_test.py +308 -0
ml4t/diagnostic/evaluation/stationarity/phillips_perron.py +365 -0
ml4t/diagnostic/evaluation/stats/AGENT.md +43 -0
ml4t/diagnostic/evaluation/stats/__init__.py +191 -0
ml4t/diagnostic/evaluation/stats/backtest_overfitting.py +219 -0
ml4t/diagnostic/evaluation/stats/bootstrap.py +228 -0
ml4t/diagnostic/evaluation/stats/deflated_sharpe_ratio.py +591 -0
ml4t/diagnostic/evaluation/stats/false_discovery_rate.py +295 -0
ml4t/diagnostic/evaluation/stats/hac_standard_errors.py +108 -0
ml4t/diagnostic/evaluation/stats/minimum_track_record.py +408 -0
ml4t/diagnostic/evaluation/stats/moments.py +164 -0
ml4t/diagnostic/evaluation/stats/rademacher_adjustment.py +436 -0
ml4t/diagnostic/evaluation/stats/reality_check.py +155 -0
ml4t/diagnostic/evaluation/stats/sharpe_inference.py +219 -0
ml4t/diagnostic/evaluation/themes.py +330 -0
ml4t/diagnostic/evaluation/threshold_analysis.py +957 -0
ml4t/diagnostic/evaluation/trade_analysis.py +1136 -0
ml4t/diagnostic/evaluation/trade_dashboard/__init__.py +32 -0
ml4t/diagnostic/evaluation/trade_dashboard/app.py +315 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/__init__.py +18 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/csv.py +82 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/html.py +276 -0
ml4t/diagnostic/evaluation/trade_dashboard/io.py +166 -0
ml4t/diagnostic/evaluation/trade_dashboard/normalize.py +304 -0
ml4t/diagnostic/evaluation/trade_dashboard/stats.py +386 -0
ml4t/diagnostic/evaluation/trade_dashboard/style.py +79 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/__init__.py +21 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/patterns.py +354 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/shap_analysis.py +280 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/stat_validation.py +186 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/worst_trades.py +236 -0
ml4t/diagnostic/evaluation/trade_dashboard/types.py +129 -0
ml4t/diagnostic/evaluation/trade_shap/__init__.py +102 -0
ml4t/diagnostic/evaluation/trade_shap/alignment.py +188 -0
ml4t/diagnostic/evaluation/trade_shap/characterize.py +413 -0
ml4t/diagnostic/evaluation/trade_shap/cluster.py +302 -0
ml4t/diagnostic/evaluation/trade_shap/explain.py +208 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/__init__.py +23 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/generator.py +290 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/matcher.py +251 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/templates.yaml +467 -0
ml4t/diagnostic/evaluation/trade_shap/models.py +386 -0
ml4t/diagnostic/evaluation/trade_shap/normalize.py +116 -0
ml4t/diagnostic/evaluation/trade_shap/pipeline.py +263 -0
ml4t/diagnostic/evaluation/trade_shap_dashboard.py +283 -0
ml4t/diagnostic/evaluation/trade_shap_diagnostics.py +588 -0
ml4t/diagnostic/evaluation/validated_cv.py +535 -0
ml4t/diagnostic/evaluation/visualization.py +1050 -0
ml4t/diagnostic/evaluation/volatility/__init__.py +45 -0
ml4t/diagnostic/evaluation/volatility/analysis.py +351 -0
ml4t/diagnostic/evaluation/volatility/arch.py +258 -0
ml4t/diagnostic/evaluation/volatility/garch.py +460 -0
ml4t/diagnostic/integration/__init__.py +48 -0
ml4t/diagnostic/integration/backtest_contract.py +671 -0
ml4t/diagnostic/integration/data_contract.py +316 -0
ml4t/diagnostic/integration/engineer_contract.py +226 -0
ml4t/diagnostic/logging/__init__.py +77 -0
ml4t/diagnostic/logging/logger.py +245 -0
ml4t/diagnostic/logging/performance.py +234 -0
ml4t/diagnostic/logging/progress.py +234 -0
ml4t/diagnostic/logging/wandb.py +412 -0
ml4t/diagnostic/metrics/__init__.py +9 -0
ml4t/diagnostic/metrics/percentiles.py +128 -0
ml4t/diagnostic/py.typed +1 -0
ml4t/diagnostic/reporting/__init__.py +43 -0
ml4t/diagnostic/reporting/base.py +130 -0
ml4t/diagnostic/reporting/html_renderer.py +275 -0
ml4t/diagnostic/reporting/json_renderer.py +51 -0
ml4t/diagnostic/reporting/markdown_renderer.py +117 -0
ml4t/diagnostic/results/AGENT.md +24 -0
ml4t/diagnostic/results/__init__.py +105 -0
ml4t/diagnostic/results/barrier_results/__init__.py +36 -0
ml4t/diagnostic/results/barrier_results/hit_rate.py +304 -0
ml4t/diagnostic/results/barrier_results/precision_recall.py +266 -0
ml4t/diagnostic/results/barrier_results/profit_factor.py +297 -0
ml4t/diagnostic/results/barrier_results/tearsheet.py +397 -0
ml4t/diagnostic/results/barrier_results/time_to_target.py +305 -0
ml4t/diagnostic/results/barrier_results/validation.py +38 -0
ml4t/diagnostic/results/base.py +177 -0
ml4t/diagnostic/results/event_results.py +349 -0
ml4t/diagnostic/results/feature_results.py +787 -0
ml4t/diagnostic/results/multi_signal_results.py +431 -0
ml4t/diagnostic/results/portfolio_results.py +281 -0
ml4t/diagnostic/results/sharpe_results.py +448 -0
ml4t/diagnostic/results/signal_results/__init__.py +74 -0
ml4t/diagnostic/results/signal_results/ic.py +581 -0
ml4t/diagnostic/results/signal_results/irtc.py +110 -0
ml4t/diagnostic/results/signal_results/quantile.py +392 -0
ml4t/diagnostic/results/signal_results/tearsheet.py +456 -0
ml4t/diagnostic/results/signal_results/turnover.py +213 -0
ml4t/diagnostic/results/signal_results/validation.py +147 -0
ml4t/diagnostic/signal/AGENT.md +17 -0
ml4t/diagnostic/signal/__init__.py +69 -0
ml4t/diagnostic/signal/_report.py +152 -0
ml4t/diagnostic/signal/_utils.py +261 -0
ml4t/diagnostic/signal/core.py +275 -0
ml4t/diagnostic/signal/quantile.py +148 -0
ml4t/diagnostic/signal/result.py +214 -0
ml4t/diagnostic/signal/signal_ic.py +129 -0
ml4t/diagnostic/signal/turnover.py +182 -0
ml4t/diagnostic/splitters/AGENT.md +19 -0
ml4t/diagnostic/splitters/__init__.py +36 -0
ml4t/diagnostic/splitters/base.py +501 -0
ml4t/diagnostic/splitters/calendar.py +421 -0
ml4t/diagnostic/splitters/calendar_config.py +91 -0
ml4t/diagnostic/splitters/combinatorial.py +1064 -0
ml4t/diagnostic/splitters/config.py +322 -0
ml4t/diagnostic/splitters/cpcv/__init__.py +57 -0
ml4t/diagnostic/splitters/cpcv/combinations.py +119 -0
ml4t/diagnostic/splitters/cpcv/partitioning.py +263 -0
ml4t/diagnostic/splitters/cpcv/purge_engine.py +379 -0
ml4t/diagnostic/splitters/cpcv/windows.py +190 -0
ml4t/diagnostic/splitters/group_isolation.py +329 -0
ml4t/diagnostic/splitters/persistence.py +316 -0
ml4t/diagnostic/splitters/utils.py +207 -0
ml4t/diagnostic/splitters/walk_forward.py +757 -0
ml4t/diagnostic/utils/__init__.py +42 -0
ml4t/diagnostic/utils/config.py +542 -0
ml4t/diagnostic/utils/dependencies.py +318 -0
ml4t/diagnostic/utils/sessions.py +127 -0
ml4t/diagnostic/validation/__init__.py +54 -0
ml4t/diagnostic/validation/dataframe.py +274 -0
ml4t/diagnostic/validation/returns.py +280 -0
ml4t/diagnostic/validation/timeseries.py +299 -0
ml4t/diagnostic/visualization/AGENT.md +19 -0
ml4t/diagnostic/visualization/__init__.py +223 -0
ml4t/diagnostic/visualization/backtest/__init__.py +98 -0
ml4t/diagnostic/visualization/backtest/cost_attribution.py +762 -0
ml4t/diagnostic/visualization/backtest/executive_summary.py +895 -0
ml4t/diagnostic/visualization/backtest/interactive_controls.py +673 -0
ml4t/diagnostic/visualization/backtest/statistical_validity.py +874 -0
ml4t/diagnostic/visualization/backtest/tearsheet.py +565 -0
ml4t/diagnostic/visualization/backtest/template_system.py +373 -0
ml4t/diagnostic/visualization/backtest/trade_plots.py +1172 -0
ml4t/diagnostic/visualization/barrier_plots.py +782 -0
ml4t/diagnostic/visualization/core.py +1060 -0
ml4t/diagnostic/visualization/dashboards/__init__.py +36 -0
ml4t/diagnostic/visualization/dashboards/base.py +582 -0
ml4t/diagnostic/visualization/dashboards/importance.py +801 -0
ml4t/diagnostic/visualization/dashboards/interaction.py +263 -0
ml4t/diagnostic/visualization/dashboards.py +43 -0
ml4t/diagnostic/visualization/data_extraction/__init__.py +48 -0
ml4t/diagnostic/visualization/data_extraction/importance.py +649 -0
ml4t/diagnostic/visualization/data_extraction/interaction.py +504 -0
ml4t/diagnostic/visualization/data_extraction/types.py +113 -0
ml4t/diagnostic/visualization/data_extraction/validation.py +66 -0
ml4t/diagnostic/visualization/feature_plots.py +888 -0
ml4t/diagnostic/visualization/interaction_plots.py +618 -0
ml4t/diagnostic/visualization/portfolio/__init__.py +41 -0
ml4t/diagnostic/visualization/portfolio/dashboard.py +514 -0
ml4t/diagnostic/visualization/portfolio/drawdown_plots.py +341 -0
ml4t/diagnostic/visualization/portfolio/returns_plots.py +487 -0
ml4t/diagnostic/visualization/portfolio/risk_plots.py +301 -0
ml4t/diagnostic/visualization/report_generation.py +1343 -0
ml4t/diagnostic/visualization/signal/__init__.py +103 -0
ml4t/diagnostic/visualization/signal/dashboard.py +911 -0
ml4t/diagnostic/visualization/signal/event_plots.py +514 -0
ml4t/diagnostic/visualization/signal/ic_plots.py +635 -0
ml4t/diagnostic/visualization/signal/multi_signal_dashboard.py +974 -0
ml4t/diagnostic/visualization/signal/multi_signal_plots.py +603 -0
ml4t/diagnostic/visualization/signal/quantile_plots.py +625 -0
ml4t/diagnostic/visualization/signal/turnover_plots.py +400 -0
ml4t/diagnostic/visualization/trade_shap/__init__.py +90 -0
ml4t_diagnostic-0.1.0a1.dist-info/METADATA +1044 -0
ml4t_diagnostic-0.1.0a1.dist-info/RECORD +242 -0
ml4t_diagnostic-0.1.0a1.dist-info/WHEEL +4 -0
ml4t_diagnostic-0.1.0a1.dist-info/licenses/LICENSE +21 -0

ml4t/diagnostic/evaluation/trade_shap/pipeline.py ADDED Viewed

@@ -0,0 +1,263 @@
+"""Trade SHAP analysis pipeline.
+This module provides the main TradeShapAnalyzer class that orchestrates
+all components of trade SHAP analysis:
+- TradeShapExplainer for individual trade explanations
+- HierarchicalClusterer for error pattern clustering
+- PatternCharacterizer for statistical characterization
+- HypothesisGenerator for actionable insights
+"""
+from __future__ import annotations
+from dataclasses import dataclass, field
+from typing import TYPE_CHECKING, Any
+import numpy as np
+from ml4t.diagnostic.evaluation.trade_shap.characterize import (
+    CharacterizationConfig,
+    PatternCharacterizer,
+)
+from ml4t.diagnostic.evaluation.trade_shap.cluster import (
+    ClusteringConfig,
+    HierarchicalClusterer,
+)
+from ml4t.diagnostic.evaluation.trade_shap.explain import TradeShapExplainer
+from ml4t.diagnostic.evaluation.trade_shap.hypotheses import (
+    HypothesisConfig,
+    HypothesisGenerator,
+)
+from ml4t.diagnostic.evaluation.trade_shap.models import (
+    TradeExplainFailure,
+    TradeShapExplanation,
+    TradeShapResult,
+)
+from ml4t.diagnostic.evaluation.trade_shap.normalize import normalize
+if TYPE_CHECKING:
+    import polars as pl
+    from numpy.typing import NDArray
+    from ml4t.diagnostic.evaluation.trade_analysis import TradeMetrics
+@dataclass
+class TradeShapPipelineConfig:
+    """Configuration for the trade SHAP analysis pipeline.
+    Attributes:
+        alignment_tolerance_seconds: Tolerance for timestamp alignment
+        alignment_mode: 'entry' for exact match, 'nearest' for closest
+        missing_value_strategy: How to handle alignment failures ('error', 'skip', 'zero')
+        top_n_features: Number of top features in explanations
+        normalization: Normalization method for clustering ('l1', 'l2', 'standardize', None)
+        clustering: Clustering configuration
+        characterization: Characterization configuration
+        hypothesis: Hypothesis generation configuration
+    """
+    alignment_tolerance_seconds: float = 0.0
+    alignment_mode: str = "entry"
+    missing_value_strategy: str = "skip"
+    top_n_features: int = 10
+    normalization: str | None = "l2"
+    clustering: ClusteringConfig = field(default_factory=ClusteringConfig)
+    characterization: CharacterizationConfig = field(default_factory=CharacterizationConfig)
+    hypothesis: HypothesisConfig = field(default_factory=HypothesisConfig)
+class TradeShapPipeline:
+    """Orchestrates trade SHAP analysis components.
+    This is the main entry point for trade SHAP analysis, providing a clean
+    interface that uses the refactored components internally.
+    Attributes:
+        features_df: Polars DataFrame with timestamp and feature columns
+        shap_values: SHAP values array (n_samples x n_features)
+        feature_names: List of feature column names
+        config: Pipeline configuration
+    Example:
+        >>> pipeline = TradeShapPipeline(
+        ...     features_df=features,
+        ...     shap_values=shap_values,
+        ...     feature_names=feature_names,
+        ... )
+        >>> result = pipeline.analyze_worst_trades(trades, n=20)
+        >>> for pattern in result.error_patterns:
+        ...     print(pattern.hypothesis)
+        ...     print(pattern.actions)
+    """
+    def __init__(
+        self,
+        features_df: pl.DataFrame,
+        shap_values: NDArray[np.floating[Any]],
+        feature_names: list[str],
+        config: TradeShapPipelineConfig | None = None,
+    ) -> None:
+        """Initialize pipeline.
+        Args:
+            features_df: Polars DataFrame with 'timestamp' column and feature columns
+            shap_values: SHAP values array (n_samples x n_features)
+            feature_names: List of feature column names
+            config: Pipeline configuration (uses defaults if None)
+        """
+        self.features_df = features_df
+        self.shap_values = shap_values
+        self.feature_names = feature_names
+        self.config = config or TradeShapPipelineConfig()
+        # Initialize explainer
+        self.explainer = TradeShapExplainer(
+            features_df=features_df,
+            shap_values=shap_values,
+            feature_names=feature_names,
+            tolerance_seconds=self.config.alignment_tolerance_seconds,
+            top_n_features=self.config.top_n_features,
+            alignment_mode=self.config.alignment_mode,
+            missing_value_strategy=self.config.missing_value_strategy,
+        )
+        # Initialize clusterer
+        self.clusterer = HierarchicalClusterer(config=self.config.clustering)
+        # Initialize characterizer
+        self.characterizer = PatternCharacterizer(
+            feature_names=feature_names,
+            config=self.config.characterization,
+        )
+        # Initialize hypothesis generator
+        self.hypothesis_generator = HypothesisGenerator(config=self.config.hypothesis)
+    def explain_trade(
+        self,
+        trade: TradeMetrics,
+    ) -> TradeShapExplanation | TradeExplainFailure:
+        """Explain a single trade.
+        Args:
+            trade: Trade to explain
+        Returns:
+            TradeShapExplanation on success, TradeExplainFailure on failure
+        """
+        return self.explainer.explain(trade)
+    def explain_trades(
+        self,
+        trades: list[TradeMetrics],
+    ) -> tuple[list[TradeShapExplanation], list[TradeExplainFailure]]:
+        """Explain multiple trades.
+        Args:
+            trades: List of trades to explain
+        Returns:
+            Tuple of (successful explanations, failures)
+        """
+        return self.explainer.explain_many(trades)
+    def analyze_worst_trades(
+        self,
+        trades: list[TradeMetrics],
+        n: int | None = None,
+    ) -> TradeShapResult:
+        """Analyze worst trades with full pipeline.
+        This is the main entry point that:
+        1. Explains each trade
+        2. Clusters the SHAP vectors
+        3. Characterizes each cluster as an error pattern
+        4. Generates hypotheses for each pattern
+        Args:
+            trades: List of trades (should be sorted by loss, worst first)
+            n: Number of trades to analyze (defaults to all)
+        Returns:
+            TradeShapResult with explanations, error patterns, and insights
+        """
+        # Limit trades
+        trades_to_analyze = trades[:n] if n is not None else trades
+        # Step 1: Explain trades
+        explanations, failures = self.explain_trades(trades_to_analyze)
+        if not explanations:
+            # No successful explanations
+            return TradeShapResult(
+                n_trades_analyzed=len(trades_to_analyze),
+                n_trades_explained=0,
+                n_trades_failed=len(failures),
+                explanations=[],
+                failed_trades=[(f.trade_id, f.reason) for f in failures],
+                error_patterns=[],
+            )
+        # Step 2: Extract and normalize SHAP vectors for clustering
+        shap_vectors = np.array([exp.shap_vector for exp in explanations])
+        # Normalize if configured
+        if self.config.normalization:
+            shap_vectors = normalize(shap_vectors, method=self.config.normalization)
+        # Step 3: Cluster patterns (if enough trades)
+        error_patterns = []
+        min_trades = self.config.clustering.min_trades_for_clustering
+        if len(explanations) >= min_trades:
+            try:
+                clustering_result = self.clusterer.cluster(shap_vectors)
+                # Step 4: Characterize each cluster
+                patterns = self.characterizer.characterize_all_clusters(
+                    shap_vectors=shap_vectors,
+                    cluster_labels=clustering_result.cluster_assignments,
+                    n_clusters=clustering_result.n_clusters,
+                    centroids=clustering_result.centroids,
+                )
+                # Step 5: Generate hypotheses for each pattern
+                for pattern in patterns:
+                    enriched = self.hypothesis_generator.generate_hypothesis(pattern)
+                    error_patterns.append(enriched)
+            except ValueError:
+                # Clustering failed (e.g., insufficient samples)
+                # Continue without error patterns
+                pass
+        return TradeShapResult(
+            n_trades_analyzed=len(trades_to_analyze),
+            n_trades_explained=len(explanations),
+            n_trades_failed=len(failures),
+            explanations=explanations,
+            failed_trades=[(f.trade_id, f.reason) for f in failures],
+            error_patterns=error_patterns,
+        )
+    def generate_actions(
+        self,
+        pattern_index: int = 0,
+        max_actions: int | None = None,
+    ) -> list[dict[str, Any]]:
+        """Generate prioritized actions for an error pattern.
+        Args:
+            pattern_index: Index of pattern in last result (default: 0 = first)
+            max_actions: Maximum actions to return
+        Returns:
+            List of action dictionaries
+        Note:
+            Must call analyze_worst_trades first.
+        """
+        # This is a convenience method - in practice, use the hypothesis generator
+        # directly with the error pattern from results
+        raise NotImplementedError("Use hypothesis_generator.generate_actions(pattern) directly")

ml4t/diagnostic/evaluation/trade_shap_dashboard.py ADDED Viewed

@@ -0,0 +1,283 @@
+"""Streamlit dashboard for Trade-SHAP diagnostics.
+This module provides an interactive Streamlit dashboard for visualizing
+Trade-SHAP analysis results, including statistical validation, worst trades,
+SHAP explanations, and error patterns.
+The dashboard is designed for systematic trade debugging and continuous
+improvement of ML trading strategies.
+Usage:
+    # From command line
+    streamlit run -m ml4t.diagnostic.evaluation.trade_shap_dashboard
+    # Programmatically
+    from ml4t.diagnostic.evaluation.trade_shap_dashboard import run_diagnostics_dashboard
+    run_diagnostics_dashboard(result)
+Example:
+    >>> from ml4t.diagnostic.evaluation import TradeShapAnalyzer
+    >>> from ml4t.diagnostic.evaluation.trade_shap_dashboard import run_diagnostics_dashboard
+    >>>
+    >>> # Analyze trades and get results
+    >>> analyzer = TradeShapAnalyzer(model, features_df, shap_values)
+    >>> result = analyzer.explain_worst_trades(worst_trades)
+    >>>
+    >>> # Launch interactive dashboard
+    >>> run_diagnostics_dashboard(result)
+Note:
+    This module is a thin wrapper around the modular dashboard package.
+    The implementation has been refactored into:
+    - ml4t.diagnostic.evaluation.trade_dashboard.app (main orchestrator)
+    - ml4t.diagnostic.evaluation.trade_dashboard.tabs (tab modules)
+    - ml4t.diagnostic.evaluation.trade_dashboard.stats (statistical computations)
+    - ml4t.diagnostic.evaluation.trade_dashboard.export (export functions)
+"""
+from __future__ import annotations
+from typing import TYPE_CHECKING, Any
+# Re-export the main entry point for backward compatibility
+from ml4t.diagnostic.evaluation.trade_dashboard import run_diagnostics_dashboard
+if TYPE_CHECKING:
+    from ml4t.diagnostic.evaluation.trade_shap.models import TradeShapResult
+# Import utilities for backward compatibility
+from ml4t.diagnostic.evaluation.trade_dashboard.io import (
+    PickleDisabledError,
+)
+from ml4t.diagnostic.evaluation.trade_dashboard.io import (
+    load_result_from_upload as load_data_from_file,
+)
+__all__ = [
+    "run_diagnostics_dashboard",
+    "run_polished_dashboard",
+    "export_full_report_html",
+    "export_patterns_to_csv",
+    "export_trades_to_csv",
+    "load_data_from_file",
+    "PickleDisabledError",
+    "extract_trade_returns",
+    "extract_trade_data",
+]
+def run_polished_dashboard(
+    result: TradeShapResult | dict[str, Any] | None = None,
+    title: str = "Trade-SHAP Diagnostics Dashboard",
+) -> None:
+    """Run dashboard with styled=True. Alias for backward compat."""
+    run_diagnostics_dashboard(result=result, title=title, styled=True)
+# Backward-compatible export functions that accept raw dicts/lists
+def export_trades_to_csv(trades_data: list[dict[str, Any]]) -> str:
+    """Export trades to CSV format. Backward-compatible API.
+    Parameters
+    ----------
+    trades_data : list of dict
+        List of trade dictionaries.
+    Returns
+    -------
+    str
+        CSV formatted string.
+    """
+    import pandas as pd
+    if not trades_data:
+        return ""
+    return pd.DataFrame(trades_data).to_csv(index=False)
+def export_patterns_to_csv(patterns: list[dict[str, Any]]) -> str:
+    """Export patterns to CSV format. Backward-compatible API.
+    Parameters
+    ----------
+    patterns : list of dict
+        List of pattern dictionaries.
+    Returns
+    -------
+    str
+        CSV formatted string with headers Pattern ID, etc.
+    """
+    import pandas as pd
+    if not patterns:
+        return ""
+    # Transform to expected format
+    records = []
+    for p in patterns:
+        records.append(
+            {
+                "Pattern ID": p.get("cluster_id", 0),
+                "N Trades": p.get("n_trades", 0),
+                "Description": p.get("description", ""),
+                "Hypothesis": p.get("hypothesis", ""),
+                "Confidence": p.get("confidence", ""),
+            }
+        )
+    return pd.DataFrame(records).to_csv(index=False)
+def export_full_report_html(result: dict[str, Any]) -> str:
+    """Export full HTML report. Backward-compatible API.
+    Parameters
+    ----------
+    result : dict
+        Analysis result dictionary.
+    Returns
+    -------
+    str
+        HTML report string.
+    """
+    from datetime import datetime
+    patterns = result.get("error_patterns", [])
+    n_analyzed = result.get("n_trades_analyzed", 0)
+    n_explained = result.get("n_trades_explained", 0)
+    n_failed = result.get("n_trades_failed", 0)
+    patterns_html = ""
+    for p in patterns:
+        hypothesis = p.get("hypothesis", "No hypothesis")
+        actions = p.get("actions", [])
+        actions_html = "".join(f"<li>{a}</li>" for a in actions) if actions else ""
+        patterns_html += f"""
+        <div class="pattern">
+            <h3>Pattern {p.get("cluster_id", "N/A")}: {p.get("n_trades", 0)} trades</h3>
+            <p><strong>Description:</strong> {p.get("description", "N/A")}</p>
+            <p><strong>Hypothesis:</strong> {hypothesis}</p>
+            <ul>{actions_html}</ul>
+        </div>
+        """
+    return f"""<!DOCTYPE html>
+<html>
+<head>
+    <title>Trade-SHAP Analysis Report</title>
+    <style>
+        body {{ font-family: sans-serif; max-width: 1000px; margin: 0 auto; padding: 20px; }}
+        .header {{ background: #1f77b4; color: white; padding: 20px; }}
+        .metrics {{ display: flex; gap: 20px; margin: 20px 0; }}
+        .metric {{ background: #f0f0f0; padding: 15px; }}
+        .pattern {{ border: 1px solid #ddd; padding: 15px; margin: 10px 0; }}
+    </style>
+</head>
+<body>
+    <div class="header">
+        <h1>Trade-SHAP Analysis Report</h1>
+        <p>Generated: {datetime.now().strftime("%Y-%m-%d %H:%M:%S")}</p>
+    </div>
+    <div class="metrics">
+        <div class="metric"><strong>Analyzed:</strong> {n_analyzed}</div>
+        <div class="metric"><strong>Explained:</strong> {n_explained}</div>
+        <div class="metric"><strong>Failed:</strong> {n_failed}</div>
+    </div>
+    <h2>Error Patterns</h2>
+    {patterns_html}
+</body>
+</html>"""
+def extract_trade_returns(result: dict[str, Any]) -> list[float]:
+    """Extract trade PnL values from analysis result.
+    Parameters
+    ----------
+    result : dict
+        Analysis result dictionary with "explanations" key.
+    Returns
+    -------
+    list of float
+        List of PnL values from each trade.
+    Examples
+    --------
+    >>> result = {"explanations": [{"trade_metrics": {"pnl": 100.0}}]}
+    >>> extract_trade_returns(result)
+    [100.0]
+    """
+    explanations = result.get("explanations", [])
+    returns = []
+    for exp in explanations:
+        trade_metrics = exp.get("trade_metrics", {})
+        pnl = trade_metrics.get("pnl", 0.0)
+        returns.append(pnl)
+    return returns
+def extract_trade_data(result: dict[str, Any]) -> list[dict[str, Any]]:
+    """Extract trade data for display from analysis result.
+    Parameters
+    ----------
+    result : dict
+        Analysis result dictionary with "explanations" key.
+    Returns
+    -------
+    list of dict
+        List of trade data dictionaries with keys:
+        - trade_id: Trade identifier
+        - timestamp: Trade timestamp
+        - symbol: Trading symbol
+        - pnl: Profit/loss
+        - return_pct: Return percentage
+        - duration_days: Trade duration
+        - entry_price: Entry price
+        - exit_price: Exit price
+        - top_feature: Most important feature
+        - top_shap_value: SHAP value of top feature
+    Examples
+    --------
+    >>> result = {"explanations": [{"trade_id": "T1", "trade_metrics": {"pnl": 100.0}}]}
+    >>> data = extract_trade_data(result)
+    >>> data[0]["trade_id"]
+    'T1'
+    """
+    explanations = result.get("explanations", [])
+    trade_data = []
+    for exp in explanations:
+        trade_metrics = exp.get("trade_metrics", {})
+        top_features = exp.get("top_features", [])
+        # Get top feature info
+        top_feature = top_features[0][0] if top_features else None
+        top_shap_value = top_features[0][1] if top_features else None
+        trade_data.append(
+            {
+                "trade_id": exp.get("trade_id", ""),
+                "timestamp": exp.get("timestamp", ""),
+                "symbol": trade_metrics.get("symbol", ""),
+                "pnl": trade_metrics.get("pnl", 0.0),
+                "return_pct": trade_metrics.get("return_pct", 0.0),
+                "duration_days": trade_metrics.get("duration_days", 0.0),
+                "entry_price": trade_metrics.get("entry_price", 0.0),
+                "exit_price": trade_metrics.get("exit_price", 0.0),
+                "top_feature": top_feature,
+                "top_shap_value": top_shap_value,
+            }
+        )
+    return trade_data
+# Allow running as a standalone Streamlit app
+if __name__ == "__main__":
+    run_diagnostics_dashboard()