PyPI - ml4t-diagnostic - Versions diffs - 0.1.0a1__py3-none-any.whl - Mend

ml4t-diagnostic 0.1.0a1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

ml4t/diagnostic/AGENT.md +25 -0
ml4t/diagnostic/__init__.py +166 -0
ml4t/diagnostic/backends/__init__.py +10 -0
ml4t/diagnostic/backends/adapter.py +192 -0
ml4t/diagnostic/backends/polars_backend.py +899 -0
ml4t/diagnostic/caching/__init__.py +40 -0
ml4t/diagnostic/caching/cache.py +331 -0
ml4t/diagnostic/caching/decorators.py +131 -0
ml4t/diagnostic/caching/smart_cache.py +339 -0
ml4t/diagnostic/config/AGENT.md +24 -0
ml4t/diagnostic/config/README.md +267 -0
ml4t/diagnostic/config/__init__.py +219 -0
ml4t/diagnostic/config/barrier_config.py +277 -0
ml4t/diagnostic/config/base.py +301 -0
ml4t/diagnostic/config/event_config.py +148 -0
ml4t/diagnostic/config/feature_config.py +404 -0
ml4t/diagnostic/config/multi_signal_config.py +55 -0
ml4t/diagnostic/config/portfolio_config.py +215 -0
ml4t/diagnostic/config/report_config.py +391 -0
ml4t/diagnostic/config/sharpe_config.py +202 -0
ml4t/diagnostic/config/signal_config.py +206 -0
ml4t/diagnostic/config/trade_analysis_config.py +310 -0
ml4t/diagnostic/config/validation.py +279 -0
ml4t/diagnostic/core/__init__.py +29 -0
ml4t/diagnostic/core/numba_utils.py +315 -0
ml4t/diagnostic/core/purging.py +372 -0
ml4t/diagnostic/core/sampling.py +471 -0
ml4t/diagnostic/errors/__init__.py +205 -0
ml4t/diagnostic/evaluation/AGENT.md +26 -0
ml4t/diagnostic/evaluation/__init__.py +437 -0
ml4t/diagnostic/evaluation/autocorrelation.py +531 -0
ml4t/diagnostic/evaluation/barrier_analysis.py +1050 -0
ml4t/diagnostic/evaluation/binary_metrics.py +910 -0
ml4t/diagnostic/evaluation/dashboard.py +715 -0
ml4t/diagnostic/evaluation/diagnostic_plots.py +1037 -0
ml4t/diagnostic/evaluation/distribution/__init__.py +499 -0
ml4t/diagnostic/evaluation/distribution/moments.py +299 -0
ml4t/diagnostic/evaluation/distribution/tails.py +777 -0
ml4t/diagnostic/evaluation/distribution/tests.py +470 -0
ml4t/diagnostic/evaluation/drift/__init__.py +139 -0
ml4t/diagnostic/evaluation/drift/analysis.py +432 -0
ml4t/diagnostic/evaluation/drift/domain_classifier.py +517 -0
ml4t/diagnostic/evaluation/drift/population_stability_index.py +310 -0
ml4t/diagnostic/evaluation/drift/wasserstein.py +388 -0
ml4t/diagnostic/evaluation/event_analysis.py +647 -0
ml4t/diagnostic/evaluation/excursion.py +390 -0
ml4t/diagnostic/evaluation/feature_diagnostics.py +873 -0
ml4t/diagnostic/evaluation/feature_outcome.py +666 -0
ml4t/diagnostic/evaluation/framework.py +935 -0
ml4t/diagnostic/evaluation/metric_registry.py +255 -0
ml4t/diagnostic/evaluation/metrics/AGENT.md +23 -0
ml4t/diagnostic/evaluation/metrics/__init__.py +133 -0
ml4t/diagnostic/evaluation/metrics/basic.py +160 -0
ml4t/diagnostic/evaluation/metrics/conditional_ic.py +469 -0
ml4t/diagnostic/evaluation/metrics/feature_outcome.py +475 -0
ml4t/diagnostic/evaluation/metrics/ic_statistics.py +446 -0
ml4t/diagnostic/evaluation/metrics/importance_analysis.py +338 -0
ml4t/diagnostic/evaluation/metrics/importance_classical.py +375 -0
ml4t/diagnostic/evaluation/metrics/importance_mda.py +371 -0
ml4t/diagnostic/evaluation/metrics/importance_shap.py +715 -0
ml4t/diagnostic/evaluation/metrics/information_coefficient.py +527 -0
ml4t/diagnostic/evaluation/metrics/interactions.py +772 -0
ml4t/diagnostic/evaluation/metrics/monotonicity.py +226 -0
ml4t/diagnostic/evaluation/metrics/risk_adjusted.py +324 -0
ml4t/diagnostic/evaluation/multi_signal.py +550 -0
ml4t/diagnostic/evaluation/portfolio_analysis/__init__.py +83 -0
ml4t/diagnostic/evaluation/portfolio_analysis/analysis.py +734 -0
ml4t/diagnostic/evaluation/portfolio_analysis/metrics.py +589 -0
ml4t/diagnostic/evaluation/portfolio_analysis/results.py +334 -0
ml4t/diagnostic/evaluation/report_generation.py +824 -0
ml4t/diagnostic/evaluation/signal_selector.py +452 -0
ml4t/diagnostic/evaluation/stat_registry.py +139 -0
ml4t/diagnostic/evaluation/stationarity/__init__.py +97 -0
ml4t/diagnostic/evaluation/stationarity/analysis.py +518 -0
ml4t/diagnostic/evaluation/stationarity/augmented_dickey_fuller.py +296 -0
ml4t/diagnostic/evaluation/stationarity/kpss_test.py +308 -0
ml4t/diagnostic/evaluation/stationarity/phillips_perron.py +365 -0
ml4t/diagnostic/evaluation/stats/AGENT.md +43 -0
ml4t/diagnostic/evaluation/stats/__init__.py +191 -0
ml4t/diagnostic/evaluation/stats/backtest_overfitting.py +219 -0
ml4t/diagnostic/evaluation/stats/bootstrap.py +228 -0
ml4t/diagnostic/evaluation/stats/deflated_sharpe_ratio.py +591 -0
ml4t/diagnostic/evaluation/stats/false_discovery_rate.py +295 -0
ml4t/diagnostic/evaluation/stats/hac_standard_errors.py +108 -0
ml4t/diagnostic/evaluation/stats/minimum_track_record.py +408 -0
ml4t/diagnostic/evaluation/stats/moments.py +164 -0
ml4t/diagnostic/evaluation/stats/rademacher_adjustment.py +436 -0
ml4t/diagnostic/evaluation/stats/reality_check.py +155 -0
ml4t/diagnostic/evaluation/stats/sharpe_inference.py +219 -0
ml4t/diagnostic/evaluation/themes.py +330 -0
ml4t/diagnostic/evaluation/threshold_analysis.py +957 -0
ml4t/diagnostic/evaluation/trade_analysis.py +1136 -0
ml4t/diagnostic/evaluation/trade_dashboard/__init__.py +32 -0
ml4t/diagnostic/evaluation/trade_dashboard/app.py +315 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/__init__.py +18 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/csv.py +82 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/html.py +276 -0
ml4t/diagnostic/evaluation/trade_dashboard/io.py +166 -0
ml4t/diagnostic/evaluation/trade_dashboard/normalize.py +304 -0
ml4t/diagnostic/evaluation/trade_dashboard/stats.py +386 -0
ml4t/diagnostic/evaluation/trade_dashboard/style.py +79 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/__init__.py +21 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/patterns.py +354 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/shap_analysis.py +280 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/stat_validation.py +186 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/worst_trades.py +236 -0
ml4t/diagnostic/evaluation/trade_dashboard/types.py +129 -0
ml4t/diagnostic/evaluation/trade_shap/__init__.py +102 -0
ml4t/diagnostic/evaluation/trade_shap/alignment.py +188 -0
ml4t/diagnostic/evaluation/trade_shap/characterize.py +413 -0
ml4t/diagnostic/evaluation/trade_shap/cluster.py +302 -0
ml4t/diagnostic/evaluation/trade_shap/explain.py +208 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/__init__.py +23 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/generator.py +290 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/matcher.py +251 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/templates.yaml +467 -0
ml4t/diagnostic/evaluation/trade_shap/models.py +386 -0
ml4t/diagnostic/evaluation/trade_shap/normalize.py +116 -0
ml4t/diagnostic/evaluation/trade_shap/pipeline.py +263 -0
ml4t/diagnostic/evaluation/trade_shap_dashboard.py +283 -0
ml4t/diagnostic/evaluation/trade_shap_diagnostics.py +588 -0
ml4t/diagnostic/evaluation/validated_cv.py +535 -0
ml4t/diagnostic/evaluation/visualization.py +1050 -0
ml4t/diagnostic/evaluation/volatility/__init__.py +45 -0
ml4t/diagnostic/evaluation/volatility/analysis.py +351 -0
ml4t/diagnostic/evaluation/volatility/arch.py +258 -0
ml4t/diagnostic/evaluation/volatility/garch.py +460 -0
ml4t/diagnostic/integration/__init__.py +48 -0
ml4t/diagnostic/integration/backtest_contract.py +671 -0
ml4t/diagnostic/integration/data_contract.py +316 -0
ml4t/diagnostic/integration/engineer_contract.py +226 -0
ml4t/diagnostic/logging/__init__.py +77 -0
ml4t/diagnostic/logging/logger.py +245 -0
ml4t/diagnostic/logging/performance.py +234 -0
ml4t/diagnostic/logging/progress.py +234 -0
ml4t/diagnostic/logging/wandb.py +412 -0
ml4t/diagnostic/metrics/__init__.py +9 -0
ml4t/diagnostic/metrics/percentiles.py +128 -0
ml4t/diagnostic/py.typed +1 -0
ml4t/diagnostic/reporting/__init__.py +43 -0
ml4t/diagnostic/reporting/base.py +130 -0
ml4t/diagnostic/reporting/html_renderer.py +275 -0
ml4t/diagnostic/reporting/json_renderer.py +51 -0
ml4t/diagnostic/reporting/markdown_renderer.py +117 -0
ml4t/diagnostic/results/AGENT.md +24 -0
ml4t/diagnostic/results/__init__.py +105 -0
ml4t/diagnostic/results/barrier_results/__init__.py +36 -0
ml4t/diagnostic/results/barrier_results/hit_rate.py +304 -0
ml4t/diagnostic/results/barrier_results/precision_recall.py +266 -0
ml4t/diagnostic/results/barrier_results/profit_factor.py +297 -0
ml4t/diagnostic/results/barrier_results/tearsheet.py +397 -0
ml4t/diagnostic/results/barrier_results/time_to_target.py +305 -0
ml4t/diagnostic/results/barrier_results/validation.py +38 -0
ml4t/diagnostic/results/base.py +177 -0
ml4t/diagnostic/results/event_results.py +349 -0
ml4t/diagnostic/results/feature_results.py +787 -0
ml4t/diagnostic/results/multi_signal_results.py +431 -0
ml4t/diagnostic/results/portfolio_results.py +281 -0
ml4t/diagnostic/results/sharpe_results.py +448 -0
ml4t/diagnostic/results/signal_results/__init__.py +74 -0
ml4t/diagnostic/results/signal_results/ic.py +581 -0
ml4t/diagnostic/results/signal_results/irtc.py +110 -0
ml4t/diagnostic/results/signal_results/quantile.py +392 -0
ml4t/diagnostic/results/signal_results/tearsheet.py +456 -0
ml4t/diagnostic/results/signal_results/turnover.py +213 -0
ml4t/diagnostic/results/signal_results/validation.py +147 -0
ml4t/diagnostic/signal/AGENT.md +17 -0
ml4t/diagnostic/signal/__init__.py +69 -0
ml4t/diagnostic/signal/_report.py +152 -0
ml4t/diagnostic/signal/_utils.py +261 -0
ml4t/diagnostic/signal/core.py +275 -0
ml4t/diagnostic/signal/quantile.py +148 -0
ml4t/diagnostic/signal/result.py +214 -0
ml4t/diagnostic/signal/signal_ic.py +129 -0
ml4t/diagnostic/signal/turnover.py +182 -0
ml4t/diagnostic/splitters/AGENT.md +19 -0
ml4t/diagnostic/splitters/__init__.py +36 -0
ml4t/diagnostic/splitters/base.py +501 -0
ml4t/diagnostic/splitters/calendar.py +421 -0
ml4t/diagnostic/splitters/calendar_config.py +91 -0
ml4t/diagnostic/splitters/combinatorial.py +1064 -0
ml4t/diagnostic/splitters/config.py +322 -0
ml4t/diagnostic/splitters/cpcv/__init__.py +57 -0
ml4t/diagnostic/splitters/cpcv/combinations.py +119 -0
ml4t/diagnostic/splitters/cpcv/partitioning.py +263 -0
ml4t/diagnostic/splitters/cpcv/purge_engine.py +379 -0
ml4t/diagnostic/splitters/cpcv/windows.py +190 -0
ml4t/diagnostic/splitters/group_isolation.py +329 -0
ml4t/diagnostic/splitters/persistence.py +316 -0
ml4t/diagnostic/splitters/utils.py +207 -0
ml4t/diagnostic/splitters/walk_forward.py +757 -0
ml4t/diagnostic/utils/__init__.py +42 -0
ml4t/diagnostic/utils/config.py +542 -0
ml4t/diagnostic/utils/dependencies.py +318 -0
ml4t/diagnostic/utils/sessions.py +127 -0
ml4t/diagnostic/validation/__init__.py +54 -0
ml4t/diagnostic/validation/dataframe.py +274 -0
ml4t/diagnostic/validation/returns.py +280 -0
ml4t/diagnostic/validation/timeseries.py +299 -0
ml4t/diagnostic/visualization/AGENT.md +19 -0
ml4t/diagnostic/visualization/__init__.py +223 -0
ml4t/diagnostic/visualization/backtest/__init__.py +98 -0
ml4t/diagnostic/visualization/backtest/cost_attribution.py +762 -0
ml4t/diagnostic/visualization/backtest/executive_summary.py +895 -0
ml4t/diagnostic/visualization/backtest/interactive_controls.py +673 -0
ml4t/diagnostic/visualization/backtest/statistical_validity.py +874 -0
ml4t/diagnostic/visualization/backtest/tearsheet.py +565 -0
ml4t/diagnostic/visualization/backtest/template_system.py +373 -0
ml4t/diagnostic/visualization/backtest/trade_plots.py +1172 -0
ml4t/diagnostic/visualization/barrier_plots.py +782 -0
ml4t/diagnostic/visualization/core.py +1060 -0
ml4t/diagnostic/visualization/dashboards/__init__.py +36 -0
ml4t/diagnostic/visualization/dashboards/base.py +582 -0
ml4t/diagnostic/visualization/dashboards/importance.py +801 -0
ml4t/diagnostic/visualization/dashboards/interaction.py +263 -0
ml4t/diagnostic/visualization/dashboards.py +43 -0
ml4t/diagnostic/visualization/data_extraction/__init__.py +48 -0
ml4t/diagnostic/visualization/data_extraction/importance.py +649 -0
ml4t/diagnostic/visualization/data_extraction/interaction.py +504 -0
ml4t/diagnostic/visualization/data_extraction/types.py +113 -0
ml4t/diagnostic/visualization/data_extraction/validation.py +66 -0
ml4t/diagnostic/visualization/feature_plots.py +888 -0
ml4t/diagnostic/visualization/interaction_plots.py +618 -0
ml4t/diagnostic/visualization/portfolio/__init__.py +41 -0
ml4t/diagnostic/visualization/portfolio/dashboard.py +514 -0
ml4t/diagnostic/visualization/portfolio/drawdown_plots.py +341 -0
ml4t/diagnostic/visualization/portfolio/returns_plots.py +487 -0
ml4t/diagnostic/visualization/portfolio/risk_plots.py +301 -0
ml4t/diagnostic/visualization/report_generation.py +1343 -0
ml4t/diagnostic/visualization/signal/__init__.py +103 -0
ml4t/diagnostic/visualization/signal/dashboard.py +911 -0
ml4t/diagnostic/visualization/signal/event_plots.py +514 -0
ml4t/diagnostic/visualization/signal/ic_plots.py +635 -0
ml4t/diagnostic/visualization/signal/multi_signal_dashboard.py +974 -0
ml4t/diagnostic/visualization/signal/multi_signal_plots.py +603 -0
ml4t/diagnostic/visualization/signal/quantile_plots.py +625 -0
ml4t/diagnostic/visualization/signal/turnover_plots.py +400 -0
ml4t/diagnostic/visualization/trade_shap/__init__.py +90 -0
ml4t_diagnostic-0.1.0a1.dist-info/METADATA +1044 -0
ml4t_diagnostic-0.1.0a1.dist-info/RECORD +242 -0
ml4t_diagnostic-0.1.0a1.dist-info/WHEEL +4 -0
ml4t_diagnostic-0.1.0a1.dist-info/licenses/LICENSE +21 -0

ml4t/diagnostic/evaluation/trade_shap_diagnostics.py ADDED Viewed

@@ -0,0 +1,588 @@
+"""Trade-level SHAP diagnostics for ML trading feedback loop.
+Connects SHAP values to trade outcomes for systematic debugging and improvement.
+This module is a thin wrapper around the modular trade_shap package.
+Implementation has been refactored into:
+- ml4t.diagnostic.evaluation.trade_shap.models (data models)
+- ml4t.diagnostic.evaluation.trade_shap.pipeline (TradeShapPipeline)
+- ml4t.diagnostic.evaluation.trade_shap.explain (TradeShapExplainer)
+- ml4t.diagnostic.evaluation.trade_shap.cluster (HierarchicalClusterer)
+- ml4t.diagnostic.evaluation.trade_shap.characterize (PatternCharacterizer)
+- ml4t.diagnostic.evaluation.trade_shap.hypotheses (HypothesisGenerator)
+Example:
+    >>> analyzer = TradeShapAnalyzer(model, features_df, shap_values)
+    >>> result = analyzer.explain_worst_trades(worst_trades)
+    >>> for pattern in result.error_patterns:
+    ...     print(pattern.hypothesis, pattern.actions)
+See: docs/trimmed/evaluation/trade_shap_diagnostics.md for full documentation.
+"""
+from __future__ import annotations
+from typing import TYPE_CHECKING, Any
+import numpy as np
+import polars as pl
+from numpy.typing import NDArray
+# Re-export all models and components from modular package
+from ml4t.diagnostic.evaluation.trade_shap import (
+    # Alignment
+    AlignmentResult,
+    # Characterization
+    CharacterizationConfig,
+    # Clustering
+    ClusteringConfig,
+    ClusteringResult,
+    # Result models
+    ErrorPattern,
+    FeatureStatistics,
+    HierarchicalClusterer,
+    # Hypothesis generation
+    HypothesisConfig,
+    HypothesisGenerator,
+    # Normalization
+    NormalizationType,
+    PatternCharacterizer,
+    Template,
+    TemplateMatcher,
+    TimestampAligner,
+    TradeExplainFailure,
+    # Explainer
+    TradeShapExplainer,
+    TradeShapExplanation,
+    # Pipeline
+    TradeShapPipeline,
+    TradeShapPipelineConfig,
+    TradeShapResult,
+    benjamini_hochberg,
+    compute_centroids,
+    compute_cluster_sizes,
+    find_optimal_clusters,
+    load_templates,
+    normalize,
+    normalize_l1,
+    normalize_l2,
+    standardize,
+)
+if TYPE_CHECKING:
+    from ml4t.diagnostic.config import TradeConfig
+    from ml4t.diagnostic.evaluation.trade_analysis import TradeMetrics
+class TradeShapAnalyzer:
+    """Analyze trade failures using SHAP explanations.
+    This class wraps TradeShapPipeline with additional features:
+    - On-demand SHAP value computation from a model
+    - Pandas/Polars DataFrame conversion
+    - GPU acceleration support
+    For simpler use cases with pre-computed SHAP values, use TradeShapPipeline
+    directly.
+    Example:
+        >>> analyzer = TradeShapAnalyzer(model, features_df, shap_values)
+        >>> result = analyzer.explain_worst_trades(worst_trades)
+    """
+    def __init__(
+        self,
+        model: Any,
+        features_df: pl.DataFrame | Any,
+        shap_values: NDArray[np.floating[Any]] | None = None,
+        config: TradeConfig | None = None,
+        explainer_type: str = "auto",
+        use_gpu: bool | str = "auto",
+        background_data: NDArray[Any] | None = None,
+        explainer_kwargs: dict | None = None,
+        show_progress: bool = False,
+        performance_warning: bool = True,
+    ):
+        """Initialize with model, features DataFrame, and optional SHAP values.
+        Args:
+            model: Trained model for SHAP computation
+            features_df: DataFrame with 'timestamp' column and feature columns
+            shap_values: Pre-computed SHAP values (optional, computed if None)
+            config: TradeConfig for analysis parameters
+            explainer_type: SHAP explainer type ('auto', 'tree', 'kernel', etc.)
+            use_gpu: Whether to use GPU acceleration
+            background_data: Background data for SHAP computation
+            explainer_kwargs: Additional kwargs for SHAP explainer
+            show_progress: Show progress bars during computation
+            performance_warning: Warn about performance issues
+        """
+        self.model = model
+        self.features_df = self._validate_and_convert_features(features_df)
+        self.shap_values = shap_values
+        self.config = config or self._get_default_config()
+        # Store API parameters for on-demand SHAP computation
+        self._explainer_type = explainer_type
+        self._use_gpu = use_gpu
+        self._background_data = background_data
+        self._explainer_kwargs = explainer_kwargs or {}
+        self._show_progress = show_progress
+        self._performance_warning = performance_warning
+        # Extract feature names
+        self.feature_names = self._extract_feature_names()
+        # Validate SHAP values if provided
+        if self.shap_values is not None:
+            self._validate_shap_values()
+        # Pipeline created lazily after SHAP values are available
+        self._pipeline: TradeShapPipeline | None = None
+        self._hypothesis_generator: HypothesisGenerator | None = None
+    def _validate_and_convert_features(self, features_df: Any) -> pl.DataFrame:
+        """Validate and convert features DataFrame to Polars."""
+        if not isinstance(features_df, pl.DataFrame):
+            import pandas as pd
+            if isinstance(features_df, pd.DataFrame):
+                features_df = pl.from_pandas(features_df)
+            else:
+                raise TypeError(
+                    f"features_df must be pl.DataFrame or pd.DataFrame, got {type(features_df)}"
+                )
+        if "timestamp" not in features_df.columns:
+            raise ValueError(
+                "features_df must have 'timestamp' column for SHAP alignment to trades."
+            )
+        return features_df
+    def _extract_feature_names(self) -> list[str]:
+        """Extract feature names from DataFrame."""
+        feature_names = [col for col in self.features_df.columns if col != "timestamp"]
+        if not feature_names:
+            raise ValueError("No feature columns found in features_df.")
+        return feature_names
+    def _validate_shap_values(self) -> None:
+        """Validate SHAP values shape matches features."""
+        if self.shap_values is None:
+            return
+        n_samples = len(self.features_df)
+        n_features = len(self.feature_names)
+        if self.shap_values.shape != (n_samples, n_features):
+            raise ValueError(
+                f"SHAP values shape {self.shap_values.shape} doesn't match "
+                f"features_df shape ({n_samples}, {n_features})."
+            )
+    def _get_default_config(self) -> TradeConfig:
+        """Get default configuration."""
+        from ml4t.diagnostic.config import TradeConfig
+        return TradeConfig()
+    def _compute_shap_values(self) -> None:
+        """Compute SHAP values on-demand if not provided."""
+        from ml4t.diagnostic.evaluation.metrics import compute_shap_importance
+        feature_cols = [col for col in self.features_df.columns if col != "timestamp"]
+        features_df = self.features_df.select(feature_cols)
+        result = compute_shap_importance(
+            model=self.model,
+            X=features_df,
+            feature_names=feature_cols,
+            explainer_type=self._explainer_type,
+            use_gpu=self._use_gpu,
+            background_data=self._background_data,
+            show_progress=self._show_progress,
+            explainer_kwargs=self._explainer_kwargs,
+        )
+        self.shap_values = result["shap_values"]
+    def _ensure_pipeline(self) -> TradeShapPipeline:
+        """Ensure pipeline is initialized with SHAP values."""
+        if self._pipeline is None:
+            # Compute SHAP values if not provided
+            if self.shap_values is None:
+                self._compute_shap_values()
+            # Build pipeline config from TradeConfig
+            # Check for nested alignment config
+            alignment_cfg = getattr(self.config, "alignment", None)
+            if alignment_cfg is not None:
+                # AlignmentSettings has: tolerance, mode, missing_strategy, top_n_features
+                tolerance = getattr(alignment_cfg, "tolerance", 0.0)
+                mode = getattr(alignment_cfg, "mode", "entry")
+                missing_strategy = getattr(alignment_cfg, "missing_strategy", "skip")
+                top_n = getattr(alignment_cfg, "top_n_features", 10)
+                normalization = getattr(alignment_cfg, "normalization", "l2")
+            else:
+                tolerance = getattr(self.config, "alignment_tolerance_seconds", 0.0)
+                mode = getattr(self.config, "alignment_mode", "entry")
+                missing_strategy = getattr(self.config, "missing_value_strategy", "skip")
+                top_n = getattr(self.config, "top_n_features", 10)
+                normalization = getattr(self.config, "normalization", "l2")
+            pipeline_config = TradeShapPipelineConfig(
+                alignment_tolerance_seconds=tolerance,
+                alignment_mode=mode,
+                missing_value_strategy=missing_strategy,
+                top_n_features=top_n,
+                normalization=normalization,
+            )
+            self._pipeline = TradeShapPipeline(
+                features_df=self.features_df,
+                shap_values=self.shap_values,
+                feature_names=self.feature_names,
+                config=pipeline_config,
+            )
+        return self._pipeline
+    def explain_worst_trades(
+        self,
+        worst_trades: list[TradeMetrics],
+        n: int | None = None,
+    ) -> TradeShapResult:
+        """Explain worst trades with full SHAP analysis pipeline.
+        Args:
+            worst_trades: List of trades sorted by loss (worst first)
+            n: Number of trades to analyze (None = all)
+        Returns:
+            TradeShapResult with explanations, patterns, and hypotheses
+        """
+        pipeline = self._ensure_pipeline()
+        return pipeline.analyze_worst_trades(worst_trades, n=n)
+    def explain_trade(
+        self,
+        trade: TradeMetrics,
+    ) -> TradeShapExplanation | TradeExplainFailure:
+        """Explain a single trade."""
+        pipeline = self._ensure_pipeline()
+        return pipeline.explain_trade(trade)
+    def explain_trades(
+        self,
+        trades: list[TradeMetrics],
+    ) -> tuple[list[TradeShapExplanation], list[TradeExplainFailure]]:
+        """Explain multiple trades."""
+        pipeline = self._ensure_pipeline()
+        return pipeline.explain_trades(trades)
+    _UNSET: Any = object()  # Sentinel for "use config default"
+    def extract_shap_vectors(
+        self,
+        explanations: list[TradeShapExplanation],
+        normalization: str | None | Any = _UNSET,
+        top_n_features: int | None = None,
+    ) -> NDArray[np.floating[Any]]:
+        """Extract SHAP vectors from explanations.
+        Args:
+            explanations: List of TradeShapExplanation objects
+            normalization: Normalization type ('l1', 'l2', 'standardize', None for none,
+                          or omit to use config default)
+            top_n_features: Reduce to top N features (by mean |SHAP|)
+        Returns:
+            2D array of shape (n_explanations, n_features)
+        Raises:
+            ValueError: If explanations is empty or normalization is invalid
+        """
+        if not explanations:
+            raise ValueError("Cannot extract vectors from empty explanations list")
+        # Stack SHAP vectors
+        vectors = np.vstack([exp.shap_vector for exp in explanations])
+        # Handle top_n reduction
+        if top_n_features is not None:
+            n_features = vectors.shape[1]
+            if top_n_features > n_features:
+                raise ValueError(
+                    f"top_n_features ({top_n_features}) exceeds feature count ({n_features})"
+                )
+            if top_n_features < 1:
+                raise ValueError("top_n_features must be positive")
+            # Select top features by mean absolute SHAP
+            importance = np.abs(vectors).mean(axis=0)
+            top_idx = np.argsort(importance)[-top_n_features:]
+            vectors = vectors[:, top_idx]
+        # Apply normalization
+        # If normalization is _UNSET, use config default; if None, no normalization
+        if normalization is self._UNSET:
+            # Use config default if available (check clustering then alignment)
+            normalization = getattr(getattr(self.config, "clustering", None), "normalization", None)
+            if normalization is None:
+                normalization = getattr(
+                    getattr(self.config, "alignment", None), "normalization", None
+                )
+        if normalization is not None:
+            vectors = normalize(vectors, normalization)
+        return vectors
+    def cluster_patterns(
+        self,
+        shap_vectors: NDArray[np.floating[Any]],
+        n_clusters: int | None = None,
+    ) -> ClusteringResult:
+        """Cluster SHAP vectors to identify error patterns.
+        Args:
+            shap_vectors: 2D array of SHAP vectors (n_trades, n_features)
+            n_clusters: Number of clusters (auto-detected if None)
+        Returns:
+            ClusteringResult with cluster assignments and metrics
+        Raises:
+            ValueError: If insufficient trades for clustering
+        """
+        n_trades = len(shap_vectors)
+        if n_trades < 3:
+            raise ValueError("Need at least 3 trades for clustering")
+        # Check against min_trades_for_clustering config
+        min_trades = getattr(self.config, "min_trades_for_clustering", 10)
+        if n_trades < min_trades:
+            raise ValueError(
+                f"Insufficient trades for clustering: {n_trades} < {min_trades} "
+                "(set min_trades_for_clustering to lower this threshold)"
+            )
+        if n_clusters is not None:
+            if n_clusters < 1:
+                raise ValueError("n_clusters must be positive")
+            if n_clusters > n_trades:
+                raise ValueError(f"n_clusters ({n_clusters}) exceeds trade count ({n_trades})")
+        # Get clustering config
+        clustering_cfg = getattr(self.config, "clustering", None)
+        if clustering_cfg is not None:
+            config = ClusteringConfig(
+                min_cluster_size=getattr(clustering_cfg, "min_cluster_size", 3),
+                distance_metric=getattr(clustering_cfg, "distance_metric", "euclidean"),
+                linkage_method=getattr(clustering_cfg, "linkage_method", "ward"),
+            )
+        else:
+            config = ClusteringConfig()
+        clusterer = HierarchicalClusterer(config=config)
+        return clusterer.cluster(shap_vectors, n_clusters=n_clusters)
+    def characterize_pattern(
+        self,
+        shap_vectors: NDArray[np.floating[Any]] | None = None,
+        clustering_result: ClusteringResult | None = None,
+        cluster_id: int | None = None,
+        feature_names: list[str] | None = None,
+        top_n: int = 5,
+        *,
+        # Backward-compat kwargs
+        cluster_assignments: list[int] | None = None,
+    ) -> dict[str, Any]:
+        """Characterize a single error pattern.
+        Supports both old dict-return API and new object-based API.
+        Args:
+            shap_vectors: 2D array of SHAP vectors
+            clustering_result: Result from cluster_patterns() (new API)
+            cluster_id: Which cluster to characterize
+            feature_names: Feature names (uses self.feature_names if None)
+            top_n: Number of top features to include
+            cluster_assignments: Cluster labels (backward compat, use clustering_result instead)
+        Returns:
+            Dict with pattern info (cluster_id, n_trades, top_features, etc.)
+        Raises:
+            ValueError: If cluster_id is invalid
+        """
+        if shap_vectors is None:
+            raise ValueError("shap_vectors is required")
+        if cluster_id is None:
+            raise ValueError("cluster_id is required")
+        # Handle backward compat: cluster_assignments list vs ClusteringResult
+        if cluster_assignments is not None:
+            # Old API: create minimal ClusteringResult-like structure
+            labels = cluster_assignments
+            n_clusters = len(set(labels))
+            centroids = None  # Will compute from shap_vectors
+        elif clustering_result is not None:
+            labels = clustering_result.cluster_assignments
+            n_clusters = clustering_result.n_clusters
+            centroids = clustering_result.centroids
+        else:
+            raise ValueError("Either clustering_result or cluster_assignments is required")
+        if cluster_id < 0 or cluster_id >= n_clusters:
+            raise ValueError(f"cluster_id {cluster_id} out of range [0, {n_clusters})")
+        if feature_names is None:
+            feature_names = self.feature_names
+        # Validate feature count
+        if shap_vectors.shape[1] != len(feature_names):
+            raise ValueError(
+                f"Feature count mismatch: vectors have {shap_vectors.shape[1]} features, "
+                f"but got {len(feature_names)} feature names"
+            )
+        # Get cluster mask
+        cluster_mask = np.array([lbl == cluster_id for lbl in labels])
+        other_mask = ~cluster_mask
+        cluster_shap = shap_vectors[cluster_mask]
+        other_shap = shap_vectors[other_mask]
+        n_trades = int(cluster_mask.sum())
+        # Compute centroids if not provided
+        if centroids is None:
+            centroids = np.zeros((n_clusters, shap_vectors.shape[1]))
+            for c in range(n_clusters):
+                c_mask = np.array([lbl == c for lbl in labels])
+                if c_mask.sum() > 0:
+                    centroids[c] = shap_vectors[c_mask].mean(axis=0)
+        # Use characterizer
+        char_cfg = getattr(self.config, "characterization", None)
+        if char_cfg is not None:
+            config = CharacterizationConfig(
+                top_n_features=top_n,
+                significance_level=getattr(char_cfg, "significance_level", 0.05),
+            )
+        else:
+            config = CharacterizationConfig(top_n_features=top_n)
+        characterizer = PatternCharacterizer(
+            feature_names=feature_names,
+            config=config,
+        )
+        pattern = characterizer.characterize_cluster(
+            cluster_shap=cluster_shap,
+            other_shap=other_shap,
+            cluster_id=cluster_id,
+            centroids=centroids,
+        )
+        # Return dict for backward compat
+        # top_features is list[tuple[str, float, float, float, bool]]
+        # (name, mean_shap, p_value_t, p_value_mw, is_significant)
+        return {
+            "cluster_id": cluster_id,
+            "n_trades": n_trades,
+            "top_features": [
+                {
+                    "feature": tf[0],
+                    "mean_shap": tf[1],
+                    "p_value_t": tf[2],
+                    "p_value_mw": tf[3],
+                    "significant": tf[4],
+                }
+                for tf in pattern.top_features
+            ],
+            "pattern_description": pattern.description,
+            "separation_score": pattern.separation_score,
+            "distinctiveness": pattern.distinctiveness,
+            # Include ErrorPattern object for callers that want it
+            "_pattern_object": pattern,
+        }
+    @property
+    def hypothesis_generator(self) -> HypothesisGenerator:
+        """Get hypothesis generator for custom hypothesis generation."""
+        if self._hypothesis_generator is None:
+            # Get hypothesis config from TradeConfig
+            ext_config = getattr(self.config, "hypothesis", None)
+            # Convert HypothesisGenerationConfig to HypothesisConfig if needed
+            if ext_config is not None and hasattr(ext_config, "min_confidence"):
+                # It's a HypothesisGenerationConfig - convert to HypothesisConfig
+                config = HypothesisConfig(
+                    template_library=getattr(ext_config, "template_library", "comprehensive"),
+                    min_confidence=getattr(ext_config, "min_confidence", 0.5),
+                    max_actions=getattr(ext_config, "max_hypotheses_per_cluster", 4),
+                )
+            elif isinstance(ext_config, HypothesisConfig):
+                config = ext_config
+            else:
+                config = HypothesisConfig()
+            self._hypothesis_generator = HypothesisGenerator(config=config)
+        return self._hypothesis_generator
+    def generate_hypothesis(
+        self,
+        error_pattern: ErrorPattern,
+    ) -> ErrorPattern:
+        """Generate hypothesis for an error pattern.
+        Args:
+            error_pattern: Error pattern to analyze
+        Returns:
+            ErrorPattern with hypothesis, actions, and confidence fields populated
+        """
+        return self.hypothesis_generator.generate_hypothesis(
+            error_pattern,
+            feature_names=self.feature_names,
+        )
+__all__ = [
+    # Main analyzer class
+    "TradeShapAnalyzer",
+    # Pipeline (new recommended interface)
+    "TradeShapPipeline",
+    "TradeShapPipelineConfig",
+    # Result models
+    "TradeShapResult",
+    "TradeShapExplanation",
+    "TradeExplainFailure",
+    "ErrorPattern",
+    "ClusteringResult",
+    # Components
+    "TradeShapExplainer",
+    "TimestampAligner",
+    "AlignmentResult",
+    "HierarchicalClusterer",
+    "ClusteringConfig",
+    "PatternCharacterizer",
+    "CharacterizationConfig",
+    "FeatureStatistics",
+    "HypothesisGenerator",
+    "HypothesisConfig",
+    # Utilities
+    "normalize",
+    "normalize_l1",
+    "normalize_l2",
+    "standardize",
+    "NormalizationType",
+    "benjamini_hochberg",
+    "find_optimal_clusters",
+    "compute_cluster_sizes",
+    "compute_centroids",
+    "Template",
+    "TemplateMatcher",
+    "load_templates",
+]