PyPI - ml4t-diagnostic - Versions diffs - 0.1.0a1__py3-none-any.whl - Mend

ml4t-diagnostic 0.1.0a1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

ml4t/diagnostic/AGENT.md +25 -0
ml4t/diagnostic/__init__.py +166 -0
ml4t/diagnostic/backends/__init__.py +10 -0
ml4t/diagnostic/backends/adapter.py +192 -0
ml4t/diagnostic/backends/polars_backend.py +899 -0
ml4t/diagnostic/caching/__init__.py +40 -0
ml4t/diagnostic/caching/cache.py +331 -0
ml4t/diagnostic/caching/decorators.py +131 -0
ml4t/diagnostic/caching/smart_cache.py +339 -0
ml4t/diagnostic/config/AGENT.md +24 -0
ml4t/diagnostic/config/README.md +267 -0
ml4t/diagnostic/config/__init__.py +219 -0
ml4t/diagnostic/config/barrier_config.py +277 -0
ml4t/diagnostic/config/base.py +301 -0
ml4t/diagnostic/config/event_config.py +148 -0
ml4t/diagnostic/config/feature_config.py +404 -0
ml4t/diagnostic/config/multi_signal_config.py +55 -0
ml4t/diagnostic/config/portfolio_config.py +215 -0
ml4t/diagnostic/config/report_config.py +391 -0
ml4t/diagnostic/config/sharpe_config.py +202 -0
ml4t/diagnostic/config/signal_config.py +206 -0
ml4t/diagnostic/config/trade_analysis_config.py +310 -0
ml4t/diagnostic/config/validation.py +279 -0
ml4t/diagnostic/core/__init__.py +29 -0
ml4t/diagnostic/core/numba_utils.py +315 -0
ml4t/diagnostic/core/purging.py +372 -0
ml4t/diagnostic/core/sampling.py +471 -0
ml4t/diagnostic/errors/__init__.py +205 -0
ml4t/diagnostic/evaluation/AGENT.md +26 -0
ml4t/diagnostic/evaluation/__init__.py +437 -0
ml4t/diagnostic/evaluation/autocorrelation.py +531 -0
ml4t/diagnostic/evaluation/barrier_analysis.py +1050 -0
ml4t/diagnostic/evaluation/binary_metrics.py +910 -0
ml4t/diagnostic/evaluation/dashboard.py +715 -0
ml4t/diagnostic/evaluation/diagnostic_plots.py +1037 -0
ml4t/diagnostic/evaluation/distribution/__init__.py +499 -0
ml4t/diagnostic/evaluation/distribution/moments.py +299 -0
ml4t/diagnostic/evaluation/distribution/tails.py +777 -0
ml4t/diagnostic/evaluation/distribution/tests.py +470 -0
ml4t/diagnostic/evaluation/drift/__init__.py +139 -0
ml4t/diagnostic/evaluation/drift/analysis.py +432 -0
ml4t/diagnostic/evaluation/drift/domain_classifier.py +517 -0
ml4t/diagnostic/evaluation/drift/population_stability_index.py +310 -0
ml4t/diagnostic/evaluation/drift/wasserstein.py +388 -0
ml4t/diagnostic/evaluation/event_analysis.py +647 -0
ml4t/diagnostic/evaluation/excursion.py +390 -0
ml4t/diagnostic/evaluation/feature_diagnostics.py +873 -0
ml4t/diagnostic/evaluation/feature_outcome.py +666 -0
ml4t/diagnostic/evaluation/framework.py +935 -0
ml4t/diagnostic/evaluation/metric_registry.py +255 -0
ml4t/diagnostic/evaluation/metrics/AGENT.md +23 -0
ml4t/diagnostic/evaluation/metrics/__init__.py +133 -0
ml4t/diagnostic/evaluation/metrics/basic.py +160 -0
ml4t/diagnostic/evaluation/metrics/conditional_ic.py +469 -0
ml4t/diagnostic/evaluation/metrics/feature_outcome.py +475 -0
ml4t/diagnostic/evaluation/metrics/ic_statistics.py +446 -0
ml4t/diagnostic/evaluation/metrics/importance_analysis.py +338 -0
ml4t/diagnostic/evaluation/metrics/importance_classical.py +375 -0
ml4t/diagnostic/evaluation/metrics/importance_mda.py +371 -0
ml4t/diagnostic/evaluation/metrics/importance_shap.py +715 -0
ml4t/diagnostic/evaluation/metrics/information_coefficient.py +527 -0
ml4t/diagnostic/evaluation/metrics/interactions.py +772 -0
ml4t/diagnostic/evaluation/metrics/monotonicity.py +226 -0
ml4t/diagnostic/evaluation/metrics/risk_adjusted.py +324 -0
ml4t/diagnostic/evaluation/multi_signal.py +550 -0
ml4t/diagnostic/evaluation/portfolio_analysis/__init__.py +83 -0
ml4t/diagnostic/evaluation/portfolio_analysis/analysis.py +734 -0
ml4t/diagnostic/evaluation/portfolio_analysis/metrics.py +589 -0
ml4t/diagnostic/evaluation/portfolio_analysis/results.py +334 -0
ml4t/diagnostic/evaluation/report_generation.py +824 -0
ml4t/diagnostic/evaluation/signal_selector.py +452 -0
ml4t/diagnostic/evaluation/stat_registry.py +139 -0
ml4t/diagnostic/evaluation/stationarity/__init__.py +97 -0
ml4t/diagnostic/evaluation/stationarity/analysis.py +518 -0
ml4t/diagnostic/evaluation/stationarity/augmented_dickey_fuller.py +296 -0
ml4t/diagnostic/evaluation/stationarity/kpss_test.py +308 -0
ml4t/diagnostic/evaluation/stationarity/phillips_perron.py +365 -0
ml4t/diagnostic/evaluation/stats/AGENT.md +43 -0
ml4t/diagnostic/evaluation/stats/__init__.py +191 -0
ml4t/diagnostic/evaluation/stats/backtest_overfitting.py +219 -0
ml4t/diagnostic/evaluation/stats/bootstrap.py +228 -0
ml4t/diagnostic/evaluation/stats/deflated_sharpe_ratio.py +591 -0
ml4t/diagnostic/evaluation/stats/false_discovery_rate.py +295 -0
ml4t/diagnostic/evaluation/stats/hac_standard_errors.py +108 -0
ml4t/diagnostic/evaluation/stats/minimum_track_record.py +408 -0
ml4t/diagnostic/evaluation/stats/moments.py +164 -0
ml4t/diagnostic/evaluation/stats/rademacher_adjustment.py +436 -0
ml4t/diagnostic/evaluation/stats/reality_check.py +155 -0
ml4t/diagnostic/evaluation/stats/sharpe_inference.py +219 -0
ml4t/diagnostic/evaluation/themes.py +330 -0
ml4t/diagnostic/evaluation/threshold_analysis.py +957 -0
ml4t/diagnostic/evaluation/trade_analysis.py +1136 -0
ml4t/diagnostic/evaluation/trade_dashboard/__init__.py +32 -0
ml4t/diagnostic/evaluation/trade_dashboard/app.py +315 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/__init__.py +18 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/csv.py +82 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/html.py +276 -0
ml4t/diagnostic/evaluation/trade_dashboard/io.py +166 -0
ml4t/diagnostic/evaluation/trade_dashboard/normalize.py +304 -0
ml4t/diagnostic/evaluation/trade_dashboard/stats.py +386 -0
ml4t/diagnostic/evaluation/trade_dashboard/style.py +79 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/__init__.py +21 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/patterns.py +354 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/shap_analysis.py +280 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/stat_validation.py +186 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/worst_trades.py +236 -0
ml4t/diagnostic/evaluation/trade_dashboard/types.py +129 -0
ml4t/diagnostic/evaluation/trade_shap/__init__.py +102 -0
ml4t/diagnostic/evaluation/trade_shap/alignment.py +188 -0
ml4t/diagnostic/evaluation/trade_shap/characterize.py +413 -0
ml4t/diagnostic/evaluation/trade_shap/cluster.py +302 -0
ml4t/diagnostic/evaluation/trade_shap/explain.py +208 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/__init__.py +23 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/generator.py +290 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/matcher.py +251 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/templates.yaml +467 -0
ml4t/diagnostic/evaluation/trade_shap/models.py +386 -0
ml4t/diagnostic/evaluation/trade_shap/normalize.py +116 -0
ml4t/diagnostic/evaluation/trade_shap/pipeline.py +263 -0
ml4t/diagnostic/evaluation/trade_shap_dashboard.py +283 -0
ml4t/diagnostic/evaluation/trade_shap_diagnostics.py +588 -0
ml4t/diagnostic/evaluation/validated_cv.py +535 -0
ml4t/diagnostic/evaluation/visualization.py +1050 -0
ml4t/diagnostic/evaluation/volatility/__init__.py +45 -0
ml4t/diagnostic/evaluation/volatility/analysis.py +351 -0
ml4t/diagnostic/evaluation/volatility/arch.py +258 -0
ml4t/diagnostic/evaluation/volatility/garch.py +460 -0
ml4t/diagnostic/integration/__init__.py +48 -0
ml4t/diagnostic/integration/backtest_contract.py +671 -0
ml4t/diagnostic/integration/data_contract.py +316 -0
ml4t/diagnostic/integration/engineer_contract.py +226 -0
ml4t/diagnostic/logging/__init__.py +77 -0
ml4t/diagnostic/logging/logger.py +245 -0
ml4t/diagnostic/logging/performance.py +234 -0
ml4t/diagnostic/logging/progress.py +234 -0
ml4t/diagnostic/logging/wandb.py +412 -0
ml4t/diagnostic/metrics/__init__.py +9 -0
ml4t/diagnostic/metrics/percentiles.py +128 -0
ml4t/diagnostic/py.typed +1 -0
ml4t/diagnostic/reporting/__init__.py +43 -0
ml4t/diagnostic/reporting/base.py +130 -0
ml4t/diagnostic/reporting/html_renderer.py +275 -0
ml4t/diagnostic/reporting/json_renderer.py +51 -0
ml4t/diagnostic/reporting/markdown_renderer.py +117 -0
ml4t/diagnostic/results/AGENT.md +24 -0
ml4t/diagnostic/results/__init__.py +105 -0
ml4t/diagnostic/results/barrier_results/__init__.py +36 -0
ml4t/diagnostic/results/barrier_results/hit_rate.py +304 -0
ml4t/diagnostic/results/barrier_results/precision_recall.py +266 -0
ml4t/diagnostic/results/barrier_results/profit_factor.py +297 -0
ml4t/diagnostic/results/barrier_results/tearsheet.py +397 -0
ml4t/diagnostic/results/barrier_results/time_to_target.py +305 -0
ml4t/diagnostic/results/barrier_results/validation.py +38 -0
ml4t/diagnostic/results/base.py +177 -0
ml4t/diagnostic/results/event_results.py +349 -0
ml4t/diagnostic/results/feature_results.py +787 -0
ml4t/diagnostic/results/multi_signal_results.py +431 -0
ml4t/diagnostic/results/portfolio_results.py +281 -0
ml4t/diagnostic/results/sharpe_results.py +448 -0
ml4t/diagnostic/results/signal_results/__init__.py +74 -0
ml4t/diagnostic/results/signal_results/ic.py +581 -0
ml4t/diagnostic/results/signal_results/irtc.py +110 -0
ml4t/diagnostic/results/signal_results/quantile.py +392 -0
ml4t/diagnostic/results/signal_results/tearsheet.py +456 -0
ml4t/diagnostic/results/signal_results/turnover.py +213 -0
ml4t/diagnostic/results/signal_results/validation.py +147 -0
ml4t/diagnostic/signal/AGENT.md +17 -0
ml4t/diagnostic/signal/__init__.py +69 -0
ml4t/diagnostic/signal/_report.py +152 -0
ml4t/diagnostic/signal/_utils.py +261 -0
ml4t/diagnostic/signal/core.py +275 -0
ml4t/diagnostic/signal/quantile.py +148 -0
ml4t/diagnostic/signal/result.py +214 -0
ml4t/diagnostic/signal/signal_ic.py +129 -0
ml4t/diagnostic/signal/turnover.py +182 -0
ml4t/diagnostic/splitters/AGENT.md +19 -0
ml4t/diagnostic/splitters/__init__.py +36 -0
ml4t/diagnostic/splitters/base.py +501 -0
ml4t/diagnostic/splitters/calendar.py +421 -0
ml4t/diagnostic/splitters/calendar_config.py +91 -0
ml4t/diagnostic/splitters/combinatorial.py +1064 -0
ml4t/diagnostic/splitters/config.py +322 -0
ml4t/diagnostic/splitters/cpcv/__init__.py +57 -0
ml4t/diagnostic/splitters/cpcv/combinations.py +119 -0
ml4t/diagnostic/splitters/cpcv/partitioning.py +263 -0
ml4t/diagnostic/splitters/cpcv/purge_engine.py +379 -0
ml4t/diagnostic/splitters/cpcv/windows.py +190 -0
ml4t/diagnostic/splitters/group_isolation.py +329 -0
ml4t/diagnostic/splitters/persistence.py +316 -0
ml4t/diagnostic/splitters/utils.py +207 -0
ml4t/diagnostic/splitters/walk_forward.py +757 -0
ml4t/diagnostic/utils/__init__.py +42 -0
ml4t/diagnostic/utils/config.py +542 -0
ml4t/diagnostic/utils/dependencies.py +318 -0
ml4t/diagnostic/utils/sessions.py +127 -0
ml4t/diagnostic/validation/__init__.py +54 -0
ml4t/diagnostic/validation/dataframe.py +274 -0
ml4t/diagnostic/validation/returns.py +280 -0
ml4t/diagnostic/validation/timeseries.py +299 -0
ml4t/diagnostic/visualization/AGENT.md +19 -0
ml4t/diagnostic/visualization/__init__.py +223 -0
ml4t/diagnostic/visualization/backtest/__init__.py +98 -0
ml4t/diagnostic/visualization/backtest/cost_attribution.py +762 -0
ml4t/diagnostic/visualization/backtest/executive_summary.py +895 -0
ml4t/diagnostic/visualization/backtest/interactive_controls.py +673 -0
ml4t/diagnostic/visualization/backtest/statistical_validity.py +874 -0
ml4t/diagnostic/visualization/backtest/tearsheet.py +565 -0
ml4t/diagnostic/visualization/backtest/template_system.py +373 -0
ml4t/diagnostic/visualization/backtest/trade_plots.py +1172 -0
ml4t/diagnostic/visualization/barrier_plots.py +782 -0
ml4t/diagnostic/visualization/core.py +1060 -0
ml4t/diagnostic/visualization/dashboards/__init__.py +36 -0
ml4t/diagnostic/visualization/dashboards/base.py +582 -0
ml4t/diagnostic/visualization/dashboards/importance.py +801 -0
ml4t/diagnostic/visualization/dashboards/interaction.py +263 -0
ml4t/diagnostic/visualization/dashboards.py +43 -0
ml4t/diagnostic/visualization/data_extraction/__init__.py +48 -0
ml4t/diagnostic/visualization/data_extraction/importance.py +649 -0
ml4t/diagnostic/visualization/data_extraction/interaction.py +504 -0
ml4t/diagnostic/visualization/data_extraction/types.py +113 -0
ml4t/diagnostic/visualization/data_extraction/validation.py +66 -0
ml4t/diagnostic/visualization/feature_plots.py +888 -0
ml4t/diagnostic/visualization/interaction_plots.py +618 -0
ml4t/diagnostic/visualization/portfolio/__init__.py +41 -0
ml4t/diagnostic/visualization/portfolio/dashboard.py +514 -0
ml4t/diagnostic/visualization/portfolio/drawdown_plots.py +341 -0
ml4t/diagnostic/visualization/portfolio/returns_plots.py +487 -0
ml4t/diagnostic/visualization/portfolio/risk_plots.py +301 -0
ml4t/diagnostic/visualization/report_generation.py +1343 -0
ml4t/diagnostic/visualization/signal/__init__.py +103 -0
ml4t/diagnostic/visualization/signal/dashboard.py +911 -0
ml4t/diagnostic/visualization/signal/event_plots.py +514 -0
ml4t/diagnostic/visualization/signal/ic_plots.py +635 -0
ml4t/diagnostic/visualization/signal/multi_signal_dashboard.py +974 -0
ml4t/diagnostic/visualization/signal/multi_signal_plots.py +603 -0
ml4t/diagnostic/visualization/signal/quantile_plots.py +625 -0
ml4t/diagnostic/visualization/signal/turnover_plots.py +400 -0
ml4t/diagnostic/visualization/trade_shap/__init__.py +90 -0
ml4t_diagnostic-0.1.0a1.dist-info/METADATA +1044 -0
ml4t_diagnostic-0.1.0a1.dist-info/RECORD +242 -0
ml4t_diagnostic-0.1.0a1.dist-info/WHEEL +4 -0
ml4t_diagnostic-0.1.0a1.dist-info/licenses/LICENSE +21 -0

ml4t/diagnostic/evaluation/trade_shap/models.py ADDED Viewed

@@ -0,0 +1,386 @@
+"""Pydantic models for Trade SHAP diagnostics.
+This module contains the data models used throughout the Trade SHAP analysis:
+- TradeShapExplanation: SHAP explanation for a single trade
+- ClusteringResult: Result of error pattern clustering
+- ErrorPattern: Characterized error pattern from clustered trades
+- TradeShapResult: Complete result of trade-level SHAP analysis
+"""
+from __future__ import annotations
+from datetime import datetime
+from typing import TYPE_CHECKING, Any
+import numpy as np
+from numpy.typing import NDArray
+from pydantic import BaseModel, Field
+if TYPE_CHECKING:
+    pass
+class TradeExplainFailure(BaseModel):
+    """Structured failure result for trade explanation.
+    Used instead of exceptions for expected failure cases (alignment missing,
+    feature mismatch, etc.) to enable batch processing without try/except.
+    Attributes:
+        trade_id: Unique trade identifier
+        timestamp: Trade entry timestamp
+        reason: Machine-readable failure reason code
+        details: Additional context about the failure
+    """
+    trade_id: str = Field(..., description="Unique trade identifier")
+    timestamp: datetime = Field(..., description="Trade entry timestamp")
+    reason: str = Field(
+        ...,
+        description="Failure reason: 'alignment_missing', 'shap_error', 'feature_mismatch'",
+    )
+    details: dict[str, Any] = Field(default_factory=dict, description="Additional failure context")
+class TradeShapExplanation(BaseModel):
+    """SHAP explanation for a single trade.
+    Contains SHAP attribution details for one trade, including:
+        - Top contributing features (sorted by absolute SHAP value)
+        - Feature values at trade entry
+        - Full SHAP vector for all features
+        - Waterfall plot data (future enhancement)
+    Attributes:
+        trade_id: Unique trade identifier (symbol_timestamp)
+        timestamp: Trade entry timestamp
+        top_features: List of (feature_name, shap_value) sorted by |shap_value| descending
+        feature_values: Dictionary of feature values at trade entry
+        shap_vector: Full SHAP vector for all features (numpy array)
+    Example:
+        >>> explanation.top_features[:3]
+        [('momentum_20d', 0.342), ('volatility_10d', -0.215), ('rsi_14d', 0.108)]
+        >>> explanation.feature_values['momentum_20d']
+        1.235
+        >>> explanation.shap_vector.shape
+        (50,)  # 50 features
+    """
+    trade_id: str = Field(..., description="Unique trade identifier")
+    timestamp: datetime = Field(..., description="Trade entry timestamp")
+    top_features: list[tuple[str, float]] = Field(
+        ..., description="Top N features by absolute SHAP value (descending)"
+    )
+    feature_values: dict[str, float] = Field(
+        ..., description="Feature values at trade entry timestamp"
+    )
+    shap_vector: NDArray[np.floating[Any]] = Field(
+        ..., description="Full SHAP vector for all features"
+    )
+    class Config:
+        """Pydantic config."""
+        arbitrary_types_allowed = True
+class ClusteringResult(BaseModel):
+    """Result of error pattern clustering.
+    Contains cluster assignments, centroids, quality metrics, and linkage matrix
+    for dendrogram visualization.
+    Attributes:
+        n_clusters: Number of clusters identified
+        cluster_assignments: Cluster ID for each trade (0-indexed list)
+        linkage_matrix: Scipy linkage matrix for dendrogram plotting
+        centroids: Mean SHAP vector for each cluster (shape: n_clusters x n_features)
+        silhouette_score: Quality metric (range: -1 to 1, higher is better)
+            - 1.0: Perfect separation
+            - 0.5: Good separation
+            - 0.0: Overlapping clusters
+            - <0.0: Poor clustering (mis-assigned trades)
+        davies_bouldin_score: Davies-Bouldin Index (lower = better, min: 0)
+            - Measures ratio of within-cluster to between-cluster distances
+            - < 1.0: Good clustering
+            - 1.0-2.0: Acceptable clustering
+            - > 2.0: Poor clustering
+        calinski_harabasz_score: Calinski-Harabasz Score (higher = better, min: 0)
+            - Also known as Variance Ratio Criterion
+            - Measures ratio of between-cluster to within-cluster dispersion
+            - Higher values indicate better-defined clusters
+        cluster_sizes: Number of trades in each cluster
+        distance_metric: Distance metric used ('euclidean', 'cosine', etc.)
+        linkage_method: Linkage method used ('ward', 'average', 'complete', 'single')
+    Example - Basic inspection:
+        >>> result = analyzer.cluster_patterns(shap_vectors)
+        >>> print(f"Found {result.n_clusters} clusters")
+        >>> print(f"Cluster sizes: {result.cluster_sizes}")
+        >>> print(f"Quality (silhouette): {result.silhouette_score:.3f}")
+    Example - Visualize dendrogram:
+        >>> from scipy.cluster.hierarchy import dendrogram
+        >>> import matplotlib.pyplot as plt
+        >>> dendrogram(result.linkage_matrix)
+        >>> plt.title("Error Pattern Dendrogram")
+        >>> plt.xlabel("Trade Index")
+        >>> plt.ylabel("Distance")
+        >>> plt.show()
+    Example - Analyze specific cluster:
+        >>> cluster_id = 0
+        >>> trades_in_cluster = [i for i, c in enumerate(result.cluster_assignments) if c == cluster_id]
+        >>> cluster_centroid = result.centroids[cluster_id]
+        >>> print(f"Cluster {cluster_id}: {len(trades_in_cluster)} trades")
+        >>> print(f"Centroid (mean SHAP): {cluster_centroid}")
+    Note:
+        - linkage_matrix can be used directly with scipy.cluster.hierarchy.dendrogram()
+        - centroids represent "typical" SHAP pattern for each cluster
+        - silhouette_score > 0.5 indicates well-separated clusters
+    """
+    n_clusters: int = Field(..., description="Number of clusters identified")
+    cluster_assignments: list[int] = Field(..., description="Cluster ID for each trade (0-indexed)")
+    linkage_matrix: NDArray[np.floating[Any]] = Field(
+        ..., description="Scipy linkage matrix for dendrogram"
+    )
+    centroids: NDArray[np.floating[Any]] = Field(
+        ..., description="Mean SHAP vector per cluster (n_clusters x n_features)"
+    )
+    silhouette_score: float = Field(
+        ..., description="Cluster quality metric (range: -1 to 1, higher is better)"
+    )
+    davies_bouldin_score: float | None = Field(
+        None,
+        description="Davies-Bouldin Index (lower = better, min: 0, no upper bound). "
+        "Measures ratio of within-cluster to between-cluster distances. "
+        "Values < 1.0 indicate good clustering.",
+    )
+    calinski_harabasz_score: float | None = Field(
+        None,
+        description="Calinski-Harabasz Score (higher = better, min: 0, no upper bound). "
+        "Also known as Variance Ratio Criterion. "
+        "Measures ratio of between-cluster to within-cluster dispersion.",
+    )
+    cluster_sizes: list[int] = Field(..., description="Number of trades per cluster")
+    distance_metric: str = Field(..., description="Distance metric used for clustering")
+    linkage_method: str = Field(..., description="Linkage method used for clustering")
+    class Config:
+        """Pydantic config."""
+        arbitrary_types_allowed = True
+class ErrorPattern(BaseModel):
+    """Characterized error pattern from clustered trades.
+    Represents a distinct pattern of trading errors identified through SHAP-based
+    clustering and statistical characterization. Contains the defining features,
+    quality metrics, and (optionally) generated hypotheses and action suggestions.
+    Attributes:
+        cluster_id: Unique identifier for this error pattern (0-indexed)
+        n_trades: Number of trades exhibiting this pattern
+        description: Human-readable pattern description
+            Format: "High feature_X (up 0.45) + Low feature_Y (down -0.32) -> Losses"
+        top_features: Top contributing SHAP features
+            List of (feature_name, mean_shap, p_value_t, p_value_mw, is_significant)
+        separation_score: Distance to nearest other cluster (higher = more distinct)
+        distinctiveness: Ratio of max SHAP vs other clusters (higher = more unique)
+        hypothesis: Optional generated hypothesis about why pattern causes losses
+        actions: Optional list of suggested remediation actions
+        confidence: Optional confidence score for hypothesis (0-1)
+    Example - Basic pattern:
+        >>> pattern = ErrorPattern(
+        ...     cluster_id=0,
+        ...     n_trades=15,
+        ...     description="High momentum (up 0.45) + Low volatility (down -0.32) -> Losses",
+        ...     top_features=[
+        ...         ("momentum_20d", 0.45, 0.001, 0.002, True),
+        ...         ("volatility_10d", -0.32, 0.003, 0.004, True)
+        ...     ],
+        ...     separation_score=1.2,
+        ...     distinctiveness=1.8
+        ... )
+        >>> print(pattern.summary())
+        "Pattern 0: 15 trades - High momentum (up 0.45) + Low volatility (down -0.32) -> Losses"
+    Example - With hypothesis and actions:
+        >>> pattern = ErrorPattern(
+        ...     cluster_id=1,
+        ...     n_trades=22,
+        ...     description="High RSI (up 0.38) + High volume (up 0.29) -> Losses",
+        ...     top_features=[("rsi_14", 0.38, 0.001, 0.001, True)],
+        ...     separation_score=0.9,
+        ...     distinctiveness=1.5,
+        ...     hypothesis="Trades entering overbought conditions with high volume (potential reversals)",
+        ...     actions=[
+        ...         "Add overbought filter: skip trades when RSI > 70",
+        ...         "Consider volume profile: avoid high volume in overbought zones",
+        ...         "Add mean reversion features to capture reversal dynamics"
+        ...     ],
+        ...     confidence=0.85
+        ... )
+        >>> for action in pattern.actions:
+        ...     print(f"  - {action}")
+    Note:
+        - hypothesis, actions, and confidence are populated by HypothesisGenerator
+        - top_features are sorted by absolute SHAP value (descending)
+        - separation_score and distinctiveness are quality metrics for pattern validation
+    """
+    cluster_id: int = Field(..., description="Cluster identifier (0-indexed)", ge=0)
+    n_trades: int = Field(..., description="Number of trades in this pattern", gt=0)
+    description: str = Field(..., description="Human-readable pattern description", min_length=1)
+    top_features: list[tuple[str, float, float, float, bool]] = Field(
+        ...,
+        description="Top SHAP features: (name, mean_shap, p_value_t, p_value_mw, is_significant)",
+    )
+    separation_score: float = Field(
+        ..., description="Distance to nearest other cluster (higher = better)", ge=0.0
+    )
+    distinctiveness: float = Field(
+        ..., description="Ratio of max SHAP vs other clusters (higher = better)", gt=0.0
+    )
+    hypothesis: str | None = Field(
+        None, description="Generated hypothesis about why this pattern causes losses"
+    )
+    actions: list[str] | None = Field(
+        None, description="Suggested remediation actions for this pattern"
+    )
+    confidence: float | None = Field(
+        None, description="Confidence score for hypothesis (0-1)", ge=0.0, le=1.0
+    )
+    def to_dict(self) -> dict[str, Any]:
+        """Convert ErrorPattern to dictionary.
+        Returns:
+            Dictionary representation suitable for JSON serialization
+        Example:
+            >>> pattern_dict = pattern.to_dict()
+            >>> import json
+            >>> json.dumps(pattern_dict, indent=2)
+        """
+        return {
+            "cluster_id": self.cluster_id,
+            "n_trades": self.n_trades,
+            "description": self.description,
+            "top_features": [
+                {
+                    "feature_name": feat[0],
+                    "mean_shap": feat[1],
+                    "p_value_t": feat[2],
+                    "p_value_mw": feat[3],
+                    "is_significant": feat[4],
+                }
+                for feat in self.top_features
+            ],
+            "separation_score": self.separation_score,
+            "distinctiveness": self.distinctiveness,
+            "hypothesis": self.hypothesis,
+            "actions": self.actions if self.actions else [],
+            "confidence": self.confidence,
+        }
+    def summary(self, include_actions: bool = False) -> str:
+        """Generate human-readable summary of error pattern.
+        Args:
+            include_actions: Whether to include action suggestions in summary
+        Returns:
+            Formatted summary string
+        Example:
+            >>> print(pattern.summary())
+            "Pattern 0: 15 trades - High momentum (up 0.45) + Low volatility (down -0.32) -> Losses"
+            >>> print(pattern.summary(include_actions=True))
+            '''
+            Pattern 0: 15 trades
+            Description: High momentum (up 0.45) + Low volatility (down -0.32) -> Losses
+            Hypothesis: Trades entering overbought conditions
+            Actions:
+              - Add overbought filter: skip trades when RSI > 70
+              - Consider volume profile
+            Confidence: 85%
+            '''
+        """
+        if not include_actions or not self.hypothesis:
+            # Simple one-line summary
+            return f"Pattern {self.cluster_id}: {self.n_trades} trades - {self.description}"
+        # Detailed multi-line summary with hypothesis and actions
+        lines = [
+            f"Pattern {self.cluster_id}: {self.n_trades} trades",
+            f"Description: {self.description}",
+        ]
+        if self.hypothesis:
+            lines.append(f"Hypothesis: {self.hypothesis}")
+        if self.actions:
+            lines.append("Actions:")
+            for action in self.actions:
+                lines.append(f"  - {action}")
+        if self.confidence is not None:
+            lines.append(f"Confidence: {self.confidence:.0%}")
+        return "\n".join(lines)
+    class Config:
+        """Pydantic config."""
+        arbitrary_types_allowed = True
+class TradeShapResult(BaseModel):
+    """Complete result of trade-level SHAP analysis.
+    Contains SHAP explanations for multiple trades, along with error patterns
+    and actionable recommendations.
+    Attributes:
+        n_trades_analyzed: Total number of trades attempted to analyze
+        n_trades_explained: Number of trades successfully explained
+        n_trades_failed: Number of trades that failed explanation
+        explanations: List of successful TradeShapExplanation objects
+        failed_trades: List of (trade_id, error_message) tuples for failed trades
+        error_patterns: Identified error patterns from clustering
+    Example:
+        >>> result = analyzer.explain_worst_trades(trades, n=20)
+        >>> print(f"Success rate: {result.n_trades_explained}/{result.n_trades_analyzed}")
+        >>> for explanation in result.explanations:
+        ...     print(f"Trade {explanation.trade_id}: top feature = {explanation.top_features[0]}")
+    """
+    n_trades_analyzed: int = Field(..., description="Total trades analyzed")
+    n_trades_explained: int = Field(..., description="Trades successfully explained")
+    n_trades_failed: int = Field(..., description="Trades that failed explanation")
+    explanations: list[TradeShapExplanation] = Field(
+        default_factory=list, description="Successful SHAP explanations"
+    )
+    failed_trades: list[tuple[str, str]] = Field(
+        default_factory=list, description="Failed trades: (trade_id, error_message)"
+    )
+    error_patterns: list[ErrorPattern] = Field(
+        default_factory=list,
+        description="Identified error patterns (populated by clustering and characterization)",
+    )
+    class Config:
+        """Pydantic config."""
+        arbitrary_types_allowed = True

ml4t/diagnostic/evaluation/trade_shap/normalize.py ADDED Viewed

@@ -0,0 +1,116 @@
+"""Normalization functions for SHAP vector clustering.
+Provides L1, L2, and standardization normalization with proper
+handling of edge cases (zero vectors, zero variance).
+"""
+from __future__ import annotations
+from typing import TYPE_CHECKING, Any, Literal
+import numpy as np
+if TYPE_CHECKING:
+    from numpy.typing import NDArray
+NormalizationType = Literal["l1", "l2", "standardize", "none"]
+def normalize_l1(vectors: NDArray[np.floating[Any]]) -> NDArray[np.floating[Any]]:
+    """L1 normalization: Scale each row by sum of absolute values.
+    Args:
+        vectors: Input vectors of shape (n_samples, n_features)
+    Returns:
+        L1-normalized vectors where each row sums to 1.0 (in absolute terms)
+    Note:
+        Zero vectors are returned unchanged (no division by zero)
+    """
+    l1_norms = np.sum(np.abs(vectors), axis=1, keepdims=True)
+    l1_norms = np.where(l1_norms == 0, 1.0, l1_norms)
+    return vectors / l1_norms
+def normalize_l2(vectors: NDArray[np.floating[Any]]) -> NDArray[np.floating[Any]]:
+    """L2 normalization: Scale each row to unit Euclidean norm.
+    Args:
+        vectors: Input vectors of shape (n_samples, n_features)
+    Returns:
+        L2-normalized unit vectors (norm = 1.0 per row)
+    Note:
+        Zero vectors are returned unchanged (no division by zero)
+    """
+    l2_norms = np.linalg.norm(vectors, axis=1, keepdims=True)
+    l2_norms = np.where(l2_norms == 0, 1.0, l2_norms)
+    return vectors / l2_norms
+def standardize(vectors: NDArray[np.floating[Any]]) -> NDArray[np.floating[Any]]:
+    """Z-score standardization: (x - mean) / std per feature.
+    Args:
+        vectors: Input vectors of shape (n_samples, n_features)
+    Returns:
+        Standardized vectors (mean=0, std=1 per feature column)
+    Note:
+        Zero-variance features are returned unchanged
+    """
+    mean = np.mean(vectors, axis=0, keepdims=True)
+    std = np.std(vectors, axis=0, keepdims=True)
+    std = np.where(std == 0, 1.0, std)
+    return (vectors - mean) / std
+def normalize(
+    vectors: NDArray[np.floating[Any]],
+    method: NormalizationType | None = None,
+) -> NDArray[np.floating[Any]]:
+    """Apply normalization to vectors.
+    Args:
+        vectors: Input vectors of shape (n_samples, n_features)
+        method: Normalization method: 'l1', 'l2', 'standardize', 'none', or None
+    Returns:
+        Normalized vectors
+    Raises:
+        ValueError: If normalization produces NaN/Inf or method is unknown
+    Example:
+        >>> vectors = np.array([[1, 2, 3], [4, 5, 6]])
+        >>> normalize(vectors, method='l2')
+        array([[0.267, 0.535, 0.802],
+               [0.456, 0.570, 0.684]])
+    """
+    if method is None or method == "none":
+        return vectors.copy()
+    elif method == "l1":
+        normalized = normalize_l1(vectors)
+    elif method == "l2":
+        normalized = normalize_l2(vectors)
+    elif method == "standardize":
+        normalized = standardize(vectors)
+    else:
+        raise ValueError(
+            f"Invalid normalization method: '{method}'. "
+            "Valid options: 'l1', 'l2', 'standardize', 'none', None"
+        )
+    # Validate output
+    if not np.all(np.isfinite(normalized)):
+        raise ValueError(
+            "Normalization produced NaN or Inf values. "
+            "This may indicate zero-variance features or numerical instability. "
+            f"Normalization method: {method}"
+        )
+    return normalized