PyPI - ml4t-diagnostic - Versions diffs - 0.1.0a1__py3-none-any.whl - Mend

ml4t-diagnostic 0.1.0a1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

ml4t/diagnostic/AGENT.md +25 -0
ml4t/diagnostic/__init__.py +166 -0
ml4t/diagnostic/backends/__init__.py +10 -0
ml4t/diagnostic/backends/adapter.py +192 -0
ml4t/diagnostic/backends/polars_backend.py +899 -0
ml4t/diagnostic/caching/__init__.py +40 -0
ml4t/diagnostic/caching/cache.py +331 -0
ml4t/diagnostic/caching/decorators.py +131 -0
ml4t/diagnostic/caching/smart_cache.py +339 -0
ml4t/diagnostic/config/AGENT.md +24 -0
ml4t/diagnostic/config/README.md +267 -0
ml4t/diagnostic/config/__init__.py +219 -0
ml4t/diagnostic/config/barrier_config.py +277 -0
ml4t/diagnostic/config/base.py +301 -0
ml4t/diagnostic/config/event_config.py +148 -0
ml4t/diagnostic/config/feature_config.py +404 -0
ml4t/diagnostic/config/multi_signal_config.py +55 -0
ml4t/diagnostic/config/portfolio_config.py +215 -0
ml4t/diagnostic/config/report_config.py +391 -0
ml4t/diagnostic/config/sharpe_config.py +202 -0
ml4t/diagnostic/config/signal_config.py +206 -0
ml4t/diagnostic/config/trade_analysis_config.py +310 -0
ml4t/diagnostic/config/validation.py +279 -0
ml4t/diagnostic/core/__init__.py +29 -0
ml4t/diagnostic/core/numba_utils.py +315 -0
ml4t/diagnostic/core/purging.py +372 -0
ml4t/diagnostic/core/sampling.py +471 -0
ml4t/diagnostic/errors/__init__.py +205 -0
ml4t/diagnostic/evaluation/AGENT.md +26 -0
ml4t/diagnostic/evaluation/__init__.py +437 -0
ml4t/diagnostic/evaluation/autocorrelation.py +531 -0
ml4t/diagnostic/evaluation/barrier_analysis.py +1050 -0
ml4t/diagnostic/evaluation/binary_metrics.py +910 -0
ml4t/diagnostic/evaluation/dashboard.py +715 -0
ml4t/diagnostic/evaluation/diagnostic_plots.py +1037 -0
ml4t/diagnostic/evaluation/distribution/__init__.py +499 -0
ml4t/diagnostic/evaluation/distribution/moments.py +299 -0
ml4t/diagnostic/evaluation/distribution/tails.py +777 -0
ml4t/diagnostic/evaluation/distribution/tests.py +470 -0
ml4t/diagnostic/evaluation/drift/__init__.py +139 -0
ml4t/diagnostic/evaluation/drift/analysis.py +432 -0
ml4t/diagnostic/evaluation/drift/domain_classifier.py +517 -0
ml4t/diagnostic/evaluation/drift/population_stability_index.py +310 -0
ml4t/diagnostic/evaluation/drift/wasserstein.py +388 -0
ml4t/diagnostic/evaluation/event_analysis.py +647 -0
ml4t/diagnostic/evaluation/excursion.py +390 -0
ml4t/diagnostic/evaluation/feature_diagnostics.py +873 -0
ml4t/diagnostic/evaluation/feature_outcome.py +666 -0
ml4t/diagnostic/evaluation/framework.py +935 -0
ml4t/diagnostic/evaluation/metric_registry.py +255 -0
ml4t/diagnostic/evaluation/metrics/AGENT.md +23 -0
ml4t/diagnostic/evaluation/metrics/__init__.py +133 -0
ml4t/diagnostic/evaluation/metrics/basic.py +160 -0
ml4t/diagnostic/evaluation/metrics/conditional_ic.py +469 -0
ml4t/diagnostic/evaluation/metrics/feature_outcome.py +475 -0
ml4t/diagnostic/evaluation/metrics/ic_statistics.py +446 -0
ml4t/diagnostic/evaluation/metrics/importance_analysis.py +338 -0
ml4t/diagnostic/evaluation/metrics/importance_classical.py +375 -0
ml4t/diagnostic/evaluation/metrics/importance_mda.py +371 -0
ml4t/diagnostic/evaluation/metrics/importance_shap.py +715 -0
ml4t/diagnostic/evaluation/metrics/information_coefficient.py +527 -0
ml4t/diagnostic/evaluation/metrics/interactions.py +772 -0
ml4t/diagnostic/evaluation/metrics/monotonicity.py +226 -0
ml4t/diagnostic/evaluation/metrics/risk_adjusted.py +324 -0
ml4t/diagnostic/evaluation/multi_signal.py +550 -0
ml4t/diagnostic/evaluation/portfolio_analysis/__init__.py +83 -0
ml4t/diagnostic/evaluation/portfolio_analysis/analysis.py +734 -0
ml4t/diagnostic/evaluation/portfolio_analysis/metrics.py +589 -0
ml4t/diagnostic/evaluation/portfolio_analysis/results.py +334 -0
ml4t/diagnostic/evaluation/report_generation.py +824 -0
ml4t/diagnostic/evaluation/signal_selector.py +452 -0
ml4t/diagnostic/evaluation/stat_registry.py +139 -0
ml4t/diagnostic/evaluation/stationarity/__init__.py +97 -0
ml4t/diagnostic/evaluation/stationarity/analysis.py +518 -0
ml4t/diagnostic/evaluation/stationarity/augmented_dickey_fuller.py +296 -0
ml4t/diagnostic/evaluation/stationarity/kpss_test.py +308 -0
ml4t/diagnostic/evaluation/stationarity/phillips_perron.py +365 -0
ml4t/diagnostic/evaluation/stats/AGENT.md +43 -0
ml4t/diagnostic/evaluation/stats/__init__.py +191 -0
ml4t/diagnostic/evaluation/stats/backtest_overfitting.py +219 -0
ml4t/diagnostic/evaluation/stats/bootstrap.py +228 -0
ml4t/diagnostic/evaluation/stats/deflated_sharpe_ratio.py +591 -0
ml4t/diagnostic/evaluation/stats/false_discovery_rate.py +295 -0
ml4t/diagnostic/evaluation/stats/hac_standard_errors.py +108 -0
ml4t/diagnostic/evaluation/stats/minimum_track_record.py +408 -0
ml4t/diagnostic/evaluation/stats/moments.py +164 -0
ml4t/diagnostic/evaluation/stats/rademacher_adjustment.py +436 -0
ml4t/diagnostic/evaluation/stats/reality_check.py +155 -0
ml4t/diagnostic/evaluation/stats/sharpe_inference.py +219 -0
ml4t/diagnostic/evaluation/themes.py +330 -0
ml4t/diagnostic/evaluation/threshold_analysis.py +957 -0
ml4t/diagnostic/evaluation/trade_analysis.py +1136 -0
ml4t/diagnostic/evaluation/trade_dashboard/__init__.py +32 -0
ml4t/diagnostic/evaluation/trade_dashboard/app.py +315 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/__init__.py +18 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/csv.py +82 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/html.py +276 -0
ml4t/diagnostic/evaluation/trade_dashboard/io.py +166 -0
ml4t/diagnostic/evaluation/trade_dashboard/normalize.py +304 -0
ml4t/diagnostic/evaluation/trade_dashboard/stats.py +386 -0
ml4t/diagnostic/evaluation/trade_dashboard/style.py +79 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/__init__.py +21 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/patterns.py +354 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/shap_analysis.py +280 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/stat_validation.py +186 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/worst_trades.py +236 -0
ml4t/diagnostic/evaluation/trade_dashboard/types.py +129 -0
ml4t/diagnostic/evaluation/trade_shap/__init__.py +102 -0
ml4t/diagnostic/evaluation/trade_shap/alignment.py +188 -0
ml4t/diagnostic/evaluation/trade_shap/characterize.py +413 -0
ml4t/diagnostic/evaluation/trade_shap/cluster.py +302 -0
ml4t/diagnostic/evaluation/trade_shap/explain.py +208 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/__init__.py +23 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/generator.py +290 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/matcher.py +251 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/templates.yaml +467 -0
ml4t/diagnostic/evaluation/trade_shap/models.py +386 -0
ml4t/diagnostic/evaluation/trade_shap/normalize.py +116 -0
ml4t/diagnostic/evaluation/trade_shap/pipeline.py +263 -0
ml4t/diagnostic/evaluation/trade_shap_dashboard.py +283 -0
ml4t/diagnostic/evaluation/trade_shap_diagnostics.py +588 -0
ml4t/diagnostic/evaluation/validated_cv.py +535 -0
ml4t/diagnostic/evaluation/visualization.py +1050 -0
ml4t/diagnostic/evaluation/volatility/__init__.py +45 -0
ml4t/diagnostic/evaluation/volatility/analysis.py +351 -0
ml4t/diagnostic/evaluation/volatility/arch.py +258 -0
ml4t/diagnostic/evaluation/volatility/garch.py +460 -0
ml4t/diagnostic/integration/__init__.py +48 -0
ml4t/diagnostic/integration/backtest_contract.py +671 -0
ml4t/diagnostic/integration/data_contract.py +316 -0
ml4t/diagnostic/integration/engineer_contract.py +226 -0
ml4t/diagnostic/logging/__init__.py +77 -0
ml4t/diagnostic/logging/logger.py +245 -0
ml4t/diagnostic/logging/performance.py +234 -0
ml4t/diagnostic/logging/progress.py +234 -0
ml4t/diagnostic/logging/wandb.py +412 -0
ml4t/diagnostic/metrics/__init__.py +9 -0
ml4t/diagnostic/metrics/percentiles.py +128 -0
ml4t/diagnostic/py.typed +1 -0
ml4t/diagnostic/reporting/__init__.py +43 -0
ml4t/diagnostic/reporting/base.py +130 -0
ml4t/diagnostic/reporting/html_renderer.py +275 -0
ml4t/diagnostic/reporting/json_renderer.py +51 -0
ml4t/diagnostic/reporting/markdown_renderer.py +117 -0
ml4t/diagnostic/results/AGENT.md +24 -0
ml4t/diagnostic/results/__init__.py +105 -0
ml4t/diagnostic/results/barrier_results/__init__.py +36 -0
ml4t/diagnostic/results/barrier_results/hit_rate.py +304 -0
ml4t/diagnostic/results/barrier_results/precision_recall.py +266 -0
ml4t/diagnostic/results/barrier_results/profit_factor.py +297 -0
ml4t/diagnostic/results/barrier_results/tearsheet.py +397 -0
ml4t/diagnostic/results/barrier_results/time_to_target.py +305 -0
ml4t/diagnostic/results/barrier_results/validation.py +38 -0
ml4t/diagnostic/results/base.py +177 -0
ml4t/diagnostic/results/event_results.py +349 -0
ml4t/diagnostic/results/feature_results.py +787 -0
ml4t/diagnostic/results/multi_signal_results.py +431 -0
ml4t/diagnostic/results/portfolio_results.py +281 -0
ml4t/diagnostic/results/sharpe_results.py +448 -0
ml4t/diagnostic/results/signal_results/__init__.py +74 -0
ml4t/diagnostic/results/signal_results/ic.py +581 -0
ml4t/diagnostic/results/signal_results/irtc.py +110 -0
ml4t/diagnostic/results/signal_results/quantile.py +392 -0
ml4t/diagnostic/results/signal_results/tearsheet.py +456 -0
ml4t/diagnostic/results/signal_results/turnover.py +213 -0
ml4t/diagnostic/results/signal_results/validation.py +147 -0
ml4t/diagnostic/signal/AGENT.md +17 -0
ml4t/diagnostic/signal/__init__.py +69 -0
ml4t/diagnostic/signal/_report.py +152 -0
ml4t/diagnostic/signal/_utils.py +261 -0
ml4t/diagnostic/signal/core.py +275 -0
ml4t/diagnostic/signal/quantile.py +148 -0
ml4t/diagnostic/signal/result.py +214 -0
ml4t/diagnostic/signal/signal_ic.py +129 -0
ml4t/diagnostic/signal/turnover.py +182 -0
ml4t/diagnostic/splitters/AGENT.md +19 -0
ml4t/diagnostic/splitters/__init__.py +36 -0
ml4t/diagnostic/splitters/base.py +501 -0
ml4t/diagnostic/splitters/calendar.py +421 -0
ml4t/diagnostic/splitters/calendar_config.py +91 -0
ml4t/diagnostic/splitters/combinatorial.py +1064 -0
ml4t/diagnostic/splitters/config.py +322 -0
ml4t/diagnostic/splitters/cpcv/__init__.py +57 -0
ml4t/diagnostic/splitters/cpcv/combinations.py +119 -0
ml4t/diagnostic/splitters/cpcv/partitioning.py +263 -0
ml4t/diagnostic/splitters/cpcv/purge_engine.py +379 -0
ml4t/diagnostic/splitters/cpcv/windows.py +190 -0
ml4t/diagnostic/splitters/group_isolation.py +329 -0
ml4t/diagnostic/splitters/persistence.py +316 -0
ml4t/diagnostic/splitters/utils.py +207 -0
ml4t/diagnostic/splitters/walk_forward.py +757 -0
ml4t/diagnostic/utils/__init__.py +42 -0
ml4t/diagnostic/utils/config.py +542 -0
ml4t/diagnostic/utils/dependencies.py +318 -0
ml4t/diagnostic/utils/sessions.py +127 -0
ml4t/diagnostic/validation/__init__.py +54 -0
ml4t/diagnostic/validation/dataframe.py +274 -0
ml4t/diagnostic/validation/returns.py +280 -0
ml4t/diagnostic/validation/timeseries.py +299 -0
ml4t/diagnostic/visualization/AGENT.md +19 -0
ml4t/diagnostic/visualization/__init__.py +223 -0
ml4t/diagnostic/visualization/backtest/__init__.py +98 -0
ml4t/diagnostic/visualization/backtest/cost_attribution.py +762 -0
ml4t/diagnostic/visualization/backtest/executive_summary.py +895 -0
ml4t/diagnostic/visualization/backtest/interactive_controls.py +673 -0
ml4t/diagnostic/visualization/backtest/statistical_validity.py +874 -0
ml4t/diagnostic/visualization/backtest/tearsheet.py +565 -0
ml4t/diagnostic/visualization/backtest/template_system.py +373 -0
ml4t/diagnostic/visualization/backtest/trade_plots.py +1172 -0
ml4t/diagnostic/visualization/barrier_plots.py +782 -0
ml4t/diagnostic/visualization/core.py +1060 -0
ml4t/diagnostic/visualization/dashboards/__init__.py +36 -0
ml4t/diagnostic/visualization/dashboards/base.py +582 -0
ml4t/diagnostic/visualization/dashboards/importance.py +801 -0
ml4t/diagnostic/visualization/dashboards/interaction.py +263 -0
ml4t/diagnostic/visualization/dashboards.py +43 -0
ml4t/diagnostic/visualization/data_extraction/__init__.py +48 -0
ml4t/diagnostic/visualization/data_extraction/importance.py +649 -0
ml4t/diagnostic/visualization/data_extraction/interaction.py +504 -0
ml4t/diagnostic/visualization/data_extraction/types.py +113 -0
ml4t/diagnostic/visualization/data_extraction/validation.py +66 -0
ml4t/diagnostic/visualization/feature_plots.py +888 -0
ml4t/diagnostic/visualization/interaction_plots.py +618 -0
ml4t/diagnostic/visualization/portfolio/__init__.py +41 -0
ml4t/diagnostic/visualization/portfolio/dashboard.py +514 -0
ml4t/diagnostic/visualization/portfolio/drawdown_plots.py +341 -0
ml4t/diagnostic/visualization/portfolio/returns_plots.py +487 -0
ml4t/diagnostic/visualization/portfolio/risk_plots.py +301 -0
ml4t/diagnostic/visualization/report_generation.py +1343 -0
ml4t/diagnostic/visualization/signal/__init__.py +103 -0
ml4t/diagnostic/visualization/signal/dashboard.py +911 -0
ml4t/diagnostic/visualization/signal/event_plots.py +514 -0
ml4t/diagnostic/visualization/signal/ic_plots.py +635 -0
ml4t/diagnostic/visualization/signal/multi_signal_dashboard.py +974 -0
ml4t/diagnostic/visualization/signal/multi_signal_plots.py +603 -0
ml4t/diagnostic/visualization/signal/quantile_plots.py +625 -0
ml4t/diagnostic/visualization/signal/turnover_plots.py +400 -0
ml4t/diagnostic/visualization/trade_shap/__init__.py +90 -0
ml4t_diagnostic-0.1.0a1.dist-info/METADATA +1044 -0
ml4t_diagnostic-0.1.0a1.dist-info/RECORD +242 -0
ml4t_diagnostic-0.1.0a1.dist-info/WHEEL +4 -0
ml4t_diagnostic-0.1.0a1.dist-info/licenses/LICENSE +21 -0

ml4t/diagnostic/visualization/data_extraction/interaction.py ADDED Viewed

@@ -0,0 +1,504 @@
+"""Interaction data extraction for visualization layer.
+Extracts comprehensive visualization data from feature interaction analysis results.
+"""
+from __future__ import annotations
+from datetime import datetime
+from typing import Any, cast
+import numpy as np
+from .types import (
+    FeatureInteractionData,
+    InteractionMatrixData,
+    InteractionVizData,
+    LLMContextData,
+    NetworkGraphData,
+)
+from .validation import _validate_matrix_feature_alignment
+def extract_interaction_viz_data(
+    interaction_results: dict[str, Any],
+    importance_results: dict[str, Any] | None = None,
+    n_top_partners: int = 5,
+    cluster_threshold: float = 0.3,
+    include_llm_context: bool = True,
+) -> InteractionVizData:
+    """Extract comprehensive visualization data from interaction analysis results.
+    This function transforms raw SHAP interaction results into structured data
+    optimized for rich interactive visualization, including per-feature summaries,
+    network graph data, interaction matrices, and auto-generated insights.
+    Parameters
+    ----------
+    interaction_results : dict
+        Results from compute_shap_interactions() containing:
+        - 'interaction_matrix': DataFrame with pairwise interactions
+        - 'feature_names': list of feature names
+        - 'shap_values': raw SHAP values (optional)
+        - 'shap_interaction_values': raw interaction values (optional)
+    importance_results : dict, optional
+        Optional importance results to cross-reference for node sizing.
+        If provided, will use consensus ranking to size network nodes.
+    n_top_partners : int, default=5
+        Number of top interaction partners to include per feature.
+    cluster_threshold : float, default=0.3
+        Minimum interaction strength to consider for clustering.
+        Features with interactions above this threshold are clustered.
+    include_llm_context : bool, default=True
+        Whether to generate auto-narratives for LLM consumption.
+    Returns
+    -------
+    InteractionVizData
+        Complete structured data package with:
+        - Per-feature interaction summaries
+        - Network graph data (nodes, edges, clusters)
+        - Interaction matrix data
+        - Strength distribution statistics
+        - Auto-generated LLM narratives
+    Examples
+    --------
+    >>> from ml4t.diagnostic.evaluation import compute_shap_interactions
+    >>> from ml4t.diagnostic.visualization.data_extraction import extract_interaction_viz_data
+    >>>
+    >>> # Compute interactions
+    >>> interaction_results = compute_shap_interactions(model, X, y)
+    >>>
+    >>> # Extract visualization data
+    >>> viz_data = extract_interaction_viz_data(interaction_results)
+    >>>
+    >>> # Access different views
+    >>> print(viz_data['summary']['strongest_interaction'])
+    >>> print(viz_data['per_feature']['momentum']['top_partners'][:3])
+    >>> print(viz_data['network_graph']['nodes'])
+    >>> print(viz_data['llm_context']['key_insights'])
+    Notes
+    -----
+    - Network graph data is pre-computed for custom rendering
+    - Clustering identifies groups of strongly interacting features
+    - Per-feature summaries enable drill-down dashboards
+    - Cross-referencing with importance results enables better node sizing
+    """
+    # Extract basic info
+    interaction_matrix_df = interaction_results.get("interaction_matrix")
+    feature_names = interaction_results.get("feature_names", [])
+    if interaction_matrix_df is None:
+        raise ValueError("interaction_results must contain 'interaction_matrix'")
+    # Convert to numpy for easier manipulation
+    if hasattr(interaction_matrix_df, "to_numpy"):
+        interaction_matrix = interaction_matrix_df.to_numpy()
+    else:
+        interaction_matrix = np.array(interaction_matrix_df)
+    # Validate matrix dimensions match feature names
+    _validate_matrix_feature_alignment(interaction_matrix, feature_names)
+    n_features = len(feature_names)
+    # Build summary statistics
+    summary = _build_interaction_summary(interaction_matrix, feature_names)
+    # Build per-feature interaction data
+    per_feature = _build_per_feature_interactions(interaction_matrix, feature_names, n_top_partners)
+    # Build network graph data
+    network_graph = _build_network_graph(
+        interaction_matrix, feature_names, importance_results, cluster_threshold
+    )
+    # Build matrix data
+    matrix_data = _build_interaction_matrix_data(interaction_matrix, feature_names)
+    # Build strength distribution
+    strength_distribution = _build_strength_distribution(interaction_matrix)
+    # Build metadata
+    metadata = {
+        "n_features": n_features,
+        "n_interactions": int(n_features * (n_features - 1) / 2),
+        "analysis_timestamp": datetime.now().isoformat(),
+        "cluster_threshold": cluster_threshold,
+        "n_top_partners": n_top_partners,
+    }
+    # Generate LLM context
+    llm_context: LLMContextData = {
+        "summary_narrative": "",
+        "key_insights": [],
+        "recommendations": [],
+        "caveats": [],
+        "analysis_quality": "medium",
+    }
+    if include_llm_context:
+        llm_context = _generate_interaction_llm_context(
+            summary, per_feature, network_graph, strength_distribution
+        )
+    return InteractionVizData(
+        summary=summary,
+        per_feature=per_feature,
+        network_graph=network_graph,
+        interaction_matrix=matrix_data,
+        strength_distribution=strength_distribution,
+        metadata=metadata,
+        llm_context=llm_context,
+    )
+# =============================================================================
+# Interaction Analysis Helpers
+# =============================================================================
+def _build_interaction_summary(
+    interaction_matrix: np.ndarray, feature_names: list[str]
+) -> dict[str, Any]:
+    """Build high-level summary statistics for interactions."""
+    n_features = len(feature_names)
+    # Get upper triangle (exclude diagonal)
+    triu_indices = np.triu_indices(n_features, k=1)
+    interaction_values = interaction_matrix[triu_indices]
+    # Find strongest interaction
+    abs_values = np.abs(interaction_values)
+    max_idx = np.argmax(abs_values)
+    max_interaction = float(interaction_values[max_idx])
+    # Get feature pair for strongest interaction
+    i, j = triu_indices[0][max_idx], triu_indices[1][max_idx]
+    strongest_pair = (feature_names[i], feature_names[j])
+    # Compute distribution statistics
+    mean_interaction = float(np.mean(abs_values))
+    median_interaction = float(np.median(abs_values))
+    std_interaction = float(np.std(abs_values))
+    # Identify features with strongest overall interactions
+    total_interactions = np.sum(np.abs(interaction_matrix), axis=1)
+    top_idx = np.argmax(total_interactions)
+    most_interactive_feature = feature_names[top_idx]
+    return {
+        "n_features": n_features,
+        "n_interactions": len(interaction_values),
+        "strongest_interaction": max_interaction,
+        "strongest_pair": strongest_pair,
+        "mean_interaction": mean_interaction,
+        "median_interaction": median_interaction,
+        "std_interaction": std_interaction,
+        "most_interactive_feature": most_interactive_feature,
+        "max_total_interaction": float(total_interactions[top_idx]),
+    }
+def _build_per_feature_interactions(
+    interaction_matrix: np.ndarray, feature_names: list[str], n_top_partners: int = 5
+) -> dict[str, FeatureInteractionData]:
+    """Build per-feature interaction summaries."""
+    per_feature: dict[str, FeatureInteractionData] = {}
+    n_features = len(feature_names)
+    for i, feature_name in enumerate(feature_names):
+        # Get all interactions for this feature
+        interactions = interaction_matrix[i, :]
+        # Exclude self-interaction
+        partner_indices = [j for j in range(n_features) if j != i]
+        partner_interactions = [(feature_names[j], float(interactions[j])) for j in partner_indices]
+        # Sort by absolute interaction strength
+        partner_interactions.sort(key=lambda x: abs(x[1]), reverse=True)
+        # Get top N partners
+        top_partners = partner_interactions[:n_top_partners]
+        # Total interaction strength
+        total_strength = float(np.sum(np.abs(interactions)))
+        # Generate interpretation
+        interpretation = _generate_interaction_interpretation(feature_name, top_partners)
+        per_feature[feature_name] = FeatureInteractionData(
+            feature_name=feature_name,
+            top_partners=top_partners,
+            total_interaction_strength=total_strength,
+            cluster_id=None,  # Will be filled by clustering
+            interpretation=interpretation,
+        )
+    return per_feature
+def _build_network_graph(
+    interaction_matrix: np.ndarray,
+    feature_names: list[str],
+    importance_results: dict[str, Any] | None,
+    cluster_threshold: float,
+) -> NetworkGraphData:
+    """Build network graph data (nodes, edges, clusters)."""
+    n_features = len(feature_names)
+    # Build nodes
+    nodes = []
+    for i, feature_name in enumerate(feature_names):
+        # Node importance (for sizing) - use importance if available
+        if importance_results and "consensus_ranking" in importance_results:
+            consensus_ranking = importance_results["consensus_ranking"]
+            if feature_name in consensus_ranking:
+                rank = consensus_ranking.index(feature_name) + 1
+                # Higher rank = smaller number = more important = larger node
+                node_importance = 1.0 / rank
+            else:
+                node_importance = 0.1
+        else:
+            # Use total interaction strength as proxy
+            node_importance = float(np.sum(np.abs(interaction_matrix[i, :])))
+        nodes.append(
+            {
+                "id": feature_name,
+                "label": feature_name,
+                "importance": node_importance,
+                "total_interaction": float(np.sum(np.abs(interaction_matrix[i, :]))),
+            }
+        )
+    # Build edges (only upper triangle to avoid duplicates)
+    edges = []
+    for i in range(n_features):
+        for j in range(i + 1, n_features):
+            interaction_value = float(interaction_matrix[i, j])
+            if abs(interaction_value) > 0:  # Include all non-zero interactions
+                edges.append(
+                    {
+                        "source": feature_names[i],
+                        "target": feature_names[j],
+                        "weight": interaction_value,
+                        "abs_weight": abs(interaction_value),
+                    }
+                )
+    # Sort edges by absolute weight
+    edges.sort(key=lambda e: cast(float, e["abs_weight"]), reverse=True)
+    # Perform simple clustering based on strong interactions
+    clusters = _detect_interaction_clusters(interaction_matrix, feature_names, cluster_threshold)
+    return NetworkGraphData(nodes=nodes, edges=edges, clusters=clusters)
+def _build_interaction_matrix_data(
+    interaction_matrix: np.ndarray, feature_names: list[str]
+) -> InteractionMatrixData:
+    """Build matrix data for heatmap visualization."""
+    # Convert to list of lists for JSON serialization
+    matrix_list = interaction_matrix.tolist()
+    # Compute statistics
+    triu_indices = np.triu_indices(len(feature_names), k=1)
+    interaction_values = interaction_matrix[triu_indices]
+    max_interaction = float(np.max(np.abs(interaction_values)))
+    mean_interaction = float(np.mean(np.abs(interaction_values)))
+    return InteractionMatrixData(
+        features=feature_names,
+        matrix=matrix_list,
+        max_interaction=max_interaction,
+        mean_interaction=mean_interaction,
+    )
+def _build_strength_distribution(interaction_matrix: np.ndarray) -> dict[str, Any]:
+    """Build distribution statistics for interaction strengths."""
+    n_features = interaction_matrix.shape[0]
+    triu_indices = np.triu_indices(n_features, k=1)
+    interaction_values = interaction_matrix[triu_indices]
+    abs_values = np.abs(interaction_values)
+    # Compute percentiles
+    percentiles = [10, 25, 50, 75, 90, 95, 99]
+    percentile_values = {f"p{p}": float(np.percentile(abs_values, p)) for p in percentiles}
+    # Binning for histogram
+    hist, bin_edges = np.histogram(abs_values, bins=20)
+    return {
+        "mean": float(np.mean(abs_values)),
+        "median": float(np.median(abs_values)),
+        "std": float(np.std(abs_values)),
+        "min": float(np.min(abs_values)),
+        "max": float(np.max(abs_values)),
+        "percentiles": percentile_values,
+        "histogram": {"counts": hist.tolist(), "bin_edges": bin_edges.tolist()},
+    }
+def _detect_interaction_clusters(
+    interaction_matrix: np.ndarray, feature_names: list[str], threshold: float
+) -> list[list[str]]:
+    """Detect clusters of strongly interacting features using simple thresholding.
+    This is a basic clustering approach based on connected components in the
+    interaction graph. More sophisticated methods could be added later.
+    """
+    n_features = len(feature_names)
+    # Create adjacency matrix based on threshold
+    adj_matrix = np.abs(interaction_matrix) > threshold
+    np.fill_diagonal(adj_matrix, False)  # No self-loops
+    # Find connected components (simple DFS)
+    visited = [False] * n_features
+    clusters = []
+    def dfs(node: int, cluster: list[int]) -> None:
+        visited[node] = True
+        cluster.append(node)
+        for neighbor in range(n_features):
+            if adj_matrix[node, neighbor] and not visited[neighbor]:
+                dfs(neighbor, cluster)
+    for i in range(n_features):
+        if not visited[i]:
+            cluster_indices: list[int] = []
+            dfs(i, cluster_indices)
+            if len(cluster_indices) > 1:  # Only include clusters with >1 feature
+                clusters.append([feature_names[idx] for idx in cluster_indices])
+    return clusters
+def _generate_interaction_interpretation(
+    feature_name: str, top_partners: list[tuple[str, float]]
+) -> str:
+    """Generate auto-interpretation for a single feature's interactions."""
+    if not top_partners:
+        return f"'{feature_name}' has no significant interactions."
+    # Get top 3 for narrative
+    top_3 = top_partners[:3]
+    partner_str = ", ".join([f"'{p[0]}' ({p[1]:.3f})" for p in top_3])
+    return (
+        f"'{feature_name}' shows strongest interactions with {partner_str}. "
+        f"These interaction effects suggest the feature's predictive power "
+        f"depends on the values of these partner features."
+    )
+def _generate_interaction_llm_context(
+    summary: dict[str, Any],
+    _per_feature: dict[str, FeatureInteractionData],
+    network_graph: NetworkGraphData,
+    strength_distribution: dict[str, Any],
+) -> LLMContextData:
+    """Generate auto-narratives for interaction analysis."""
+    n_features = summary["n_features"]
+    n_interactions = summary["n_interactions"]
+    strongest_pair = summary["strongest_pair"]
+    strongest_value = summary["strongest_interaction"]
+    most_interactive = summary["most_interactive_feature"]
+    # Build summary narrative
+    summary_narrative = (
+        f"This interaction analysis examined {n_features} features, identifying "
+        f"{n_interactions} pairwise interactions. "
+    )
+    summary_narrative += (
+        f"The strongest interaction ({strongest_value:.3f}) occurs between "
+        f"'{strongest_pair[0]}' and '{strongest_pair[1]}'. "
+    )
+    if network_graph["clusters"]:
+        n_clusters = len(network_graph["clusters"])
+        summary_narrative += (
+            f"Cluster analysis identified {n_clusters} group(s) of strongly interacting features. "
+        )
+    # Key insights
+    key_insights = []
+    # Insight 1: Strongest interaction
+    key_insights.append(
+        f"Strongest interaction: {strongest_pair[0]} <-> {strongest_pair[1]} (strength: {strongest_value:.3f})"
+    )
+    # Insight 2: Most interactive feature
+    key_insights.append(
+        f"Most interactive feature: '{most_interactive}' (total interaction: {summary['max_total_interaction']:.3f})"
+    )
+    # Insight 3: Distribution characteristics
+    mean_strength = strength_distribution["mean"]
+    median_strength = strength_distribution["median"]
+    if mean_strength > median_strength * 1.5:
+        key_insights.append(
+            f"Interaction strength distribution is right-skewed "
+            f"(mean: {mean_strength:.3f}, median: {median_strength:.3f}) - "
+            "a few strong interactions dominate"
+        )
+    # Insight 4: Clustering
+    if network_graph["clusters"]:
+        largest_cluster = list(max(network_graph["clusters"], key=len))  # type: ignore[arg-type]
+        key_insights.append(
+            f"Largest interaction cluster has {len(largest_cluster)} features: "
+            f"{', '.join(largest_cluster[:5])}" + ("..." if len(largest_cluster) > 5 else "")
+        )
+    # Recommendations
+    recommendations = []
+    # Rec 1: Focus on strong interactions
+    recommendations.append(
+        f"Investigate the {strongest_pair[0]}/{strongest_pair[1]} interaction further. "
+        "Strong interactions suggest conditional effects or non-linear relationships."
+    )
+    # Rec 2: Feature engineering
+    if network_graph["clusters"]:
+        recommendations.append(
+            "Consider creating interaction features (products, ratios) for clustered "
+            "feature groups to capture non-linear effects explicitly."
+        )
+    # Rec 3: Model selection
+    recommendations.append(
+        "Tree-based models and neural networks can capture these interactions naturally. "
+        "Linear models may benefit from explicit interaction terms."
+    )
+    # Caveats
+    caveats = [
+        "SHAP interactions measure feature contribution interactions, not statistical "
+        "correlations. High interaction doesn't imply high correlation.",
+        "Interaction values are model-specific and depend on the underlying model structure.",
+    ]
+    # Determine quality
+    if n_features >= 5 and summary["max_total_interaction"] > 0.1:
+        analysis_quality = "high"
+    elif n_features >= 3:
+        analysis_quality = "medium"
+    else:
+        analysis_quality = "low"
+    return LLMContextData(
+        summary_narrative=summary_narrative,
+        key_insights=key_insights,
+        recommendations=recommendations,
+        caveats=caveats,
+        analysis_quality=analysis_quality,
+    )

ml4t/diagnostic/visualization/data_extraction/types.py ADDED Viewed

@@ -0,0 +1,113 @@
+"""Type definitions for data extraction.
+TypedDict classes for structured visualization data packages.
+"""
+from __future__ import annotations
+from typing import Any, TypedDict
+class MethodImportanceData(TypedDict, total=False):
+    """Importance data for a single method."""
+    importances: dict[str, float]  # feature_name -> importance_score
+    ranking: list[str]  # Features sorted by importance
+    std: dict[str, float] | None  # Standard deviation if available (PFI)
+    confidence_intervals: dict[str, tuple[float, float]] | None  # 95% CI if available
+    raw_values: list[dict[str, float]] | None  # Per-repeat values (PFI)
+    metadata: dict[str, Any]  # Method-specific metadata
+class FeatureDetailData(TypedDict):
+    """Complete data for a single feature across all analyses."""
+    consensus_rank: int  # Overall ranking
+    consensus_score: float  # Consensus importance score
+    method_ranks: dict[str, int]  # Method name -> rank in that method
+    method_scores: dict[str, float]  # Method name -> importance score
+    method_stds: dict[str, float]  # Method name -> std dev (if available)
+    agreement_level: str  # 'high', 'medium', 'low'
+    stability_score: float  # 0-1, higher = more stable
+    interpretation: str  # Auto-generated interpretation
+class MethodComparisonData(TypedDict):
+    """Method agreement and comparison metrics."""
+    correlation_matrix: list[list[float]]  # Method x Method correlation matrix
+    correlation_methods: list[str]  # Method names for matrix axes
+    rank_differences: dict[
+        tuple[str, str], dict[str, int]
+    ]  # (method1, method2) -> {feature: rank_diff}
+    agreement_summary: dict[str, float]  # Pairwise correlations as dict
+class UncertaintyData(TypedDict):
+    """Uncertainty and stability metrics."""
+    method_stability: dict[str, float]  # Method -> stability score (0-1)
+    rank_stability: dict[str, list[int]]  # Feature -> list of ranks across bootstraps
+    confidence_intervals: dict[str, dict[str, tuple[float, float]]]  # Method -> {feature: (lo, hi)}
+    coefficient_of_variation: dict[str, dict[str, float]]  # Method -> {feature: CV}
+class LLMContextData(TypedDict):
+    """Structured data for LLM interpretation."""
+    summary_narrative: str  # High-level summary in natural language
+    key_insights: list[str]  # Bullet points of findings
+    recommendations: list[str]  # Actionable recommendations
+    caveats: list[str]  # Limitations and warnings
+    analysis_quality: str  # 'high', 'medium', 'low'
+class ImportanceVizData(TypedDict):
+    """Complete visualization data package for importance analysis."""
+    summary: dict[str, Any]  # High-level metrics
+    per_method: dict[str, MethodImportanceData]  # Method name -> detailed data
+    per_feature: dict[str, FeatureDetailData]  # Feature name -> aggregated view
+    uncertainty: UncertaintyData  # Stability and confidence metrics
+    method_comparison: MethodComparisonData  # Cross-method analysis
+    metadata: dict[str, Any]  # Context information
+    llm_context: LLMContextData  # LLM-friendly narratives
+class FeatureInteractionData(TypedDict):
+    """Interaction data for a single feature."""
+    feature_name: str
+    top_partners: list[tuple[str, float]]  # (partner_feature, interaction_strength)
+    total_interaction_strength: float  # Sum of absolute interactions
+    cluster_id: int | None  # ID of interaction cluster (if clustering performed)
+    interpretation: str  # Auto-generated interpretation
+class NetworkGraphData(TypedDict):
+    """Network graph representation of interactions."""
+    nodes: list[dict[str, Any]]  # [{id: str, label: str, importance: float, ...}]
+    edges: list[dict[str, Any]]  # [{source: str, target: str, weight: float, ...}]
+    clusters: list[list[str]]  # List of feature clusters based on interactions
+class InteractionMatrixData(TypedDict):
+    """Matrix representation of pairwise interactions."""
+    features: list[str]  # Ordered feature names
+    matrix: list[list[float]]  # Symmetric interaction matrix
+    max_interaction: float  # Maximum interaction value
+    mean_interaction: float  # Mean interaction strength
+class InteractionVizData(TypedDict):
+    """Complete visualization data package for interaction analysis."""
+    summary: dict[str, Any]  # High-level metrics
+    per_feature: dict[str, FeatureInteractionData]  # Feature -> interaction details
+    network_graph: NetworkGraphData  # Graph visualization data
+    interaction_matrix: InteractionMatrixData  # Matrix visualization data
+    strength_distribution: dict[str, Any]  # Distribution of interaction strengths
+    metadata: dict[str, Any]  # Context information
+    llm_context: LLMContextData  # LLM-friendly narratives

ml4t/diagnostic/visualization/data_extraction/validation.py ADDED Viewed

@@ -0,0 +1,66 @@
+"""Validation helpers for data extraction.
+Provides length and dimension validation for extracted visualization data.
+"""
+from __future__ import annotations
+import numpy as np
+def _validate_lengths_match(
+    *arrays: tuple[str, list | np.ndarray],
+) -> None:
+    """Validate that all provided arrays have matching lengths.
+    Parameters
+    ----------
+    *arrays : tuple[str, list | np.ndarray]
+        Tuples of (name, array) to validate.
+    Raises
+    ------
+    ValueError
+        If arrays have different lengths.
+    """
+    if not arrays:
+        return
+    lengths = [(name, len(arr)) for name, arr in arrays]
+    unique_lengths = {length for _, length in lengths}
+    if len(unique_lengths) > 1:
+        length_info = ", ".join(f"{name}={length}" for name, length in lengths)
+        raise ValueError(
+            f"Length mismatch in data extraction: {length_info}. "
+            "All arrays must have the same length for consistent visualization."
+        )
+def _validate_matrix_feature_alignment(matrix: np.ndarray, feature_names: list[str]) -> None:
+    """Validate that interaction matrix dimensions match feature names.
+    Parameters
+    ----------
+    matrix : np.ndarray
+        Square interaction matrix.
+    feature_names : list[str]
+        Feature names for matrix axes.
+    Raises
+    ------
+    ValueError
+        If matrix is not square or dimensions don't match feature count.
+    """
+    n_features = len(feature_names)
+    if matrix.ndim != 2:
+        raise ValueError(
+            f"Interaction matrix must be 2D, got {matrix.ndim}D with shape {matrix.shape}"
+        )
+    if matrix.shape[0] != matrix.shape[1]:
+        raise ValueError(f"Interaction matrix must be square, got shape {matrix.shape}")
+    if matrix.shape[0] != n_features:
+        raise ValueError(
+            f"Interaction matrix size ({matrix.shape[0]}) does not match "
+            f"number of features ({n_features})"
+        )