PyPI - ml4t-diagnostic - Versions diffs - 0.1.0a1__py3-none-any.whl - Mend

ml4t-diagnostic 0.1.0a1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

ml4t/diagnostic/AGENT.md +25 -0
ml4t/diagnostic/__init__.py +166 -0
ml4t/diagnostic/backends/__init__.py +10 -0
ml4t/diagnostic/backends/adapter.py +192 -0
ml4t/diagnostic/backends/polars_backend.py +899 -0
ml4t/diagnostic/caching/__init__.py +40 -0
ml4t/diagnostic/caching/cache.py +331 -0
ml4t/diagnostic/caching/decorators.py +131 -0
ml4t/diagnostic/caching/smart_cache.py +339 -0
ml4t/diagnostic/config/AGENT.md +24 -0
ml4t/diagnostic/config/README.md +267 -0
ml4t/diagnostic/config/__init__.py +219 -0
ml4t/diagnostic/config/barrier_config.py +277 -0
ml4t/diagnostic/config/base.py +301 -0
ml4t/diagnostic/config/event_config.py +148 -0
ml4t/diagnostic/config/feature_config.py +404 -0
ml4t/diagnostic/config/multi_signal_config.py +55 -0
ml4t/diagnostic/config/portfolio_config.py +215 -0
ml4t/diagnostic/config/report_config.py +391 -0
ml4t/diagnostic/config/sharpe_config.py +202 -0
ml4t/diagnostic/config/signal_config.py +206 -0
ml4t/diagnostic/config/trade_analysis_config.py +310 -0
ml4t/diagnostic/config/validation.py +279 -0
ml4t/diagnostic/core/__init__.py +29 -0
ml4t/diagnostic/core/numba_utils.py +315 -0
ml4t/diagnostic/core/purging.py +372 -0
ml4t/diagnostic/core/sampling.py +471 -0
ml4t/diagnostic/errors/__init__.py +205 -0
ml4t/diagnostic/evaluation/AGENT.md +26 -0
ml4t/diagnostic/evaluation/__init__.py +437 -0
ml4t/diagnostic/evaluation/autocorrelation.py +531 -0
ml4t/diagnostic/evaluation/barrier_analysis.py +1050 -0
ml4t/diagnostic/evaluation/binary_metrics.py +910 -0
ml4t/diagnostic/evaluation/dashboard.py +715 -0
ml4t/diagnostic/evaluation/diagnostic_plots.py +1037 -0
ml4t/diagnostic/evaluation/distribution/__init__.py +499 -0
ml4t/diagnostic/evaluation/distribution/moments.py +299 -0
ml4t/diagnostic/evaluation/distribution/tails.py +777 -0
ml4t/diagnostic/evaluation/distribution/tests.py +470 -0
ml4t/diagnostic/evaluation/drift/__init__.py +139 -0
ml4t/diagnostic/evaluation/drift/analysis.py +432 -0
ml4t/diagnostic/evaluation/drift/domain_classifier.py +517 -0
ml4t/diagnostic/evaluation/drift/population_stability_index.py +310 -0
ml4t/diagnostic/evaluation/drift/wasserstein.py +388 -0
ml4t/diagnostic/evaluation/event_analysis.py +647 -0
ml4t/diagnostic/evaluation/excursion.py +390 -0
ml4t/diagnostic/evaluation/feature_diagnostics.py +873 -0
ml4t/diagnostic/evaluation/feature_outcome.py +666 -0
ml4t/diagnostic/evaluation/framework.py +935 -0
ml4t/diagnostic/evaluation/metric_registry.py +255 -0
ml4t/diagnostic/evaluation/metrics/AGENT.md +23 -0
ml4t/diagnostic/evaluation/metrics/__init__.py +133 -0
ml4t/diagnostic/evaluation/metrics/basic.py +160 -0
ml4t/diagnostic/evaluation/metrics/conditional_ic.py +469 -0
ml4t/diagnostic/evaluation/metrics/feature_outcome.py +475 -0
ml4t/diagnostic/evaluation/metrics/ic_statistics.py +446 -0
ml4t/diagnostic/evaluation/metrics/importance_analysis.py +338 -0
ml4t/diagnostic/evaluation/metrics/importance_classical.py +375 -0
ml4t/diagnostic/evaluation/metrics/importance_mda.py +371 -0
ml4t/diagnostic/evaluation/metrics/importance_shap.py +715 -0
ml4t/diagnostic/evaluation/metrics/information_coefficient.py +527 -0
ml4t/diagnostic/evaluation/metrics/interactions.py +772 -0
ml4t/diagnostic/evaluation/metrics/monotonicity.py +226 -0
ml4t/diagnostic/evaluation/metrics/risk_adjusted.py +324 -0
ml4t/diagnostic/evaluation/multi_signal.py +550 -0
ml4t/diagnostic/evaluation/portfolio_analysis/__init__.py +83 -0
ml4t/diagnostic/evaluation/portfolio_analysis/analysis.py +734 -0
ml4t/diagnostic/evaluation/portfolio_analysis/metrics.py +589 -0
ml4t/diagnostic/evaluation/portfolio_analysis/results.py +334 -0
ml4t/diagnostic/evaluation/report_generation.py +824 -0
ml4t/diagnostic/evaluation/signal_selector.py +452 -0
ml4t/diagnostic/evaluation/stat_registry.py +139 -0
ml4t/diagnostic/evaluation/stationarity/__init__.py +97 -0
ml4t/diagnostic/evaluation/stationarity/analysis.py +518 -0
ml4t/diagnostic/evaluation/stationarity/augmented_dickey_fuller.py +296 -0
ml4t/diagnostic/evaluation/stationarity/kpss_test.py +308 -0
ml4t/diagnostic/evaluation/stationarity/phillips_perron.py +365 -0
ml4t/diagnostic/evaluation/stats/AGENT.md +43 -0
ml4t/diagnostic/evaluation/stats/__init__.py +191 -0
ml4t/diagnostic/evaluation/stats/backtest_overfitting.py +219 -0
ml4t/diagnostic/evaluation/stats/bootstrap.py +228 -0
ml4t/diagnostic/evaluation/stats/deflated_sharpe_ratio.py +591 -0
ml4t/diagnostic/evaluation/stats/false_discovery_rate.py +295 -0
ml4t/diagnostic/evaluation/stats/hac_standard_errors.py +108 -0
ml4t/diagnostic/evaluation/stats/minimum_track_record.py +408 -0
ml4t/diagnostic/evaluation/stats/moments.py +164 -0
ml4t/diagnostic/evaluation/stats/rademacher_adjustment.py +436 -0
ml4t/diagnostic/evaluation/stats/reality_check.py +155 -0
ml4t/diagnostic/evaluation/stats/sharpe_inference.py +219 -0
ml4t/diagnostic/evaluation/themes.py +330 -0
ml4t/diagnostic/evaluation/threshold_analysis.py +957 -0
ml4t/diagnostic/evaluation/trade_analysis.py +1136 -0
ml4t/diagnostic/evaluation/trade_dashboard/__init__.py +32 -0
ml4t/diagnostic/evaluation/trade_dashboard/app.py +315 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/__init__.py +18 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/csv.py +82 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/html.py +276 -0
ml4t/diagnostic/evaluation/trade_dashboard/io.py +166 -0
ml4t/diagnostic/evaluation/trade_dashboard/normalize.py +304 -0
ml4t/diagnostic/evaluation/trade_dashboard/stats.py +386 -0
ml4t/diagnostic/evaluation/trade_dashboard/style.py +79 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/__init__.py +21 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/patterns.py +354 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/shap_analysis.py +280 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/stat_validation.py +186 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/worst_trades.py +236 -0
ml4t/diagnostic/evaluation/trade_dashboard/types.py +129 -0
ml4t/diagnostic/evaluation/trade_shap/__init__.py +102 -0
ml4t/diagnostic/evaluation/trade_shap/alignment.py +188 -0
ml4t/diagnostic/evaluation/trade_shap/characterize.py +413 -0
ml4t/diagnostic/evaluation/trade_shap/cluster.py +302 -0
ml4t/diagnostic/evaluation/trade_shap/explain.py +208 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/__init__.py +23 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/generator.py +290 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/matcher.py +251 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/templates.yaml +467 -0
ml4t/diagnostic/evaluation/trade_shap/models.py +386 -0
ml4t/diagnostic/evaluation/trade_shap/normalize.py +116 -0
ml4t/diagnostic/evaluation/trade_shap/pipeline.py +263 -0
ml4t/diagnostic/evaluation/trade_shap_dashboard.py +283 -0
ml4t/diagnostic/evaluation/trade_shap_diagnostics.py +588 -0
ml4t/diagnostic/evaluation/validated_cv.py +535 -0
ml4t/diagnostic/evaluation/visualization.py +1050 -0
ml4t/diagnostic/evaluation/volatility/__init__.py +45 -0
ml4t/diagnostic/evaluation/volatility/analysis.py +351 -0
ml4t/diagnostic/evaluation/volatility/arch.py +258 -0
ml4t/diagnostic/evaluation/volatility/garch.py +460 -0
ml4t/diagnostic/integration/__init__.py +48 -0
ml4t/diagnostic/integration/backtest_contract.py +671 -0
ml4t/diagnostic/integration/data_contract.py +316 -0
ml4t/diagnostic/integration/engineer_contract.py +226 -0
ml4t/diagnostic/logging/__init__.py +77 -0
ml4t/diagnostic/logging/logger.py +245 -0
ml4t/diagnostic/logging/performance.py +234 -0
ml4t/diagnostic/logging/progress.py +234 -0
ml4t/diagnostic/logging/wandb.py +412 -0
ml4t/diagnostic/metrics/__init__.py +9 -0
ml4t/diagnostic/metrics/percentiles.py +128 -0
ml4t/diagnostic/py.typed +1 -0
ml4t/diagnostic/reporting/__init__.py +43 -0
ml4t/diagnostic/reporting/base.py +130 -0
ml4t/diagnostic/reporting/html_renderer.py +275 -0
ml4t/diagnostic/reporting/json_renderer.py +51 -0
ml4t/diagnostic/reporting/markdown_renderer.py +117 -0
ml4t/diagnostic/results/AGENT.md +24 -0
ml4t/diagnostic/results/__init__.py +105 -0
ml4t/diagnostic/results/barrier_results/__init__.py +36 -0
ml4t/diagnostic/results/barrier_results/hit_rate.py +304 -0
ml4t/diagnostic/results/barrier_results/precision_recall.py +266 -0
ml4t/diagnostic/results/barrier_results/profit_factor.py +297 -0
ml4t/diagnostic/results/barrier_results/tearsheet.py +397 -0
ml4t/diagnostic/results/barrier_results/time_to_target.py +305 -0
ml4t/diagnostic/results/barrier_results/validation.py +38 -0
ml4t/diagnostic/results/base.py +177 -0
ml4t/diagnostic/results/event_results.py +349 -0
ml4t/diagnostic/results/feature_results.py +787 -0
ml4t/diagnostic/results/multi_signal_results.py +431 -0
ml4t/diagnostic/results/portfolio_results.py +281 -0
ml4t/diagnostic/results/sharpe_results.py +448 -0
ml4t/diagnostic/results/signal_results/__init__.py +74 -0
ml4t/diagnostic/results/signal_results/ic.py +581 -0
ml4t/diagnostic/results/signal_results/irtc.py +110 -0
ml4t/diagnostic/results/signal_results/quantile.py +392 -0
ml4t/diagnostic/results/signal_results/tearsheet.py +456 -0
ml4t/diagnostic/results/signal_results/turnover.py +213 -0
ml4t/diagnostic/results/signal_results/validation.py +147 -0
ml4t/diagnostic/signal/AGENT.md +17 -0
ml4t/diagnostic/signal/__init__.py +69 -0
ml4t/diagnostic/signal/_report.py +152 -0
ml4t/diagnostic/signal/_utils.py +261 -0
ml4t/diagnostic/signal/core.py +275 -0
ml4t/diagnostic/signal/quantile.py +148 -0
ml4t/diagnostic/signal/result.py +214 -0
ml4t/diagnostic/signal/signal_ic.py +129 -0
ml4t/diagnostic/signal/turnover.py +182 -0
ml4t/diagnostic/splitters/AGENT.md +19 -0
ml4t/diagnostic/splitters/__init__.py +36 -0
ml4t/diagnostic/splitters/base.py +501 -0
ml4t/diagnostic/splitters/calendar.py +421 -0
ml4t/diagnostic/splitters/calendar_config.py +91 -0
ml4t/diagnostic/splitters/combinatorial.py +1064 -0
ml4t/diagnostic/splitters/config.py +322 -0
ml4t/diagnostic/splitters/cpcv/__init__.py +57 -0
ml4t/diagnostic/splitters/cpcv/combinations.py +119 -0
ml4t/diagnostic/splitters/cpcv/partitioning.py +263 -0
ml4t/diagnostic/splitters/cpcv/purge_engine.py +379 -0
ml4t/diagnostic/splitters/cpcv/windows.py +190 -0
ml4t/diagnostic/splitters/group_isolation.py +329 -0
ml4t/diagnostic/splitters/persistence.py +316 -0
ml4t/diagnostic/splitters/utils.py +207 -0
ml4t/diagnostic/splitters/walk_forward.py +757 -0
ml4t/diagnostic/utils/__init__.py +42 -0
ml4t/diagnostic/utils/config.py +542 -0
ml4t/diagnostic/utils/dependencies.py +318 -0
ml4t/diagnostic/utils/sessions.py +127 -0
ml4t/diagnostic/validation/__init__.py +54 -0
ml4t/diagnostic/validation/dataframe.py +274 -0
ml4t/diagnostic/validation/returns.py +280 -0
ml4t/diagnostic/validation/timeseries.py +299 -0
ml4t/diagnostic/visualization/AGENT.md +19 -0
ml4t/diagnostic/visualization/__init__.py +223 -0
ml4t/diagnostic/visualization/backtest/__init__.py +98 -0
ml4t/diagnostic/visualization/backtest/cost_attribution.py +762 -0
ml4t/diagnostic/visualization/backtest/executive_summary.py +895 -0
ml4t/diagnostic/visualization/backtest/interactive_controls.py +673 -0
ml4t/diagnostic/visualization/backtest/statistical_validity.py +874 -0
ml4t/diagnostic/visualization/backtest/tearsheet.py +565 -0
ml4t/diagnostic/visualization/backtest/template_system.py +373 -0
ml4t/diagnostic/visualization/backtest/trade_plots.py +1172 -0
ml4t/diagnostic/visualization/barrier_plots.py +782 -0
ml4t/diagnostic/visualization/core.py +1060 -0
ml4t/diagnostic/visualization/dashboards/__init__.py +36 -0
ml4t/diagnostic/visualization/dashboards/base.py +582 -0
ml4t/diagnostic/visualization/dashboards/importance.py +801 -0
ml4t/diagnostic/visualization/dashboards/interaction.py +263 -0
ml4t/diagnostic/visualization/dashboards.py +43 -0
ml4t/diagnostic/visualization/data_extraction/__init__.py +48 -0
ml4t/diagnostic/visualization/data_extraction/importance.py +649 -0
ml4t/diagnostic/visualization/data_extraction/interaction.py +504 -0
ml4t/diagnostic/visualization/data_extraction/types.py +113 -0
ml4t/diagnostic/visualization/data_extraction/validation.py +66 -0
ml4t/diagnostic/visualization/feature_plots.py +888 -0
ml4t/diagnostic/visualization/interaction_plots.py +618 -0
ml4t/diagnostic/visualization/portfolio/__init__.py +41 -0
ml4t/diagnostic/visualization/portfolio/dashboard.py +514 -0
ml4t/diagnostic/visualization/portfolio/drawdown_plots.py +341 -0
ml4t/diagnostic/visualization/portfolio/returns_plots.py +487 -0
ml4t/diagnostic/visualization/portfolio/risk_plots.py +301 -0
ml4t/diagnostic/visualization/report_generation.py +1343 -0
ml4t/diagnostic/visualization/signal/__init__.py +103 -0
ml4t/diagnostic/visualization/signal/dashboard.py +911 -0
ml4t/diagnostic/visualization/signal/event_plots.py +514 -0
ml4t/diagnostic/visualization/signal/ic_plots.py +635 -0
ml4t/diagnostic/visualization/signal/multi_signal_dashboard.py +974 -0
ml4t/diagnostic/visualization/signal/multi_signal_plots.py +603 -0
ml4t/diagnostic/visualization/signal/quantile_plots.py +625 -0
ml4t/diagnostic/visualization/signal/turnover_plots.py +400 -0
ml4t/diagnostic/visualization/trade_shap/__init__.py +90 -0
ml4t_diagnostic-0.1.0a1.dist-info/METADATA +1044 -0
ml4t_diagnostic-0.1.0a1.dist-info/RECORD +242 -0
ml4t_diagnostic-0.1.0a1.dist-info/WHEEL +4 -0
ml4t_diagnostic-0.1.0a1.dist-info/licenses/LICENSE +21 -0

ml4t/diagnostic/evaluation/metrics/feature_outcome.py ADDED Viewed

@@ -0,0 +1,475 @@
+"""Feature-outcome relationship analysis: Comprehensive IC diagnostics.
+This module provides the main entry point for evaluating feature predictive power,
+combining IC analysis, significance testing, monotonicity validation, and decay analysis.
+"""
+from typing import TYPE_CHECKING, Any, cast
+import numpy as np
+import pandas as pd
+import polars as pl
+from ml4t.diagnostic.evaluation.metrics.basic import compute_forward_returns
+from ml4t.diagnostic.evaluation.metrics.ic_statistics import (
+    compute_ic_decay,
+    compute_ic_hac_stats,
+)
+from ml4t.diagnostic.evaluation.metrics.information_coefficient import (
+    compute_ic_ir,
+    compute_ic_series,
+    information_coefficient,
+)
+from ml4t.diagnostic.evaluation.metrics.monotonicity import compute_monotonicity
+if TYPE_CHECKING:
+    pass
+def analyze_feature_outcome(
+    predictions: pl.DataFrame | pd.DataFrame,
+    prices: pl.DataFrame | pd.DataFrame,
+    pred_col: str = "prediction",
+    price_col: str = "close",
+    date_col: str = "date",
+    group_col: str | None = None,
+    horizons: list[int] | None = None,
+    n_quantiles: int = 5,
+    method: str = "spearman",
+    include_decay: bool = True,
+    include_monotonicity: bool = True,
+    include_hac: bool = True,
+    annualization_factor: float = np.sqrt(252),
+) -> dict[str, Any]:
+    """Comprehensive feature-outcome relationship analysis (FR-C1-C4).
+    This is the main diagnostic function that combines IC analysis, significance
+    testing, monotonicity validation, and decay analysis into a single comprehensive
+    summary of feature quality.
+    Use this function as the primary entry point for evaluating whether a feature
+    (prediction/signal) has predictive power for outcomes (returns).
+    Parameters
+    ----------
+    predictions : Union[pl.DataFrame, pd.DataFrame]
+        DataFrame with predictions, must have pred_col, date_col, and optionally group_col
+    prices : Union[pl.DataFrame, pd.DataFrame]
+        DataFrame with prices, must have price_col, date_col, and optionally group_col
+    pred_col : str, default "prediction"
+        Column name for predictions
+    price_col : str, default "close"
+        Column name for prices
+    date_col : str, default "date"
+        Column name for dates
+    group_col : str | None, default None
+        Column name for grouping (e.g., "symbol" for multi-asset)
+    horizons : list[int] | None, default None
+        List of forward horizons in days for multi-horizon analysis.
+        If None, uses [1, 2, 5, 10, 21] for decay analysis
+    n_quantiles : int, default 5
+        Number of quantile bins for monotonicity analysis
+    method : str, default "spearman"
+        Correlation method: "spearman" or "pearson"
+    include_decay : bool, default True
+        Whether to compute IC decay analysis
+    include_monotonicity : bool, default True
+        Whether to compute monotonicity analysis
+    include_hac : bool, default True
+        Whether to compute HAC-adjusted significance
+    annualization_factor : float, default sqrt(252)
+        Factor to annualize IC-IR (sqrt(periods_per_year))
+    Returns
+    -------
+    dict[str, Any]
+        Comprehensive analysis dictionary with:
+        - ic_summary: Core IC statistics (mean, std, IR, significance)
+        - ic_series: Time series of IC values
+        - decay_analysis: IC decay across horizons (if include_decay=True)
+        - monotonicity_analysis: Quantile-based monotonicity (if include_monotonicity=True)
+        - interpretation: Textual interpretation and guidance
+        - metadata: Analysis parameters and timestamps
+    Examples
+    --------
+    >>> # Comprehensive feature analysis
+    >>> analysis = analyze_feature_outcome(
+    ...     predictions=pred_df,
+    ...     prices=price_df,
+    ...     group_col="symbol",
+    ...     horizons=[1, 2, 5, 10, 21]
+    ... )
+    >>>
+    >>> # Check core statistics
+    >>> print(f"Mean IC: {analysis['ic_summary']['mean_ic']:.4f}")
+    >>> print(f"IC-IR: {analysis['ic_summary']['ic_ir']:.2f}")
+    >>> print(f"P-value: {analysis['ic_summary']['p_value']:.4f}")
+    >>> print(f"Significant: {analysis['ic_summary']['is_significant']}")
+    Mean IC: 0.0234
+    IC-IR: 1.12
+    P-value: 0.0327
+    Significant: True
+    >>>
+    >>> # Check decay characteristics
+    >>> print(f"Half-life: {analysis['decay_analysis']['half_life']:.1f} days")
+    >>> print(f"Optimal horizon: {analysis['decay_analysis']['optimal_horizon']} days")
+    Half-life: 8.3 days
+    Optimal horizon: 1 days
+    >>>
+    >>> # Check monotonicity
+    >>> print(f"Monotonic: {analysis['monotonicity_analysis']['is_monotonic']}")
+    >>> print(f"Direction: {analysis['monotonicity_analysis']['direction']}")
+    Monotonic: True
+    Direction: increasing
+    >>>
+    >>> # Read interpretation guidance
+    >>> print(analysis['interpretation'])
+    FEATURE QUALITY: GOOD
+    - Mean IC: 0.0234 (positive predictive power)
+    - IC-IR: 1.12 (excellent consistency)
+    - Statistical Significance: p < 0.05 (robust)
+    - Monotonicity: Increasing (valid predictor)
+    - Signal Persistence: Moderate (half-life 8.3 days)
+    RECOMMENDATION: Feature shows strong predictive power with good consistency.
+    Consider using for short-to-medium term predictions (1-10 days).
+    Notes
+    -----
+    This function is designed to be the primary entry point for feature evaluation,
+    combining multiple analyses into a comprehensive assessment. For more focused
+    analysis, use individual functions:
+    - compute_ic_series(): Time series IC only
+    - compute_ic_ir(): Information ratio only
+    - compute_ic_decay(): Decay analysis only
+    - compute_monotonicity(): Monotonicity only
+    - compute_ic_hac_stats(): Significance testing only
+    Quality Thresholds:
+    - Mean IC: >0.02 is good, >0.05 is excellent
+    - IC-IR: >0.5 is good, >1.0 is excellent
+    - P-value: <0.05 for significance
+    - Monotonicity score: >0.8 for strong monotonicity
+    - Half-life: Depends on strategy horizon (align with holding period)
+    """
+    # 1. Compute forward returns from prices using compute_forward_returns
+    prices_with_fwd = compute_forward_returns(
+        prices=prices,
+        periods=1,  # 1-day forward returns for IC series
+        price_col=price_col,
+        group_col=group_col,
+    )
+    # 2. Merge predictions with returns
+    merge_cols = [date_col, group_col] if group_col else [date_col]
+    merged: pl.DataFrame | pd.DataFrame
+    if isinstance(predictions, pl.DataFrame):
+        prices_fwd_pl = cast(pl.DataFrame, prices_with_fwd)
+        merged = predictions.join(prices_fwd_pl, on=merge_cols, how="inner")
+        # Drop NaN forward returns
+        merged = merged.filter(pl.col("fwd_ret_1").is_not_null())
+    else:
+        prices_fwd_pd = cast(pd.DataFrame, prices_with_fwd)
+        merged = pd.merge(predictions, prices_fwd_pd, on=merge_cols, how="inner")
+        # Drop NaN forward returns
+        merged = merged.dropna(subset=["fwd_ret_1"])
+    # 3. Compute IC time series (cross-sectional IC per date)
+    # For panel data, compute IC by grouping on date and correlating across assets
+    ic_series: pl.DataFrame | pd.DataFrame  # Declare type before branches
+    if group_col:
+        # Panel data: group by date and compute IC within each date
+        def compute_date_ic(group: pd.DataFrame) -> pd.Series:
+            # Explicitly convert to float arrays to handle ExtensionArray types
+            pred_vals = np.asarray(group[pred_col].values, dtype=np.float64)
+            ret_vals = np.asarray(group["fwd_ret_1"].values, dtype=np.float64)
+            # Remove NaN pairs
+            valid_mask = ~(np.isnan(pred_vals) | np.isnan(ret_vals))
+            pred_clean = pred_vals[valid_mask]
+            ret_clean = ret_vals[valid_mask]
+            n_obs = len(pred_clean)
+            if n_obs >= 2:  # Need at least 2 observations for correlation
+                ic_val = information_coefficient(
+                    pred_clean, ret_clean, method=method, confidence_intervals=False
+                )
+            else:
+                ic_val = np.nan
+            return pd.Series({"ic": ic_val, "n_obs": n_obs})
+        # Convert to pandas for groupby.apply() operation
+        merged_pd: pd.DataFrame = merged.to_pandas() if isinstance(merged, pl.DataFrame) else merged
+        ic_series = merged_pd.groupby(date_col).apply(compute_date_ic).reset_index()
+    else:
+        # Time series data: use standard compute_ic_series
+        ic_series = compute_ic_series(
+            predictions=merged[[date_col, pred_col]],
+            returns=merged[[date_col, "fwd_ret_1"]],
+            pred_col=pred_col,
+            ret_col="fwd_ret_1",
+            date_col=date_col,
+            method=method,
+        )
+    # 4. Compute IC-IR (Information Ratio)
+    ic_ir_result = compute_ic_ir(
+        ic_series=ic_series,
+        ic_col="ic",
+        annualization_factor=annualization_factor,
+        confidence_intervals=True,
+    )
+    # 5. Compute HAC-adjusted significance (if requested)
+    if include_hac:
+        hac_stats = compute_ic_hac_stats(ic_series=ic_series, ic_col="ic")
+    else:
+        # Fallback to simple statistics - explicitly convert to float array
+        if isinstance(ic_series, pl.DataFrame):
+            ic_array = np.asarray(ic_series["ic"].to_numpy(), dtype=np.float64)
+        elif isinstance(ic_series, pd.DataFrame):
+            ic_array = np.asarray(ic_series["ic"].to_numpy(), dtype=np.float64)
+        else:
+            raise TypeError(f"ic_series must be DataFrame, got {type(ic_series)}")
+        mean_ic = float(np.mean(ic_array))
+        std_ic = float(np.std(ic_array, ddof=1))
+        t_stat = mean_ic / (std_ic / np.sqrt(len(ic_array)))
+        from scipy.stats import t as t_dist
+        p_value = float(2 * (1 - t_dist.cdf(abs(t_stat), df=len(ic_array) - 1)))
+        hac_stats = {
+            "mean_ic": mean_ic,
+            "hac_se": std_ic / np.sqrt(len(ic_array)),
+            "t_stat": t_stat,
+            "p_value": p_value,
+            "n_periods": len(ic_array),
+        }
+    # 6. Compute IC decay analysis (if requested)
+    decay_analysis = None
+    if include_decay:
+        decay_analysis = compute_ic_decay(
+            predictions=predictions,
+            prices=prices,
+            horizons=horizons,
+            pred_col=pred_col,
+            price_col=price_col,
+            date_col=date_col,
+            group_col=group_col,
+            method=method,
+            estimate_half_life=True,
+        )
+    # 7. Compute monotonicity analysis (if requested)
+    monotonicity_analysis = None
+    if include_monotonicity:
+        # Use already-merged data with forward returns - convert to pandas for values access
+        merged_for_mono: pd.DataFrame
+        if isinstance(merged, pl.DataFrame):
+            merged_for_mono = merged.to_pandas()
+        else:
+            merged_for_mono = merged
+        monotonicity_analysis = compute_monotonicity(
+            features=merged_for_mono[pred_col].to_numpy(),
+            outcomes=merged_for_mono["fwd_ret_1"].to_numpy(),
+            n_quantiles=n_quantiles,
+            method=method,
+        )
+    # 8. Build comprehensive summary
+    # Extract IC values for std calculation - explicitly convert to float array
+    if isinstance(ic_series, pl.DataFrame):
+        ic_values_for_std = np.asarray(ic_series["ic"].to_numpy(), dtype=np.float64)
+    elif isinstance(ic_series, pd.DataFrame):
+        ic_values_for_std = np.asarray(ic_series["ic"].to_numpy(), dtype=np.float64)
+    else:
+        raise TypeError(f"ic_series must be DataFrame, got {type(ic_series)}")
+    ic_summary = {
+        "mean_ic": hac_stats["mean_ic"],
+        "std_ic": float(np.std(ic_values_for_std, ddof=1)),
+        "ic_ir": ic_ir_result["ic_ir"] if isinstance(ic_ir_result, dict) else ic_ir_result,
+        "ic_ir_lower_ci": ic_ir_result.get("lower_ci") if isinstance(ic_ir_result, dict) else None,
+        "ic_ir_upper_ci": ic_ir_result.get("upper_ci") if isinstance(ic_ir_result, dict) else None,
+        "t_stat": hac_stats["t_stat"],
+        "p_value": hac_stats["p_value"],
+        "is_significant": hac_stats["p_value"] < 0.05,
+        "n_periods": hac_stats["n_periods"],
+        "fraction_positive": float(np.mean(ic_values_for_std > 0)),
+    }
+    # 9. Generate interpretation guidance
+    interpretation = _generate_interpretation(
+        ic_summary=ic_summary,
+        decay_analysis=decay_analysis,
+        monotonicity_analysis=monotonicity_analysis,
+    )
+    # 10. Build final result
+    result = {
+        "ic_summary": ic_summary,
+        "ic_series": ic_series,
+        "interpretation": interpretation,
+        "metadata": {
+            "analysis_date": pd.Timestamp.now().isoformat(),
+            "method": method,
+            "n_quantiles": n_quantiles,
+            "horizons": horizons or [1, 2, 5, 10, 21],
+            "include_decay": include_decay,
+            "include_monotonicity": include_monotonicity,
+            "include_hac": include_hac,
+        },
+    }
+    if decay_analysis is not None:
+        result["decay_analysis"] = decay_analysis
+    if monotonicity_analysis is not None:
+        result["monotonicity_analysis"] = monotonicity_analysis
+    return result
+def _generate_interpretation(
+    ic_summary: dict[str, Any],
+    decay_analysis: dict[str, Any] | None,
+    monotonicity_analysis: dict[str, Any] | None,
+) -> str:
+    """Generate human-readable interpretation of feature-outcome analysis.
+    Parameters
+    ----------
+    ic_summary : dict
+        IC summary statistics
+    decay_analysis : dict | None
+        IC decay analysis results
+    monotonicity_analysis : dict | None
+        Monotonicity analysis results
+    Returns
+    -------
+    str
+        Multi-line interpretation text
+    """
+    lines = []
+    # Determine overall quality
+    mean_ic = ic_summary["mean_ic"]
+    ic_ir = ic_summary["ic_ir"]
+    is_sig = ic_summary["is_significant"]
+    if abs(mean_ic) > 0.05 and ic_ir > 1.0 and is_sig:
+        quality = "EXCELLENT"
+    elif abs(mean_ic) > 0.02 and ic_ir > 0.5 and is_sig:
+        quality = "GOOD"
+    elif abs(mean_ic) > 0.01 and is_sig:
+        quality = "MODERATE"
+    else:
+        quality = "WEAK"
+    lines.append(f"FEATURE QUALITY: {quality}")
+    lines.append("")
+    # IC statistics
+    lines.append(
+        f"- Mean IC: {mean_ic:.4f} ({'positive' if mean_ic > 0 else 'negative'} predictive power)"
+    )
+    lines.append(
+        f"- IC-IR: {ic_ir:.2f} ({'excellent' if ic_ir > 1.0 else 'good' if ic_ir > 0.5 else 'moderate'} consistency)"
+    )
+    lines.append(
+        f"- Statistical Significance: p = {ic_summary['p_value']:.4f} ({'robust' if is_sig else 'not significant'})"
+    )
+    # Monotonicity
+    if monotonicity_analysis:
+        is_mono = monotonicity_analysis["is_monotonic"]
+        direction = monotonicity_analysis["direction"]
+        score = monotonicity_analysis["monotonicity_score"]
+        lines.append(
+            f"- Monotonicity: {direction.replace('_', ' ').title()} (score: {score:.2f}, {'valid' if is_mono or score > 0.8 else 'weak'})"
+        )
+    # Decay characteristics
+    if decay_analysis and decay_analysis.get("half_life"):
+        half_life = decay_analysis["half_life"]
+        if half_life < 5:
+            persistence = "Short-term"
+        elif half_life < 20:
+            persistence = "Moderate"
+        else:
+            persistence = "Long-term"
+        lines.append(f"- Signal Persistence: {persistence} (half-life {half_life:.1f} days)")
+    lines.append("")
+    # Recommendation
+    if quality in ["EXCELLENT", "GOOD"]:
+        if decay_analysis and decay_analysis.get("half_life"):
+            hl = decay_analysis["half_life"]
+            horizon_rec = (
+                f"short-to-medium term predictions (1-{int(hl * 2)} days)"
+                if hl < 10
+                else f"medium-to-long term predictions ({int(hl)}-{int(hl * 3)} days)"
+            )
+        else:
+            horizon_rec = "predictions aligned with signal strength"
+        lines.append(
+            f"RECOMMENDATION: Feature shows {quality.lower()} predictive power with {'excellent' if ic_ir > 1 else 'good'} consistency."
+        )
+        lines.append(f"Consider using for {horizon_rec}.")
+    elif quality == "MODERATE":
+        lines.append("RECOMMENDATION: Feature shows moderate predictive power.")
+        lines.append(
+            "Consider combining with other features or transforming (e.g., ranking, winsorization)."
+        )
+    else:
+        lines.append("RECOMMENDATION: Feature shows weak predictive power.")
+        lines.append(
+            "Investigate data quality, consider feature transformations, or exclude from model."
+        )
+    return "\n".join(lines)
+# Pydantic schema for analyze_feature_outcome() results
+try:
+    from pydantic import BaseModel, Field
+    class ICSummary(BaseModel):
+        """IC summary statistics."""
+        mean_ic: float = Field(description="Mean Information Coefficient")
+        std_ic: float = Field(description="Standard deviation of IC")
+        ic_ir: float = Field(description="IC Information Ratio")
+        ic_ir_lower_ci: float | None = Field(None, description="IC-IR lower confidence interval")
+        ic_ir_upper_ci: float | None = Field(None, description="IC-IR upper confidence interval")
+        t_stat: float = Field(description="HAC-adjusted t-statistic")
+        p_value: float = Field(description="HAC-adjusted p-value")
+        is_significant: bool = Field(description="Whether p-value < 0.05")
+        n_periods: int = Field(description="Number of periods analyzed")
+        fraction_positive: float = Field(description="Fraction of periods with positive IC")
+    class FeatureOutcomeAnalysis(BaseModel):
+        """Pydantic schema for analyze_feature_outcome() results."""
+        ic_summary: ICSummary = Field(description="Core IC statistics")
+        interpretation: str = Field(description="Human-readable interpretation")
+        metadata: dict[str, Any] = Field(description="Analysis metadata")
+        decay_analysis: dict[str, Any] | None = Field(None, description="IC decay analysis")
+        monotonicity_analysis: dict[str, Any] | None = Field(
+            None, description="Monotonicity analysis"
+        )
+        class Config:
+            extra = "allow"  # Allow ic_series and other fields
+except ImportError:
+    # Pydantic not available, skip schema definition
+    pass