PyPI - ml4t-diagnostic - Versions diffs - 0.1.0a1__py3-none-any.whl - Mend

ml4t-diagnostic 0.1.0a1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

ml4t/diagnostic/AGENT.md +25 -0
ml4t/diagnostic/__init__.py +166 -0
ml4t/diagnostic/backends/__init__.py +10 -0
ml4t/diagnostic/backends/adapter.py +192 -0
ml4t/diagnostic/backends/polars_backend.py +899 -0
ml4t/diagnostic/caching/__init__.py +40 -0
ml4t/diagnostic/caching/cache.py +331 -0
ml4t/diagnostic/caching/decorators.py +131 -0
ml4t/diagnostic/caching/smart_cache.py +339 -0
ml4t/diagnostic/config/AGENT.md +24 -0
ml4t/diagnostic/config/README.md +267 -0
ml4t/diagnostic/config/__init__.py +219 -0
ml4t/diagnostic/config/barrier_config.py +277 -0
ml4t/diagnostic/config/base.py +301 -0
ml4t/diagnostic/config/event_config.py +148 -0
ml4t/diagnostic/config/feature_config.py +404 -0
ml4t/diagnostic/config/multi_signal_config.py +55 -0
ml4t/diagnostic/config/portfolio_config.py +215 -0
ml4t/diagnostic/config/report_config.py +391 -0
ml4t/diagnostic/config/sharpe_config.py +202 -0
ml4t/diagnostic/config/signal_config.py +206 -0
ml4t/diagnostic/config/trade_analysis_config.py +310 -0
ml4t/diagnostic/config/validation.py +279 -0
ml4t/diagnostic/core/__init__.py +29 -0
ml4t/diagnostic/core/numba_utils.py +315 -0
ml4t/diagnostic/core/purging.py +372 -0
ml4t/diagnostic/core/sampling.py +471 -0
ml4t/diagnostic/errors/__init__.py +205 -0
ml4t/diagnostic/evaluation/AGENT.md +26 -0
ml4t/diagnostic/evaluation/__init__.py +437 -0
ml4t/diagnostic/evaluation/autocorrelation.py +531 -0
ml4t/diagnostic/evaluation/barrier_analysis.py +1050 -0
ml4t/diagnostic/evaluation/binary_metrics.py +910 -0
ml4t/diagnostic/evaluation/dashboard.py +715 -0
ml4t/diagnostic/evaluation/diagnostic_plots.py +1037 -0
ml4t/diagnostic/evaluation/distribution/__init__.py +499 -0
ml4t/diagnostic/evaluation/distribution/moments.py +299 -0
ml4t/diagnostic/evaluation/distribution/tails.py +777 -0
ml4t/diagnostic/evaluation/distribution/tests.py +470 -0
ml4t/diagnostic/evaluation/drift/__init__.py +139 -0
ml4t/diagnostic/evaluation/drift/analysis.py +432 -0
ml4t/diagnostic/evaluation/drift/domain_classifier.py +517 -0
ml4t/diagnostic/evaluation/drift/population_stability_index.py +310 -0
ml4t/diagnostic/evaluation/drift/wasserstein.py +388 -0
ml4t/diagnostic/evaluation/event_analysis.py +647 -0
ml4t/diagnostic/evaluation/excursion.py +390 -0
ml4t/diagnostic/evaluation/feature_diagnostics.py +873 -0
ml4t/diagnostic/evaluation/feature_outcome.py +666 -0
ml4t/diagnostic/evaluation/framework.py +935 -0
ml4t/diagnostic/evaluation/metric_registry.py +255 -0
ml4t/diagnostic/evaluation/metrics/AGENT.md +23 -0
ml4t/diagnostic/evaluation/metrics/__init__.py +133 -0
ml4t/diagnostic/evaluation/metrics/basic.py +160 -0
ml4t/diagnostic/evaluation/metrics/conditional_ic.py +469 -0
ml4t/diagnostic/evaluation/metrics/feature_outcome.py +475 -0
ml4t/diagnostic/evaluation/metrics/ic_statistics.py +446 -0
ml4t/diagnostic/evaluation/metrics/importance_analysis.py +338 -0
ml4t/diagnostic/evaluation/metrics/importance_classical.py +375 -0
ml4t/diagnostic/evaluation/metrics/importance_mda.py +371 -0
ml4t/diagnostic/evaluation/metrics/importance_shap.py +715 -0
ml4t/diagnostic/evaluation/metrics/information_coefficient.py +527 -0
ml4t/diagnostic/evaluation/metrics/interactions.py +772 -0
ml4t/diagnostic/evaluation/metrics/monotonicity.py +226 -0
ml4t/diagnostic/evaluation/metrics/risk_adjusted.py +324 -0
ml4t/diagnostic/evaluation/multi_signal.py +550 -0
ml4t/diagnostic/evaluation/portfolio_analysis/__init__.py +83 -0
ml4t/diagnostic/evaluation/portfolio_analysis/analysis.py +734 -0
ml4t/diagnostic/evaluation/portfolio_analysis/metrics.py +589 -0
ml4t/diagnostic/evaluation/portfolio_analysis/results.py +334 -0
ml4t/diagnostic/evaluation/report_generation.py +824 -0
ml4t/diagnostic/evaluation/signal_selector.py +452 -0
ml4t/diagnostic/evaluation/stat_registry.py +139 -0
ml4t/diagnostic/evaluation/stationarity/__init__.py +97 -0
ml4t/diagnostic/evaluation/stationarity/analysis.py +518 -0
ml4t/diagnostic/evaluation/stationarity/augmented_dickey_fuller.py +296 -0
ml4t/diagnostic/evaluation/stationarity/kpss_test.py +308 -0
ml4t/diagnostic/evaluation/stationarity/phillips_perron.py +365 -0
ml4t/diagnostic/evaluation/stats/AGENT.md +43 -0
ml4t/diagnostic/evaluation/stats/__init__.py +191 -0
ml4t/diagnostic/evaluation/stats/backtest_overfitting.py +219 -0
ml4t/diagnostic/evaluation/stats/bootstrap.py +228 -0
ml4t/diagnostic/evaluation/stats/deflated_sharpe_ratio.py +591 -0
ml4t/diagnostic/evaluation/stats/false_discovery_rate.py +295 -0
ml4t/diagnostic/evaluation/stats/hac_standard_errors.py +108 -0
ml4t/diagnostic/evaluation/stats/minimum_track_record.py +408 -0
ml4t/diagnostic/evaluation/stats/moments.py +164 -0
ml4t/diagnostic/evaluation/stats/rademacher_adjustment.py +436 -0
ml4t/diagnostic/evaluation/stats/reality_check.py +155 -0
ml4t/diagnostic/evaluation/stats/sharpe_inference.py +219 -0
ml4t/diagnostic/evaluation/themes.py +330 -0
ml4t/diagnostic/evaluation/threshold_analysis.py +957 -0
ml4t/diagnostic/evaluation/trade_analysis.py +1136 -0
ml4t/diagnostic/evaluation/trade_dashboard/__init__.py +32 -0
ml4t/diagnostic/evaluation/trade_dashboard/app.py +315 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/__init__.py +18 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/csv.py +82 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/html.py +276 -0
ml4t/diagnostic/evaluation/trade_dashboard/io.py +166 -0
ml4t/diagnostic/evaluation/trade_dashboard/normalize.py +304 -0
ml4t/diagnostic/evaluation/trade_dashboard/stats.py +386 -0
ml4t/diagnostic/evaluation/trade_dashboard/style.py +79 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/__init__.py +21 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/patterns.py +354 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/shap_analysis.py +280 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/stat_validation.py +186 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/worst_trades.py +236 -0
ml4t/diagnostic/evaluation/trade_dashboard/types.py +129 -0
ml4t/diagnostic/evaluation/trade_shap/__init__.py +102 -0
ml4t/diagnostic/evaluation/trade_shap/alignment.py +188 -0
ml4t/diagnostic/evaluation/trade_shap/characterize.py +413 -0
ml4t/diagnostic/evaluation/trade_shap/cluster.py +302 -0
ml4t/diagnostic/evaluation/trade_shap/explain.py +208 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/__init__.py +23 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/generator.py +290 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/matcher.py +251 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/templates.yaml +467 -0
ml4t/diagnostic/evaluation/trade_shap/models.py +386 -0
ml4t/diagnostic/evaluation/trade_shap/normalize.py +116 -0
ml4t/diagnostic/evaluation/trade_shap/pipeline.py +263 -0
ml4t/diagnostic/evaluation/trade_shap_dashboard.py +283 -0
ml4t/diagnostic/evaluation/trade_shap_diagnostics.py +588 -0
ml4t/diagnostic/evaluation/validated_cv.py +535 -0
ml4t/diagnostic/evaluation/visualization.py +1050 -0
ml4t/diagnostic/evaluation/volatility/__init__.py +45 -0
ml4t/diagnostic/evaluation/volatility/analysis.py +351 -0
ml4t/diagnostic/evaluation/volatility/arch.py +258 -0
ml4t/diagnostic/evaluation/volatility/garch.py +460 -0
ml4t/diagnostic/integration/__init__.py +48 -0
ml4t/diagnostic/integration/backtest_contract.py +671 -0
ml4t/diagnostic/integration/data_contract.py +316 -0
ml4t/diagnostic/integration/engineer_contract.py +226 -0
ml4t/diagnostic/logging/__init__.py +77 -0
ml4t/diagnostic/logging/logger.py +245 -0
ml4t/diagnostic/logging/performance.py +234 -0
ml4t/diagnostic/logging/progress.py +234 -0
ml4t/diagnostic/logging/wandb.py +412 -0
ml4t/diagnostic/metrics/__init__.py +9 -0
ml4t/diagnostic/metrics/percentiles.py +128 -0
ml4t/diagnostic/py.typed +1 -0
ml4t/diagnostic/reporting/__init__.py +43 -0
ml4t/diagnostic/reporting/base.py +130 -0
ml4t/diagnostic/reporting/html_renderer.py +275 -0
ml4t/diagnostic/reporting/json_renderer.py +51 -0
ml4t/diagnostic/reporting/markdown_renderer.py +117 -0
ml4t/diagnostic/results/AGENT.md +24 -0
ml4t/diagnostic/results/__init__.py +105 -0
ml4t/diagnostic/results/barrier_results/__init__.py +36 -0
ml4t/diagnostic/results/barrier_results/hit_rate.py +304 -0
ml4t/diagnostic/results/barrier_results/precision_recall.py +266 -0
ml4t/diagnostic/results/barrier_results/profit_factor.py +297 -0
ml4t/diagnostic/results/barrier_results/tearsheet.py +397 -0
ml4t/diagnostic/results/barrier_results/time_to_target.py +305 -0
ml4t/diagnostic/results/barrier_results/validation.py +38 -0
ml4t/diagnostic/results/base.py +177 -0
ml4t/diagnostic/results/event_results.py +349 -0
ml4t/diagnostic/results/feature_results.py +787 -0
ml4t/diagnostic/results/multi_signal_results.py +431 -0
ml4t/diagnostic/results/portfolio_results.py +281 -0
ml4t/diagnostic/results/sharpe_results.py +448 -0
ml4t/diagnostic/results/signal_results/__init__.py +74 -0
ml4t/diagnostic/results/signal_results/ic.py +581 -0
ml4t/diagnostic/results/signal_results/irtc.py +110 -0
ml4t/diagnostic/results/signal_results/quantile.py +392 -0
ml4t/diagnostic/results/signal_results/tearsheet.py +456 -0
ml4t/diagnostic/results/signal_results/turnover.py +213 -0
ml4t/diagnostic/results/signal_results/validation.py +147 -0
ml4t/diagnostic/signal/AGENT.md +17 -0
ml4t/diagnostic/signal/__init__.py +69 -0
ml4t/diagnostic/signal/_report.py +152 -0
ml4t/diagnostic/signal/_utils.py +261 -0
ml4t/diagnostic/signal/core.py +275 -0
ml4t/diagnostic/signal/quantile.py +148 -0
ml4t/diagnostic/signal/result.py +214 -0
ml4t/diagnostic/signal/signal_ic.py +129 -0
ml4t/diagnostic/signal/turnover.py +182 -0
ml4t/diagnostic/splitters/AGENT.md +19 -0
ml4t/diagnostic/splitters/__init__.py +36 -0
ml4t/diagnostic/splitters/base.py +501 -0
ml4t/diagnostic/splitters/calendar.py +421 -0
ml4t/diagnostic/splitters/calendar_config.py +91 -0
ml4t/diagnostic/splitters/combinatorial.py +1064 -0
ml4t/diagnostic/splitters/config.py +322 -0
ml4t/diagnostic/splitters/cpcv/__init__.py +57 -0
ml4t/diagnostic/splitters/cpcv/combinations.py +119 -0
ml4t/diagnostic/splitters/cpcv/partitioning.py +263 -0
ml4t/diagnostic/splitters/cpcv/purge_engine.py +379 -0
ml4t/diagnostic/splitters/cpcv/windows.py +190 -0
ml4t/diagnostic/splitters/group_isolation.py +329 -0
ml4t/diagnostic/splitters/persistence.py +316 -0
ml4t/diagnostic/splitters/utils.py +207 -0
ml4t/diagnostic/splitters/walk_forward.py +757 -0
ml4t/diagnostic/utils/__init__.py +42 -0
ml4t/diagnostic/utils/config.py +542 -0
ml4t/diagnostic/utils/dependencies.py +318 -0
ml4t/diagnostic/utils/sessions.py +127 -0
ml4t/diagnostic/validation/__init__.py +54 -0
ml4t/diagnostic/validation/dataframe.py +274 -0
ml4t/diagnostic/validation/returns.py +280 -0
ml4t/diagnostic/validation/timeseries.py +299 -0
ml4t/diagnostic/visualization/AGENT.md +19 -0
ml4t/diagnostic/visualization/__init__.py +223 -0
ml4t/diagnostic/visualization/backtest/__init__.py +98 -0
ml4t/diagnostic/visualization/backtest/cost_attribution.py +762 -0
ml4t/diagnostic/visualization/backtest/executive_summary.py +895 -0
ml4t/diagnostic/visualization/backtest/interactive_controls.py +673 -0
ml4t/diagnostic/visualization/backtest/statistical_validity.py +874 -0
ml4t/diagnostic/visualization/backtest/tearsheet.py +565 -0
ml4t/diagnostic/visualization/backtest/template_system.py +373 -0
ml4t/diagnostic/visualization/backtest/trade_plots.py +1172 -0
ml4t/diagnostic/visualization/barrier_plots.py +782 -0
ml4t/diagnostic/visualization/core.py +1060 -0
ml4t/diagnostic/visualization/dashboards/__init__.py +36 -0
ml4t/diagnostic/visualization/dashboards/base.py +582 -0
ml4t/diagnostic/visualization/dashboards/importance.py +801 -0
ml4t/diagnostic/visualization/dashboards/interaction.py +263 -0
ml4t/diagnostic/visualization/dashboards.py +43 -0
ml4t/diagnostic/visualization/data_extraction/__init__.py +48 -0
ml4t/diagnostic/visualization/data_extraction/importance.py +649 -0
ml4t/diagnostic/visualization/data_extraction/interaction.py +504 -0
ml4t/diagnostic/visualization/data_extraction/types.py +113 -0
ml4t/diagnostic/visualization/data_extraction/validation.py +66 -0
ml4t/diagnostic/visualization/feature_plots.py +888 -0
ml4t/diagnostic/visualization/interaction_plots.py +618 -0
ml4t/diagnostic/visualization/portfolio/__init__.py +41 -0
ml4t/diagnostic/visualization/portfolio/dashboard.py +514 -0
ml4t/diagnostic/visualization/portfolio/drawdown_plots.py +341 -0
ml4t/diagnostic/visualization/portfolio/returns_plots.py +487 -0
ml4t/diagnostic/visualization/portfolio/risk_plots.py +301 -0
ml4t/diagnostic/visualization/report_generation.py +1343 -0
ml4t/diagnostic/visualization/signal/__init__.py +103 -0
ml4t/diagnostic/visualization/signal/dashboard.py +911 -0
ml4t/diagnostic/visualization/signal/event_plots.py +514 -0
ml4t/diagnostic/visualization/signal/ic_plots.py +635 -0
ml4t/diagnostic/visualization/signal/multi_signal_dashboard.py +974 -0
ml4t/diagnostic/visualization/signal/multi_signal_plots.py +603 -0
ml4t/diagnostic/visualization/signal/quantile_plots.py +625 -0
ml4t/diagnostic/visualization/signal/turnover_plots.py +400 -0
ml4t/diagnostic/visualization/trade_shap/__init__.py +90 -0
ml4t_diagnostic-0.1.0a1.dist-info/METADATA +1044 -0
ml4t_diagnostic-0.1.0a1.dist-info/RECORD +242 -0
ml4t_diagnostic-0.1.0a1.dist-info/WHEEL +4 -0
ml4t_diagnostic-0.1.0a1.dist-info/licenses/LICENSE +21 -0

ml4t/diagnostic/evaluation/metrics/information_coefficient.py ADDED Viewed

@@ -0,0 +1,527 @@
+"""Core Information Coefficient (IC) metrics.
+This module provides the fundamental IC calculations used for evaluating
+feature predictiveness.
+"""
+from typing import TYPE_CHECKING, Any, Union, cast
+import numpy as np
+import pandas as pd
+import polars as pl
+from scipy import stats
+from scipy.stats import spearmanr
+from ml4t.diagnostic.backends.adapter import DataFrameAdapter
+from ml4t.diagnostic.evaluation.metrics.basic import compute_forward_returns
+if TYPE_CHECKING:
+    from numpy.typing import NDArray
+def information_coefficient(
+    predictions: Union[pl.Series, pd.Series, "NDArray[Any]"],
+    returns: Union[pl.Series, pd.Series, "NDArray[Any]"],
+    method: str = "spearman",
+    confidence_intervals: bool = False,
+    alpha: float = 0.05,
+) -> float | dict[str, float]:
+    """Calculate Information Coefficient between predictions and returns.
+    The Information Coefficient measures the linear relationship between model
+    predictions and subsequent returns. Spearman correlation is preferred as it's
+    robust to outliers and non-linear relationships.
+    Parameters
+    ----------
+    predictions : Union[pl.Series, pd.Series, np.ndarray]
+        Model predictions or scores
+    returns : Union[pl.Series, pd.Series, np.ndarray]
+        Forward returns corresponding to predictions
+    method : str, default "spearman"
+        Correlation method: "spearman" or "pearson"
+    confidence_intervals : bool, default False
+        Whether to return confidence intervals
+    alpha : float, default 0.05
+        Significance level for confidence intervals
+    Returns
+    -------
+    Union[float, dict]
+        If confidence_intervals=False: IC value
+        If confidence_intervals=True: dict with 'ic', 'lower_ci', 'upper_ci', 'p_value'
+    Examples
+    --------
+    >>> predictions = np.array([0.1, 0.3, -0.2, 0.5])
+    >>> returns = np.array([0.02, 0.05, -0.01, 0.08])
+    >>> ic = information_coefficient(predictions, returns)
+    >>> print(f"IC: {ic:.3f}")
+    IC: 0.800
+    >>> # With confidence intervals
+    >>> result = information_coefficient(predictions, returns, confidence_intervals=True)
+    >>> print(f"IC: {result['ic']:.3f} [{result['lower_ci']:.3f}, {result['upper_ci']:.3f}]")
+    IC: 0.800 [-0.602, 0.995]
+    """
+    # Convert inputs to numpy for consistent handling
+    pred_array = DataFrameAdapter.to_numpy(predictions).flatten()
+    ret_array = DataFrameAdapter.to_numpy(returns).flatten()
+    # Validate inputs
+    if len(pred_array) != len(ret_array):
+        raise ValueError("Predictions and returns must have the same length")
+    if len(pred_array) < 2:
+        if confidence_intervals:
+            return {
+                "ic": np.nan,
+                "lower_ci": np.nan,
+                "upper_ci": np.nan,
+                "p_value": np.nan,
+            }
+        return np.nan
+    # Remove NaN pairs
+    valid_mask = ~(np.isnan(pred_array) | np.isnan(ret_array))
+    pred_clean = pred_array[valid_mask]
+    ret_clean = ret_array[valid_mask]
+    if len(pred_clean) < 2:
+        if confidence_intervals:
+            return {
+                "ic": np.nan,
+                "lower_ci": np.nan,
+                "upper_ci": np.nan,
+                "p_value": np.nan,
+            }
+        return np.nan
+    # Calculate correlation
+    if method == "spearman":
+        ic_value, p_value = spearmanr(pred_clean, ret_clean)
+    elif method == "pearson":
+        ic_value, p_value = stats.pearsonr(pred_clean, ret_clean)
+    else:
+        raise ValueError(f"Unknown correlation method: {method}")
+    # Handle edge cases
+    if np.isnan(ic_value):
+        if confidence_intervals:
+            return {
+                "ic": np.nan,
+                "lower_ci": np.nan,
+                "upper_ci": np.nan,
+                "p_value": np.nan,
+            }
+        return np.nan
+    # Return simple IC if no confidence intervals requested
+    if not confidence_intervals:
+        return float(ic_value)
+    # Calculate confidence intervals using Fisher transformation
+    n = len(pred_clean)
+    if n < 4:  # Need sufficient data for meaningful CI
+        return {
+            "ic": float(ic_value),
+            "lower_ci": np.nan,
+            "upper_ci": np.nan,
+            "p_value": float(p_value) if not np.isnan(p_value) else np.nan,
+        }
+    # Fisher transformation for correlation confidence intervals
+    z = np.arctanh(ic_value)  # Fisher z-transform
+    se = 1 / np.sqrt(n - 3)  # Standard error
+    z_critical = stats.norm.ppf(1 - alpha / 2)
+    # Transform back to correlation scale
+    lower_z = z - z_critical * se
+    upper_z = z + z_critical * se
+    lower_ci = np.tanh(lower_z)
+    upper_ci = np.tanh(upper_z)
+    return {
+        "ic": float(ic_value),
+        "lower_ci": float(lower_ci),
+        "upper_ci": float(upper_ci),
+        "p_value": float(p_value) if not np.isnan(p_value) else np.nan,
+    }
+def compute_ic_series(
+    predictions: pl.DataFrame | pd.DataFrame,
+    returns: pl.DataFrame | pd.DataFrame,
+    pred_col: str = "prediction",
+    ret_col: str = "forward_return",
+    date_col: str = "date",
+    method: str = "spearman",
+    min_periods: int = 10,
+) -> pl.DataFrame | pd.DataFrame:
+    """Compute IC time series for temporal analysis (Alphalens-style).
+    This function computes the Information Coefficient for each time period
+    (typically daily), enabling temporal analysis of prediction quality.
+    This is THE fundamental visualization in Alphalens.
+    Parameters
+    ----------
+    predictions : Union[pl.DataFrame, pd.DataFrame]
+        DataFrame with predictions, indexed or with date column
+    returns : Union[pl.DataFrame, pd.DataFrame]
+        DataFrame with forward returns, matching predictions structure
+    pred_col : str, default "prediction"
+        Column name for predictions/features
+    ret_col : str, default "forward_return"
+        Column name for forward returns
+    date_col : str, default "date"
+        Column name for dates (for grouping by period)
+    method : str, default "spearman"
+        Correlation method: "spearman" or "pearson"
+    min_periods : int, default 10
+        Minimum observations per period for valid IC calculation
+    Returns
+    -------
+    Union[pl.DataFrame, pd.DataFrame]
+        Time series of IC values with columns: [date_col, 'ic', 'n_obs']
+    Examples
+    --------
+    >>> # Create sample data
+    >>> dates = pd.date_range("2024-01-01", periods=100)
+    >>> pred_df = pd.DataFrame({
+    ...     "date": dates,
+    ...     "prediction": np.random.randn(100)
+    ... })
+    >>> ret_df = pd.DataFrame({
+    ...     "date": dates,
+    ...     "forward_return": np.random.randn(100) * 0.02
+    ... })
+    >>> ic_series = compute_ic_series(pred_df, ret_df)
+    >>> print(ic_series.head())
+    """
+    is_polars = isinstance(predictions, pl.DataFrame)
+    if is_polars:
+        # Merge predictions and returns
+        predictions_pl = cast(pl.DataFrame, predictions)
+        returns_pl = cast(pl.DataFrame, returns)
+        df = predictions_pl.join(returns_pl, on=date_col, how="inner")
+        # Use group_by().map_groups() for efficient per-group processing
+        def compute_group_ic(group: pl.DataFrame) -> pl.DataFrame:
+            """Compute IC for a single date group."""
+            pred_array = group[pred_col].to_numpy()
+            ret_array = group[ret_col].to_numpy()
+            # Remove NaN pairs
+            valid_mask = ~(np.isnan(pred_array) | np.isnan(ret_array))
+            pred_clean = pred_array[valid_mask]
+            ret_clean = ret_array[valid_mask]
+            n_obs = len(pred_clean)
+            if n_obs >= min_periods:
+                ic_val = information_coefficient(
+                    pred_clean, ret_clean, method=method, confidence_intervals=False
+                )
+            else:
+                ic_val = np.nan
+            return pl.DataFrame({date_col: [group[date_col][0]], "ic": [ic_val], "n_obs": [n_obs]})
+        return df.group_by(date_col).map_groups(compute_group_ic).sort(date_col)
+    # pandas - use different variable name to avoid type conflict
+    # Merge predictions and returns
+    predictions_pd = cast(pd.DataFrame, predictions)
+    returns_pd = cast(pd.DataFrame, returns)
+    df_pd = pd.merge(predictions_pd, returns_pd, on=date_col, how="inner")
+    # Group by date and compute IC
+    def compute_period_ic(group: pd.DataFrame) -> pd.Series:
+        # Explicitly convert to ndarray to handle ExtensionArray types
+        pred_array = np.asarray(group[pred_col].values, dtype=np.float64)
+        ret_array = np.asarray(group[ret_col].values, dtype=np.float64)
+        # Remove NaN pairs
+        valid_mask = ~(np.isnan(pred_array) | np.isnan(ret_array))
+        pred_clean = pred_array[valid_mask]
+        ret_clean = ret_array[valid_mask]
+        n_obs = len(pred_clean)
+        if n_obs >= min_periods:
+            ic_val = information_coefficient(
+                pred_clean, ret_clean, method=method, confidence_intervals=False
+            )
+        else:
+            ic_val = np.nan
+        return pd.Series({"ic": ic_val, "n_obs": n_obs})
+    ic_series = df_pd.groupby(date_col, group_keys=False).apply(compute_period_ic).reset_index()
+    return ic_series
+def compute_ic_by_horizon(
+    predictions: pl.DataFrame | pd.DataFrame,
+    prices: pl.DataFrame | pd.DataFrame,
+    horizons: list[int] | None = None,
+    pred_col: str = "prediction",
+    price_col: str = "close",
+    date_col: str = "date",
+    group_col: str | None = None,
+    method: str = "spearman",
+) -> dict[int, float]:
+    """Compute IC across multiple forward return horizons.
+    This function computes IC for different forward-looking periods
+    (e.g., 1-day, 5-day, 21-day), which is essential for understanding
+    prediction persistence and optimal holding periods.
+    Parameters
+    ----------
+    predictions : Union[pl.DataFrame, pd.DataFrame]
+        DataFrame with predictions
+    prices : Union[pl.DataFrame, pd.DataFrame]
+        DataFrame with prices to compute forward returns
+    horizons : list[int], default [1, 5, 21]
+        Forward periods to analyze (in days/bars)
+    pred_col : str, default "prediction"
+        Column name for predictions
+    price_col : str, default "close"
+        Column name for prices
+    date_col : str, default "date"
+        Column name for dates
+    group_col : str | None, default None
+        Column for grouping (e.g., 'symbol')
+    method : str, default "spearman"
+        Correlation method
+    Returns
+    -------
+    dict[int, float | dict]
+        Dictionary mapping horizon -> IC value
+        Keys are horizon periods, values are IC (or dict with CI if requested)
+    Examples
+    --------
+    >>> pred_df = pd.DataFrame({"date": dates, "prediction": preds})
+    >>> price_df = pd.DataFrame({"date": dates, "close": prices})
+    >>> ic_by_horizon = compute_ic_by_horizon(
+    ...     pred_df, price_df, horizons=[1, 5, 21]
+    ... )
+    >>> print(f"1-day IC: {ic_by_horizon[1]:.3f}")
+    >>> print(f"5-day IC: {ic_by_horizon[5]:.3f}")
+    """
+    # Compute forward returns for all horizons
+    if horizons is None:
+        horizons = [1, 5, 21]
+    prices_with_fwd = compute_forward_returns(
+        prices, periods=horizons, price_col=price_col, group_col=group_col
+    )
+    # Merge with predictions - declare type before branching
+    df: pl.DataFrame | pd.DataFrame
+    if isinstance(predictions, pl.DataFrame):
+        # Type is narrowed by isinstance check, but prices_with_fwd needs cast
+        prices_with_fwd_pl = cast(pl.DataFrame, prices_with_fwd)
+        df = predictions.join(prices_with_fwd_pl, on=date_col, how="inner")
+    elif isinstance(predictions, pd.DataFrame):
+        prices_with_fwd_pd = cast(pd.DataFrame, prices_with_fwd)
+        df = pd.merge(predictions, prices_with_fwd_pd, on=date_col, how="inner")
+    else:
+        raise TypeError(
+            f"predictions must be pl.DataFrame or pd.DataFrame, got {type(predictions)}"
+        )
+    # Compute IC for each horizon
+    ic_results: dict[int, float] = {}
+    for horizon in horizons:
+        ret_col = f"fwd_ret_{horizon}"
+        # Extract arrays - df type is known from construction above
+        if isinstance(df, pl.DataFrame):
+            pred_array = df[pred_col].to_numpy()
+            ret_array = df[ret_col].to_numpy()
+        else:
+            pred_array = df[pred_col].to_numpy()
+            ret_array = df[ret_col].to_numpy()
+        # Compute IC (confidence_intervals=False returns float)
+        ic_result = information_coefficient(
+            pred_array, ret_array, method=method, confidence_intervals=False
+        )
+        # When confidence_intervals=False, returns float; otherwise dict
+        if isinstance(ic_result, dict):
+            ic_val = float(ic_result.get("ic", np.nan))
+        else:
+            ic_val = float(ic_result)
+        ic_results[horizon] = ic_val
+    return ic_results
+def compute_ic_ir(
+    ic_series: Union[pl.DataFrame, pd.DataFrame, "NDArray[Any]"],
+    ic_col: str = "ic",
+    annualization_factor: float = np.sqrt(252),
+    confidence_intervals: bool = False,
+    n_bootstrap: int = 10000,
+    alpha: float = 0.05,
+) -> float | dict[str, float]:
+    """Compute IC Information Ratio (IC-IR) - risk-adjusted IC metric.
+    IC-IR is analogous to the Sharpe ratio but for IC instead of returns.
+    It measures the consistency of predictive power by computing mean IC
+    divided by the standard deviation of IC.
+    Higher IC-IR indicates more consistent predictions. IC-IR > 0.5 is
+    generally considered good, IC-IR > 1.0 is excellent.
+    Parameters
+    ----------
+    ic_series : Union[pl.DataFrame, pd.DataFrame, np.ndarray]
+        Time series of IC values (from compute_ic_series)
+    ic_col : str, default "ic"
+        Column name for IC values (if DataFrame)
+    annualization_factor : float, default sqrt(252)
+        Factor to annualize IC-IR (sqrt(periods_per_year))
+        - Daily: sqrt(252) ~ 15.87
+        - Weekly: sqrt(52) ~ 7.21
+        - Monthly: sqrt(12) ~ 3.46
+    confidence_intervals : bool, default False
+        Whether to compute bootstrap confidence intervals
+    n_bootstrap : int, default 10000
+        Number of bootstrap samples for CI computation
+    alpha : float, default 0.05
+        Significance level for confidence intervals (95% CI)
+    Returns
+    -------
+    Union[float, dict]
+        If confidence_intervals=False: IC-IR value
+        If confidence_intervals=True: dict with 'ic_ir', 'lower_ci', 'upper_ci'
+    Examples
+    --------
+    >>> # Compute IC series first
+    >>> ic_series = compute_ic_series(pred_df, ret_df)
+    >>>
+    >>> # Compute IC-IR
+    >>> ic_ir = compute_ic_ir(ic_series)
+    >>> print(f"IC-IR: {ic_ir:.3f}")
+    IC-IR: 0.645
+    >>>
+    >>> # With confidence intervals
+    >>> result = compute_ic_ir(ic_series, confidence_intervals=True)
+    >>> print(f"IC-IR: {result['ic_ir']:.3f} [{result['lower_ci']:.3f}, {result['upper_ci']:.3f}]")
+    IC-IR: 0.645 [0.412, 0.891]
+    Notes
+    -----
+    IC-IR Interpretation:
+    - IC-IR < 0.3: Weak/inconsistent predictive power
+    - IC-IR 0.3-0.5: Moderate consistency
+    - IC-IR 0.5-1.0: Good consistency
+    - IC-IR > 1.0: Excellent consistency
+    The annualization factor adjusts IC-IR to an annual scale for easier
+    interpretation and comparison across different rebalancing frequencies.
+    """
+    # Extract IC values
+    ic_values: NDArray[Any]
+    if isinstance(ic_series, pl.DataFrame | pd.DataFrame):
+        is_polars = isinstance(ic_series, pl.DataFrame)
+        if is_polars:
+            ic_values = cast(pl.DataFrame, ic_series)[ic_col].to_numpy()
+        else:
+            ic_values = cast(pd.DataFrame, ic_series)[ic_col].to_numpy()
+    else:
+        ic_values = np.asarray(ic_series).flatten()
+    # Remove NaN values
+    ic_clean: NDArray[Any] = ic_values[~np.isnan(ic_values)]
+    # Validate sufficient data
+    if len(ic_clean) < 2:
+        if confidence_intervals:
+            return {
+                "ic_ir": np.nan,
+                "lower_ci": np.nan,
+                "upper_ci": np.nan,
+                "mean_ic": np.nan,
+                "std_ic": np.nan,
+                "n_periods": len(ic_clean),
+            }
+        return np.nan
+    # Compute IC-IR
+    mean_ic = float(np.mean(ic_clean))
+    std_ic = float(np.std(ic_clean, ddof=1))  # Sample std
+    if std_ic == 0:
+        # Perfect consistency (all IC values identical)
+        ic_ir = np.inf if mean_ic > 0 else -np.inf if mean_ic < 0 else np.nan
+    else:
+        ic_ir = (mean_ic / std_ic) * annualization_factor
+    # Return simple IC-IR if no CI requested
+    if not confidence_intervals:
+        return float(ic_ir)
+    # Bootstrap confidence intervals
+    if len(ic_clean) < 10:
+        # Insufficient data for meaningful bootstrap
+        return {
+            "ic_ir": float(ic_ir),
+            "lower_ci": np.nan,
+            "upper_ci": np.nan,
+            "mean_ic": float(mean_ic),
+            "std_ic": float(std_ic),
+            "n_periods": len(ic_clean),
+        }
+    # Perform bootstrap
+    rng = np.random.RandomState(42)  # For reproducibility
+    bootstrap_ics = []
+    for _ in range(n_bootstrap):
+        # Resample with replacement
+        sample = rng.choice(ic_clean, size=len(ic_clean), replace=True)
+        sample_mean = np.mean(sample)
+        sample_std = np.std(sample, ddof=1)
+        if sample_std > 0:
+            bootstrap_ic_ir = (sample_mean / sample_std) * annualization_factor
+            bootstrap_ics.append(bootstrap_ic_ir)
+    if len(bootstrap_ics) == 0:
+        # Bootstrap failed (all samples had zero std)
+        return {
+            "ic_ir": float(ic_ir),
+            "lower_ci": np.nan,
+            "upper_ci": np.nan,
+            "mean_ic": float(mean_ic),
+            "std_ic": float(std_ic),
+            "n_periods": len(ic_clean),
+        }
+    # Compute percentile confidence intervals
+    lower_ci = np.percentile(bootstrap_ics, (alpha / 2) * 100)
+    upper_ci = np.percentile(bootstrap_ics, (1 - alpha / 2) * 100)
+    return {
+        "ic_ir": float(ic_ir),
+        "lower_ci": float(lower_ci),
+        "upper_ci": float(upper_ci),
+        "mean_ic": float(mean_ic),
+        "std_ic": float(std_ic),
+        "n_periods": len(ic_clean),
+    }