PyPI - ml4t-diagnostic - Versions diffs - 0.1.0a1__py3-none-any.whl - Mend

ml4t-diagnostic 0.1.0a1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

ml4t/diagnostic/AGENT.md +25 -0
ml4t/diagnostic/__init__.py +166 -0
ml4t/diagnostic/backends/__init__.py +10 -0
ml4t/diagnostic/backends/adapter.py +192 -0
ml4t/diagnostic/backends/polars_backend.py +899 -0
ml4t/diagnostic/caching/__init__.py +40 -0
ml4t/diagnostic/caching/cache.py +331 -0
ml4t/diagnostic/caching/decorators.py +131 -0
ml4t/diagnostic/caching/smart_cache.py +339 -0
ml4t/diagnostic/config/AGENT.md +24 -0
ml4t/diagnostic/config/README.md +267 -0
ml4t/diagnostic/config/__init__.py +219 -0
ml4t/diagnostic/config/barrier_config.py +277 -0
ml4t/diagnostic/config/base.py +301 -0
ml4t/diagnostic/config/event_config.py +148 -0
ml4t/diagnostic/config/feature_config.py +404 -0
ml4t/diagnostic/config/multi_signal_config.py +55 -0
ml4t/diagnostic/config/portfolio_config.py +215 -0
ml4t/diagnostic/config/report_config.py +391 -0
ml4t/diagnostic/config/sharpe_config.py +202 -0
ml4t/diagnostic/config/signal_config.py +206 -0
ml4t/diagnostic/config/trade_analysis_config.py +310 -0
ml4t/diagnostic/config/validation.py +279 -0
ml4t/diagnostic/core/__init__.py +29 -0
ml4t/diagnostic/core/numba_utils.py +315 -0
ml4t/diagnostic/core/purging.py +372 -0
ml4t/diagnostic/core/sampling.py +471 -0
ml4t/diagnostic/errors/__init__.py +205 -0
ml4t/diagnostic/evaluation/AGENT.md +26 -0
ml4t/diagnostic/evaluation/__init__.py +437 -0
ml4t/diagnostic/evaluation/autocorrelation.py +531 -0
ml4t/diagnostic/evaluation/barrier_analysis.py +1050 -0
ml4t/diagnostic/evaluation/binary_metrics.py +910 -0
ml4t/diagnostic/evaluation/dashboard.py +715 -0
ml4t/diagnostic/evaluation/diagnostic_plots.py +1037 -0
ml4t/diagnostic/evaluation/distribution/__init__.py +499 -0
ml4t/diagnostic/evaluation/distribution/moments.py +299 -0
ml4t/diagnostic/evaluation/distribution/tails.py +777 -0
ml4t/diagnostic/evaluation/distribution/tests.py +470 -0
ml4t/diagnostic/evaluation/drift/__init__.py +139 -0
ml4t/diagnostic/evaluation/drift/analysis.py +432 -0
ml4t/diagnostic/evaluation/drift/domain_classifier.py +517 -0
ml4t/diagnostic/evaluation/drift/population_stability_index.py +310 -0
ml4t/diagnostic/evaluation/drift/wasserstein.py +388 -0
ml4t/diagnostic/evaluation/event_analysis.py +647 -0
ml4t/diagnostic/evaluation/excursion.py +390 -0
ml4t/diagnostic/evaluation/feature_diagnostics.py +873 -0
ml4t/diagnostic/evaluation/feature_outcome.py +666 -0
ml4t/diagnostic/evaluation/framework.py +935 -0
ml4t/diagnostic/evaluation/metric_registry.py +255 -0
ml4t/diagnostic/evaluation/metrics/AGENT.md +23 -0
ml4t/diagnostic/evaluation/metrics/__init__.py +133 -0
ml4t/diagnostic/evaluation/metrics/basic.py +160 -0
ml4t/diagnostic/evaluation/metrics/conditional_ic.py +469 -0
ml4t/diagnostic/evaluation/metrics/feature_outcome.py +475 -0
ml4t/diagnostic/evaluation/metrics/ic_statistics.py +446 -0
ml4t/diagnostic/evaluation/metrics/importance_analysis.py +338 -0
ml4t/diagnostic/evaluation/metrics/importance_classical.py +375 -0
ml4t/diagnostic/evaluation/metrics/importance_mda.py +371 -0
ml4t/diagnostic/evaluation/metrics/importance_shap.py +715 -0
ml4t/diagnostic/evaluation/metrics/information_coefficient.py +527 -0
ml4t/diagnostic/evaluation/metrics/interactions.py +772 -0
ml4t/diagnostic/evaluation/metrics/monotonicity.py +226 -0
ml4t/diagnostic/evaluation/metrics/risk_adjusted.py +324 -0
ml4t/diagnostic/evaluation/multi_signal.py +550 -0
ml4t/diagnostic/evaluation/portfolio_analysis/__init__.py +83 -0
ml4t/diagnostic/evaluation/portfolio_analysis/analysis.py +734 -0
ml4t/diagnostic/evaluation/portfolio_analysis/metrics.py +589 -0
ml4t/diagnostic/evaluation/portfolio_analysis/results.py +334 -0
ml4t/diagnostic/evaluation/report_generation.py +824 -0
ml4t/diagnostic/evaluation/signal_selector.py +452 -0
ml4t/diagnostic/evaluation/stat_registry.py +139 -0
ml4t/diagnostic/evaluation/stationarity/__init__.py +97 -0
ml4t/diagnostic/evaluation/stationarity/analysis.py +518 -0
ml4t/diagnostic/evaluation/stationarity/augmented_dickey_fuller.py +296 -0
ml4t/diagnostic/evaluation/stationarity/kpss_test.py +308 -0
ml4t/diagnostic/evaluation/stationarity/phillips_perron.py +365 -0
ml4t/diagnostic/evaluation/stats/AGENT.md +43 -0
ml4t/diagnostic/evaluation/stats/__init__.py +191 -0
ml4t/diagnostic/evaluation/stats/backtest_overfitting.py +219 -0
ml4t/diagnostic/evaluation/stats/bootstrap.py +228 -0
ml4t/diagnostic/evaluation/stats/deflated_sharpe_ratio.py +591 -0
ml4t/diagnostic/evaluation/stats/false_discovery_rate.py +295 -0
ml4t/diagnostic/evaluation/stats/hac_standard_errors.py +108 -0
ml4t/diagnostic/evaluation/stats/minimum_track_record.py +408 -0
ml4t/diagnostic/evaluation/stats/moments.py +164 -0
ml4t/diagnostic/evaluation/stats/rademacher_adjustment.py +436 -0
ml4t/diagnostic/evaluation/stats/reality_check.py +155 -0
ml4t/diagnostic/evaluation/stats/sharpe_inference.py +219 -0
ml4t/diagnostic/evaluation/themes.py +330 -0
ml4t/diagnostic/evaluation/threshold_analysis.py +957 -0
ml4t/diagnostic/evaluation/trade_analysis.py +1136 -0
ml4t/diagnostic/evaluation/trade_dashboard/__init__.py +32 -0
ml4t/diagnostic/evaluation/trade_dashboard/app.py +315 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/__init__.py +18 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/csv.py +82 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/html.py +276 -0
ml4t/diagnostic/evaluation/trade_dashboard/io.py +166 -0
ml4t/diagnostic/evaluation/trade_dashboard/normalize.py +304 -0
ml4t/diagnostic/evaluation/trade_dashboard/stats.py +386 -0
ml4t/diagnostic/evaluation/trade_dashboard/style.py +79 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/__init__.py +21 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/patterns.py +354 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/shap_analysis.py +280 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/stat_validation.py +186 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/worst_trades.py +236 -0
ml4t/diagnostic/evaluation/trade_dashboard/types.py +129 -0
ml4t/diagnostic/evaluation/trade_shap/__init__.py +102 -0
ml4t/diagnostic/evaluation/trade_shap/alignment.py +188 -0
ml4t/diagnostic/evaluation/trade_shap/characterize.py +413 -0
ml4t/diagnostic/evaluation/trade_shap/cluster.py +302 -0
ml4t/diagnostic/evaluation/trade_shap/explain.py +208 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/__init__.py +23 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/generator.py +290 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/matcher.py +251 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/templates.yaml +467 -0
ml4t/diagnostic/evaluation/trade_shap/models.py +386 -0
ml4t/diagnostic/evaluation/trade_shap/normalize.py +116 -0
ml4t/diagnostic/evaluation/trade_shap/pipeline.py +263 -0
ml4t/diagnostic/evaluation/trade_shap_dashboard.py +283 -0
ml4t/diagnostic/evaluation/trade_shap_diagnostics.py +588 -0
ml4t/diagnostic/evaluation/validated_cv.py +535 -0
ml4t/diagnostic/evaluation/visualization.py +1050 -0
ml4t/diagnostic/evaluation/volatility/__init__.py +45 -0
ml4t/diagnostic/evaluation/volatility/analysis.py +351 -0
ml4t/diagnostic/evaluation/volatility/arch.py +258 -0
ml4t/diagnostic/evaluation/volatility/garch.py +460 -0
ml4t/diagnostic/integration/__init__.py +48 -0
ml4t/diagnostic/integration/backtest_contract.py +671 -0
ml4t/diagnostic/integration/data_contract.py +316 -0
ml4t/diagnostic/integration/engineer_contract.py +226 -0
ml4t/diagnostic/logging/__init__.py +77 -0
ml4t/diagnostic/logging/logger.py +245 -0
ml4t/diagnostic/logging/performance.py +234 -0
ml4t/diagnostic/logging/progress.py +234 -0
ml4t/diagnostic/logging/wandb.py +412 -0
ml4t/diagnostic/metrics/__init__.py +9 -0
ml4t/diagnostic/metrics/percentiles.py +128 -0
ml4t/diagnostic/py.typed +1 -0
ml4t/diagnostic/reporting/__init__.py +43 -0
ml4t/diagnostic/reporting/base.py +130 -0
ml4t/diagnostic/reporting/html_renderer.py +275 -0
ml4t/diagnostic/reporting/json_renderer.py +51 -0
ml4t/diagnostic/reporting/markdown_renderer.py +117 -0
ml4t/diagnostic/results/AGENT.md +24 -0
ml4t/diagnostic/results/__init__.py +105 -0
ml4t/diagnostic/results/barrier_results/__init__.py +36 -0
ml4t/diagnostic/results/barrier_results/hit_rate.py +304 -0
ml4t/diagnostic/results/barrier_results/precision_recall.py +266 -0
ml4t/diagnostic/results/barrier_results/profit_factor.py +297 -0
ml4t/diagnostic/results/barrier_results/tearsheet.py +397 -0
ml4t/diagnostic/results/barrier_results/time_to_target.py +305 -0
ml4t/diagnostic/results/barrier_results/validation.py +38 -0
ml4t/diagnostic/results/base.py +177 -0
ml4t/diagnostic/results/event_results.py +349 -0
ml4t/diagnostic/results/feature_results.py +787 -0
ml4t/diagnostic/results/multi_signal_results.py +431 -0
ml4t/diagnostic/results/portfolio_results.py +281 -0
ml4t/diagnostic/results/sharpe_results.py +448 -0
ml4t/diagnostic/results/signal_results/__init__.py +74 -0
ml4t/diagnostic/results/signal_results/ic.py +581 -0
ml4t/diagnostic/results/signal_results/irtc.py +110 -0
ml4t/diagnostic/results/signal_results/quantile.py +392 -0
ml4t/diagnostic/results/signal_results/tearsheet.py +456 -0
ml4t/diagnostic/results/signal_results/turnover.py +213 -0
ml4t/diagnostic/results/signal_results/validation.py +147 -0
ml4t/diagnostic/signal/AGENT.md +17 -0
ml4t/diagnostic/signal/__init__.py +69 -0
ml4t/diagnostic/signal/_report.py +152 -0
ml4t/diagnostic/signal/_utils.py +261 -0
ml4t/diagnostic/signal/core.py +275 -0
ml4t/diagnostic/signal/quantile.py +148 -0
ml4t/diagnostic/signal/result.py +214 -0
ml4t/diagnostic/signal/signal_ic.py +129 -0
ml4t/diagnostic/signal/turnover.py +182 -0
ml4t/diagnostic/splitters/AGENT.md +19 -0
ml4t/diagnostic/splitters/__init__.py +36 -0
ml4t/diagnostic/splitters/base.py +501 -0
ml4t/diagnostic/splitters/calendar.py +421 -0
ml4t/diagnostic/splitters/calendar_config.py +91 -0
ml4t/diagnostic/splitters/combinatorial.py +1064 -0
ml4t/diagnostic/splitters/config.py +322 -0
ml4t/diagnostic/splitters/cpcv/__init__.py +57 -0
ml4t/diagnostic/splitters/cpcv/combinations.py +119 -0
ml4t/diagnostic/splitters/cpcv/partitioning.py +263 -0
ml4t/diagnostic/splitters/cpcv/purge_engine.py +379 -0
ml4t/diagnostic/splitters/cpcv/windows.py +190 -0
ml4t/diagnostic/splitters/group_isolation.py +329 -0
ml4t/diagnostic/splitters/persistence.py +316 -0
ml4t/diagnostic/splitters/utils.py +207 -0
ml4t/diagnostic/splitters/walk_forward.py +757 -0
ml4t/diagnostic/utils/__init__.py +42 -0
ml4t/diagnostic/utils/config.py +542 -0
ml4t/diagnostic/utils/dependencies.py +318 -0
ml4t/diagnostic/utils/sessions.py +127 -0
ml4t/diagnostic/validation/__init__.py +54 -0
ml4t/diagnostic/validation/dataframe.py +274 -0
ml4t/diagnostic/validation/returns.py +280 -0
ml4t/diagnostic/validation/timeseries.py +299 -0
ml4t/diagnostic/visualization/AGENT.md +19 -0
ml4t/diagnostic/visualization/__init__.py +223 -0
ml4t/diagnostic/visualization/backtest/__init__.py +98 -0
ml4t/diagnostic/visualization/backtest/cost_attribution.py +762 -0
ml4t/diagnostic/visualization/backtest/executive_summary.py +895 -0
ml4t/diagnostic/visualization/backtest/interactive_controls.py +673 -0
ml4t/diagnostic/visualization/backtest/statistical_validity.py +874 -0
ml4t/diagnostic/visualization/backtest/tearsheet.py +565 -0
ml4t/diagnostic/visualization/backtest/template_system.py +373 -0
ml4t/diagnostic/visualization/backtest/trade_plots.py +1172 -0
ml4t/diagnostic/visualization/barrier_plots.py +782 -0
ml4t/diagnostic/visualization/core.py +1060 -0
ml4t/diagnostic/visualization/dashboards/__init__.py +36 -0
ml4t/diagnostic/visualization/dashboards/base.py +582 -0
ml4t/diagnostic/visualization/dashboards/importance.py +801 -0
ml4t/diagnostic/visualization/dashboards/interaction.py +263 -0
ml4t/diagnostic/visualization/dashboards.py +43 -0
ml4t/diagnostic/visualization/data_extraction/__init__.py +48 -0
ml4t/diagnostic/visualization/data_extraction/importance.py +649 -0
ml4t/diagnostic/visualization/data_extraction/interaction.py +504 -0
ml4t/diagnostic/visualization/data_extraction/types.py +113 -0
ml4t/diagnostic/visualization/data_extraction/validation.py +66 -0
ml4t/diagnostic/visualization/feature_plots.py +888 -0
ml4t/diagnostic/visualization/interaction_plots.py +618 -0
ml4t/diagnostic/visualization/portfolio/__init__.py +41 -0
ml4t/diagnostic/visualization/portfolio/dashboard.py +514 -0
ml4t/diagnostic/visualization/portfolio/drawdown_plots.py +341 -0
ml4t/diagnostic/visualization/portfolio/returns_plots.py +487 -0
ml4t/diagnostic/visualization/portfolio/risk_plots.py +301 -0
ml4t/diagnostic/visualization/report_generation.py +1343 -0
ml4t/diagnostic/visualization/signal/__init__.py +103 -0
ml4t/diagnostic/visualization/signal/dashboard.py +911 -0
ml4t/diagnostic/visualization/signal/event_plots.py +514 -0
ml4t/diagnostic/visualization/signal/ic_plots.py +635 -0
ml4t/diagnostic/visualization/signal/multi_signal_dashboard.py +974 -0
ml4t/diagnostic/visualization/signal/multi_signal_plots.py +603 -0
ml4t/diagnostic/visualization/signal/quantile_plots.py +625 -0
ml4t/diagnostic/visualization/signal/turnover_plots.py +400 -0
ml4t/diagnostic/visualization/trade_shap/__init__.py +90 -0
ml4t_diagnostic-0.1.0a1.dist-info/METADATA +1044 -0
ml4t_diagnostic-0.1.0a1.dist-info/RECORD +242 -0
ml4t_diagnostic-0.1.0a1.dist-info/WHEEL +4 -0
ml4t_diagnostic-0.1.0a1.dist-info/licenses/LICENSE +21 -0

ml4t/diagnostic/results/signal_results/ic.py ADDED Viewed

@@ -0,0 +1,581 @@
+"""IC (Information Coefficient) result classes for signal analysis.
+This module provides result classes for storing IC analysis outputs including
+time series data, summary statistics, HAC-adjusted values, and RAS adjustments.
+References
+----------
+Lopez de Prado, M. (2018). "Advances in Financial Machine Learning"
+Paleologo, G. (2024). "Elements of Quantitative Investing"
+"""
+from __future__ import annotations
+from dataclasses import dataclass
+from typing import Any
+import polars as pl
+from pydantic import Field, model_validator
+from ml4t.diagnostic.results.base import BaseResult
+from ml4t.diagnostic.results.signal_results.validation import (
+    _normalize_period,
+    _validate_dict_keys_match,
+)
+@dataclass
+class ICStats:
+    """IC statistics for a single period.
+    Provides a convenient typed container for all IC metrics
+    at a specific forward return period.
+    Examples
+    --------
+    >>> stats = ic_result.get_stats(21)
+    >>> if stats:
+    ...     print(f"IC: {stats.mean:.4f} (t={stats.t_stat:.2f})")
+    """
+    mean: float
+    std: float
+    t_stat: float
+    p_value: float
+    positive_pct: float
+    ir: float  # Information Ratio
+    t_stat_hac: float | None = None
+    p_value_hac: float | None = None
+    ras_adjusted: float | None = None
+    ras_significant: bool | None = None
+class SignalICResult(BaseResult):
+    """Results from Signal IC (Information Coefficient) analysis.
+    Contains IC time series, summary statistics, t-statistics,
+    and optional RAS-adjusted values for signal analysis.
+    This is distinct from feature_results.ICAnalysisResult which
+    handles single-feature IC analysis (Module C).
+    Examples
+    --------
+    >>> result = signal_ic_result
+    >>> print(result.summary())
+    >>> df = result.get_dataframe("ic_by_date")
+    """
+    analysis_type: str = Field(default="signal_ic_analysis", frozen=True)
+    # ==========================================================================
+    # IC Time Series Data
+    # ==========================================================================
+    ic_by_date: dict[str, list[float]] = Field(
+        ...,
+        description="IC values by date for each period. Keys: period names, values: IC series",
+    )
+    dates: list[str] = Field(
+        ...,
+        description="Date strings (ISO format) corresponding to IC values",
+    )
+    # ==========================================================================
+    # Summary Statistics
+    # ==========================================================================
+    ic_mean: dict[str, float] = Field(
+        ...,
+        description="Mean IC for each period",
+    )
+    ic_std: dict[str, float] = Field(
+        ...,
+        description="Standard deviation of IC for each period",
+    )
+    ic_t_stat: dict[str, float] = Field(
+        ...,
+        description="T-statistic for IC mean != 0",
+    )
+    ic_p_value: dict[str, float] = Field(
+        ...,
+        description="P-value for IC significance (two-tailed)",
+    )
+    ic_positive_pct: dict[str, float] = Field(
+        ...,
+        description="Percentage of periods with positive IC",
+    )
+    ic_ir: dict[str, float] = Field(
+        ...,
+        description="Information Ratio (IC_mean / IC_std)",
+    )
+    # ==========================================================================
+    # HAC-Adjusted Statistics (Newey-West)
+    # ==========================================================================
+    ic_t_stat_hac: dict[str, float] | None = Field(
+        default=None,
+        description="HAC-adjusted t-statistic (Newey-West)",
+    )
+    ic_p_value_hac: dict[str, float] | None = Field(
+        default=None,
+        description="HAC-adjusted p-value",
+    )
+    hac_lags_used: int | None = Field(
+        default=None,
+        description="Number of lags used for HAC adjustment",
+    )
+    # ==========================================================================
+    # RAS-Adjusted Values (Rademacher Anti-Serum)
+    # ==========================================================================
+    ras_adjusted_ic: dict[str, float] | None = Field(
+        default=None,
+        description="RAS-adjusted conservative IC lower bounds",
+    )
+    ras_complexity: float | None = Field(
+        default=None,
+        description="Rademacher complexity R^ used in adjustment",
+    )
+    ras_significant: dict[str, bool] | None = Field(
+        default=None,
+        description="Whether RAS-adjusted IC > 0 (significant after multiple testing)",
+    )
+    # ==========================================================================
+    # Validation
+    # ==========================================================================
+    @model_validator(mode="after")
+    def _validate_period_keys(self) -> SignalICResult:
+        """Validate that all period-keyed dicts share the same keys."""
+        data = self.model_dump()
+        _validate_dict_keys_match(
+            data,
+            required_fields=[
+                "ic_by_date",
+                "ic_mean",
+                "ic_std",
+                "ic_t_stat",
+                "ic_p_value",
+                "ic_positive_pct",
+                "ic_ir",
+            ],
+            optional_fields=[
+                "ic_t_stat_hac",
+                "ic_p_value_hac",
+                "ras_adjusted_ic",
+                "ras_significant",
+            ],
+            reference_field="ic_mean",
+        )
+        return self
+    # ==========================================================================
+    # Methods
+    # ==========================================================================
+    def get_dataframe(self, name: str | None = None) -> pl.DataFrame:
+        """Get results as Polars DataFrame.
+        Parameters
+        ----------
+        name : str | None
+            DataFrame to retrieve:
+            - None or "ic_by_date": IC time series by date
+            - "summary": Summary statistics
+        Returns
+        -------
+        pl.DataFrame
+            Requested DataFrame
+        """
+        if name is None or name == "ic_by_date":
+            # Build IC time series DataFrame
+            data: dict[str, Any] = {"date": self.dates}
+            for period, values in self.ic_by_date.items():
+                data[f"ic_{period}"] = values
+            return pl.DataFrame(data)
+        if name == "summary":
+            # Build summary statistics DataFrame
+            periods = list(self.ic_mean.keys())
+            data_summary: dict[str, Any] = {
+                "period": periods,
+                "ic_mean": [self.ic_mean[p] for p in periods],
+                "ic_std": [self.ic_std[p] for p in periods],
+                "ic_t_stat": [self.ic_t_stat[p] for p in periods],
+                "ic_p_value": [self.ic_p_value[p] for p in periods],
+                "ic_positive_pct": [self.ic_positive_pct[p] for p in periods],
+                "ic_ir": [self.ic_ir[p] for p in periods],
+            }
+            if self.ras_adjusted_ic is not None and self.ras_significant is not None:
+                data_summary["ras_adjusted_ic"] = [self.ras_adjusted_ic[p] for p in periods]
+                data_summary["ras_significant"] = [self.ras_significant[p] for p in periods]
+            return pl.DataFrame(data_summary)
+        raise ValueError(f"Unknown DataFrame name: {name}. Available: 'ic_by_date', 'summary'")
+    def list_available_dataframes(self) -> list[str]:
+        """List available DataFrame views."""
+        return ["ic_by_date", "summary"]
+    def summary(self) -> str:
+        """Get human-readable summary of IC analysis results."""
+        lines = ["=" * 60, "IC Analysis Summary", "=" * 60, ""]
+        for period in self.ic_mean:
+            lines.append(f"Period: {period}")
+            lines.append(f"  Mean IC:      {self.ic_mean[period]:>8.4f}")
+            lines.append(f"  Std IC:       {self.ic_std[period]:>8.4f}")
+            lines.append(f"  IR:           {self.ic_ir[period]:>8.4f}")
+            lines.append(f"  t-stat:       {self.ic_t_stat[period]:>8.2f}")
+            lines.append(f"  p-value:      {self.ic_p_value[period]:>8.4f}")
+            lines.append(f"  Positive %:   {self.ic_positive_pct[period]:>8.1%}")
+            if self.ras_adjusted_ic is not None and self.ras_significant is not None:
+                lines.append(f"  RAS IC:       {self.ras_adjusted_ic[period]:>8.4f}")
+                sig = "Y" if self.ras_significant[period] else "X"
+                lines.append(f"  RAS Signif:   {sig:>8}")
+            lines.append("")
+        return "\n".join(lines)
+    # =========================================================================
+    # Convenience Accessor Methods
+    # =========================================================================
+    @property
+    def periods(self) -> list[str]:
+        """List of available periods (e.g., ['1D', '5D', '21D'])."""
+        return list(self.ic_mean.keys())
+    def get_ic(self, period: int | str) -> float | None:
+        """Get mean IC for a period, accepting int or string keys.
+        Parameters
+        ----------
+        period : int | str
+            Period as integer (21) or string ('21' or '21D').
+        Returns
+        -------
+        float | None
+            Mean IC for the period, or None if not found.
+        Examples
+        --------
+        >>> ic_result.get_ic(21)  # Works
+        >>> ic_result.get_ic('21')  # Works
+        >>> ic_result.get_ic('21D')  # Works
+        """
+        key = _normalize_period(period)
+        return self.ic_mean.get(key)
+    def get_t_stat(self, period: int | str) -> float | None:
+        """Get t-statistic for a period."""
+        key = _normalize_period(period)
+        return self.ic_t_stat.get(key)
+    def get_p_value(self, period: int | str) -> float | None:
+        """Get p-value for a period."""
+        key = _normalize_period(period)
+        return self.ic_p_value.get(key)
+    def get_ir(self, period: int | str) -> float | None:
+        """Get Information Ratio (IC/std) for a period."""
+        key = _normalize_period(period)
+        return self.ic_ir.get(key)
+    def get_stats(self, period: int | str) -> ICStats | None:
+        """Get all IC statistics for a period as a typed object.
+        This is the recommended way to access IC results, providing
+        a clean typed interface instead of multiple dict lookups.
+        Parameters
+        ----------
+        period : int | str
+            Period as integer or string (e.g., 21, '21', '21D').
+        Returns
+        -------
+        ICStats | None
+            Typed container with all IC metrics, or None if period not found.
+        Examples
+        --------
+        >>> stats = ic_result.get_stats(21)
+        >>> if stats:
+        ...     print(f"IC: {stats.mean:.4f} (t={stats.t_stat:.2f}, p={stats.p_value:.4f})")
+        ...     if stats.ras_significant:
+        ...         print("Significant after RAS adjustment!")
+        """
+        key = _normalize_period(period)
+        if key not in self.ic_mean:
+            return None
+        return ICStats(
+            mean=self.ic_mean[key],
+            std=self.ic_std[key],
+            t_stat=self.ic_t_stat[key],
+            p_value=self.ic_p_value[key],
+            positive_pct=self.ic_positive_pct[key],
+            ir=self.ic_ir[key],
+            t_stat_hac=self.ic_t_stat_hac.get(key) if self.ic_t_stat_hac else None,
+            p_value_hac=self.ic_p_value_hac.get(key) if self.ic_p_value_hac else None,
+            ras_adjusted=self.ras_adjusted_ic.get(key) if self.ras_adjusted_ic else None,
+            ras_significant=self.ras_significant.get(key) if self.ras_significant else None,
+        )
+    def is_significant(self, period: int | str, alpha: float = 0.05, use_hac: bool = True) -> bool:
+        """Check if IC is statistically significant for a period.
+        Parameters
+        ----------
+        period : int | str
+            Period to check.
+        alpha : float, default 0.05
+            Significance level.
+        use_hac : bool, default True
+            Use HAC-adjusted p-value if available.
+        Returns
+        -------
+        bool
+            True if p-value < alpha.
+        """
+        key = _normalize_period(period)
+        # Prefer HAC-adjusted p-value if available and requested
+        p_val: float | None
+        if use_hac and self.ic_p_value_hac and key in self.ic_p_value_hac:
+            p_val = self.ic_p_value_hac[key]
+        else:
+            p_val = self.ic_p_value.get(key)
+        if p_val is None:
+            return False
+        return p_val < alpha
+class RASICResult(BaseResult):
+    """Results from RAS-adjusted IC analysis.
+    Specialized result class for Rademacher Anti-Serum adjustments
+    used in multiple testing correction.
+    Examples
+    --------
+    >>> result = ras_ic_result
+    >>> if result.any_significant:
+    ...     print("Found significant signals after RAS adjustment")
+    """
+    analysis_type: str = Field(default="ras_ic_analysis", frozen=True)
+    # ==========================================================================
+    # Input Summary
+    # ==========================================================================
+    n_signals: int = Field(
+        ...,
+        description="Number of signals tested",
+    )
+    n_samples: int = Field(
+        ...,
+        description="Number of time periods used",
+    )
+    # ==========================================================================
+    # RAS Parameters
+    # ==========================================================================
+    delta: float = Field(
+        ...,
+        description="Significance level used (1-delta = confidence)",
+    )
+    kappa: float = Field(
+        ...,
+        description="IC bound used (|IC| <= kappa)",
+    )
+    n_simulations: int = Field(
+        ...,
+        description="Monte Carlo simulations used",
+    )
+    # ==========================================================================
+    # Results
+    # ==========================================================================
+    rademacher_complexity: float = Field(
+        ...,
+        description="Empirical Rademacher complexity R^",
+    )
+    massart_bound: float = Field(
+        ...,
+        description="Massart's theoretical upper bound sqrt(2logN/T)",
+    )
+    observed_ic: dict[str, float] = Field(
+        ...,
+        description="Observed IC for each signal",
+    )
+    adjusted_ic: dict[str, float] = Field(
+        ...,
+        description="RAS-adjusted conservative IC lower bounds",
+    )
+    is_significant: dict[str, bool] = Field(
+        ...,
+        description="Whether adjusted IC > 0 for each signal",
+    )
+    # ==========================================================================
+    # Summary Statistics
+    # ==========================================================================
+    n_significant: int = Field(
+        ...,
+        description="Number of signals with adjusted IC > 0",
+    )
+    any_significant: bool = Field(
+        ...,
+        description="Whether any signal passed RAS test",
+    )
+    data_snooping_term: float = Field(
+        ...,
+        description="Data snooping penalty (2 * R^)",
+    )
+    estimation_error_term: float = Field(
+        ...,
+        description="Estimation error term (2*kappa*sqrt(log(2/delta)/T))",
+    )
+    # ==========================================================================
+    # Validation
+    # ==========================================================================
+    @model_validator(mode="after")
+    def _validate_signal_keys(self) -> RASICResult:
+        """Validate that all signal-keyed dicts share the same keys."""
+        data = self.model_dump()
+        _validate_dict_keys_match(
+            data,
+            required_fields=["observed_ic", "adjusted_ic", "is_significant"],
+            reference_field="observed_ic",
+        )
+        return self
+    # ==========================================================================
+    # Methods
+    # ==========================================================================
+    def get_dataframe(self, name: str | None = None) -> pl.DataFrame:
+        """Get results as Polars DataFrame.
+        Parameters
+        ----------
+        name : str | None
+            DataFrame to retrieve:
+            - None or "signals": Per-signal results
+            - "summary": Summary statistics
+        Returns
+        -------
+        pl.DataFrame
+            Requested DataFrame
+        """
+        if name is None or name == "signals":
+            signals = list(self.observed_ic.keys())
+            return pl.DataFrame(
+                {
+                    "signal": signals,
+                    "observed_ic": [self.observed_ic[s] for s in signals],
+                    "adjusted_ic": [self.adjusted_ic[s] for s in signals],
+                    "is_significant": [self.is_significant[s] for s in signals],
+                }
+            )
+        if name == "summary":
+            return pl.DataFrame(
+                {
+                    "metric": [
+                        "n_signals",
+                        "n_samples",
+                        "rademacher_complexity",
+                        "massart_bound",
+                        "data_snooping_term",
+                        "estimation_error_term",
+                        "n_significant",
+                    ],
+                    "value": [
+                        float(self.n_signals),
+                        float(self.n_samples),
+                        self.rademacher_complexity,
+                        self.massart_bound,
+                        self.data_snooping_term,
+                        self.estimation_error_term,
+                        float(self.n_significant),
+                    ],
+                }
+            )
+        raise ValueError(f"Unknown DataFrame name: {name}. Available: 'signals', 'summary'")
+    def list_available_dataframes(self) -> list[str]:
+        """List available DataFrame views."""
+        return ["signals", "summary"]
+    def summary(self) -> str:
+        """Get human-readable summary of RAS IC results."""
+        lines = [
+            "=" * 60,
+            "RAS IC Analysis Summary",
+            "=" * 60,
+            "",
+            f"Signals Tested:       {self.n_signals:>10}",
+            f"Time Periods:         {self.n_samples:>10}",
+            f"Confidence Level:     {1 - self.delta:>10.1%}",
+            f"IC Bound (kappa):     {self.kappa:>10.4f}",
+            "",
+            f"Rademacher Complexity:{self.rademacher_complexity:>10.4f}",
+            f"Massart Bound:        {self.massart_bound:>10.4f}",
+            f"Data Snooping Term:   {self.data_snooping_term:>10.4f}",
+            f"Estimation Error:     {self.estimation_error_term:>10.4f}",
+            "",
+            f"Significant Signals:  {self.n_significant:>10} / {self.n_signals}",
+            "",
+        ]
+        if self.any_significant:
+            lines.append("Significant signals (RAS-adjusted IC > 0):")
+            for signal, sig in self.is_significant.items():
+                if sig:
+                    obs = self.observed_ic[signal]
+                    adj = self.adjusted_ic[signal]
+                    lines.append(f"  {signal}: observed={obs:.4f}, adjusted={adj:.4f}")
+        return "\n".join(lines)

ml4t/diagnostic/results/signal_results/irtc.py ADDED Viewed

@@ -0,0 +1,110 @@
+"""IR_tc (Transaction-Cost Adjusted Information Ratio) result classes.
+This module provides result classes for storing transaction-cost-adjusted
+Information Ratio analysis outputs.
+References
+----------
+Lopez de Prado, M. (2018). "Advances in Financial Machine Learning"
+"""
+from __future__ import annotations
+import polars as pl
+from pydantic import Field
+from ml4t.diagnostic.results.base import BaseResult
+class IRtcResult(BaseResult):
+    """Results from transaction-cost-adjusted Information Ratio analysis.
+    IR_tc measures the risk-adjusted IC after accounting for the cost
+    of turnover required to maintain the signal-based portfolio.
+    IR_tc = (IC * spread_return - turnover * cost) / volatility
+    Examples
+    --------
+    >>> result = ir_tc_result
+    >>> print(result.summary())
+    """
+    analysis_type: str = Field(default="ir_tc_analysis", frozen=True)
+    # ==========================================================================
+    # Configuration
+    # ==========================================================================
+    cost_per_trade: float = Field(
+        ...,
+        description="Transaction cost per unit turnover used",
+    )
+    # ==========================================================================
+    # Results by Period
+    # ==========================================================================
+    ir_gross: dict[str, float] = Field(
+        ...,
+        description="Gross IR (before transaction costs) per period",
+    )
+    ir_tc: dict[str, float] = Field(
+        ...,
+        description="Net IR (after transaction costs) per period",
+    )
+    implied_cost: dict[str, float] = Field(
+        ...,
+        description="Implied cost from turnover per period",
+    )
+    breakeven_cost: dict[str, float] = Field(
+        ...,
+        description="Breakeven cost (cost at which IR_tc = 0)",
+    )
+    cost_drag: dict[str, float] = Field(
+        ...,
+        description="Percentage of gross return lost to costs",
+    )
+    def get_dataframe(self, name: str | None = None) -> pl.DataFrame:
+        """Get results as Polars DataFrame."""
+        periods = list(self.ir_gross.keys())
+        return pl.DataFrame(
+            {
+                "period": periods,
+                "ir_gross": [self.ir_gross[p] for p in periods],
+                "ir_tc": [self.ir_tc[p] for p in periods],
+                "implied_cost": [self.implied_cost[p] for p in periods],
+                "breakeven_cost": [self.breakeven_cost[p] for p in periods],
+                "cost_drag": [self.cost_drag[p] for p in periods],
+            }
+        )
+    def list_available_dataframes(self) -> list[str]:
+        """List available DataFrame views."""
+        return ["primary"]
+    def summary(self) -> str:
+        """Get human-readable summary of IR_tc results."""
+        lines = [
+            "=" * 60,
+            "Transaction-Cost Adjusted IR Summary",
+            "=" * 60,
+            "",
+            f"Cost per Trade: {self.cost_per_trade:.4f} ({self.cost_per_trade * 10000:.0f} bps)",
+            "",
+            "Period       IR_gross    IR_tc    Cost Drag   Breakeven",
+            "-" * 60,
+        ]
+        for period in self.ir_gross:
+            lines.append(
+                f"{period:<12} {self.ir_gross[period]:>8.4f}  {self.ir_tc[period]:>8.4f}  "
+                f"{self.cost_drag[period]:>8.1%}  {self.breakeven_cost[period]:>8.4f}"
+            )
+        return "\n".join(lines)