PyPI - ml4t-diagnostic - Versions diffs - 0.1.0a1__py3-none-any.whl - Mend

ml4t-diagnostic 0.1.0a1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

ml4t/diagnostic/AGENT.md +25 -0
ml4t/diagnostic/__init__.py +166 -0
ml4t/diagnostic/backends/__init__.py +10 -0
ml4t/diagnostic/backends/adapter.py +192 -0
ml4t/diagnostic/backends/polars_backend.py +899 -0
ml4t/diagnostic/caching/__init__.py +40 -0
ml4t/diagnostic/caching/cache.py +331 -0
ml4t/diagnostic/caching/decorators.py +131 -0
ml4t/diagnostic/caching/smart_cache.py +339 -0
ml4t/diagnostic/config/AGENT.md +24 -0
ml4t/diagnostic/config/README.md +267 -0
ml4t/diagnostic/config/__init__.py +219 -0
ml4t/diagnostic/config/barrier_config.py +277 -0
ml4t/diagnostic/config/base.py +301 -0
ml4t/diagnostic/config/event_config.py +148 -0
ml4t/diagnostic/config/feature_config.py +404 -0
ml4t/diagnostic/config/multi_signal_config.py +55 -0
ml4t/diagnostic/config/portfolio_config.py +215 -0
ml4t/diagnostic/config/report_config.py +391 -0
ml4t/diagnostic/config/sharpe_config.py +202 -0
ml4t/diagnostic/config/signal_config.py +206 -0
ml4t/diagnostic/config/trade_analysis_config.py +310 -0
ml4t/diagnostic/config/validation.py +279 -0
ml4t/diagnostic/core/__init__.py +29 -0
ml4t/diagnostic/core/numba_utils.py +315 -0
ml4t/diagnostic/core/purging.py +372 -0
ml4t/diagnostic/core/sampling.py +471 -0
ml4t/diagnostic/errors/__init__.py +205 -0
ml4t/diagnostic/evaluation/AGENT.md +26 -0
ml4t/diagnostic/evaluation/__init__.py +437 -0
ml4t/diagnostic/evaluation/autocorrelation.py +531 -0
ml4t/diagnostic/evaluation/barrier_analysis.py +1050 -0
ml4t/diagnostic/evaluation/binary_metrics.py +910 -0
ml4t/diagnostic/evaluation/dashboard.py +715 -0
ml4t/diagnostic/evaluation/diagnostic_plots.py +1037 -0
ml4t/diagnostic/evaluation/distribution/__init__.py +499 -0
ml4t/diagnostic/evaluation/distribution/moments.py +299 -0
ml4t/diagnostic/evaluation/distribution/tails.py +777 -0
ml4t/diagnostic/evaluation/distribution/tests.py +470 -0
ml4t/diagnostic/evaluation/drift/__init__.py +139 -0
ml4t/diagnostic/evaluation/drift/analysis.py +432 -0
ml4t/diagnostic/evaluation/drift/domain_classifier.py +517 -0
ml4t/diagnostic/evaluation/drift/population_stability_index.py +310 -0
ml4t/diagnostic/evaluation/drift/wasserstein.py +388 -0
ml4t/diagnostic/evaluation/event_analysis.py +647 -0
ml4t/diagnostic/evaluation/excursion.py +390 -0
ml4t/diagnostic/evaluation/feature_diagnostics.py +873 -0
ml4t/diagnostic/evaluation/feature_outcome.py +666 -0
ml4t/diagnostic/evaluation/framework.py +935 -0
ml4t/diagnostic/evaluation/metric_registry.py +255 -0
ml4t/diagnostic/evaluation/metrics/AGENT.md +23 -0
ml4t/diagnostic/evaluation/metrics/__init__.py +133 -0
ml4t/diagnostic/evaluation/metrics/basic.py +160 -0
ml4t/diagnostic/evaluation/metrics/conditional_ic.py +469 -0
ml4t/diagnostic/evaluation/metrics/feature_outcome.py +475 -0
ml4t/diagnostic/evaluation/metrics/ic_statistics.py +446 -0
ml4t/diagnostic/evaluation/metrics/importance_analysis.py +338 -0
ml4t/diagnostic/evaluation/metrics/importance_classical.py +375 -0
ml4t/diagnostic/evaluation/metrics/importance_mda.py +371 -0
ml4t/diagnostic/evaluation/metrics/importance_shap.py +715 -0
ml4t/diagnostic/evaluation/metrics/information_coefficient.py +527 -0
ml4t/diagnostic/evaluation/metrics/interactions.py +772 -0
ml4t/diagnostic/evaluation/metrics/monotonicity.py +226 -0
ml4t/diagnostic/evaluation/metrics/risk_adjusted.py +324 -0
ml4t/diagnostic/evaluation/multi_signal.py +550 -0
ml4t/diagnostic/evaluation/portfolio_analysis/__init__.py +83 -0
ml4t/diagnostic/evaluation/portfolio_analysis/analysis.py +734 -0
ml4t/diagnostic/evaluation/portfolio_analysis/metrics.py +589 -0
ml4t/diagnostic/evaluation/portfolio_analysis/results.py +334 -0
ml4t/diagnostic/evaluation/report_generation.py +824 -0
ml4t/diagnostic/evaluation/signal_selector.py +452 -0
ml4t/diagnostic/evaluation/stat_registry.py +139 -0
ml4t/diagnostic/evaluation/stationarity/__init__.py +97 -0
ml4t/diagnostic/evaluation/stationarity/analysis.py +518 -0
ml4t/diagnostic/evaluation/stationarity/augmented_dickey_fuller.py +296 -0
ml4t/diagnostic/evaluation/stationarity/kpss_test.py +308 -0
ml4t/diagnostic/evaluation/stationarity/phillips_perron.py +365 -0
ml4t/diagnostic/evaluation/stats/AGENT.md +43 -0
ml4t/diagnostic/evaluation/stats/__init__.py +191 -0
ml4t/diagnostic/evaluation/stats/backtest_overfitting.py +219 -0
ml4t/diagnostic/evaluation/stats/bootstrap.py +228 -0
ml4t/diagnostic/evaluation/stats/deflated_sharpe_ratio.py +591 -0
ml4t/diagnostic/evaluation/stats/false_discovery_rate.py +295 -0
ml4t/diagnostic/evaluation/stats/hac_standard_errors.py +108 -0
ml4t/diagnostic/evaluation/stats/minimum_track_record.py +408 -0
ml4t/diagnostic/evaluation/stats/moments.py +164 -0
ml4t/diagnostic/evaluation/stats/rademacher_adjustment.py +436 -0
ml4t/diagnostic/evaluation/stats/reality_check.py +155 -0
ml4t/diagnostic/evaluation/stats/sharpe_inference.py +219 -0
ml4t/diagnostic/evaluation/themes.py +330 -0
ml4t/diagnostic/evaluation/threshold_analysis.py +957 -0
ml4t/diagnostic/evaluation/trade_analysis.py +1136 -0
ml4t/diagnostic/evaluation/trade_dashboard/__init__.py +32 -0
ml4t/diagnostic/evaluation/trade_dashboard/app.py +315 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/__init__.py +18 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/csv.py +82 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/html.py +276 -0
ml4t/diagnostic/evaluation/trade_dashboard/io.py +166 -0
ml4t/diagnostic/evaluation/trade_dashboard/normalize.py +304 -0
ml4t/diagnostic/evaluation/trade_dashboard/stats.py +386 -0
ml4t/diagnostic/evaluation/trade_dashboard/style.py +79 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/__init__.py +21 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/patterns.py +354 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/shap_analysis.py +280 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/stat_validation.py +186 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/worst_trades.py +236 -0
ml4t/diagnostic/evaluation/trade_dashboard/types.py +129 -0
ml4t/diagnostic/evaluation/trade_shap/__init__.py +102 -0
ml4t/diagnostic/evaluation/trade_shap/alignment.py +188 -0
ml4t/diagnostic/evaluation/trade_shap/characterize.py +413 -0
ml4t/diagnostic/evaluation/trade_shap/cluster.py +302 -0
ml4t/diagnostic/evaluation/trade_shap/explain.py +208 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/__init__.py +23 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/generator.py +290 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/matcher.py +251 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/templates.yaml +467 -0
ml4t/diagnostic/evaluation/trade_shap/models.py +386 -0
ml4t/diagnostic/evaluation/trade_shap/normalize.py +116 -0
ml4t/diagnostic/evaluation/trade_shap/pipeline.py +263 -0
ml4t/diagnostic/evaluation/trade_shap_dashboard.py +283 -0
ml4t/diagnostic/evaluation/trade_shap_diagnostics.py +588 -0
ml4t/diagnostic/evaluation/validated_cv.py +535 -0
ml4t/diagnostic/evaluation/visualization.py +1050 -0
ml4t/diagnostic/evaluation/volatility/__init__.py +45 -0
ml4t/diagnostic/evaluation/volatility/analysis.py +351 -0
ml4t/diagnostic/evaluation/volatility/arch.py +258 -0
ml4t/diagnostic/evaluation/volatility/garch.py +460 -0
ml4t/diagnostic/integration/__init__.py +48 -0
ml4t/diagnostic/integration/backtest_contract.py +671 -0
ml4t/diagnostic/integration/data_contract.py +316 -0
ml4t/diagnostic/integration/engineer_contract.py +226 -0
ml4t/diagnostic/logging/__init__.py +77 -0
ml4t/diagnostic/logging/logger.py +245 -0
ml4t/diagnostic/logging/performance.py +234 -0
ml4t/diagnostic/logging/progress.py +234 -0
ml4t/diagnostic/logging/wandb.py +412 -0
ml4t/diagnostic/metrics/__init__.py +9 -0
ml4t/diagnostic/metrics/percentiles.py +128 -0
ml4t/diagnostic/py.typed +1 -0
ml4t/diagnostic/reporting/__init__.py +43 -0
ml4t/diagnostic/reporting/base.py +130 -0
ml4t/diagnostic/reporting/html_renderer.py +275 -0
ml4t/diagnostic/reporting/json_renderer.py +51 -0
ml4t/diagnostic/reporting/markdown_renderer.py +117 -0
ml4t/diagnostic/results/AGENT.md +24 -0
ml4t/diagnostic/results/__init__.py +105 -0
ml4t/diagnostic/results/barrier_results/__init__.py +36 -0
ml4t/diagnostic/results/barrier_results/hit_rate.py +304 -0
ml4t/diagnostic/results/barrier_results/precision_recall.py +266 -0
ml4t/diagnostic/results/barrier_results/profit_factor.py +297 -0
ml4t/diagnostic/results/barrier_results/tearsheet.py +397 -0
ml4t/diagnostic/results/barrier_results/time_to_target.py +305 -0
ml4t/diagnostic/results/barrier_results/validation.py +38 -0
ml4t/diagnostic/results/base.py +177 -0
ml4t/diagnostic/results/event_results.py +349 -0
ml4t/diagnostic/results/feature_results.py +787 -0
ml4t/diagnostic/results/multi_signal_results.py +431 -0
ml4t/diagnostic/results/portfolio_results.py +281 -0
ml4t/diagnostic/results/sharpe_results.py +448 -0
ml4t/diagnostic/results/signal_results/__init__.py +74 -0
ml4t/diagnostic/results/signal_results/ic.py +581 -0
ml4t/diagnostic/results/signal_results/irtc.py +110 -0
ml4t/diagnostic/results/signal_results/quantile.py +392 -0
ml4t/diagnostic/results/signal_results/tearsheet.py +456 -0
ml4t/diagnostic/results/signal_results/turnover.py +213 -0
ml4t/diagnostic/results/signal_results/validation.py +147 -0
ml4t/diagnostic/signal/AGENT.md +17 -0
ml4t/diagnostic/signal/__init__.py +69 -0
ml4t/diagnostic/signal/_report.py +152 -0
ml4t/diagnostic/signal/_utils.py +261 -0
ml4t/diagnostic/signal/core.py +275 -0
ml4t/diagnostic/signal/quantile.py +148 -0
ml4t/diagnostic/signal/result.py +214 -0
ml4t/diagnostic/signal/signal_ic.py +129 -0
ml4t/diagnostic/signal/turnover.py +182 -0
ml4t/diagnostic/splitters/AGENT.md +19 -0
ml4t/diagnostic/splitters/__init__.py +36 -0
ml4t/diagnostic/splitters/base.py +501 -0
ml4t/diagnostic/splitters/calendar.py +421 -0
ml4t/diagnostic/splitters/calendar_config.py +91 -0
ml4t/diagnostic/splitters/combinatorial.py +1064 -0
ml4t/diagnostic/splitters/config.py +322 -0
ml4t/diagnostic/splitters/cpcv/__init__.py +57 -0
ml4t/diagnostic/splitters/cpcv/combinations.py +119 -0
ml4t/diagnostic/splitters/cpcv/partitioning.py +263 -0
ml4t/diagnostic/splitters/cpcv/purge_engine.py +379 -0
ml4t/diagnostic/splitters/cpcv/windows.py +190 -0
ml4t/diagnostic/splitters/group_isolation.py +329 -0
ml4t/diagnostic/splitters/persistence.py +316 -0
ml4t/diagnostic/splitters/utils.py +207 -0
ml4t/diagnostic/splitters/walk_forward.py +757 -0
ml4t/diagnostic/utils/__init__.py +42 -0
ml4t/diagnostic/utils/config.py +542 -0
ml4t/diagnostic/utils/dependencies.py +318 -0
ml4t/diagnostic/utils/sessions.py +127 -0
ml4t/diagnostic/validation/__init__.py +54 -0
ml4t/diagnostic/validation/dataframe.py +274 -0
ml4t/diagnostic/validation/returns.py +280 -0
ml4t/diagnostic/validation/timeseries.py +299 -0
ml4t/diagnostic/visualization/AGENT.md +19 -0
ml4t/diagnostic/visualization/__init__.py +223 -0
ml4t/diagnostic/visualization/backtest/__init__.py +98 -0
ml4t/diagnostic/visualization/backtest/cost_attribution.py +762 -0
ml4t/diagnostic/visualization/backtest/executive_summary.py +895 -0
ml4t/diagnostic/visualization/backtest/interactive_controls.py +673 -0
ml4t/diagnostic/visualization/backtest/statistical_validity.py +874 -0
ml4t/diagnostic/visualization/backtest/tearsheet.py +565 -0
ml4t/diagnostic/visualization/backtest/template_system.py +373 -0
ml4t/diagnostic/visualization/backtest/trade_plots.py +1172 -0
ml4t/diagnostic/visualization/barrier_plots.py +782 -0
ml4t/diagnostic/visualization/core.py +1060 -0
ml4t/diagnostic/visualization/dashboards/__init__.py +36 -0
ml4t/diagnostic/visualization/dashboards/base.py +582 -0
ml4t/diagnostic/visualization/dashboards/importance.py +801 -0
ml4t/diagnostic/visualization/dashboards/interaction.py +263 -0
ml4t/diagnostic/visualization/dashboards.py +43 -0
ml4t/diagnostic/visualization/data_extraction/__init__.py +48 -0
ml4t/diagnostic/visualization/data_extraction/importance.py +649 -0
ml4t/diagnostic/visualization/data_extraction/interaction.py +504 -0
ml4t/diagnostic/visualization/data_extraction/types.py +113 -0
ml4t/diagnostic/visualization/data_extraction/validation.py +66 -0
ml4t/diagnostic/visualization/feature_plots.py +888 -0
ml4t/diagnostic/visualization/interaction_plots.py +618 -0
ml4t/diagnostic/visualization/portfolio/__init__.py +41 -0
ml4t/diagnostic/visualization/portfolio/dashboard.py +514 -0
ml4t/diagnostic/visualization/portfolio/drawdown_plots.py +341 -0
ml4t/diagnostic/visualization/portfolio/returns_plots.py +487 -0
ml4t/diagnostic/visualization/portfolio/risk_plots.py +301 -0
ml4t/diagnostic/visualization/report_generation.py +1343 -0
ml4t/diagnostic/visualization/signal/__init__.py +103 -0
ml4t/diagnostic/visualization/signal/dashboard.py +911 -0
ml4t/diagnostic/visualization/signal/event_plots.py +514 -0
ml4t/diagnostic/visualization/signal/ic_plots.py +635 -0
ml4t/diagnostic/visualization/signal/multi_signal_dashboard.py +974 -0
ml4t/diagnostic/visualization/signal/multi_signal_plots.py +603 -0
ml4t/diagnostic/visualization/signal/quantile_plots.py +625 -0
ml4t/diagnostic/visualization/signal/turnover_plots.py +400 -0
ml4t/diagnostic/visualization/trade_shap/__init__.py +90 -0
ml4t_diagnostic-0.1.0a1.dist-info/METADATA +1044 -0
ml4t_diagnostic-0.1.0a1.dist-info/RECORD +242 -0
ml4t_diagnostic-0.1.0a1.dist-info/WHEEL +4 -0
ml4t_diagnostic-0.1.0a1.dist-info/licenses/LICENSE +21 -0

ml4t/diagnostic/results/feature_results.py ADDED Viewed

@@ -0,0 +1,787 @@
+"""Result schemas for feature evaluation modules (A, B, C).
+Module A: Feature Diagnostics (stationarity, ACF, volatility clustering)
+Module B: Cross-Feature Analysis (correlations, PCA, clustering)
+Module C: Feature-Outcome Relationships (IC analysis, threshold analysis)
+"""
+from __future__ import annotations
+from typing import TYPE_CHECKING, Any
+import polars as pl
+from pydantic import Field
+from ml4t.diagnostic.results.base import BaseResult
+if TYPE_CHECKING:
+    from ml4t.diagnostic.integration.engineer_contract import EngineerConfig
+# =============================================================================
+# Module A: Feature Diagnostics
+# =============================================================================
+class StationarityTestResult(BaseResult):
+    """Results from stationarity tests (ADF, KPSS, PP).
+    Tests whether a time series is stationary (mean-reverting) or has unit root.
+    Attributes:
+        feature_name: Name of feature tested
+        adf_statistic: Augmented Dickey-Fuller test statistic
+        adf_pvalue: ADF p-value (reject H0 if < alpha => stationary)
+        adf_is_stationary: Whether ADF indicates stationarity
+        adf_critical_values: ADF critical values at 1%, 5%, 10% levels
+        adf_lags_used: Number of lags used in ADF test
+        adf_n_obs: Number of observations used in ADF test
+        kpss_statistic: KPSS test statistic
+        kpss_pvalue: KPSS p-value (reject H0 if < alpha => non-stationary)
+        kpss_is_stationary: Whether KPSS indicates stationarity
+        pp_statistic: Phillips-Perron test statistic
+        pp_pvalue: PP p-value
+        pp_is_stationary: Whether PP indicates stationarity
+    """
+    analysis_type: str = "stationarity_test"
+    feature_name: str = Field(..., description="Feature name")
+    # ADF test
+    adf_statistic: float | None = Field(None, description="ADF test statistic")
+    adf_pvalue: float | None = Field(None, description="ADF p-value")
+    adf_is_stationary: bool | None = Field(None, description="ADF stationarity")
+    adf_critical_values: dict[str, float] | None = Field(
+        None, description="ADF critical values (1%, 5%, 10%)"
+    )
+    adf_lags_used: int | None = Field(None, description="Lags used in ADF test")
+    adf_n_obs: int | None = Field(None, description="Observations in ADF test")
+    # KPSS test
+    kpss_statistic: float | None = Field(None, description="KPSS test statistic")
+    kpss_pvalue: float | None = Field(None, description="KPSS p-value")
+    kpss_is_stationary: bool | None = Field(None, description="KPSS stationarity")
+    # Phillips-Perron test
+    pp_statistic: float | None = Field(None, description="PP test statistic")
+    pp_pvalue: float | None = Field(None, description="PP p-value")
+    pp_is_stationary: bool | None = Field(None, description="PP stationarity")
+    def list_available_dataframes(self) -> list[str]:
+        """List available DataFrame views.
+        Returns:
+            List with single 'primary' view containing all test results
+        """
+        return ["primary"]
+    def get_dataframe(self, name: str | None = None) -> pl.DataFrame:
+        """Get test results as DataFrame.
+        Args:
+            name: DataFrame name (ignored, only 'primary' available)
+        Returns:
+            DataFrame with test statistics and conclusions
+        Raises:
+            ValueError: If name is provided but not 'primary'
+        """
+        if name is not None and name != "primary":
+            raise ValueError(
+                f"Unknown DataFrame name: {name}. Available: {self.list_available_dataframes()}"
+            )
+        data = {
+            "feature": [self.feature_name],
+            "adf_statistic": [self.adf_statistic],
+            "adf_pvalue": [self.adf_pvalue],
+            "adf_stationary": [self.adf_is_stationary],
+            "adf_lags_used": [self.adf_lags_used],
+            "adf_n_obs": [self.adf_n_obs],
+            "kpss_statistic": [self.kpss_statistic],
+            "kpss_pvalue": [self.kpss_pvalue],
+            "kpss_stationary": [self.kpss_is_stationary],
+            "pp_statistic": [self.pp_statistic],
+            "pp_pvalue": [self.pp_pvalue],
+            "pp_stationary": [self.pp_is_stationary],
+        }
+        return pl.DataFrame(data)
+    def summary(self) -> str:
+        """Human-readable summary of stationarity tests."""
+        lines = [f"Stationarity Tests: {self.feature_name}"]
+        if self.adf_is_stationary is not None:
+            lines.append(
+                f"  ADF: {'Stationary' if self.adf_is_stationary else 'Non-stationary'} (p={self.adf_pvalue:.4f})"
+            )
+        if self.kpss_is_stationary is not None:
+            lines.append(
+                f"  KPSS: {'Stationary' if self.kpss_is_stationary else 'Non-stationary'} (p={self.kpss_pvalue:.4f})"
+            )
+        if self.pp_is_stationary is not None:
+            lines.append(
+                f"  PP: {'Stationary' if self.pp_is_stationary else 'Non-stationary'} (p={self.pp_pvalue:.4f})"
+            )
+        return "\n".join(lines)
+class ACFResult(BaseResult):
+    """Autocorrelation Function (ACF) and Partial ACF analysis results.
+    Detects serial correlation and lag structure in time series.
+    Attributes:
+        feature_name: Name of feature analyzed
+        acf_values: ACF values at each lag
+        pacf_values: PACF values at each lag
+        significant_lags_acf: List of lags with significant ACF
+        significant_lags_pacf: List of lags with significant PACF
+        ljung_box_statistic: Ljung-Box test statistic
+        ljung_box_pvalue: Ljung-Box p-value (reject H0 => autocorrelation present)
+    """
+    analysis_type: str = "acf_analysis"
+    feature_name: str = Field(..., description="Feature name")
+    acf_values: list[float] = Field(..., description="ACF at each lag")
+    pacf_values: list[float] = Field(..., description="PACF at each lag")
+    significant_lags_acf: list[int] = Field(
+        default_factory=list, description="Lags with significant ACF"
+    )
+    significant_lags_pacf: list[int] = Field(
+        default_factory=list, description="Lags with significant PACF"
+    )
+    ljung_box_statistic: float | None = Field(None, description="Ljung-Box statistic")
+    ljung_box_pvalue: float | None = Field(None, description="Ljung-Box p-value")
+    def list_available_dataframes(self) -> list[str]:
+        """List available DataFrame views.
+        Returns:
+            List with single 'primary' view containing ACF/PACF values
+        """
+        return ["primary"]
+    def get_dataframe(self, name: str | None = None) -> pl.DataFrame:
+        """Get ACF/PACF values as DataFrame.
+        Args:
+            name: DataFrame name (ignored, only 'primary' available)
+        Returns:
+            DataFrame with lag, ACF, and PACF values
+        Raises:
+            ValueError: If name is provided but not 'primary'
+        """
+        if name is not None and name != "primary":
+            raise ValueError(
+                f"Unknown DataFrame name: {name}. Available: {self.list_available_dataframes()}"
+            )
+        n_lags = len(self.acf_values)
+        data = {
+            "lag": list(range(n_lags)),
+            "acf": self.acf_values,
+            "pacf": self.pacf_values,
+        }
+        return pl.DataFrame(data)
+    def summary(self) -> str:
+        """Human-readable summary of autocorrelation analysis."""
+        lines = [f"ACF/PACF Analysis: {self.feature_name}"]
+        lines.append(f"  Lags analyzed: {len(self.acf_values)}")
+        lines.append(f"  Significant ACF lags: {self.significant_lags_acf}")
+        lines.append(f"  Significant PACF lags: {self.significant_lags_pacf}")
+        if self.ljung_box_pvalue is not None:
+            lines.append(
+                f"  Ljung-Box test: p={self.ljung_box_pvalue:.4f} "
+                f"({'Autocorrelation present' if self.ljung_box_pvalue < 0.05 else 'No autocorrelation'})"
+            )
+        return "\n".join(lines)
+class FeatureDiagnosticsResult(BaseResult):
+    """Complete results from Module A: Feature Diagnostics.
+    Comprehensive analysis of individual feature properties:
+    - Stationarity testing (ADF, KPSS, PP)
+    - Autocorrelation structure (ACF, PACF)
+    - Volatility clustering (GARCH effects)
+    - Distribution characteristics (normality, skewness, kurtosis)
+    Attributes:
+        stationarity_tests: Stationarity test results for each feature
+        acf_results: ACF/PACF analysis for each feature
+        volatility_clustering: GARCH detection results
+        distribution_stats: Distribution characteristics
+    """
+    analysis_type: str = "feature_diagnostics"
+    stationarity_tests: list[StationarityTestResult] = Field(
+        default_factory=list, description="Stationarity test results"
+    )
+    acf_results: list[ACFResult] = Field(
+        default_factory=list, description="ACF/PACF analysis results"
+    )
+    volatility_clustering: dict[str, Any] = Field(
+        default_factory=dict, description="GARCH detection results"
+    )
+    distribution_stats: dict[str, Any] = Field(
+        default_factory=dict, description="Distribution characteristics"
+    )
+    def get_stationarity_dataframe(self) -> pl.DataFrame:
+        """Get stationarity test results as DataFrame.
+        Returns:
+            DataFrame with all stationarity tests
+        """
+        if not self.stationarity_tests:
+            return pl.DataFrame()
+        # Combine all test results
+        dfs = [test.get_dataframe() for test in self.stationarity_tests]
+        return pl.concat(dfs)
+    def get_acf_dataframe(self, feature_name: str | None = None) -> pl.DataFrame:
+        """Get ACF/PACF results as DataFrame.
+        Args:
+            feature_name: Optional filter by feature
+        Returns:
+            DataFrame with ACF/PACF values
+        """
+        if not self.acf_results:
+            return pl.DataFrame()
+        results = self.acf_results
+        if feature_name:
+            results = [r for r in results if r.feature_name == feature_name]
+        dfs = []
+        for result in results:
+            df = result.get_dataframe()
+            df = df.with_columns(pl.lit(result.feature_name).alias("feature"))
+            dfs.append(df)
+        return pl.concat(dfs) if dfs else pl.DataFrame()
+    def get_dataframe(self, name: str | None = None) -> pl.DataFrame:
+        """Get results as DataFrame.
+        Args:
+            name: 'stationarity' or 'acf'
+        Returns:
+            Requested DataFrame
+        """
+        if name == "stationarity":
+            return self.get_stationarity_dataframe()
+        elif name == "acf":
+            return self.get_acf_dataframe()
+        else:
+            return self.get_stationarity_dataframe()
+    def summary(self) -> str:
+        """Human-readable summary of diagnostics."""
+        lines = ["Feature Diagnostics Summary", "=" * 40]
+        lines.append(f"Features analyzed: {len(self.stationarity_tests)}")
+        lines.append("")
+        # Stationarity summary
+        if self.stationarity_tests:
+            stationary = sum(
+                1 for t in self.stationarity_tests if t.adf_is_stationary or t.kpss_is_stationary
+            )
+            lines.append(f"Stationary features: {stationary}/{len(self.stationarity_tests)}")
+        # ACF summary
+        if self.acf_results:
+            with_autocorr = sum(1 for r in self.acf_results if r.significant_lags_acf)
+            lines.append(f"Features with autocorrelation: {with_autocorr}/{len(self.acf_results)}")
+        return "\n".join(lines)
+    def to_engineer_config(self) -> EngineerConfig:
+        """Generate preprocessing recommendations for ML4T Engineer.
+        Analyzes diagnostic results to recommend appropriate transforms:
+        - Non-stationary → DIFF (first difference)
+        - High skewness (>2) → LOG or SQRT transform
+        - Outliers detected → WINSORIZE
+        - Already good quality → NONE
+        Returns:
+            EngineerConfig with preprocessing recommendations
+        Example:
+            >>> diagnostics = evaluator.evaluate_diagnostics(features_df)
+            >>> eng_config = diagnostics.to_engineer_config()
+            >>> preprocessing_dict = eng_config.to_dict()
+        """
+        from ml4t.diagnostic.integration.engineer_contract import (
+            EngineerConfig,
+            PreprocessingRecommendation,
+            TransformType,
+        )
+        recommendations = []
+        # Process stationarity tests
+        for stationarity in self.stationarity_tests:
+            feature_name = stationarity.feature_name
+            # Check if non-stationary (both ADF and KPSS should agree ideally)
+            adf_non_stationary = (
+                stationarity.adf_is_stationary is not None and not stationarity.adf_is_stationary
+            )
+            kpss_non_stationary = (
+                stationarity.kpss_is_stationary is not None and not stationarity.kpss_is_stationary
+            )
+            pp_non_stationary = (
+                stationarity.pp_is_stationary is not None and not stationarity.pp_is_stationary
+            )
+            # Count non-stationary signals
+            non_stationary_count = sum([adf_non_stationary, kpss_non_stationary, pp_non_stationary])
+            if non_stationary_count >= 2:
+                # At least 2 tests indicate non-stationarity
+                confidence = 0.9 if non_stationary_count == 3 else 0.8
+                diagnostics_dict = {}
+                if stationarity.adf_pvalue is not None:
+                    diagnostics_dict["adf_pvalue"] = stationarity.adf_pvalue
+                if stationarity.kpss_pvalue is not None:
+                    diagnostics_dict["kpss_pvalue"] = stationarity.kpss_pvalue
+                recommendations.append(
+                    PreprocessingRecommendation(
+                        feature_name=feature_name,
+                        transform=TransformType.DIFF,
+                        reason=f"Feature is non-stationary ({non_stationary_count}/3 tests)",
+                        confidence=confidence,
+                        diagnostics=diagnostics_dict if diagnostics_dict else None,
+                    )
+                )
+            elif non_stationary_count == 1:
+                # Only 1 test indicates non-stationarity - lower confidence
+                test_name = "ADF" if adf_non_stationary else "KPSS" if kpss_non_stationary else "PP"
+                pvalue: float | None = getattr(stationarity, f"{test_name.lower()}_pvalue")
+                single_test_diagnostics: dict[str, float] | None = (
+                    {f"{test_name.lower()}_pvalue": pvalue} if pvalue is not None else None
+                )
+                recommendations.append(
+                    PreprocessingRecommendation(
+                        feature_name=feature_name,
+                        transform=TransformType.DIFF,
+                        reason=f"Possible non-stationarity ({test_name} test)",
+                        confidence=0.6,
+                        diagnostics=single_test_diagnostics,
+                    )
+                )
+            else:
+                # Stationary - no transform needed
+                recommendations.append(
+                    PreprocessingRecommendation(
+                        feature_name=feature_name,
+                        transform=TransformType.NONE,
+                        reason="Feature is stationary (all tests)",
+                        confidence=0.9,
+                    )
+                )
+        # Check distribution stats for skewness/outliers
+        # (This is a placeholder - actual implementation depends on what's in distribution_stats)
+        if self.distribution_stats:
+            for feature_name, stats in self.distribution_stats.items():
+                # Skip if already recommended differencing
+                if any(
+                    r.feature_name == feature_name and r.transform == TransformType.DIFF
+                    for r in recommendations
+                ):
+                    continue
+                # Check for high skewness
+                skewness = stats.get("skewness")
+                if skewness is not None and abs(skewness) > 2:
+                    # High positive skew → log transform
+                    if skewness > 2:
+                        recommendations.append(
+                            PreprocessingRecommendation(
+                                feature_name=feature_name,
+                                transform=TransformType.LOG,
+                                reason=f"High right skew (skewness={skewness:.2f})",
+                                confidence=0.85,
+                                diagnostics={"skewness": skewness},
+                            )
+                        )
+                    # High negative skew → reflect and log (but we'll use sqrt as milder)
+                    else:
+                        recommendations.append(
+                            PreprocessingRecommendation(
+                                feature_name=feature_name,
+                                transform=TransformType.SQRT,
+                                reason=f"High left skew (skewness={skewness:.2f})",
+                                confidence=0.75,
+                                diagnostics={"skewness": skewness},
+                            )
+                        )
+                # Check for outliers
+                has_outliers = stats.get("has_outliers", False)
+                if has_outliers:
+                    recommendations.append(
+                        PreprocessingRecommendation(
+                            feature_name=feature_name,
+                            transform=TransformType.WINSORIZE,
+                            reason="Outliers detected at tail percentiles",
+                            confidence=0.8,
+                        )
+                    )
+        return EngineerConfig(
+            recommendations=recommendations,
+            metadata={
+                "created_at": self.created_at,
+                "diagnostic_version": self.version,
+            },
+        )
+# =============================================================================
+# Module B: Cross-Feature Analysis
+# =============================================================================
+class CrossFeatureResult(BaseResult):
+    """Results from Module B: Cross-Feature Analysis.
+    Analysis of relationships between features:
+    - Correlation matrix
+    - PCA (dimensionality reduction)
+    - Clustering (feature groups)
+    - Redundancy detection
+    Attributes:
+        correlation_matrix: Correlation matrix (stored as nested list for JSON)
+        feature_names: List of feature names
+        pca_results: PCA analysis results (variance explained, loadings)
+        clustering_results: Feature clustering results
+        redundant_features: Highly correlated feature pairs
+    """
+    analysis_type: str = "cross_feature"
+    correlation_matrix: list[list[float]] = Field(
+        ..., description="Correlation matrix as nested list"
+    )
+    feature_names: list[str] = Field(..., description="Feature names in matrix order")
+    pca_results: dict[str, Any] | None = Field(
+        None, description="PCA analysis (variance explained, loadings)"
+    )
+    clustering_results: dict[str, Any] | None = Field(
+        None, description="Feature clustering results"
+    )
+    redundant_features: list[tuple[str, str, float]] | None = Field(
+        None, description="Redundant pairs: (feature1, feature2, correlation)"
+    )
+    def get_correlation_dataframe(self) -> pl.DataFrame:
+        """Get correlation matrix as DataFrame.
+        Returns:
+            DataFrame with correlations in long format
+        """
+        # Convert to long format for easier manipulation
+        n = len(self.feature_names)
+        rows = []
+        for i in range(n):
+            for j in range(n):
+                rows.append(
+                    {
+                        "feature_1": self.feature_names[i],
+                        "feature_2": self.feature_names[j],
+                        "correlation": self.correlation_matrix[i][j],
+                    }
+                )
+        return pl.DataFrame(rows)
+    def get_redundancy_dataframe(self) -> pl.DataFrame:
+        """Get redundant feature pairs as DataFrame.
+        Returns:
+            DataFrame with redundant pairs
+        """
+        if not self.redundant_features:
+            return pl.DataFrame(
+                schema={"feature_1": pl.Utf8, "feature_2": pl.Utf8, "correlation": pl.Float64}
+            )
+        rows = [
+            {"feature_1": f1, "feature_2": f2, "correlation": corr}
+            for f1, f2, corr in self.redundant_features
+        ]
+        return pl.DataFrame(rows)
+    def get_dataframe(self, name: str | None = None) -> pl.DataFrame:
+        """Get results as DataFrame.
+        Args:
+            name: 'correlation' or 'redundancy'
+        Returns:
+            Requested DataFrame
+        """
+        if name == "redundancy":
+            return self.get_redundancy_dataframe()
+        else:
+            return self.get_correlation_dataframe()
+    def summary(self) -> str:
+        """Human-readable summary of cross-feature analysis."""
+        lines = ["Cross-Feature Analysis Summary", "=" * 40]
+        lines.append(f"Features analyzed: {len(self.feature_names)}")
+        if self.redundant_features:
+            lines.append(f"Redundant pairs detected: {len(self.redundant_features)}")
+            for f1, f2, corr in self.redundant_features[:5]:  # Show top 5
+                lines.append(f"  {f1} <-> {f2}: {corr:.3f}")
+            if len(self.redundant_features) > 5:
+                lines.append(f"  ... and {len(self.redundant_features) - 5} more")
+        if self.pca_results:
+            variance = self.pca_results.get("variance_explained", [])
+            if variance:
+                lines.append(
+                    f"PCA: {len(variance)} components explain {sum(variance):.1%} variance"
+                )
+        return "\n".join(lines)
+# =============================================================================
+# Module C: Feature-Outcome Relationships
+# =============================================================================
+class ICAnalysisResult(BaseResult):
+    """Information Coefficient (IC) analysis for a single feature.
+    Measures correlation between feature ranks and outcome ranks,
+    with HAC adjustment for autocorrelation.
+    Attributes:
+        feature_name: Feature being analyzed
+        ic_values: IC at each lag (if lagged analysis)
+        mean_ic: Average IC across lags
+        ic_std: Standard deviation of IC
+        ic_ir: Information Ratio (mean_ic / ic_std)
+        pvalue: P-value for IC significance
+        hac_adjusted_pvalue: HAC-adjusted p-value
+    """
+    analysis_type: str = "ic_analysis"
+    feature_name: str = Field(..., description="Feature name")
+    ic_values: list[float] = Field(..., description="IC at each lag")
+    mean_ic: float = Field(..., description="Mean IC")
+    ic_std: float = Field(..., description="IC standard deviation")
+    ic_ir: float = Field(..., description="Information Ratio (mean / std)")
+    pvalue: float | None = Field(None, description="P-value for IC significance")
+    hac_adjusted_pvalue: float | None = Field(None, description="HAC-adjusted p-value")
+    def get_dataframe(self, name: str | None = None) -> pl.DataFrame:
+        """Get IC values as DataFrame.
+        Args:
+            name: Unused, included for base class compatibility.
+        Returns:
+            DataFrame with lag and IC values
+        """
+        del name  # Unused, base class compatibility
+        data = {
+            "feature": [self.feature_name] * len(self.ic_values),
+            "lag": list(range(len(self.ic_values))),
+            "ic": self.ic_values,
+        }
+        return pl.DataFrame(data)
+    def summary(self) -> str:
+        """Human-readable summary of IC analysis."""
+        lines = [f"IC Analysis: {self.feature_name}"]
+        lines.append(f"  Mean IC: {self.mean_ic:.4f}")
+        lines.append(f"  IC IR: {self.ic_ir:.4f}")
+        if self.hac_adjusted_pvalue is not None:
+            sig = "Significant" if self.hac_adjusted_pvalue < 0.05 else "Not significant"
+            lines.append(f"  HAC p-value: {self.hac_adjusted_pvalue:.4f} ({sig})")
+        return "\n".join(lines)
+class ThresholdAnalysisResult(BaseResult):
+    """Binary classification threshold analysis for a single feature.
+    Evaluates feature as binary signal using optimal threshold.
+    Attributes:
+        feature_name: Feature being analyzed
+        optimal_threshold: Threshold value that optimizes target metric
+        precision: Precision at optimal threshold
+        recall: Recall at optimal threshold
+        f1_score: F1 score at optimal threshold
+        lift: Lift over base rate
+        coverage: Fraction of observations with positive signal
+    """
+    analysis_type: str = "threshold_analysis"
+    feature_name: str = Field(..., description="Feature name")
+    optimal_threshold: float = Field(..., description="Optimal threshold value")
+    precision: float = Field(..., description="Precision at optimal threshold")
+    recall: float = Field(..., description="Recall at optimal threshold")
+    f1_score: float = Field(..., description="F1 score at optimal threshold")
+    lift: float = Field(..., description="Lift over base rate")
+    coverage: float = Field(..., description="Signal coverage (fraction positive)")
+    def get_dataframe(self, name: str | None = None) -> pl.DataFrame:
+        """Get threshold analysis as DataFrame.
+        Args:
+            name: Unused, included for base class compatibility.
+        Returns:
+            Single-row DataFrame with all metrics
+        """
+        del name  # Unused, base class compatibility
+        data = {
+            "feature": [self.feature_name],
+            "threshold": [self.optimal_threshold],
+            "precision": [self.precision],
+            "recall": [self.recall],
+            "f1_score": [self.f1_score],
+            "lift": [self.lift],
+            "coverage": [self.coverage],
+        }
+        return pl.DataFrame(data)
+    def summary(self) -> str:
+        """Human-readable summary of threshold analysis."""
+        lines = [f"Threshold Analysis: {self.feature_name}"]
+        lines.append(f"  Optimal threshold: {self.optimal_threshold:.4f}")
+        lines.append(f"  Precision: {self.precision:.2%}")
+        lines.append(f"  Recall: {self.recall:.2%}")
+        lines.append(f"  F1 Score: {self.f1_score:.2%}")
+        lines.append(f"  Lift: {self.lift:.2f}x")
+        lines.append(f"  Coverage: {self.coverage:.2%}")
+        return "\n".join(lines)
+class FeatureOutcomeResult(BaseResult):
+    """Complete results from Module C: Feature-Outcome Relationships.
+    Analysis of how features relate to outcomes:
+    - IC analysis (rank correlations)
+    - Threshold analysis (binary classification)
+    - ML feature importance (if applicable)
+    Attributes:
+        ic_results: IC analysis for each feature
+        threshold_results: Threshold analysis for each feature
+        ml_importance: ML feature importance scores
+    """
+    analysis_type: str = "feature_outcome"
+    ic_results: list[ICAnalysisResult] = Field(
+        default_factory=list, description="IC analysis per feature"
+    )
+    threshold_results: list[ThresholdAnalysisResult] | None = Field(
+        None, description="Threshold analysis per feature"
+    )
+    ml_importance: dict[str, float] | None = Field(
+        None, description="ML feature importance: {feature: importance}"
+    )
+    def get_ic_dataframe(self) -> pl.DataFrame:
+        """Get IC analysis as DataFrame.
+        Returns:
+            DataFrame with IC metrics for all features
+        """
+        if not self.ic_results:
+            return pl.DataFrame()
+        rows = []
+        for result in self.ic_results:
+            rows.append(
+                {
+                    "feature": result.feature_name,
+                    "mean_ic": result.mean_ic,
+                    "ic_std": result.ic_std,
+                    "ic_ir": result.ic_ir,
+                    "pvalue": result.pvalue,
+                    "hac_pvalue": result.hac_adjusted_pvalue,
+                }
+            )
+        return pl.DataFrame(rows)
+    def get_threshold_dataframe(self) -> pl.DataFrame:
+        """Get threshold analysis as DataFrame.
+        Returns:
+            DataFrame with threshold metrics for all features
+        """
+        if not self.threshold_results:
+            return pl.DataFrame()
+        dfs = [result.get_dataframe() for result in self.threshold_results]
+        return pl.concat(dfs)
+    def get_dataframe(self, name: str | None = None) -> pl.DataFrame:
+        """Get results as DataFrame.
+        Args:
+            name: 'ic' or 'threshold'
+        Returns:
+            Requested DataFrame
+        """
+        if name == "threshold":
+            return self.get_threshold_dataframe()
+        else:
+            return self.get_ic_dataframe()
+    def summary(self) -> str:
+        """Human-readable summary of feature-outcome relationships."""
+        lines = ["Feature-Outcome Analysis Summary", "=" * 40]
+        if self.ic_results:
+            lines.append(f"IC analysis: {len(self.ic_results)} features")
+            significant = sum(
+                1 for r in self.ic_results if r.hac_adjusted_pvalue and r.hac_adjusted_pvalue < 0.05
+            )
+            lines.append(f"  Significant features: {significant}")
+            # Top features by IC
+            top = sorted(self.ic_results, key=lambda r: abs(r.mean_ic), reverse=True)[:3]
+            lines.append("  Top 3 by |IC|:")
+            for r in top:
+                lines.append(f"    {r.feature_name}: IC={r.mean_ic:.4f}, IR={r.ic_ir:.4f}")
+        if self.threshold_results:
+            lines.append("")
+            lines.append(f"Threshold analysis: {len(self.threshold_results)} features")
+            # Top features by F1
+            top = sorted(self.threshold_results, key=lambda r: r.f1_score, reverse=True)[:3]
+            lines.append("  Top 3 by F1:")
+            for r in top:
+                lines.append(f"    {r.feature_name}: F1={r.f1_score:.2%}, Lift={r.lift:.2f}x")
+        return "\n".join(lines)