PyPI - ml4t-diagnostic - Versions diffs - 0.1.0a1__py3-none-any.whl - Mend

ml4t-diagnostic 0.1.0a1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

ml4t/diagnostic/AGENT.md +25 -0
ml4t/diagnostic/__init__.py +166 -0
ml4t/diagnostic/backends/__init__.py +10 -0
ml4t/diagnostic/backends/adapter.py +192 -0
ml4t/diagnostic/backends/polars_backend.py +899 -0
ml4t/diagnostic/caching/__init__.py +40 -0
ml4t/diagnostic/caching/cache.py +331 -0
ml4t/diagnostic/caching/decorators.py +131 -0
ml4t/diagnostic/caching/smart_cache.py +339 -0
ml4t/diagnostic/config/AGENT.md +24 -0
ml4t/diagnostic/config/README.md +267 -0
ml4t/diagnostic/config/__init__.py +219 -0
ml4t/diagnostic/config/barrier_config.py +277 -0
ml4t/diagnostic/config/base.py +301 -0
ml4t/diagnostic/config/event_config.py +148 -0
ml4t/diagnostic/config/feature_config.py +404 -0
ml4t/diagnostic/config/multi_signal_config.py +55 -0
ml4t/diagnostic/config/portfolio_config.py +215 -0
ml4t/diagnostic/config/report_config.py +391 -0
ml4t/diagnostic/config/sharpe_config.py +202 -0
ml4t/diagnostic/config/signal_config.py +206 -0
ml4t/diagnostic/config/trade_analysis_config.py +310 -0
ml4t/diagnostic/config/validation.py +279 -0
ml4t/diagnostic/core/__init__.py +29 -0
ml4t/diagnostic/core/numba_utils.py +315 -0
ml4t/diagnostic/core/purging.py +372 -0
ml4t/diagnostic/core/sampling.py +471 -0
ml4t/diagnostic/errors/__init__.py +205 -0
ml4t/diagnostic/evaluation/AGENT.md +26 -0
ml4t/diagnostic/evaluation/__init__.py +437 -0
ml4t/diagnostic/evaluation/autocorrelation.py +531 -0
ml4t/diagnostic/evaluation/barrier_analysis.py +1050 -0
ml4t/diagnostic/evaluation/binary_metrics.py +910 -0
ml4t/diagnostic/evaluation/dashboard.py +715 -0
ml4t/diagnostic/evaluation/diagnostic_plots.py +1037 -0
ml4t/diagnostic/evaluation/distribution/__init__.py +499 -0
ml4t/diagnostic/evaluation/distribution/moments.py +299 -0
ml4t/diagnostic/evaluation/distribution/tails.py +777 -0
ml4t/diagnostic/evaluation/distribution/tests.py +470 -0
ml4t/diagnostic/evaluation/drift/__init__.py +139 -0
ml4t/diagnostic/evaluation/drift/analysis.py +432 -0
ml4t/diagnostic/evaluation/drift/domain_classifier.py +517 -0
ml4t/diagnostic/evaluation/drift/population_stability_index.py +310 -0
ml4t/diagnostic/evaluation/drift/wasserstein.py +388 -0
ml4t/diagnostic/evaluation/event_analysis.py +647 -0
ml4t/diagnostic/evaluation/excursion.py +390 -0
ml4t/diagnostic/evaluation/feature_diagnostics.py +873 -0
ml4t/diagnostic/evaluation/feature_outcome.py +666 -0
ml4t/diagnostic/evaluation/framework.py +935 -0
ml4t/diagnostic/evaluation/metric_registry.py +255 -0
ml4t/diagnostic/evaluation/metrics/AGENT.md +23 -0
ml4t/diagnostic/evaluation/metrics/__init__.py +133 -0
ml4t/diagnostic/evaluation/metrics/basic.py +160 -0
ml4t/diagnostic/evaluation/metrics/conditional_ic.py +469 -0
ml4t/diagnostic/evaluation/metrics/feature_outcome.py +475 -0
ml4t/diagnostic/evaluation/metrics/ic_statistics.py +446 -0
ml4t/diagnostic/evaluation/metrics/importance_analysis.py +338 -0
ml4t/diagnostic/evaluation/metrics/importance_classical.py +375 -0
ml4t/diagnostic/evaluation/metrics/importance_mda.py +371 -0
ml4t/diagnostic/evaluation/metrics/importance_shap.py +715 -0
ml4t/diagnostic/evaluation/metrics/information_coefficient.py +527 -0
ml4t/diagnostic/evaluation/metrics/interactions.py +772 -0
ml4t/diagnostic/evaluation/metrics/monotonicity.py +226 -0
ml4t/diagnostic/evaluation/metrics/risk_adjusted.py +324 -0
ml4t/diagnostic/evaluation/multi_signal.py +550 -0
ml4t/diagnostic/evaluation/portfolio_analysis/__init__.py +83 -0
ml4t/diagnostic/evaluation/portfolio_analysis/analysis.py +734 -0
ml4t/diagnostic/evaluation/portfolio_analysis/metrics.py +589 -0
ml4t/diagnostic/evaluation/portfolio_analysis/results.py +334 -0
ml4t/diagnostic/evaluation/report_generation.py +824 -0
ml4t/diagnostic/evaluation/signal_selector.py +452 -0
ml4t/diagnostic/evaluation/stat_registry.py +139 -0
ml4t/diagnostic/evaluation/stationarity/__init__.py +97 -0
ml4t/diagnostic/evaluation/stationarity/analysis.py +518 -0
ml4t/diagnostic/evaluation/stationarity/augmented_dickey_fuller.py +296 -0
ml4t/diagnostic/evaluation/stationarity/kpss_test.py +308 -0
ml4t/diagnostic/evaluation/stationarity/phillips_perron.py +365 -0
ml4t/diagnostic/evaluation/stats/AGENT.md +43 -0
ml4t/diagnostic/evaluation/stats/__init__.py +191 -0
ml4t/diagnostic/evaluation/stats/backtest_overfitting.py +219 -0
ml4t/diagnostic/evaluation/stats/bootstrap.py +228 -0
ml4t/diagnostic/evaluation/stats/deflated_sharpe_ratio.py +591 -0
ml4t/diagnostic/evaluation/stats/false_discovery_rate.py +295 -0
ml4t/diagnostic/evaluation/stats/hac_standard_errors.py +108 -0
ml4t/diagnostic/evaluation/stats/minimum_track_record.py +408 -0
ml4t/diagnostic/evaluation/stats/moments.py +164 -0
ml4t/diagnostic/evaluation/stats/rademacher_adjustment.py +436 -0
ml4t/diagnostic/evaluation/stats/reality_check.py +155 -0
ml4t/diagnostic/evaluation/stats/sharpe_inference.py +219 -0
ml4t/diagnostic/evaluation/themes.py +330 -0
ml4t/diagnostic/evaluation/threshold_analysis.py +957 -0
ml4t/diagnostic/evaluation/trade_analysis.py +1136 -0
ml4t/diagnostic/evaluation/trade_dashboard/__init__.py +32 -0
ml4t/diagnostic/evaluation/trade_dashboard/app.py +315 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/__init__.py +18 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/csv.py +82 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/html.py +276 -0
ml4t/diagnostic/evaluation/trade_dashboard/io.py +166 -0
ml4t/diagnostic/evaluation/trade_dashboard/normalize.py +304 -0
ml4t/diagnostic/evaluation/trade_dashboard/stats.py +386 -0
ml4t/diagnostic/evaluation/trade_dashboard/style.py +79 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/__init__.py +21 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/patterns.py +354 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/shap_analysis.py +280 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/stat_validation.py +186 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/worst_trades.py +236 -0
ml4t/diagnostic/evaluation/trade_dashboard/types.py +129 -0
ml4t/diagnostic/evaluation/trade_shap/__init__.py +102 -0
ml4t/diagnostic/evaluation/trade_shap/alignment.py +188 -0
ml4t/diagnostic/evaluation/trade_shap/characterize.py +413 -0
ml4t/diagnostic/evaluation/trade_shap/cluster.py +302 -0
ml4t/diagnostic/evaluation/trade_shap/explain.py +208 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/__init__.py +23 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/generator.py +290 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/matcher.py +251 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/templates.yaml +467 -0
ml4t/diagnostic/evaluation/trade_shap/models.py +386 -0
ml4t/diagnostic/evaluation/trade_shap/normalize.py +116 -0
ml4t/diagnostic/evaluation/trade_shap/pipeline.py +263 -0
ml4t/diagnostic/evaluation/trade_shap_dashboard.py +283 -0
ml4t/diagnostic/evaluation/trade_shap_diagnostics.py +588 -0
ml4t/diagnostic/evaluation/validated_cv.py +535 -0
ml4t/diagnostic/evaluation/visualization.py +1050 -0
ml4t/diagnostic/evaluation/volatility/__init__.py +45 -0
ml4t/diagnostic/evaluation/volatility/analysis.py +351 -0
ml4t/diagnostic/evaluation/volatility/arch.py +258 -0
ml4t/diagnostic/evaluation/volatility/garch.py +460 -0
ml4t/diagnostic/integration/__init__.py +48 -0
ml4t/diagnostic/integration/backtest_contract.py +671 -0
ml4t/diagnostic/integration/data_contract.py +316 -0
ml4t/diagnostic/integration/engineer_contract.py +226 -0
ml4t/diagnostic/logging/__init__.py +77 -0
ml4t/diagnostic/logging/logger.py +245 -0
ml4t/diagnostic/logging/performance.py +234 -0
ml4t/diagnostic/logging/progress.py +234 -0
ml4t/diagnostic/logging/wandb.py +412 -0
ml4t/diagnostic/metrics/__init__.py +9 -0
ml4t/diagnostic/metrics/percentiles.py +128 -0
ml4t/diagnostic/py.typed +1 -0
ml4t/diagnostic/reporting/__init__.py +43 -0
ml4t/diagnostic/reporting/base.py +130 -0
ml4t/diagnostic/reporting/html_renderer.py +275 -0
ml4t/diagnostic/reporting/json_renderer.py +51 -0
ml4t/diagnostic/reporting/markdown_renderer.py +117 -0
ml4t/diagnostic/results/AGENT.md +24 -0
ml4t/diagnostic/results/__init__.py +105 -0
ml4t/diagnostic/results/barrier_results/__init__.py +36 -0
ml4t/diagnostic/results/barrier_results/hit_rate.py +304 -0
ml4t/diagnostic/results/barrier_results/precision_recall.py +266 -0
ml4t/diagnostic/results/barrier_results/profit_factor.py +297 -0
ml4t/diagnostic/results/barrier_results/tearsheet.py +397 -0
ml4t/diagnostic/results/barrier_results/time_to_target.py +305 -0
ml4t/diagnostic/results/barrier_results/validation.py +38 -0
ml4t/diagnostic/results/base.py +177 -0
ml4t/diagnostic/results/event_results.py +349 -0
ml4t/diagnostic/results/feature_results.py +787 -0
ml4t/diagnostic/results/multi_signal_results.py +431 -0
ml4t/diagnostic/results/portfolio_results.py +281 -0
ml4t/diagnostic/results/sharpe_results.py +448 -0
ml4t/diagnostic/results/signal_results/__init__.py +74 -0
ml4t/diagnostic/results/signal_results/ic.py +581 -0
ml4t/diagnostic/results/signal_results/irtc.py +110 -0
ml4t/diagnostic/results/signal_results/quantile.py +392 -0
ml4t/diagnostic/results/signal_results/tearsheet.py +456 -0
ml4t/diagnostic/results/signal_results/turnover.py +213 -0
ml4t/diagnostic/results/signal_results/validation.py +147 -0
ml4t/diagnostic/signal/AGENT.md +17 -0
ml4t/diagnostic/signal/__init__.py +69 -0
ml4t/diagnostic/signal/_report.py +152 -0
ml4t/diagnostic/signal/_utils.py +261 -0
ml4t/diagnostic/signal/core.py +275 -0
ml4t/diagnostic/signal/quantile.py +148 -0
ml4t/diagnostic/signal/result.py +214 -0
ml4t/diagnostic/signal/signal_ic.py +129 -0
ml4t/diagnostic/signal/turnover.py +182 -0
ml4t/diagnostic/splitters/AGENT.md +19 -0
ml4t/diagnostic/splitters/__init__.py +36 -0
ml4t/diagnostic/splitters/base.py +501 -0
ml4t/diagnostic/splitters/calendar.py +421 -0
ml4t/diagnostic/splitters/calendar_config.py +91 -0
ml4t/diagnostic/splitters/combinatorial.py +1064 -0
ml4t/diagnostic/splitters/config.py +322 -0
ml4t/diagnostic/splitters/cpcv/__init__.py +57 -0
ml4t/diagnostic/splitters/cpcv/combinations.py +119 -0
ml4t/diagnostic/splitters/cpcv/partitioning.py +263 -0
ml4t/diagnostic/splitters/cpcv/purge_engine.py +379 -0
ml4t/diagnostic/splitters/cpcv/windows.py +190 -0
ml4t/diagnostic/splitters/group_isolation.py +329 -0
ml4t/diagnostic/splitters/persistence.py +316 -0
ml4t/diagnostic/splitters/utils.py +207 -0
ml4t/diagnostic/splitters/walk_forward.py +757 -0
ml4t/diagnostic/utils/__init__.py +42 -0
ml4t/diagnostic/utils/config.py +542 -0
ml4t/diagnostic/utils/dependencies.py +318 -0
ml4t/diagnostic/utils/sessions.py +127 -0
ml4t/diagnostic/validation/__init__.py +54 -0
ml4t/diagnostic/validation/dataframe.py +274 -0
ml4t/diagnostic/validation/returns.py +280 -0
ml4t/diagnostic/validation/timeseries.py +299 -0
ml4t/diagnostic/visualization/AGENT.md +19 -0
ml4t/diagnostic/visualization/__init__.py +223 -0
ml4t/diagnostic/visualization/backtest/__init__.py +98 -0
ml4t/diagnostic/visualization/backtest/cost_attribution.py +762 -0
ml4t/diagnostic/visualization/backtest/executive_summary.py +895 -0
ml4t/diagnostic/visualization/backtest/interactive_controls.py +673 -0
ml4t/diagnostic/visualization/backtest/statistical_validity.py +874 -0
ml4t/diagnostic/visualization/backtest/tearsheet.py +565 -0
ml4t/diagnostic/visualization/backtest/template_system.py +373 -0
ml4t/diagnostic/visualization/backtest/trade_plots.py +1172 -0
ml4t/diagnostic/visualization/barrier_plots.py +782 -0
ml4t/diagnostic/visualization/core.py +1060 -0
ml4t/diagnostic/visualization/dashboards/__init__.py +36 -0
ml4t/diagnostic/visualization/dashboards/base.py +582 -0
ml4t/diagnostic/visualization/dashboards/importance.py +801 -0
ml4t/diagnostic/visualization/dashboards/interaction.py +263 -0
ml4t/diagnostic/visualization/dashboards.py +43 -0
ml4t/diagnostic/visualization/data_extraction/__init__.py +48 -0
ml4t/diagnostic/visualization/data_extraction/importance.py +649 -0
ml4t/diagnostic/visualization/data_extraction/interaction.py +504 -0
ml4t/diagnostic/visualization/data_extraction/types.py +113 -0
ml4t/diagnostic/visualization/data_extraction/validation.py +66 -0
ml4t/diagnostic/visualization/feature_plots.py +888 -0
ml4t/diagnostic/visualization/interaction_plots.py +618 -0
ml4t/diagnostic/visualization/portfolio/__init__.py +41 -0
ml4t/diagnostic/visualization/portfolio/dashboard.py +514 -0
ml4t/diagnostic/visualization/portfolio/drawdown_plots.py +341 -0
ml4t/diagnostic/visualization/portfolio/returns_plots.py +487 -0
ml4t/diagnostic/visualization/portfolio/risk_plots.py +301 -0
ml4t/diagnostic/visualization/report_generation.py +1343 -0
ml4t/diagnostic/visualization/signal/__init__.py +103 -0
ml4t/diagnostic/visualization/signal/dashboard.py +911 -0
ml4t/diagnostic/visualization/signal/event_plots.py +514 -0
ml4t/diagnostic/visualization/signal/ic_plots.py +635 -0
ml4t/diagnostic/visualization/signal/multi_signal_dashboard.py +974 -0
ml4t/diagnostic/visualization/signal/multi_signal_plots.py +603 -0
ml4t/diagnostic/visualization/signal/quantile_plots.py +625 -0
ml4t/diagnostic/visualization/signal/turnover_plots.py +400 -0
ml4t/diagnostic/visualization/trade_shap/__init__.py +90 -0
ml4t_diagnostic-0.1.0a1.dist-info/METADATA +1044 -0
ml4t_diagnostic-0.1.0a1.dist-info/RECORD +242 -0
ml4t_diagnostic-0.1.0a1.dist-info/WHEEL +4 -0
ml4t_diagnostic-0.1.0a1.dist-info/licenses/LICENSE +21 -0

ml4t/diagnostic/evaluation/multi_signal.py ADDED Viewed

@@ -0,0 +1,550 @@
+"""Multi-Signal Analysis module for batch signal evaluation.
+This module provides efficient analysis of 50-200 signals with:
+- Parallel computation via joblib
+- Smart caching with Polars fingerprinting
+- FDR and FWER multiple testing corrections
+- Signal selection algorithms for comparison
+- Focus + Context visualization patterns
+References
+----------
+Benjamini, Y., & Hochberg, Y. (1995). "Controlling the False Discovery Rate"
+Holm, S. (1979). "A Simple Sequentially Rejective Multiple Test Procedure"
+López de Prado, M. (2018). "Advances in Financial Machine Learning"
+"""
+from __future__ import annotations
+import warnings
+from typing import TYPE_CHECKING, Any, Literal
+import numpy as np
+import polars as pl
+from tqdm import tqdm
+from ml4t.diagnostic.backends.adapter import DataFrameAdapter
+from ml4t.diagnostic.caching.smart_cache import SmartCache
+from ml4t.diagnostic.config.multi_signal_config import MultiSignalAnalysisConfig
+from ml4t.diagnostic.evaluation.signal_selector import SignalSelector
+from ml4t.diagnostic.evaluation.stats import benjamini_hochberg_fdr, holm_bonferroni
+from ml4t.diagnostic.results.multi_signal_results import ComparisonResult, MultiSignalSummary
+from ml4t.diagnostic.signal import SignalResult, analyze_signal
+if TYPE_CHECKING:
+    import pandas as pd
+class MultiSignalAnalysis:
+    """Batch analysis of multiple signals with statistical corrections.
+    Efficiently analyze 50-200 signals with parallel computation,
+    smart caching, and multiple testing corrections.
+    Parameters
+    ----------
+    signals : dict[str, pl.DataFrame | pd.DataFrame]
+        Dictionary mapping signal names to factor DataFrames.
+        Each DataFrame must have columns: date, asset, factor
+    prices : pl.DataFrame | pd.DataFrame
+        Price data with columns: date, asset, price
+    config : MultiSignalAnalysisConfig | None
+        Configuration object. If None, uses defaults.
+    Examples
+    --------
+    >>> # Basic usage
+    >>> signals = {
+    ...     'momentum_12m': mom_df,
+    ...     'value_btm': val_df,
+    ...     'quality': qual_df,
+    ... }
+    >>> analyzer = MultiSignalAnalysis(signals, prices)
+    >>> summary = analyzer.compute_summary()
+    >>> print(f"Significant: {summary.n_fdr_significant}/{summary.n_signals}")
+    >>> # Compare top uncorrelated signals
+    >>> comparison = analyzer.compare(selection="uncorrelated", n=5)
+    >>> comparison.save_html("top_signals.html")
+    >>> # Custom configuration
+    >>> config = MultiSignalAnalysisConfig(
+    ...     fdr_alpha=0.01,
+    ...     fwer_alpha=0.01,
+    ...     n_jobs=-1,  # All cores
+    ... )
+    >>> analyzer = MultiSignalAnalysis(signals, prices, config=config)
+    """
+    def __init__(
+        self,
+        signals: dict[str, pl.DataFrame | pd.DataFrame],
+        prices: pl.DataFrame | pd.DataFrame,
+        config: MultiSignalAnalysisConfig | None = None,
+    ) -> None:
+        """Initialize MultiSignalAnalysis."""
+        self.config = config or MultiSignalAnalysisConfig()
+        # Convert signals to Polars
+        self._signals: dict[str, pl.DataFrame] = {}
+        for name, df in signals.items():
+            converted, _ = DataFrameAdapter.to_polars(df)
+            self._signals[name] = converted
+        # Convert prices to Polars
+        self._prices, _ = DataFrameAdapter.to_polars(prices)
+        # Validate inputs
+        self._validate_inputs()
+        # Initialize cache if enabled
+        self._cache: SmartCache | None = None
+        if self.config.cache_enabled:
+            self._cache = SmartCache(
+                max_items=self.config.cache_max_items,
+                ttl_seconds=self.config.cache_ttl,
+            )
+        # Cached results
+        self._summary: MultiSignalSummary | None = None
+        self._individual_results: dict[str, SignalResult] = {}
+        self._correlation_matrix: pl.DataFrame | None = None
+    def _validate_inputs(self) -> None:
+        """Validate input data structure."""
+        if not self._signals:
+            raise ValueError("No signals provided")
+        # Check each signal has required columns
+        required_cols = {"date", "asset", "factor"}
+        for name, df in self._signals.items():
+            missing = required_cols - set(df.columns)
+            if missing:
+                raise ValueError(f"Signal '{name}' missing required columns: {missing}")
+        # Check prices
+        price_required = {"date", "asset", "price"}
+        missing_price = price_required - set(self._prices.columns)
+        if missing_price:
+            raise ValueError(f"Price data missing required columns: {missing_price}")
+    @property
+    def signal_names(self) -> list[str]:
+        """List of signal names."""
+        return list(self._signals.keys())
+    @property
+    def n_signals(self) -> int:
+        """Number of signals."""
+        return len(self._signals)
+    def get_individual(self, signal_name: str) -> SignalResult:
+        """Get or create SignalResult for a specific signal.
+        Parameters
+        ----------
+        signal_name : str
+            Name of signal
+        Returns
+        -------
+        SignalResult
+            Analysis result for the signal
+        """
+        if signal_name not in self._signals:
+            raise ValueError(f"Signal '{signal_name}' not found. Available: {self.signal_names}")
+        if signal_name not in self._individual_results:
+            self._individual_results[signal_name] = analyze_signal(
+                self._signals[signal_name],
+                self._prices,
+                periods=tuple(self.config.signal_config.periods),
+                quantiles=self.config.signal_config.quantiles,
+                filter_zscore=self.config.signal_config.filter_zscore,
+                compute_turnover_flag=self.config.signal_config.compute_turnover,
+            )
+        return self._individual_results[signal_name]
+    def _compute_signal_metrics(self, signal_name: str) -> dict[str, Any]:
+        """Compute metrics for a single signal.
+        This is the parallelizable unit of work.
+        """
+        # Check cache
+        cache_key = None
+        if self._cache is not None:
+            cache_key = self._cache.make_key(
+                signal_name,
+                self._signals[signal_name],
+                self.config.signal_config,
+            )
+            cached = self._cache.get(cache_key)
+            if cached is not None:
+                return cached
+        # Compute metrics using new functional API
+        try:
+            result = analyze_signal(
+                self._signals[signal_name],
+                self._prices,
+                periods=tuple(self.config.signal_config.periods),
+                quantiles=self.config.signal_config.quantiles,
+                filter_zscore=self.config.signal_config.filter_zscore,
+                compute_turnover_flag=self.config.signal_config.compute_turnover,
+            )
+            # Extract metrics for first period (most common use case)
+            period = self.config.signal_config.periods[0]
+            period_key = f"{period}D"
+            metrics = {
+                "signal_name": signal_name,
+                "ic_mean": result.ic.get(period_key, np.nan),
+                "ic_std": result.ic_std.get(period_key, np.nan),
+                "ic_t_stat": result.ic_t_stat.get(period_key, np.nan),
+                "ic_p_value": result.ic_p_value.get(period_key, np.nan),
+                "ic_ir": result.ic_ir.get(period_key, np.nan),
+                "ic_positive_pct": result.ic_positive_pct.get(period_key, np.nan),
+                "n_observations": result.n_dates,
+                "error": None,
+            }
+            # Add turnover if computed
+            if result.turnover is not None:
+                metrics["turnover_mean"] = result.turnover.get(period_key, np.nan)
+            else:
+                metrics["turnover_mean"] = np.nan
+            if result.autocorrelation is not None and len(result.autocorrelation) > 0:
+                metrics["autocorr_1"] = result.autocorrelation[0]
+            else:
+                metrics["autocorr_1"] = np.nan
+        except Exception as e:
+            metrics = {
+                "signal_name": signal_name,
+                "ic_mean": np.nan,
+                "ic_std": np.nan,
+                "ic_t_stat": np.nan,
+                "ic_p_value": np.nan,
+                "ic_ir": np.nan,
+                "ic_positive_pct": np.nan,
+                "n_observations": 0,
+                "turnover_mean": np.nan,
+                "autocorr_1": np.nan,
+                "error": str(e),
+            }
+        # Cache result
+        if self._cache is not None and cache_key is not None:
+            self._cache.set(cache_key, metrics)
+        return metrics
+    def compute_summary(
+        self,
+        progress: bool = True,
+    ) -> MultiSignalSummary:
+        """Compute summary metrics for all signals with FDR/FWER correction.
+        Parameters
+        ----------
+        progress : bool, default True
+            Show progress bar
+        Returns
+        -------
+        MultiSignalSummary
+            Summary with metrics and multiple testing corrections
+        """
+        if self._summary is not None:
+            return self._summary
+        # Compute metrics for all signals
+        if self.config.n_jobs == 1:
+            # Serial execution
+            results = []
+            iterator = tqdm(self.signal_names, disable=not progress, desc="Analyzing signals")
+            for name in iterator:
+                results.append(self._compute_signal_metrics(name))
+        else:
+            # Parallel execution
+            try:
+                from joblib import Parallel, delayed
+                results = Parallel(
+                    n_jobs=self.config.n_jobs,
+                    backend=self.config.backend,
+                )(
+                    delayed(self._compute_signal_metrics)(name)
+                    for name in tqdm(
+                        self.signal_names, disable=not progress, desc="Analyzing signals"
+                    )
+                )
+            except ImportError:
+                warnings.warn(
+                    "joblib not available, falling back to serial execution",
+                    UserWarning,
+                    stacklevel=2,
+                )
+                results = []
+                iterator = tqdm(self.signal_names, disable=not progress, desc="Analyzing signals")
+                for name in iterator:
+                    results.append(self._compute_signal_metrics(name))
+        # Build summary DataFrame
+        summary_data: dict[str, list[Any]] = {
+            "signal_name": [],
+            "ic_mean": [],
+            "ic_std": [],
+            "ic_t_stat": [],
+            "ic_p_value": [],
+            "ic_ir": [],
+            "ic_positive_pct": [],
+            "n_observations": [],
+            "turnover_mean": [],
+            "autocorr_1": [],
+        }
+        for r in results:
+            for key in summary_data:
+                summary_data[key].append(r.get(key, np.nan))
+        # Apply FDR correction
+        p_values = summary_data["ic_p_value"]
+        valid_p_values = [p if not np.isnan(p) else 1.0 for p in p_values]
+        fdr_result = benjamini_hochberg_fdr(
+            valid_p_values,
+            alpha=self.config.fdr_alpha,
+            return_details=True,
+        )
+        summary_data["fdr_significant"] = list(fdr_result["rejected"])
+        summary_data["fdr_adjusted_p"] = list(fdr_result["adjusted_p_values"])
+        # Apply FWER correction
+        fwer_result = holm_bonferroni(valid_p_values, alpha=self.config.fwer_alpha)
+        summary_data["fwer_significant"] = fwer_result["rejected"]
+        summary_data["fwer_adjusted_p"] = fwer_result["adjusted_p_values"]
+        # Count significant
+        n_fdr_sig = sum(summary_data["fdr_significant"])
+        n_fwer_sig = sum(summary_data["fwer_significant"])
+        # Create result
+        self._summary = MultiSignalSummary(
+            summary_data=summary_data,
+            n_signals=self.n_signals,
+            n_fdr_significant=n_fdr_sig,
+            n_fwer_significant=n_fwer_sig,
+            periods=self.config.signal_config.periods,
+            fdr_alpha=self.config.fdr_alpha,
+            fwer_alpha=self.config.fwer_alpha,
+        )
+        return self._summary
+    def correlation_matrix(
+        self,
+        method: Literal["returns", "ic"] = "returns",
+    ) -> pl.DataFrame:
+        """Compute pairwise signal correlation matrix.
+        Parameters
+        ----------
+        method : str, default "returns"
+            Correlation method:
+            - "returns": Correlation of signal-weighted returns
+            - "ic": Correlation of IC time series
+        Returns
+        -------
+        pl.DataFrame
+            Correlation matrix with signal names as columns
+        """
+        if self._correlation_matrix is not None:
+            return self._correlation_matrix
+        # For now, use simple cross-sectional correlation of factor values
+        # This is a reasonable approximation for signal similarity
+        # Get all dates that appear in all signals
+        all_dates: set[Any] | None = None
+        for df in self._signals.values():
+            dates = set(df["date"].unique().to_list())
+            if all_dates is None:
+                all_dates = dates
+            else:
+                all_dates = all_dates.intersection(dates)
+        if not all_dates:
+            raise ValueError("No overlapping dates across signals")
+        # Build correlation matrix
+        n = self.n_signals
+        corr_matrix = np.eye(n)
+        for i, name_i in enumerate(self.signal_names):
+            for j, name_j in enumerate(self.signal_names):
+                if i >= j:
+                    continue
+                # Get factor values for common dates and assets
+                df_i = self._signals[name_i].filter(pl.col("date").is_in(list(all_dates)))
+                df_j = self._signals[name_j].filter(pl.col("date").is_in(list(all_dates)))
+                # Join on date and asset
+                merged = df_i.select(["date", "asset", "factor"]).join(
+                    df_j.select(["date", "asset", pl.col("factor").alias("factor_j")]),
+                    on=["date", "asset"],
+                    how="inner",
+                )
+                if merged.height > 10:
+                    corr = np.corrcoef(
+                        merged["factor"].to_numpy(),
+                        merged["factor_j"].to_numpy(),
+                    )[0, 1]
+                    if not np.isnan(corr):
+                        corr_matrix[i, j] = corr
+                        corr_matrix[j, i] = corr
+        # Convert to DataFrame
+        self._correlation_matrix = pl.DataFrame(
+            corr_matrix,
+            schema=self.signal_names,
+        )
+        return self._correlation_matrix
+    def compare(
+        self,
+        selection: Literal["top_n", "uncorrelated", "pareto", "cluster", "manual"] = "top_n",
+        n: int = 10,
+        signals: list[str] | None = None,
+        **kwargs: Any,
+    ) -> ComparisonResult:
+        """Create detailed comparison of selected signals.
+        Parameters
+        ----------
+        selection : str, default "top_n"
+            Selection method:
+            - "top_n": Best N by metric (default: ic_ir)
+            - "uncorrelated": Diverse signals with low correlation
+            - "pareto": Signals on efficient frontier
+            - "cluster": Representative from each cluster
+            - "manual": Use provided signal list
+        n : int, default 10
+            Number of signals to select (ignored for "manual")
+        signals : list[str] | None
+            Signal names for "manual" selection
+        **kwargs : Any
+            Additional parameters for selection methods
+        Returns
+        -------
+        ComparisonResult
+            Detailed comparison with tear sheet data
+        """
+        # Ensure summary is computed
+        summary = self.compute_summary(progress=False)
+        summary_df = summary.get_dataframe()
+        # Get correlation matrix if needed
+        corr_matrix = None
+        if selection in ("uncorrelated", "cluster"):
+            corr_matrix = self.correlation_matrix()
+        # Select signals
+        if selection == "manual":
+            if signals is None:
+                raise ValueError("signals parameter required for manual selection")
+            selected = signals
+        elif selection == "top_n":
+            metric = kwargs.get("metric", self.config.default_selection_metric)
+            selected = SignalSelector.select_top_n(summary_df, n=n, metric=metric, **kwargs)
+        elif selection == "uncorrelated":
+            if corr_matrix is None:
+                raise ValueError("Correlation matrix required for uncorrelated selection")
+            max_corr = kwargs.get("max_correlation", self.config.default_correlation_threshold)
+            selected = SignalSelector.select_uncorrelated(
+                summary_df, corr_matrix, n=n, max_correlation=max_corr, **kwargs
+            )
+        elif selection == "pareto":
+            selected = SignalSelector.select_pareto_frontier(summary_df, **kwargs)
+            if len(selected) > n:
+                selected = selected[:n]
+        elif selection == "cluster":
+            if corr_matrix is None:
+                raise ValueError("Correlation matrix required for cluster selection")
+            n_clusters = kwargs.get("n_clusters", n)
+            selected = SignalSelector.select_by_cluster(
+                corr_matrix, summary_df, n_clusters=n_clusters, **kwargs
+            )
+        else:
+            raise ValueError(f"Unknown selection method: {selection}")
+        # Limit to max comparison signals
+        if len(selected) > self.config.max_signals_comparison:
+            selected = selected[: self.config.max_signals_comparison]
+        # Compute tear sheets (signal results) for selected signals
+        tear_sheets: dict[str, dict[str, Any]] = {}
+        for name in selected:
+            try:
+                result = self.get_individual(name)
+                tear_sheets[name] = result.to_dict()
+            except Exception as e:
+                warnings.warn(
+                    f"Failed to analyze signal {name}: {e}",
+                    UserWarning,
+                    stacklevel=2,
+                )
+                tear_sheets[name] = {"error": str(e)}
+        # Get correlation matrix for selected signals
+        full_corr = self.correlation_matrix()
+        selected_corr: dict[str, list[float]] = {}
+        for name in selected:
+            if name in full_corr.columns:
+                idx = self.signal_names.index(name)
+                selected_corr[name] = [full_corr[s][idx] for s in selected]
+            else:
+                selected_corr[name] = [np.nan] * len(selected)
+        return ComparisonResult(
+            signals=selected,
+            selection_method=selection,
+            selection_params={"n": n, **kwargs},
+            tear_sheets=tear_sheets,
+            correlation_matrix=selected_corr,
+        )
+    def cache_stats(self) -> dict[str, Any] | None:
+        """Get cache statistics.
+        Returns
+        -------
+        dict | None
+            Cache statistics if caching enabled, else None
+        """
+        if self._cache is None:
+            return None
+        return self._cache.stats
+    def clear_cache(self) -> None:
+        """Clear the cache."""
+        if self._cache is not None:
+            self._cache.clear()
+        self._summary = None
+        self._individual_results.clear()
+        self._correlation_matrix = None
+    def __repr__(self) -> str:
+        """Developer representation."""
+        return (
+            f"MultiSignalAnalysis(n_signals={self.n_signals}, "
+            f"cache={'enabled' if self._cache else 'disabled'})"
+        )

ml4t/diagnostic/evaluation/portfolio_analysis/__init__.py ADDED Viewed

@@ -0,0 +1,83 @@
+"""Portfolio analysis module.
+This package provides comprehensive portfolio performance analysis:
+- PortfolioAnalysis: Main analyzer class for portfolio diagnostics
+- PortfolioMetrics: Complete portfolio performance metrics
+- RollingMetricsResult: Rolling metrics over multiple windows
+- DrawdownResult: Detailed drawdown analysis
+- DistributionResult: Returns distribution analysis
+Decomposed from portfolio_analysis.py (1,620 lines) into:
+- results.py: Result dataclasses (~335 lines)
+- metrics.py: Core metric functions (~588 lines)
+- analysis.py: PortfolioAnalysis class (~672 lines)
+"""
+from __future__ import annotations
+# Main analysis class
+from ml4t.diagnostic.evaluation.portfolio_analysis.analysis import PortfolioAnalysis
+# Core metric functions
+from ml4t.diagnostic.evaluation.portfolio_analysis.metrics import (
+    _annualization_factor,
+    _safe_cumprod,
+    _safe_prod,
+    _to_numpy,
+    alpha_beta,
+    annual_return,
+    annual_volatility,
+    calmar_ratio,
+    compute_portfolio_turnover,
+    conditional_var,
+    information_ratio,
+    max_drawdown,
+    omega_ratio,
+    sharpe_ratio,
+    sortino_ratio,
+    stability_of_timeseries,
+    tail_ratio,
+    up_down_capture,
+    value_at_risk,
+)
+# Result classes
+from ml4t.diagnostic.evaluation.portfolio_analysis.results import (
+    DistributionResult,
+    DrawdownPeriod,
+    DrawdownResult,
+    PortfolioMetrics,
+    RollingMetricsResult,
+)
+__all__ = [
+    # Main class
+    "PortfolioAnalysis",
+    # Result classes
+    "PortfolioMetrics",
+    "RollingMetricsResult",
+    "DrawdownPeriod",
+    "DrawdownResult",
+    "DistributionResult",
+    # Core metric functions
+    "sharpe_ratio",
+    "sortino_ratio",
+    "calmar_ratio",
+    "omega_ratio",
+    "tail_ratio",
+    "max_drawdown",
+    "annual_return",
+    "annual_volatility",
+    "value_at_risk",
+    "conditional_var",
+    "stability_of_timeseries",
+    "alpha_beta",
+    "information_ratio",
+    "up_down_capture",
+    "compute_portfolio_turnover",
+    # Internal helpers (exported for testing)
+    "_to_numpy",
+    "_safe_prod",
+    "_safe_cumprod",
+    "_annualization_factor",
+]