PyPI - ml4t-diagnostic - Versions diffs - 0.1.0a1__py3-none-any.whl - Mend

ml4t-diagnostic 0.1.0a1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

ml4t/diagnostic/AGENT.md +25 -0
ml4t/diagnostic/__init__.py +166 -0
ml4t/diagnostic/backends/__init__.py +10 -0
ml4t/diagnostic/backends/adapter.py +192 -0
ml4t/diagnostic/backends/polars_backend.py +899 -0
ml4t/diagnostic/caching/__init__.py +40 -0
ml4t/diagnostic/caching/cache.py +331 -0
ml4t/diagnostic/caching/decorators.py +131 -0
ml4t/diagnostic/caching/smart_cache.py +339 -0
ml4t/diagnostic/config/AGENT.md +24 -0
ml4t/diagnostic/config/README.md +267 -0
ml4t/diagnostic/config/__init__.py +219 -0
ml4t/diagnostic/config/barrier_config.py +277 -0
ml4t/diagnostic/config/base.py +301 -0
ml4t/diagnostic/config/event_config.py +148 -0
ml4t/diagnostic/config/feature_config.py +404 -0
ml4t/diagnostic/config/multi_signal_config.py +55 -0
ml4t/diagnostic/config/portfolio_config.py +215 -0
ml4t/diagnostic/config/report_config.py +391 -0
ml4t/diagnostic/config/sharpe_config.py +202 -0
ml4t/diagnostic/config/signal_config.py +206 -0
ml4t/diagnostic/config/trade_analysis_config.py +310 -0
ml4t/diagnostic/config/validation.py +279 -0
ml4t/diagnostic/core/__init__.py +29 -0
ml4t/diagnostic/core/numba_utils.py +315 -0
ml4t/diagnostic/core/purging.py +372 -0
ml4t/diagnostic/core/sampling.py +471 -0
ml4t/diagnostic/errors/__init__.py +205 -0
ml4t/diagnostic/evaluation/AGENT.md +26 -0
ml4t/diagnostic/evaluation/__init__.py +437 -0
ml4t/diagnostic/evaluation/autocorrelation.py +531 -0
ml4t/diagnostic/evaluation/barrier_analysis.py +1050 -0
ml4t/diagnostic/evaluation/binary_metrics.py +910 -0
ml4t/diagnostic/evaluation/dashboard.py +715 -0
ml4t/diagnostic/evaluation/diagnostic_plots.py +1037 -0
ml4t/diagnostic/evaluation/distribution/__init__.py +499 -0
ml4t/diagnostic/evaluation/distribution/moments.py +299 -0
ml4t/diagnostic/evaluation/distribution/tails.py +777 -0
ml4t/diagnostic/evaluation/distribution/tests.py +470 -0
ml4t/diagnostic/evaluation/drift/__init__.py +139 -0
ml4t/diagnostic/evaluation/drift/analysis.py +432 -0
ml4t/diagnostic/evaluation/drift/domain_classifier.py +517 -0
ml4t/diagnostic/evaluation/drift/population_stability_index.py +310 -0
ml4t/diagnostic/evaluation/drift/wasserstein.py +388 -0
ml4t/diagnostic/evaluation/event_analysis.py +647 -0
ml4t/diagnostic/evaluation/excursion.py +390 -0
ml4t/diagnostic/evaluation/feature_diagnostics.py +873 -0
ml4t/diagnostic/evaluation/feature_outcome.py +666 -0
ml4t/diagnostic/evaluation/framework.py +935 -0
ml4t/diagnostic/evaluation/metric_registry.py +255 -0
ml4t/diagnostic/evaluation/metrics/AGENT.md +23 -0
ml4t/diagnostic/evaluation/metrics/__init__.py +133 -0
ml4t/diagnostic/evaluation/metrics/basic.py +160 -0
ml4t/diagnostic/evaluation/metrics/conditional_ic.py +469 -0
ml4t/diagnostic/evaluation/metrics/feature_outcome.py +475 -0
ml4t/diagnostic/evaluation/metrics/ic_statistics.py +446 -0
ml4t/diagnostic/evaluation/metrics/importance_analysis.py +338 -0
ml4t/diagnostic/evaluation/metrics/importance_classical.py +375 -0
ml4t/diagnostic/evaluation/metrics/importance_mda.py +371 -0
ml4t/diagnostic/evaluation/metrics/importance_shap.py +715 -0
ml4t/diagnostic/evaluation/metrics/information_coefficient.py +527 -0
ml4t/diagnostic/evaluation/metrics/interactions.py +772 -0
ml4t/diagnostic/evaluation/metrics/monotonicity.py +226 -0
ml4t/diagnostic/evaluation/metrics/risk_adjusted.py +324 -0
ml4t/diagnostic/evaluation/multi_signal.py +550 -0
ml4t/diagnostic/evaluation/portfolio_analysis/__init__.py +83 -0
ml4t/diagnostic/evaluation/portfolio_analysis/analysis.py +734 -0
ml4t/diagnostic/evaluation/portfolio_analysis/metrics.py +589 -0
ml4t/diagnostic/evaluation/portfolio_analysis/results.py +334 -0
ml4t/diagnostic/evaluation/report_generation.py +824 -0
ml4t/diagnostic/evaluation/signal_selector.py +452 -0
ml4t/diagnostic/evaluation/stat_registry.py +139 -0
ml4t/diagnostic/evaluation/stationarity/__init__.py +97 -0
ml4t/diagnostic/evaluation/stationarity/analysis.py +518 -0
ml4t/diagnostic/evaluation/stationarity/augmented_dickey_fuller.py +296 -0
ml4t/diagnostic/evaluation/stationarity/kpss_test.py +308 -0
ml4t/diagnostic/evaluation/stationarity/phillips_perron.py +365 -0
ml4t/diagnostic/evaluation/stats/AGENT.md +43 -0
ml4t/diagnostic/evaluation/stats/__init__.py +191 -0
ml4t/diagnostic/evaluation/stats/backtest_overfitting.py +219 -0
ml4t/diagnostic/evaluation/stats/bootstrap.py +228 -0
ml4t/diagnostic/evaluation/stats/deflated_sharpe_ratio.py +591 -0
ml4t/diagnostic/evaluation/stats/false_discovery_rate.py +295 -0
ml4t/diagnostic/evaluation/stats/hac_standard_errors.py +108 -0
ml4t/diagnostic/evaluation/stats/minimum_track_record.py +408 -0
ml4t/diagnostic/evaluation/stats/moments.py +164 -0
ml4t/diagnostic/evaluation/stats/rademacher_adjustment.py +436 -0
ml4t/diagnostic/evaluation/stats/reality_check.py +155 -0
ml4t/diagnostic/evaluation/stats/sharpe_inference.py +219 -0
ml4t/diagnostic/evaluation/themes.py +330 -0
ml4t/diagnostic/evaluation/threshold_analysis.py +957 -0
ml4t/diagnostic/evaluation/trade_analysis.py +1136 -0
ml4t/diagnostic/evaluation/trade_dashboard/__init__.py +32 -0
ml4t/diagnostic/evaluation/trade_dashboard/app.py +315 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/__init__.py +18 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/csv.py +82 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/html.py +276 -0
ml4t/diagnostic/evaluation/trade_dashboard/io.py +166 -0
ml4t/diagnostic/evaluation/trade_dashboard/normalize.py +304 -0
ml4t/diagnostic/evaluation/trade_dashboard/stats.py +386 -0
ml4t/diagnostic/evaluation/trade_dashboard/style.py +79 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/__init__.py +21 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/patterns.py +354 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/shap_analysis.py +280 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/stat_validation.py +186 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/worst_trades.py +236 -0
ml4t/diagnostic/evaluation/trade_dashboard/types.py +129 -0
ml4t/diagnostic/evaluation/trade_shap/__init__.py +102 -0
ml4t/diagnostic/evaluation/trade_shap/alignment.py +188 -0
ml4t/diagnostic/evaluation/trade_shap/characterize.py +413 -0
ml4t/diagnostic/evaluation/trade_shap/cluster.py +302 -0
ml4t/diagnostic/evaluation/trade_shap/explain.py +208 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/__init__.py +23 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/generator.py +290 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/matcher.py +251 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/templates.yaml +467 -0
ml4t/diagnostic/evaluation/trade_shap/models.py +386 -0
ml4t/diagnostic/evaluation/trade_shap/normalize.py +116 -0
ml4t/diagnostic/evaluation/trade_shap/pipeline.py +263 -0
ml4t/diagnostic/evaluation/trade_shap_dashboard.py +283 -0
ml4t/diagnostic/evaluation/trade_shap_diagnostics.py +588 -0
ml4t/diagnostic/evaluation/validated_cv.py +535 -0
ml4t/diagnostic/evaluation/visualization.py +1050 -0
ml4t/diagnostic/evaluation/volatility/__init__.py +45 -0
ml4t/diagnostic/evaluation/volatility/analysis.py +351 -0
ml4t/diagnostic/evaluation/volatility/arch.py +258 -0
ml4t/diagnostic/evaluation/volatility/garch.py +460 -0
ml4t/diagnostic/integration/__init__.py +48 -0
ml4t/diagnostic/integration/backtest_contract.py +671 -0
ml4t/diagnostic/integration/data_contract.py +316 -0
ml4t/diagnostic/integration/engineer_contract.py +226 -0
ml4t/diagnostic/logging/__init__.py +77 -0
ml4t/diagnostic/logging/logger.py +245 -0
ml4t/diagnostic/logging/performance.py +234 -0
ml4t/diagnostic/logging/progress.py +234 -0
ml4t/diagnostic/logging/wandb.py +412 -0
ml4t/diagnostic/metrics/__init__.py +9 -0
ml4t/diagnostic/metrics/percentiles.py +128 -0
ml4t/diagnostic/py.typed +1 -0
ml4t/diagnostic/reporting/__init__.py +43 -0
ml4t/diagnostic/reporting/base.py +130 -0
ml4t/diagnostic/reporting/html_renderer.py +275 -0
ml4t/diagnostic/reporting/json_renderer.py +51 -0
ml4t/diagnostic/reporting/markdown_renderer.py +117 -0
ml4t/diagnostic/results/AGENT.md +24 -0
ml4t/diagnostic/results/__init__.py +105 -0
ml4t/diagnostic/results/barrier_results/__init__.py +36 -0
ml4t/diagnostic/results/barrier_results/hit_rate.py +304 -0
ml4t/diagnostic/results/barrier_results/precision_recall.py +266 -0
ml4t/diagnostic/results/barrier_results/profit_factor.py +297 -0
ml4t/diagnostic/results/barrier_results/tearsheet.py +397 -0
ml4t/diagnostic/results/barrier_results/time_to_target.py +305 -0
ml4t/diagnostic/results/barrier_results/validation.py +38 -0
ml4t/diagnostic/results/base.py +177 -0
ml4t/diagnostic/results/event_results.py +349 -0
ml4t/diagnostic/results/feature_results.py +787 -0
ml4t/diagnostic/results/multi_signal_results.py +431 -0
ml4t/diagnostic/results/portfolio_results.py +281 -0
ml4t/diagnostic/results/sharpe_results.py +448 -0
ml4t/diagnostic/results/signal_results/__init__.py +74 -0
ml4t/diagnostic/results/signal_results/ic.py +581 -0
ml4t/diagnostic/results/signal_results/irtc.py +110 -0
ml4t/diagnostic/results/signal_results/quantile.py +392 -0
ml4t/diagnostic/results/signal_results/tearsheet.py +456 -0
ml4t/diagnostic/results/signal_results/turnover.py +213 -0
ml4t/diagnostic/results/signal_results/validation.py +147 -0
ml4t/diagnostic/signal/AGENT.md +17 -0
ml4t/diagnostic/signal/__init__.py +69 -0
ml4t/diagnostic/signal/_report.py +152 -0
ml4t/diagnostic/signal/_utils.py +261 -0
ml4t/diagnostic/signal/core.py +275 -0
ml4t/diagnostic/signal/quantile.py +148 -0
ml4t/diagnostic/signal/result.py +214 -0
ml4t/diagnostic/signal/signal_ic.py +129 -0
ml4t/diagnostic/signal/turnover.py +182 -0
ml4t/diagnostic/splitters/AGENT.md +19 -0
ml4t/diagnostic/splitters/__init__.py +36 -0
ml4t/diagnostic/splitters/base.py +501 -0
ml4t/diagnostic/splitters/calendar.py +421 -0
ml4t/diagnostic/splitters/calendar_config.py +91 -0
ml4t/diagnostic/splitters/combinatorial.py +1064 -0
ml4t/diagnostic/splitters/config.py +322 -0
ml4t/diagnostic/splitters/cpcv/__init__.py +57 -0
ml4t/diagnostic/splitters/cpcv/combinations.py +119 -0
ml4t/diagnostic/splitters/cpcv/partitioning.py +263 -0
ml4t/diagnostic/splitters/cpcv/purge_engine.py +379 -0
ml4t/diagnostic/splitters/cpcv/windows.py +190 -0
ml4t/diagnostic/splitters/group_isolation.py +329 -0
ml4t/diagnostic/splitters/persistence.py +316 -0
ml4t/diagnostic/splitters/utils.py +207 -0
ml4t/diagnostic/splitters/walk_forward.py +757 -0
ml4t/diagnostic/utils/__init__.py +42 -0
ml4t/diagnostic/utils/config.py +542 -0
ml4t/diagnostic/utils/dependencies.py +318 -0
ml4t/diagnostic/utils/sessions.py +127 -0
ml4t/diagnostic/validation/__init__.py +54 -0
ml4t/diagnostic/validation/dataframe.py +274 -0
ml4t/diagnostic/validation/returns.py +280 -0
ml4t/diagnostic/validation/timeseries.py +299 -0
ml4t/diagnostic/visualization/AGENT.md +19 -0
ml4t/diagnostic/visualization/__init__.py +223 -0
ml4t/diagnostic/visualization/backtest/__init__.py +98 -0
ml4t/diagnostic/visualization/backtest/cost_attribution.py +762 -0
ml4t/diagnostic/visualization/backtest/executive_summary.py +895 -0
ml4t/diagnostic/visualization/backtest/interactive_controls.py +673 -0
ml4t/diagnostic/visualization/backtest/statistical_validity.py +874 -0
ml4t/diagnostic/visualization/backtest/tearsheet.py +565 -0
ml4t/diagnostic/visualization/backtest/template_system.py +373 -0
ml4t/diagnostic/visualization/backtest/trade_plots.py +1172 -0
ml4t/diagnostic/visualization/barrier_plots.py +782 -0
ml4t/diagnostic/visualization/core.py +1060 -0
ml4t/diagnostic/visualization/dashboards/__init__.py +36 -0
ml4t/diagnostic/visualization/dashboards/base.py +582 -0
ml4t/diagnostic/visualization/dashboards/importance.py +801 -0
ml4t/diagnostic/visualization/dashboards/interaction.py +263 -0
ml4t/diagnostic/visualization/dashboards.py +43 -0
ml4t/diagnostic/visualization/data_extraction/__init__.py +48 -0
ml4t/diagnostic/visualization/data_extraction/importance.py +649 -0
ml4t/diagnostic/visualization/data_extraction/interaction.py +504 -0
ml4t/diagnostic/visualization/data_extraction/types.py +113 -0
ml4t/diagnostic/visualization/data_extraction/validation.py +66 -0
ml4t/diagnostic/visualization/feature_plots.py +888 -0
ml4t/diagnostic/visualization/interaction_plots.py +618 -0
ml4t/diagnostic/visualization/portfolio/__init__.py +41 -0
ml4t/diagnostic/visualization/portfolio/dashboard.py +514 -0
ml4t/diagnostic/visualization/portfolio/drawdown_plots.py +341 -0
ml4t/diagnostic/visualization/portfolio/returns_plots.py +487 -0
ml4t/diagnostic/visualization/portfolio/risk_plots.py +301 -0
ml4t/diagnostic/visualization/report_generation.py +1343 -0
ml4t/diagnostic/visualization/signal/__init__.py +103 -0
ml4t/diagnostic/visualization/signal/dashboard.py +911 -0
ml4t/diagnostic/visualization/signal/event_plots.py +514 -0
ml4t/diagnostic/visualization/signal/ic_plots.py +635 -0
ml4t/diagnostic/visualization/signal/multi_signal_dashboard.py +974 -0
ml4t/diagnostic/visualization/signal/multi_signal_plots.py +603 -0
ml4t/diagnostic/visualization/signal/quantile_plots.py +625 -0
ml4t/diagnostic/visualization/signal/turnover_plots.py +400 -0
ml4t/diagnostic/visualization/trade_shap/__init__.py +90 -0
ml4t_diagnostic-0.1.0a1.dist-info/METADATA +1044 -0
ml4t_diagnostic-0.1.0a1.dist-info/RECORD +242 -0
ml4t_diagnostic-0.1.0a1.dist-info/WHEEL +4 -0
ml4t_diagnostic-0.1.0a1.dist-info/licenses/LICENSE +21 -0

ml4t/diagnostic/evaluation/volatility/__init__.py ADDED Viewed

@@ -0,0 +1,45 @@
+"""Volatility clustering detection and modeling for time series.
+This module provides statistical tests and models for analyzing conditional
+heteroscedasticity (volatility clustering) in financial time series:
+- ARCH-LM test - Tests for autoregressive conditional heteroscedasticity (ARCH effects)
+- GARCH(p,q) fitting - Models time-varying volatility dynamics
+- Comprehensive volatility analysis - Combines ARCH-LM and GARCH
+Volatility clustering is a key stylized fact of financial returns where large
+changes tend to be followed by large changes, and small changes by small changes.
+Example:
+    >>> import numpy as np
+    >>> from ml4t.diagnostic.evaluation.volatility import arch_lm_test, analyze_volatility
+    >>>
+    >>> # White noise (no ARCH effects)
+    >>> white_noise = np.random.randn(1000)
+    >>> result = arch_lm_test(white_noise)
+    >>> print(f"Has ARCH effects: {result.has_arch_effects}")  # Should be False
+    >>>
+    >>> # Comprehensive analysis
+    >>> analysis = analyze_volatility(returns_data)
+    >>> print(analysis.summary())
+References:
+    - Engle, R. F. (1982). Autoregressive Conditional Heteroscedasticity.
+    - Bollerslev, T. (1986). Generalized Autoregressive Conditional Heteroskedasticity.
+"""
+from .analysis import VolatilityAnalysisResult, analyze_volatility
+from .arch import ARCHLMResult, arch_lm_test
+from .garch import GARCHResult, fit_garch
+__all__ = [
+    # ARCH-LM test
+    "ARCHLMResult",
+    "arch_lm_test",
+    # GARCH model
+    "GARCHResult",
+    "fit_garch",
+    # Combined analysis
+    "VolatilityAnalysisResult",
+    "analyze_volatility",
+]

ml4t/diagnostic/evaluation/volatility/analysis.py ADDED Viewed

@@ -0,0 +1,351 @@
+"""Comprehensive volatility analysis combining ARCH-LM and GARCH.
+This module provides a unified interface for volatility analysis, combining
+the ARCH-LM test for detecting volatility clustering with GARCH model
+fitting for estimating conditional volatility dynamics.
+"""
+from __future__ import annotations
+import numpy as np
+import pandas as pd
+from ml4t.diagnostic.errors import ComputationError, ValidationError
+from ml4t.diagnostic.logging import get_logger
+from .arch import ARCHLMResult, arch_lm_test
+from .garch import GARCHResult, fit_garch
+logger = get_logger(__name__)
+class VolatilityAnalysisResult:
+    """Comprehensive volatility analysis results combining ARCH-LM and GARCH.
+    This class provides a unified interface for volatility analysis, combining
+    the ARCH-LM test for detecting volatility clustering with GARCH model
+    fitting for estimating conditional volatility dynamics.
+    Workflow:
+        1. Run ARCH-LM test to detect volatility clustering
+        2. If clustering detected AND fit_garch=True, fit GARCH model
+        3. Provide comprehensive summary and recommendations
+    Attributes:
+        arch_lm_result: Results from ARCH-LM test
+        garch_result: Results from GARCH fitting (None if not fitted or no ARCH effects)
+        has_volatility_clustering: Whether volatility clustering was detected
+        persistence: Overall volatility persistence (alpha + beta from GARCH, None if not fitted)
+        interpretation: Human-readable interpretation of results
+    """
+    def __init__(
+        self,
+        arch_lm_result: ARCHLMResult,
+        garch_result: GARCHResult | None = None,
+    ):
+        """Initialize volatility analysis result.
+        Args:
+            arch_lm_result: Results from ARCH-LM test
+            garch_result: Results from GARCH fitting (optional)
+        """
+        self.arch_lm_result = arch_lm_result
+        self.garch_result = garch_result
+        self.has_volatility_clustering = arch_lm_result.has_arch_effects
+        # Extract persistence if GARCH was fitted
+        self.persistence: float | None
+        if garch_result is not None:
+            self.persistence = garch_result.persistence
+        else:
+            self.persistence = None
+        # Generate interpretation
+        self.interpretation = self._generate_interpretation()
+    def _generate_interpretation(self) -> str:
+        """Generate human-readable interpretation of results."""
+        lines = []
+        # ARCH-LM test interpretation
+        if self.has_volatility_clustering:
+            lines.append("✓ Volatility clustering detected (ARCH effects present)")
+            lines.append("  - Time-varying volatility in returns")
+            lines.append("  - Large changes tend to follow large changes")
+        else:
+            lines.append("✗ No volatility clustering detected (no ARCH effects)")
+            lines.append("  - Constant variance assumption reasonable")
+            lines.append("  - Classical methods with homoscedasticity appropriate")
+        # GARCH model interpretation (if fitted)
+        if self.garch_result is not None:
+            lines.append("")
+            lines.append("GARCH Model Results:")
+            persistence = self.persistence
+            if persistence is not None:
+                lines.append(f"  - Persistence (α+β): {persistence:.4f}")
+                if persistence >= 1.0:
+                    lines.append("  ⚠ WARNING: Non-stationary (persistence ≥ 1)")
+                    lines.append("  - Volatility shocks do not decay")
+                    lines.append("  - Consider IGARCH or alternative models")
+                elif persistence >= 0.99:
+                    lines.append("  ⚠ Very high persistence (near unit root)")
+                    lines.append("  - Volatility shocks decay very slowly")
+                    lines.append("  - Risk forecasts remain elevated for long periods")
+                elif persistence > 0.95:
+                    lines.append("  → High persistence (slow mean reversion)")
+                    lines.append("  - Typical for daily financial returns")
+                    lines.append("  - Volatility shocks persist for many periods")
+                else:
+                    lines.append("  → Moderate persistence (faster mean reversion)")
+                    lines.append("  - Volatility shocks decay relatively quickly")
+                # Compute half-life if stationary and positive
+                # Guard against persistence <= 0 which would make log undefined
+                if 0.0 < persistence < 1.0:
+                    half_life = np.log(0.5) / np.log(persistence)
+                    lines.append(f"  - Shock half-life: {half_life:.1f} periods")
+        # Recommendations
+        lines.append("")
+        lines.append("Recommendations:")
+        if self.has_volatility_clustering:
+            if self.garch_result is not None:
+                lines.append("  1. Use fitted GARCH model for volatility forecasting")
+                lines.append("  2. Apply conditional volatility in risk models (VaR, CVaR)")
+                lines.append("  3. Consider HAC-adjusted standard errors for inference")
+                lines.append("  4. Account for volatility clustering in trading strategies")
+            else:
+                lines.append("  1. Consider fitting GARCH/EGARCH models")
+                lines.append("  2. Use HAC-adjusted standard errors")
+                lines.append("  3. Account for time-varying volatility in risk models")
+        else:
+            lines.append("  1. Constant variance models appropriate")
+            lines.append("  2. Standard OLS methods valid")
+            lines.append("  3. Classical risk models acceptable")
+        return "\n".join(lines)
+    def __repr__(self) -> str:
+        """String representation."""
+        garch_info = (
+            f", persistence={self.persistence:.4f}"
+            if self.persistence is not None
+            else ", no_garch"
+        )
+        return (
+            f"VolatilityAnalysisResult("
+            f"has_clustering={self.has_volatility_clustering}, "
+            f"arch_p={self.arch_lm_result.p_value:.4f}"
+            f"{garch_info})"
+        )
+    def summary(self) -> str:
+        """Comprehensive volatility analysis summary.
+        Returns:
+            Formatted summary string with all analysis results
+        """
+        lines = [
+            "=" * 70,
+            "Comprehensive Volatility Analysis",
+            "=" * 70,
+        ]
+        # Section 1: ARCH-LM Test
+        lines.append("")
+        lines.append("1. ARCH-LM Test for Volatility Clustering")
+        lines.append("-" * 70)
+        lines.append(f"Test Statistic: {self.arch_lm_result.test_statistic:.4f}")
+        lines.append(f"P-value:        {self.arch_lm_result.p_value:.4f}")
+        lines.append(f"Lags Used:      {self.arch_lm_result.lags}")
+        lines.append(f"Observations:   {self.arch_lm_result.n_obs}")
+        lines.append("")
+        conclusion = (
+            "ARCH effects detected (volatility clustering present)"
+            if self.has_volatility_clustering
+            else "No ARCH effects (constant variance)"
+        )
+        lines.append(f"Conclusion: {conclusion}")
+        # Section 2: GARCH Model (if fitted)
+        if self.garch_result is not None:
+            lines.append("")
+            lines.append("2. GARCH Model Fitting Results")
+            lines.append("-" * 70)
+            # Infer p and q from coefficient shapes
+            p = (
+                len(self.garch_result.alpha)
+                if isinstance(self.garch_result.alpha, tuple | list)
+                else 1
+            )
+            q = (
+                len(self.garch_result.beta)
+                if isinstance(self.garch_result.beta, tuple | list)
+                else 1
+            )
+            lines.append(f"Model:          GARCH({p},{q})")
+            lines.append(f"Converged:      {'Yes' if self.garch_result.converged else 'No'}")
+            lines.append(f"Iterations:     {self.garch_result.iterations}")
+            lines.append("")
+            lines.append("Parameters:")
+            lines.append(f"  ω (omega):    {self.garch_result.omega:.6f}")
+            if isinstance(self.garch_result.alpha, tuple | list):
+                for i, a in enumerate(self.garch_result.alpha, 1):
+                    lines.append(f"  α{i} (alpha):  {a:.6f}")
+            else:
+                lines.append(f"  α (alpha):    {self.garch_result.alpha:.6f}")
+            if isinstance(self.garch_result.beta, tuple | list):
+                for i, b in enumerate(self.garch_result.beta, 1):
+                    lines.append(f"  β{i} (beta):   {b:.6f}")
+            else:
+                lines.append(f"  β (beta):     {self.garch_result.beta:.6f}")
+            lines.append("")
+            lines.append(f"Persistence (α+β): {self.persistence:.6f}")
+            # Model fit statistics
+            lines.append("")
+            lines.append("Model Fit:")
+            lines.append(f"  Log-Likelihood: {self.garch_result.log_likelihood:.4f}")
+            lines.append(f"  AIC:            {self.garch_result.aic:.4f}")
+            lines.append(f"  BIC:            {self.garch_result.bic:.4f}")
+        elif self.has_volatility_clustering:
+            lines.append("")
+            lines.append("2. GARCH Model")
+            lines.append("-" * 70)
+            lines.append("Not fitted (fit_garch=False or fitting skipped)")
+        # Section 3: Interpretation
+        lines.append("")
+        lines.append("3. Interpretation")
+        lines.append("-" * 70)
+        lines.append(self.interpretation)
+        lines.append("")
+        lines.append("=" * 70)
+        return "\n".join(lines)
+def analyze_volatility(
+    returns: pd.Series | np.ndarray,
+    arch_lags: int = 12,
+    fit_garch_model: bool = True,
+    garch_p: int = 1,
+    garch_q: int = 1,
+    alpha: float = 0.05,
+) -> VolatilityAnalysisResult:
+    """Comprehensive volatility analysis combining ARCH-LM and GARCH.
+    This function provides a complete workflow for volatility analysis:
+    1. Tests for volatility clustering using ARCH-LM test
+    2. If clustering detected AND fit_garch=True, fits GARCH model
+    3. Returns comprehensive summary with interpretation and recommendations
+    The ARCH-LM test detects autoregressive conditional heteroscedasticity
+    (volatility clustering), and the GARCH model quantifies the dynamics
+    of time-varying volatility.
+    Args:
+        returns: Returns series (NOT prices) to analyze
+        arch_lags: Number of lags for ARCH-LM test (default 12)
+        fit_garch_model: Whether to fit GARCH model if ARCH effects detected (default True)
+        garch_p: GARCH AR order (default 1)
+        garch_q: GARCH MA order (default 1)
+        alpha: Significance level for ARCH-LM test (default 0.05)
+    Returns:
+        VolatilityAnalysisResult with comprehensive analysis
+    Raises:
+        ValidationError: If data is invalid
+        ComputationError: If analysis fails
+    Notes:
+        - Always run ARCH-LM test first (even if fit_garch_model=False)
+        - GARCH fitting only attempted if ARCH effects detected
+        - Set fit_garch_model=False to skip GARCH (faster, detection only)
+        - GARCH requires 'arch' package (pip install arch)
+        - Default GARCH(1,1) sufficient for most financial applications
+        - Results include interpretation and actionable recommendations
+    References:
+        Engle, R. F. (1982). Autoregressive Conditional Heteroscedasticity.
+        Bollerslev, T. (1986). Generalized Autoregressive Conditional Heteroskedasticity.
+    """
+    logger.debug(
+        f"Running comprehensive volatility analysis: "
+        f"arch_lags={arch_lags}, fit_garch_model={fit_garch_model}, "
+        f"garch_p={garch_p}, garch_q={garch_q}"
+    )
+    # Step 1: Run ARCH-LM test
+    try:
+        arch_result = arch_lm_test(returns, lags=arch_lags, demean=True, alpha=alpha)
+        logger.info(
+            f"ARCH-LM test complete: has_arch={arch_result.has_arch_effects}, p_value={arch_result.p_value:.4f}"
+        )
+    except ValidationError:
+        # Let validation errors pass through (invalid inputs)
+        raise
+    except Exception as e:
+        # Wrap other errors as computation errors
+        logger.error(f"ARCH-LM test failed: {e}")
+        raise ComputationError(  # noqa: B904
+            f"ARCH-LM test failed during volatility analysis: {e}",
+            context={"arch_lags": arch_lags},
+            cause=e,
+        )
+    # Step 2: Fit GARCH if ARCH effects detected and requested
+    garch_result = None
+    if arch_result.has_arch_effects and fit_garch_model:
+        logger.debug(
+            f"ARCH effects detected (p={arch_result.p_value:.4f}), fitting GARCH({garch_p},{garch_q}) model"
+        )
+        try:
+            garch_result = fit_garch(returns, p=garch_p, q=garch_q)
+            logger.info(
+                f"GARCH({garch_p},{garch_q}) fitted successfully: "
+                f"persistence={garch_result.persistence:.4f}, "
+                f"converged={garch_result.converged}"
+            )
+        except ValidationError as e:
+            # If arch package not installed, log warning but continue
+            if "arch" in str(e).lower() and "package" in str(e).lower():
+                logger.warning(
+                    "GARCH fitting skipped: arch package not installed. Install with: pip install arch"
+                )
+            else:
+                # Re-raise other validation errors
+                raise
+        except Exception as e:
+            # Log error but continue with ARCH-LM results only
+            logger.warning(f"GARCH fitting failed: {e}. Continuing with ARCH-LM results only.")
+    elif not arch_result.has_arch_effects:
+        logger.info(
+            f"No ARCH effects detected (p={arch_result.p_value:.4f}), skipping GARCH fitting"
+        )
+    else:
+        logger.debug("fit_garch_model=False, skipping GARCH fitting")
+    # Step 3: Create comprehensive result
+    result = VolatilityAnalysisResult(
+        arch_lm_result=arch_result,
+        garch_result=garch_result,
+    )
+    logger.info(
+        f"Volatility analysis complete: "
+        f"has_clustering={result.has_volatility_clustering}, "
+        f"persistence={result.persistence}"
+    )
+    return result

ml4t/diagnostic/evaluation/volatility/arch.py ADDED Viewed

@@ -0,0 +1,258 @@
+"""ARCH Lagrange Multiplier test for conditional heteroscedasticity.
+The ARCH-LM test (Engle, 1982) detects autoregressive conditional
+heteroscedasticity (volatility clustering) in time series data.
+References:
+    Engle, R. F. (1982). Autoregressive Conditional Heteroscedasticity with
+    Estimates of the Variance of United Kingdom Inflation. Econometrica, 50(4),
+    987-1007. DOI: 10.2307/1912773
+"""
+from __future__ import annotations
+import numpy as np
+import pandas as pd
+# het_arch is in statsmodels (required dependency)
+from statsmodels.stats.diagnostic import het_arch
+from ml4t.diagnostic.errors import ComputationError, ValidationError
+from ml4t.diagnostic.logging import get_logger
+logger = get_logger(__name__)
+class ARCHLMResult:
+    """Results from ARCH Lagrange Multiplier test.
+    The ARCH-LM test detects autoregressive conditional heteroscedasticity
+    (volatility clustering) in time series data. The null hypothesis is
+    that there are no ARCH effects (constant variance).
+    Attributes:
+        test_statistic: LM test statistic (n * R² from auxiliary regression)
+        p_value: P-value for null hypothesis (no ARCH effects)
+        lags: Number of lags tested in auxiliary regression
+        n_obs: Number of observations used in test
+        alpha: Significance level used for the test
+        has_arch_effects: Whether ARCH effects detected (p < alpha)
+    """
+    def __init__(
+        self,
+        test_statistic: float,
+        p_value: float,
+        lags: int,
+        n_obs: int,
+        alpha: float = 0.05,
+    ):
+        """Initialize ARCH-LM result.
+        Args:
+            test_statistic: LM test statistic
+            p_value: P-value for no ARCH effects hypothesis
+            lags: Number of lags used in test
+            n_obs: Number of observations
+            alpha: Significance level for the test (default 0.05)
+        """
+        self.test_statistic = test_statistic
+        self.p_value = p_value
+        self.lags = lags
+        self.n_obs = n_obs
+        self.alpha = alpha
+        # Determine ARCH effects at specified significance level
+        # Low p-value (< alpha) means reject H0 => ARCH effects present
+        self.has_arch_effects = p_value < alpha
+    def __repr__(self) -> str:
+        """String representation."""
+        return (
+            f"ARCHLMResult(statistic={self.test_statistic:.4f}, "
+            f"p_value={self.p_value:.4f}, "
+            f"has_arch_effects={self.has_arch_effects})"
+        )
+    def summary(self) -> str:
+        """Human-readable summary of ARCH-LM test results.
+        Returns:
+            Formatted summary string
+        """
+        lines = [
+            "ARCH Lagrange Multiplier Test Results",
+            "=" * 50,
+            f"Test Statistic:    {self.test_statistic:.4f}",
+            f"P-value:           {self.p_value:.4f}",
+            f"Lags Used:         {self.lags}",
+            f"Observations:      {self.n_obs}",
+        ]
+        lines.append("")
+        lines.append(
+            f"Conclusion: {'ARCH effects detected' if self.has_arch_effects else 'No ARCH effects'}"
+        )
+        alpha_pct = self.alpha * 100
+        lines.append(
+            f"  (Reject H0 at {alpha_pct:.0f}% level)"
+            if self.has_arch_effects
+            else f"  (Fail to reject H0 at {alpha_pct:.0f}% level)"
+        )
+        lines.append("")
+        lines.append("Interpretation:")
+        if self.has_arch_effects:
+            lines.append("  - Volatility clustering present (time-varying variance)")
+            lines.append("  - Consider GARCH/EGARCH models for volatility forecasting")
+            lines.append("  - Standard errors may be unreliable without correction")
+            lines.append("  - Risk models should account for conditional heteroscedasticity")
+        else:
+            lines.append("  - No evidence of volatility clustering")
+            lines.append("  - Constant variance assumption is reasonable")
+            lines.append("  - Classical methods with homoscedasticity are appropriate")
+        lines.append("")
+        lines.append("Test Methodology:")
+        lines.append("  - Auxiliary regression: ε²_t = α₀ + Σ(α_i * ε²_{t-i})")
+        lines.append(f"  - LM statistic = n * R² ~ χ²({self.lags})")
+        lines.append("  - H0: No ARCH effects (α₁ = α₂ = ... = α_lags = 0)")
+        return "\n".join(lines)
+def arch_lm_test(
+    data: pd.Series | np.ndarray,
+    lags: int = 12,
+    demean: bool = True,
+    alpha: float = 0.05,
+) -> ARCHLMResult:
+    """Perform ARCH Lagrange Multiplier test for conditional heteroscedasticity.
+    The ARCH-LM test (Engle, 1982) tests for autoregressive conditional
+    heteroscedasticity (volatility clustering) in time series data. The test
+    is based on the principle that if ARCH effects are present, squared
+    residuals will be autocorrelated.
+    Test Methodology:
+        1. Compute residuals: ε_t (de-meaned if demean=True)
+        2. Square residuals: ε²_t
+        3. Regress ε²_t on ε²_{t-1}, ..., ε²_{t-lags}
+        4. LM statistic = n * R² from auxiliary regression
+        5. Under H0 (no ARCH): LM ~ χ²(lags)
+    Args:
+        data: Time series data to test (1D array or Series)
+        lags: Number of lags to test (default 12, ~1 year of monthly data)
+        demean: Whether to subtract mean before computing squared residuals.
+                True is common for returns which are approximately zero-mean.
+        alpha: Significance level for the test (default 0.05)
+    Returns:
+        ARCHLMResult with test statistics and conclusion
+    Raises:
+        ValidationError: If data is invalid (empty, wrong shape, etc.)
+        ComputationError: If test computation fails
+    Notes:
+        - De-meaning (demean=True) is standard for return series
+        - Lag selection: 12 for monthly, ~250 for daily returns
+        - Test is asymptotically valid (needs large sample)
+        - Presence of ARCH effects suggests GARCH models may be appropriate
+        - Uses statsmodels.stats.diagnostic.het_arch (core dependency)
+    References:
+        Engle, R. F. (1982). Autoregressive Conditional Heteroscedasticity with
+        Estimates of the Variance of United Kingdom Inflation. Econometrica,
+        50(4), 987-1007. DOI: 10.2307/1912773
+    """
+    # Input validation
+    logger.debug(f"Running ARCH-LM test with lags={lags}, demean={demean}")
+    # Convert to numpy array if needed
+    arr = data.to_numpy() if isinstance(data, pd.Series) else np.asarray(data)
+    # Validate input
+    if arr.size == 0:
+        raise ValidationError(
+            "Cannot perform ARCH-LM test on empty data",
+            context={"data_size": 0},
+        )
+    if arr.ndim != 1:
+        raise ValidationError(
+            f"Data must be 1-dimensional, got shape {arr.shape}",
+            context={"data_shape": arr.shape},
+        )
+    if np.any(~np.isfinite(arr)):
+        n_invalid = np.sum(~np.isfinite(arr))
+        raise ValidationError(
+            f"Data contains {n_invalid} NaN or infinite values",
+            context={"n_invalid": n_invalid, "data_size": arr.size},
+        )
+    # Validate lags parameter FIRST (before computing min_obs)
+    if lags < 1:
+        raise ValidationError(
+            f"Number of lags must be positive, got {lags}",
+            context={"lags": lags},
+        )
+    # Check minimum sample size (now safe since lags >= 1)
+    min_obs = lags + 10  # Need at least lags + some buffer
+    if arr.size < min_obs:
+        raise ValidationError(
+            f"Insufficient data for ARCH-LM test with {lags} lags. "
+            f"Need at least {min_obs} observations, got {arr.size}",
+            context={"n_obs": arr.size, "lags": lags, "min_required": min_obs},
+        )
+    if lags >= arr.size:
+        raise ValidationError(
+            f"Number of lags ({lags}) must be less than data size ({arr.size})",
+            context={"lags": lags, "data_size": arr.size},
+        )
+    try:
+        # De-mean the data if requested (standard for returns)
+        if demean:
+            residuals = arr - np.mean(arr)
+            logger.debug(f"De-meaned data: mean={np.mean(arr):.6f}")
+        else:
+            residuals = arr.copy()
+        # Run ARCH-LM test using statsmodels
+        # het_arch returns (statistic, p-value, f-stat, f-pvalue)
+        # We use the LM test statistic (first two values)
+        result_tuple = het_arch(residuals, nlags=lags)
+        lm_stat = result_tuple[0]
+        p_value = result_tuple[1]
+        logger.info(
+            f"ARCH-LM test complete: statistic={lm_stat:.4f}, p-value={p_value:.4f}",
+            lags=lags,
+            n_obs=arr.size,
+        )
+        return ARCHLMResult(
+            test_statistic=float(lm_stat),
+            p_value=float(p_value),
+            lags=lags,
+            n_obs=arr.size,
+            alpha=alpha,
+        )
+    except Exception as e:
+        # Handle computation errors
+        logger.error(f"ARCH-LM test failed: {e}", lags=lags, n_obs=arr.size)
+        raise ComputationError(  # noqa: B904
+            f"ARCH-LM test computation failed: {e}",
+            context={
+                "n_obs": arr.size,
+                "lags": lags,
+                "demean": demean,
+            },
+            cause=e,
+        )