PyPI - ml4t-diagnostic - Versions diffs - 0.1.0a1__py3-none-any.whl - Mend

ml4t-diagnostic 0.1.0a1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

ml4t/diagnostic/AGENT.md +25 -0
ml4t/diagnostic/__init__.py +166 -0
ml4t/diagnostic/backends/__init__.py +10 -0
ml4t/diagnostic/backends/adapter.py +192 -0
ml4t/diagnostic/backends/polars_backend.py +899 -0
ml4t/diagnostic/caching/__init__.py +40 -0
ml4t/diagnostic/caching/cache.py +331 -0
ml4t/diagnostic/caching/decorators.py +131 -0
ml4t/diagnostic/caching/smart_cache.py +339 -0
ml4t/diagnostic/config/AGENT.md +24 -0
ml4t/diagnostic/config/README.md +267 -0
ml4t/diagnostic/config/__init__.py +219 -0
ml4t/diagnostic/config/barrier_config.py +277 -0
ml4t/diagnostic/config/base.py +301 -0
ml4t/diagnostic/config/event_config.py +148 -0
ml4t/diagnostic/config/feature_config.py +404 -0
ml4t/diagnostic/config/multi_signal_config.py +55 -0
ml4t/diagnostic/config/portfolio_config.py +215 -0
ml4t/diagnostic/config/report_config.py +391 -0
ml4t/diagnostic/config/sharpe_config.py +202 -0
ml4t/diagnostic/config/signal_config.py +206 -0
ml4t/diagnostic/config/trade_analysis_config.py +310 -0
ml4t/diagnostic/config/validation.py +279 -0
ml4t/diagnostic/core/__init__.py +29 -0
ml4t/diagnostic/core/numba_utils.py +315 -0
ml4t/diagnostic/core/purging.py +372 -0
ml4t/diagnostic/core/sampling.py +471 -0
ml4t/diagnostic/errors/__init__.py +205 -0
ml4t/diagnostic/evaluation/AGENT.md +26 -0
ml4t/diagnostic/evaluation/__init__.py +437 -0
ml4t/diagnostic/evaluation/autocorrelation.py +531 -0
ml4t/diagnostic/evaluation/barrier_analysis.py +1050 -0
ml4t/diagnostic/evaluation/binary_metrics.py +910 -0
ml4t/diagnostic/evaluation/dashboard.py +715 -0
ml4t/diagnostic/evaluation/diagnostic_plots.py +1037 -0
ml4t/diagnostic/evaluation/distribution/__init__.py +499 -0
ml4t/diagnostic/evaluation/distribution/moments.py +299 -0
ml4t/diagnostic/evaluation/distribution/tails.py +777 -0
ml4t/diagnostic/evaluation/distribution/tests.py +470 -0
ml4t/diagnostic/evaluation/drift/__init__.py +139 -0
ml4t/diagnostic/evaluation/drift/analysis.py +432 -0
ml4t/diagnostic/evaluation/drift/domain_classifier.py +517 -0
ml4t/diagnostic/evaluation/drift/population_stability_index.py +310 -0
ml4t/diagnostic/evaluation/drift/wasserstein.py +388 -0
ml4t/diagnostic/evaluation/event_analysis.py +647 -0
ml4t/diagnostic/evaluation/excursion.py +390 -0
ml4t/diagnostic/evaluation/feature_diagnostics.py +873 -0
ml4t/diagnostic/evaluation/feature_outcome.py +666 -0
ml4t/diagnostic/evaluation/framework.py +935 -0
ml4t/diagnostic/evaluation/metric_registry.py +255 -0
ml4t/diagnostic/evaluation/metrics/AGENT.md +23 -0
ml4t/diagnostic/evaluation/metrics/__init__.py +133 -0
ml4t/diagnostic/evaluation/metrics/basic.py +160 -0
ml4t/diagnostic/evaluation/metrics/conditional_ic.py +469 -0
ml4t/diagnostic/evaluation/metrics/feature_outcome.py +475 -0
ml4t/diagnostic/evaluation/metrics/ic_statistics.py +446 -0
ml4t/diagnostic/evaluation/metrics/importance_analysis.py +338 -0
ml4t/diagnostic/evaluation/metrics/importance_classical.py +375 -0
ml4t/diagnostic/evaluation/metrics/importance_mda.py +371 -0
ml4t/diagnostic/evaluation/metrics/importance_shap.py +715 -0
ml4t/diagnostic/evaluation/metrics/information_coefficient.py +527 -0
ml4t/diagnostic/evaluation/metrics/interactions.py +772 -0
ml4t/diagnostic/evaluation/metrics/monotonicity.py +226 -0
ml4t/diagnostic/evaluation/metrics/risk_adjusted.py +324 -0
ml4t/diagnostic/evaluation/multi_signal.py +550 -0
ml4t/diagnostic/evaluation/portfolio_analysis/__init__.py +83 -0
ml4t/diagnostic/evaluation/portfolio_analysis/analysis.py +734 -0
ml4t/diagnostic/evaluation/portfolio_analysis/metrics.py +589 -0
ml4t/diagnostic/evaluation/portfolio_analysis/results.py +334 -0
ml4t/diagnostic/evaluation/report_generation.py +824 -0
ml4t/diagnostic/evaluation/signal_selector.py +452 -0
ml4t/diagnostic/evaluation/stat_registry.py +139 -0
ml4t/diagnostic/evaluation/stationarity/__init__.py +97 -0
ml4t/diagnostic/evaluation/stationarity/analysis.py +518 -0
ml4t/diagnostic/evaluation/stationarity/augmented_dickey_fuller.py +296 -0
ml4t/diagnostic/evaluation/stationarity/kpss_test.py +308 -0
ml4t/diagnostic/evaluation/stationarity/phillips_perron.py +365 -0
ml4t/diagnostic/evaluation/stats/AGENT.md +43 -0
ml4t/diagnostic/evaluation/stats/__init__.py +191 -0
ml4t/diagnostic/evaluation/stats/backtest_overfitting.py +219 -0
ml4t/diagnostic/evaluation/stats/bootstrap.py +228 -0
ml4t/diagnostic/evaluation/stats/deflated_sharpe_ratio.py +591 -0
ml4t/diagnostic/evaluation/stats/false_discovery_rate.py +295 -0
ml4t/diagnostic/evaluation/stats/hac_standard_errors.py +108 -0
ml4t/diagnostic/evaluation/stats/minimum_track_record.py +408 -0
ml4t/diagnostic/evaluation/stats/moments.py +164 -0
ml4t/diagnostic/evaluation/stats/rademacher_adjustment.py +436 -0
ml4t/diagnostic/evaluation/stats/reality_check.py +155 -0
ml4t/diagnostic/evaluation/stats/sharpe_inference.py +219 -0
ml4t/diagnostic/evaluation/themes.py +330 -0
ml4t/diagnostic/evaluation/threshold_analysis.py +957 -0
ml4t/diagnostic/evaluation/trade_analysis.py +1136 -0
ml4t/diagnostic/evaluation/trade_dashboard/__init__.py +32 -0
ml4t/diagnostic/evaluation/trade_dashboard/app.py +315 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/__init__.py +18 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/csv.py +82 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/html.py +276 -0
ml4t/diagnostic/evaluation/trade_dashboard/io.py +166 -0
ml4t/diagnostic/evaluation/trade_dashboard/normalize.py +304 -0
ml4t/diagnostic/evaluation/trade_dashboard/stats.py +386 -0
ml4t/diagnostic/evaluation/trade_dashboard/style.py +79 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/__init__.py +21 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/patterns.py +354 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/shap_analysis.py +280 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/stat_validation.py +186 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/worst_trades.py +236 -0
ml4t/diagnostic/evaluation/trade_dashboard/types.py +129 -0
ml4t/diagnostic/evaluation/trade_shap/__init__.py +102 -0
ml4t/diagnostic/evaluation/trade_shap/alignment.py +188 -0
ml4t/diagnostic/evaluation/trade_shap/characterize.py +413 -0
ml4t/diagnostic/evaluation/trade_shap/cluster.py +302 -0
ml4t/diagnostic/evaluation/trade_shap/explain.py +208 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/__init__.py +23 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/generator.py +290 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/matcher.py +251 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/templates.yaml +467 -0
ml4t/diagnostic/evaluation/trade_shap/models.py +386 -0
ml4t/diagnostic/evaluation/trade_shap/normalize.py +116 -0
ml4t/diagnostic/evaluation/trade_shap/pipeline.py +263 -0
ml4t/diagnostic/evaluation/trade_shap_dashboard.py +283 -0
ml4t/diagnostic/evaluation/trade_shap_diagnostics.py +588 -0
ml4t/diagnostic/evaluation/validated_cv.py +535 -0
ml4t/diagnostic/evaluation/visualization.py +1050 -0
ml4t/diagnostic/evaluation/volatility/__init__.py +45 -0
ml4t/diagnostic/evaluation/volatility/analysis.py +351 -0
ml4t/diagnostic/evaluation/volatility/arch.py +258 -0
ml4t/diagnostic/evaluation/volatility/garch.py +460 -0
ml4t/diagnostic/integration/__init__.py +48 -0
ml4t/diagnostic/integration/backtest_contract.py +671 -0
ml4t/diagnostic/integration/data_contract.py +316 -0
ml4t/diagnostic/integration/engineer_contract.py +226 -0
ml4t/diagnostic/logging/__init__.py +77 -0
ml4t/diagnostic/logging/logger.py +245 -0
ml4t/diagnostic/logging/performance.py +234 -0
ml4t/diagnostic/logging/progress.py +234 -0
ml4t/diagnostic/logging/wandb.py +412 -0
ml4t/diagnostic/metrics/__init__.py +9 -0
ml4t/diagnostic/metrics/percentiles.py +128 -0
ml4t/diagnostic/py.typed +1 -0
ml4t/diagnostic/reporting/__init__.py +43 -0
ml4t/diagnostic/reporting/base.py +130 -0
ml4t/diagnostic/reporting/html_renderer.py +275 -0
ml4t/diagnostic/reporting/json_renderer.py +51 -0
ml4t/diagnostic/reporting/markdown_renderer.py +117 -0
ml4t/diagnostic/results/AGENT.md +24 -0
ml4t/diagnostic/results/__init__.py +105 -0
ml4t/diagnostic/results/barrier_results/__init__.py +36 -0
ml4t/diagnostic/results/barrier_results/hit_rate.py +304 -0
ml4t/diagnostic/results/barrier_results/precision_recall.py +266 -0
ml4t/diagnostic/results/barrier_results/profit_factor.py +297 -0
ml4t/diagnostic/results/barrier_results/tearsheet.py +397 -0
ml4t/diagnostic/results/barrier_results/time_to_target.py +305 -0
ml4t/diagnostic/results/barrier_results/validation.py +38 -0
ml4t/diagnostic/results/base.py +177 -0
ml4t/diagnostic/results/event_results.py +349 -0
ml4t/diagnostic/results/feature_results.py +787 -0
ml4t/diagnostic/results/multi_signal_results.py +431 -0
ml4t/diagnostic/results/portfolio_results.py +281 -0
ml4t/diagnostic/results/sharpe_results.py +448 -0
ml4t/diagnostic/results/signal_results/__init__.py +74 -0
ml4t/diagnostic/results/signal_results/ic.py +581 -0
ml4t/diagnostic/results/signal_results/irtc.py +110 -0
ml4t/diagnostic/results/signal_results/quantile.py +392 -0
ml4t/diagnostic/results/signal_results/tearsheet.py +456 -0
ml4t/diagnostic/results/signal_results/turnover.py +213 -0
ml4t/diagnostic/results/signal_results/validation.py +147 -0
ml4t/diagnostic/signal/AGENT.md +17 -0
ml4t/diagnostic/signal/__init__.py +69 -0
ml4t/diagnostic/signal/_report.py +152 -0
ml4t/diagnostic/signal/_utils.py +261 -0
ml4t/diagnostic/signal/core.py +275 -0
ml4t/diagnostic/signal/quantile.py +148 -0
ml4t/diagnostic/signal/result.py +214 -0
ml4t/diagnostic/signal/signal_ic.py +129 -0
ml4t/diagnostic/signal/turnover.py +182 -0
ml4t/diagnostic/splitters/AGENT.md +19 -0
ml4t/diagnostic/splitters/__init__.py +36 -0
ml4t/diagnostic/splitters/base.py +501 -0
ml4t/diagnostic/splitters/calendar.py +421 -0
ml4t/diagnostic/splitters/calendar_config.py +91 -0
ml4t/diagnostic/splitters/combinatorial.py +1064 -0
ml4t/diagnostic/splitters/config.py +322 -0
ml4t/diagnostic/splitters/cpcv/__init__.py +57 -0
ml4t/diagnostic/splitters/cpcv/combinations.py +119 -0
ml4t/diagnostic/splitters/cpcv/partitioning.py +263 -0
ml4t/diagnostic/splitters/cpcv/purge_engine.py +379 -0
ml4t/diagnostic/splitters/cpcv/windows.py +190 -0
ml4t/diagnostic/splitters/group_isolation.py +329 -0
ml4t/diagnostic/splitters/persistence.py +316 -0
ml4t/diagnostic/splitters/utils.py +207 -0
ml4t/diagnostic/splitters/walk_forward.py +757 -0
ml4t/diagnostic/utils/__init__.py +42 -0
ml4t/diagnostic/utils/config.py +542 -0
ml4t/diagnostic/utils/dependencies.py +318 -0
ml4t/diagnostic/utils/sessions.py +127 -0
ml4t/diagnostic/validation/__init__.py +54 -0
ml4t/diagnostic/validation/dataframe.py +274 -0
ml4t/diagnostic/validation/returns.py +280 -0
ml4t/diagnostic/validation/timeseries.py +299 -0
ml4t/diagnostic/visualization/AGENT.md +19 -0
ml4t/diagnostic/visualization/__init__.py +223 -0
ml4t/diagnostic/visualization/backtest/__init__.py +98 -0
ml4t/diagnostic/visualization/backtest/cost_attribution.py +762 -0
ml4t/diagnostic/visualization/backtest/executive_summary.py +895 -0
ml4t/diagnostic/visualization/backtest/interactive_controls.py +673 -0
ml4t/diagnostic/visualization/backtest/statistical_validity.py +874 -0
ml4t/diagnostic/visualization/backtest/tearsheet.py +565 -0
ml4t/diagnostic/visualization/backtest/template_system.py +373 -0
ml4t/diagnostic/visualization/backtest/trade_plots.py +1172 -0
ml4t/diagnostic/visualization/barrier_plots.py +782 -0
ml4t/diagnostic/visualization/core.py +1060 -0
ml4t/diagnostic/visualization/dashboards/__init__.py +36 -0
ml4t/diagnostic/visualization/dashboards/base.py +582 -0
ml4t/diagnostic/visualization/dashboards/importance.py +801 -0
ml4t/diagnostic/visualization/dashboards/interaction.py +263 -0
ml4t/diagnostic/visualization/dashboards.py +43 -0
ml4t/diagnostic/visualization/data_extraction/__init__.py +48 -0
ml4t/diagnostic/visualization/data_extraction/importance.py +649 -0
ml4t/diagnostic/visualization/data_extraction/interaction.py +504 -0
ml4t/diagnostic/visualization/data_extraction/types.py +113 -0
ml4t/diagnostic/visualization/data_extraction/validation.py +66 -0
ml4t/diagnostic/visualization/feature_plots.py +888 -0
ml4t/diagnostic/visualization/interaction_plots.py +618 -0
ml4t/diagnostic/visualization/portfolio/__init__.py +41 -0
ml4t/diagnostic/visualization/portfolio/dashboard.py +514 -0
ml4t/diagnostic/visualization/portfolio/drawdown_plots.py +341 -0
ml4t/diagnostic/visualization/portfolio/returns_plots.py +487 -0
ml4t/diagnostic/visualization/portfolio/risk_plots.py +301 -0
ml4t/diagnostic/visualization/report_generation.py +1343 -0
ml4t/diagnostic/visualization/signal/__init__.py +103 -0
ml4t/diagnostic/visualization/signal/dashboard.py +911 -0
ml4t/diagnostic/visualization/signal/event_plots.py +514 -0
ml4t/diagnostic/visualization/signal/ic_plots.py +635 -0
ml4t/diagnostic/visualization/signal/multi_signal_dashboard.py +974 -0
ml4t/diagnostic/visualization/signal/multi_signal_plots.py +603 -0
ml4t/diagnostic/visualization/signal/quantile_plots.py +625 -0
ml4t/diagnostic/visualization/signal/turnover_plots.py +400 -0
ml4t/diagnostic/visualization/trade_shap/__init__.py +90 -0
ml4t_diagnostic-0.1.0a1.dist-info/METADATA +1044 -0
ml4t_diagnostic-0.1.0a1.dist-info/RECORD +242 -0
ml4t_diagnostic-0.1.0a1.dist-info/WHEEL +4 -0
ml4t_diagnostic-0.1.0a1.dist-info/licenses/LICENSE +21 -0

ml4t/diagnostic/evaluation/event_analysis.py ADDED Viewed

@@ -0,0 +1,647 @@
+"""Event Study Analysis Module.
+This module implements event study methodology following MacKinlay (1997)
+"Event Studies in Economics and Finance" for measuring abnormal returns
+around corporate events, announcements, or other market events.
+Classes
+-------
+EventStudyAnalysis
+    Main class for conducting event studies
+References
+----------
+MacKinlay, A.C. (1997). "Event Studies in Economics and Finance",
+    Journal of Economic Literature, 35(1), 13-39.
+Boehmer, E., Musumeci, J., Poulsen, A.B. (1991). "Event-study methodology
+    under conditions of event-induced variance", Journal of Financial Economics.
+Corrado, C.J. (1989). "A nonparametric test for abnormal security-price
+    performance in event studies", Journal of Financial Economics.
+"""
+from __future__ import annotations
+import warnings
+from typing import TYPE_CHECKING, Any
+import numpy as np
+import polars as pl
+from scipy import stats
+from ml4t.diagnostic.config.event_config import EventConfig
+from ml4t.diagnostic.results.event_results import AbnormalReturnResult, EventStudyResult
+if TYPE_CHECKING:
+    import pandas as pd
+class EventStudyAnalysis:
+    """Event study analysis for measuring abnormal returns around events.
+    Implements the standard event study methodology with support for:
+    - Market model (CAPM-based expected returns)
+    - Mean-adjusted model
+    - Market-adjusted model
+    And statistical tests:
+    - Standard t-test
+    - BMP test (Boehmer et al. 1991, robust to event-induced variance)
+    - Corrado rank test (non-parametric)
+    Parameters
+    ----------
+    returns : pl.DataFrame
+        Asset returns in long format with columns: [date, asset, return].
+        Returns should be simple returns (not log returns).
+    events : pl.DataFrame
+        Events to analyze with columns: [date, asset]. Optionally
+        includes [event_type, event_id] for grouping.
+    benchmark : pl.DataFrame
+        Market/benchmark returns with columns: [date, return].
+    config : EventConfig, optional
+        Configuration for the analysis.
+    Examples
+    --------
+    >>> returns_df = pl.DataFrame({
+    ...     'date': [...],
+    ...     'asset': [...],
+    ...     'return': [...]
+    ... })
+    >>> events_df = pl.DataFrame({
+    ...     'date': ['2023-01-15', '2023-02-20'],
+    ...     'asset': ['AAPL', 'MSFT']
+    ... })
+    >>> benchmark_df = pl.DataFrame({
+    ...     'date': [...],
+    ...     'return': [...]  # Market returns
+    ... })
+    >>> analysis = EventStudyAnalysis(returns_df, events_df, benchmark_df)
+    >>> result = analysis.run()
+    >>> print(result.summary())
+    """
+    def __init__(
+        self,
+        returns: pl.DataFrame | pd.DataFrame,
+        events: pl.DataFrame | pd.DataFrame,
+        benchmark: pl.DataFrame | pd.DataFrame,
+        config: EventConfig | None = None,
+    ) -> None:
+        """Initialize event study analysis."""
+        self.config = config or EventConfig()
+        # Convert to Polars if needed
+        self._returns = self._to_polars(returns)
+        self._events = self._to_polars(events)
+        self._benchmark = self._to_polars(benchmark)
+        # Validate inputs
+        self._validate_inputs()
+        # Prepare data
+        self._prepare_data()
+        # Cache for computed results
+        self._ar_results: list[AbnormalReturnResult] | None = None
+        self._aggregated_result: EventStudyResult | None = None
+    def _to_polars(self, df: Any) -> pl.DataFrame:
+        """Convert DataFrame to Polars if needed."""
+        if isinstance(df, pl.DataFrame):
+            return df
+        try:
+            import pandas as pd
+            if isinstance(df, pd.DataFrame):
+                return pl.from_pandas(df)
+        except ImportError:
+            pass
+        raise TypeError(f"Expected Polars or Pandas DataFrame, got {type(df)}")
+    def _validate_inputs(self) -> None:
+        """Validate input DataFrames have required columns."""
+        # Check returns
+        required_return_cols = {"date", "asset", "return"}
+        if not required_return_cols.issubset(set(self._returns.columns)):
+            raise ValueError(
+                f"returns DataFrame missing columns: {required_return_cols - set(self._returns.columns)}"
+            )
+        # Check events
+        required_event_cols = {"date", "asset"}
+        if not required_event_cols.issubset(set(self._events.columns)):
+            raise ValueError(
+                f"events DataFrame missing columns: {required_event_cols - set(self._events.columns)}"
+            )
+        # Check benchmark
+        required_bench_cols = {"date", "return"}
+        if not required_bench_cols.issubset(set(self._benchmark.columns)):
+            raise ValueError(
+                f"benchmark DataFrame missing columns: {required_bench_cols - set(self._benchmark.columns)}"
+            )
+        # Check we have events
+        if len(self._events) == 0:
+            raise ValueError("No events provided")
+    def _prepare_data(self) -> None:
+        """Prepare data for analysis (sorting, date alignment)."""
+        # Sort by date
+        self._returns = self._returns.sort("date")
+        self._benchmark = self._benchmark.sort("date")
+        # Create date-indexed lookup for benchmark
+        self._benchmark_dict: dict[Any, float] = dict(
+            zip(
+                self._benchmark["date"].to_list(),
+                self._benchmark["return"].to_list(),
+                strict=False,
+            )
+        )
+        # Get unique dates for index mapping
+        self._all_dates = sorted(self._returns["date"].unique().to_list())
+        self._date_to_idx = {d: i for i, d in enumerate(self._all_dates)}
+        # Add event_id if not present
+        if "event_id" not in self._events.columns:
+            self._events = self._events.with_row_index("event_id").with_columns(
+                pl.col("event_id").cast(pl.Utf8).alias("event_id")
+            )
+    def _get_estimation_window_data(
+        self, asset: str, event_date: Any
+    ) -> tuple[np.ndarray, np.ndarray] | None:
+        """Get returns for estimation window.
+        Returns
+        -------
+        tuple[np.ndarray, np.ndarray] | None
+            (asset_returns, market_returns) for estimation window,
+            or None if insufficient data.
+        """
+        est_start, est_end = self.config.window.estimation_window
+        # Find event date index
+        if event_date not in self._date_to_idx:
+            return None
+        event_idx = self._date_to_idx[event_date]
+        # Calculate estimation window indices
+        start_idx = event_idx + est_start
+        end_idx = event_idx + est_end
+        if start_idx < 0:
+            return None
+        # Get dates in estimation window
+        est_dates = self._all_dates[start_idx : end_idx + 1]
+        if len(est_dates) < self.config.min_estimation_obs:
+            return None
+        # Get asset returns
+        asset_data = self._returns.filter(
+            (pl.col("asset") == asset) & (pl.col("date").is_in(est_dates))
+        ).sort("date")
+        if len(asset_data) < self.config.min_estimation_obs:
+            return None
+        # Get benchmark returns
+        asset_returns = []
+        market_returns = []
+        for row in asset_data.iter_rows(named=True):
+            date = row["date"]
+            if date in self._benchmark_dict:
+                asset_returns.append(row["return"])
+                market_returns.append(self._benchmark_dict[date])
+        if len(asset_returns) < self.config.min_estimation_obs:
+            return None
+        return np.array(asset_returns), np.array(market_returns)
+    def _estimate_market_model(
+        self, asset_returns: np.ndarray, market_returns: np.ndarray
+    ) -> tuple[float, float, float, float]:
+        """Estimate market model parameters via OLS.
+        AR = R - (α + β*Rm)
+        Returns
+        -------
+        tuple[float, float, float, float]
+            (alpha, beta, r_squared, residual_std)
+        """
+        # OLS regression: R_asset = alpha + beta * R_market + epsilon
+        X = np.column_stack([np.ones(len(market_returns)), market_returns])
+        y = asset_returns
+        # Solve normal equations
+        try:
+            coeffs, residuals, _, _ = np.linalg.lstsq(X, y, rcond=None)
+            alpha, beta = coeffs[0], coeffs[1]
+            # Calculate R-squared
+            y_pred = alpha + beta * market_returns
+            ss_res = np.sum((y - y_pred) ** 2)
+            ss_tot = np.sum((y - np.mean(y)) ** 2)
+            r_squared = 1 - ss_res / ss_tot if ss_tot > 0 else 0.0
+            # Residual standard deviation
+            residual_std = np.std(y - y_pred, ddof=2)
+            return alpha, beta, r_squared, residual_std
+        except Exception:
+            return 0.0, 1.0, 0.0, np.std(asset_returns)
+    def _get_event_window_data(
+        self, asset: str, event_date: Any
+    ) -> dict[int, tuple[float, float]] | None:
+        """Get returns for event window.
+        Returns
+        -------
+        dict[int, tuple[float, float]] | None
+            {relative_day: (asset_return, market_return)}
+        """
+        evt_start, evt_end = self.config.window.event_window
+        if event_date not in self._date_to_idx:
+            return None
+        event_idx = self._date_to_idx[event_date]
+        result = {}
+        for rel_day in range(evt_start, evt_end + 1):
+            day_idx = event_idx + rel_day
+            if 0 <= day_idx < len(self._all_dates):
+                date = self._all_dates[day_idx]
+                # Get asset return
+                asset_ret = self._returns.filter(
+                    (pl.col("asset") == asset) & (pl.col("date") == date)
+                )
+                if len(asset_ret) > 0 and date in self._benchmark_dict:
+                    result[rel_day] = (
+                        asset_ret["return"][0],
+                        self._benchmark_dict[date],
+                    )
+        return result if result else None
+    def _compute_abnormal_return_single(
+        self, event_row: dict[str, Any]
+    ) -> AbnormalReturnResult | None:
+        """Compute abnormal returns for a single event."""
+        asset = event_row["asset"]
+        event_date = event_row["date"]
+        event_id = str(event_row.get("event_id", f"{asset}_{event_date}"))
+        # Get estimation window data
+        est_data = self._get_estimation_window_data(asset, event_date)
+        if est_data is None:
+            return None
+        asset_est_returns, market_est_returns = est_data
+        # Estimate model parameters
+        alpha, beta, r2, residual_std = 0.0, 1.0, 0.0, 0.0
+        if self.config.model == "market_model":
+            alpha, beta, r2, residual_std = self._estimate_market_model(
+                asset_est_returns, market_est_returns
+            )
+        elif self.config.model == "mean_adjusted":
+            alpha = float(np.mean(asset_est_returns))
+            beta = 0.0
+            residual_std = float(np.std(asset_est_returns, ddof=1))
+        elif self.config.model == "market_adjusted":
+            alpha = 0.0
+            beta = 1.0
+            residual_std = float(np.std(asset_est_returns - market_est_returns, ddof=1))
+        # Get event window data
+        event_data = self._get_event_window_data(asset, event_date)
+        if event_data is None:
+            return None
+        # Compute abnormal returns
+        ar_by_day: dict[int, float] = {}
+        for rel_day, (asset_ret, market_ret) in event_data.items():
+            if self.config.model == "market_model":
+                expected_ret = alpha + beta * market_ret
+            elif self.config.model == "mean_adjusted":
+                expected_ret = alpha
+            else:  # market_adjusted
+                expected_ret = market_ret
+            ar_by_day[rel_day] = asset_ret - expected_ret
+        # Compute CAR
+        car = sum(ar_by_day.values())
+        return AbnormalReturnResult(
+            event_id=event_id,
+            asset=asset,
+            event_date=str(event_date),
+            ar_by_day=ar_by_day,
+            car=car,
+            estimation_alpha=alpha if self.config.model == "market_model" else None,
+            estimation_beta=beta if self.config.model == "market_model" else None,
+            estimation_r2=r2 if self.config.model == "market_model" else None,
+            estimation_residual_std=residual_std,
+        )
+    def compute_abnormal_returns(self) -> list[AbnormalReturnResult]:
+        """Compute abnormal returns for all events.
+        Returns
+        -------
+        list[AbnormalReturnResult]
+            Abnormal return results for each valid event.
+        """
+        if self._ar_results is not None:
+            return self._ar_results
+        results = []
+        n_skipped = 0
+        for row in self._events.iter_rows(named=True):
+            result = self._compute_abnormal_return_single(row)
+            if result is not None:
+                results.append(result)
+            else:
+                n_skipped += 1
+        if n_skipped > 0:
+            warnings.warn(
+                f"Skipped {n_skipped} events due to insufficient data",
+                stacklevel=2,
+            )
+        self._ar_results = results
+        return results
+    def aggregate(self, group_by: str | None = None) -> EventStudyResult:
+        """Aggregate individual results to AAR and CAAR.
+        Parameters
+        ----------
+        group_by : str | None
+            Column to group by (e.g., 'event_type'). If None,
+            aggregates all events together.
+        Returns
+        -------
+        EventStudyResult
+            Aggregated event study results.
+        """
+        ar_results = self.compute_abnormal_returns()
+        if len(ar_results) == 0:
+            raise ValueError("No valid events to aggregate")
+        # Collect all relative days
+        all_days = set()
+        for r in ar_results:
+            all_days.update(r.ar_by_day.keys())
+        sorted_days = sorted(all_days)
+        # Compute AAR (average AR across events for each day)
+        aar_by_day: dict[int, float] = {}
+        ar_matrix: dict[int, list[float]] = {d: [] for d in sorted_days}
+        for r in ar_results:
+            for day in sorted_days:
+                if day in r.ar_by_day:
+                    ar_matrix[day].append(r.ar_by_day[day])
+        for day in sorted_days:
+            if ar_matrix[day]:
+                aar_by_day[day] = float(np.mean(ar_matrix[day]))
+            else:
+                aar_by_day[day] = 0.0
+        # Compute CAAR and its statistics
+        caar_values = []
+        caar_std = []
+        cumsum = 0.0
+        for day in sorted_days:
+            cumsum += aar_by_day[day]
+            caar_values.append(cumsum)
+            # Cross-sectional standard deviation at this day
+            if ar_matrix[day]:
+                caar_std.append(float(np.std(ar_matrix[day], ddof=1)))
+            else:
+                caar_std.append(0.0)
+        # Compute confidence intervals
+        n_events = len(ar_results)
+        z_score = stats.norm.ppf(1 - self.config.alpha / 2)
+        caar_ci_lower = []
+        caar_ci_upper = []
+        for caar, std in zip(caar_values, caar_std, strict=False):
+            se = std / np.sqrt(n_events) if n_events > 0 else 0.0
+            caar_ci_lower.append(caar - z_score * se)
+            caar_ci_upper.append(caar + z_score * se)
+        # Run statistical test
+        test_stat, p_value = self._run_statistical_test(ar_results, ar_matrix)
+        result = EventStudyResult(
+            aar_by_day=aar_by_day,
+            caar=caar_values,
+            caar_dates=sorted_days,
+            caar_std=caar_std,
+            caar_ci_lower=caar_ci_lower,
+            caar_ci_upper=caar_ci_upper,
+            test_statistic=test_stat,
+            p_value=p_value,
+            test_name=self.config.test,
+            n_events=n_events,
+            model_name=self.config.model,
+            event_window=self.config.window.event_window,
+            confidence_level=self.config.confidence_level,
+            individual_results=ar_results,
+        )
+        self._aggregated_result = result
+        return result
+    def _run_statistical_test(
+        self,
+        ar_results: list[AbnormalReturnResult],
+        ar_matrix: dict[int, list[float]],
+    ) -> tuple[float, float]:
+        """Run statistical significance test.
+        Returns
+        -------
+        tuple[float, float]
+            (test_statistic, p_value)
+        """
+        if self.config.test == "t_test":
+            return self._t_test(ar_results, ar_matrix)
+        elif self.config.test == "boehmer":
+            return self._bmp_test(ar_results)
+        elif self.config.test == "corrado":
+            return self._corrado_test(ar_results, ar_matrix)
+        else:
+            return self._t_test(ar_results, ar_matrix)
+    def _t_test(
+        self,
+        ar_results: list[AbnormalReturnResult],
+        ar_matrix: dict[int, list[float]],
+    ) -> tuple[float, float]:
+        """Standard parametric t-test on CAAR.
+        H0: CAAR = 0
+        Test statistic: t = CAAR / SE(CAAR)
+        """
+        # Get CARs for all events
+        cars = [r.car for r in ar_results]
+        n = len(cars)
+        if n < 2:
+            return 0.0, 1.0
+        mean_car = np.mean(cars)
+        std_car = np.std(cars, ddof=1)
+        se_car = std_car / np.sqrt(n)
+        if se_car == 0:
+            return 0.0, 1.0
+        t_stat = mean_car / se_car
+        p_value = 2 * (1 - stats.t.cdf(abs(t_stat), df=n - 1))
+        return float(t_stat), float(p_value)
+    def _bmp_test(self, ar_results: list[AbnormalReturnResult]) -> tuple[float, float]:
+        """Boehmer, Musumeci, Poulsen (1991) test.
+        Robust to event-induced variance changes by standardizing
+        ARs by their estimation period volatility.
+        SAR_i = AR_i / σ_i
+        Test statistic: Z = (1/N) * Σ SAR_i / SE(SAR)
+        """
+        # Compute standardized abnormal returns
+        sars = []
+        for r in ar_results:
+            if r.estimation_residual_std and r.estimation_residual_std > 0:
+                sar = r.car / r.estimation_residual_std
+            else:
+                sar = r.car  # Fallback to unstandardized
+            sars.append(sar)
+        n = len(sars)
+        if n < 2:
+            return 0.0, 1.0
+        mean_sar = np.mean(sars)
+        std_sar = np.std(sars, ddof=1)
+        se_sar = std_sar / np.sqrt(n)
+        if se_sar == 0:
+            return 0.0, 1.0
+        z_stat = mean_sar / se_sar
+        p_value = 2 * (1 - stats.norm.cdf(abs(z_stat)))
+        return float(z_stat), float(p_value)
+    def _corrado_test(
+        self,
+        ar_results: list[AbnormalReturnResult],
+        ar_matrix: dict[int, list[float]],
+    ) -> tuple[float, float]:
+        """Corrado (1989) non-parametric rank test.
+        Robust to non-normality in returns. Uses ranks instead of
+        raw abnormal returns.
+        """
+        n_events = len(ar_results)
+        if n_events < 2:
+            return 0.0, 1.0
+        # For simplicity, test at t=0 (event day)
+        if 0 not in ar_matrix or len(ar_matrix[0]) < 2:
+            # Fallback to t-test
+            return self._t_test(ar_results, ar_matrix)
+        event_day_ars = np.array(ar_matrix[0])
+        # Rank the ARs
+        ranks = stats.rankdata(event_day_ars)
+        expected_rank = (n_events + 1) / 2
+        # Compute test statistic
+        rank_deviations = ranks - expected_rank
+        mean_deviation = np.mean(rank_deviations)
+        # Standard deviation of ranks under null
+        std_rank = np.std(rank_deviations, ddof=1)
+        se_rank = std_rank / np.sqrt(n_events)
+        if se_rank == 0:
+            return 0.0, 1.0
+        z_stat = mean_deviation / se_rank
+        p_value = 2 * (1 - stats.norm.cdf(abs(z_stat)))
+        return float(z_stat), float(p_value)
+    def run(self) -> EventStudyResult:
+        """Run complete event study analysis.
+        This is the main entry point that computes abnormal returns,
+        aggregates results, and runs statistical tests.
+        Returns
+        -------
+        EventStudyResult
+            Complete event study results.
+        Examples
+        --------
+        >>> analysis = EventStudyAnalysis(returns, events, benchmark)
+        >>> result = analysis.run()
+        >>> print(result.summary())
+        >>> if result.is_significant:
+        ...     print("Significant abnormal returns detected!")
+        """
+        return self.aggregate()
+    def create_tear_sheet(self) -> EventStudyResult:
+        """Alias for run() - creates complete event study results."""
+        return self.run()
+    @property
+    def n_events(self) -> int:
+        """Number of events in the study."""
+        return len(self._events)
+    @property
+    def n_valid_events(self) -> int:
+        """Number of events with sufficient data for analysis."""
+        ar_results = self.compute_abnormal_returns()
+        return len(ar_results)
+    @property
+    def assets(self) -> list[str]:
+        """List of unique assets in the events."""
+        return self._events["asset"].unique().sort().to_list()
+    @property
+    def date_range(self) -> tuple[Any, Any]:
+        """Date range of the returns data."""
+        return self._all_dates[0], self._all_dates[-1]