PyPI - ml4t-diagnostic - Versions diffs - 0.1.0a1__py3-none-any.whl - Mend

ml4t-diagnostic 0.1.0a1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

ml4t/diagnostic/AGENT.md +25 -0
ml4t/diagnostic/__init__.py +166 -0
ml4t/diagnostic/backends/__init__.py +10 -0
ml4t/diagnostic/backends/adapter.py +192 -0
ml4t/diagnostic/backends/polars_backend.py +899 -0
ml4t/diagnostic/caching/__init__.py +40 -0
ml4t/diagnostic/caching/cache.py +331 -0
ml4t/diagnostic/caching/decorators.py +131 -0
ml4t/diagnostic/caching/smart_cache.py +339 -0
ml4t/diagnostic/config/AGENT.md +24 -0
ml4t/diagnostic/config/README.md +267 -0
ml4t/diagnostic/config/__init__.py +219 -0
ml4t/diagnostic/config/barrier_config.py +277 -0
ml4t/diagnostic/config/base.py +301 -0
ml4t/diagnostic/config/event_config.py +148 -0
ml4t/diagnostic/config/feature_config.py +404 -0
ml4t/diagnostic/config/multi_signal_config.py +55 -0
ml4t/diagnostic/config/portfolio_config.py +215 -0
ml4t/diagnostic/config/report_config.py +391 -0
ml4t/diagnostic/config/sharpe_config.py +202 -0
ml4t/diagnostic/config/signal_config.py +206 -0
ml4t/diagnostic/config/trade_analysis_config.py +310 -0
ml4t/diagnostic/config/validation.py +279 -0
ml4t/diagnostic/core/__init__.py +29 -0
ml4t/diagnostic/core/numba_utils.py +315 -0
ml4t/diagnostic/core/purging.py +372 -0
ml4t/diagnostic/core/sampling.py +471 -0
ml4t/diagnostic/errors/__init__.py +205 -0
ml4t/diagnostic/evaluation/AGENT.md +26 -0
ml4t/diagnostic/evaluation/__init__.py +437 -0
ml4t/diagnostic/evaluation/autocorrelation.py +531 -0
ml4t/diagnostic/evaluation/barrier_analysis.py +1050 -0
ml4t/diagnostic/evaluation/binary_metrics.py +910 -0
ml4t/diagnostic/evaluation/dashboard.py +715 -0
ml4t/diagnostic/evaluation/diagnostic_plots.py +1037 -0
ml4t/diagnostic/evaluation/distribution/__init__.py +499 -0
ml4t/diagnostic/evaluation/distribution/moments.py +299 -0
ml4t/diagnostic/evaluation/distribution/tails.py +777 -0
ml4t/diagnostic/evaluation/distribution/tests.py +470 -0
ml4t/diagnostic/evaluation/drift/__init__.py +139 -0
ml4t/diagnostic/evaluation/drift/analysis.py +432 -0
ml4t/diagnostic/evaluation/drift/domain_classifier.py +517 -0
ml4t/diagnostic/evaluation/drift/population_stability_index.py +310 -0
ml4t/diagnostic/evaluation/drift/wasserstein.py +388 -0
ml4t/diagnostic/evaluation/event_analysis.py +647 -0
ml4t/diagnostic/evaluation/excursion.py +390 -0
ml4t/diagnostic/evaluation/feature_diagnostics.py +873 -0
ml4t/diagnostic/evaluation/feature_outcome.py +666 -0
ml4t/diagnostic/evaluation/framework.py +935 -0
ml4t/diagnostic/evaluation/metric_registry.py +255 -0
ml4t/diagnostic/evaluation/metrics/AGENT.md +23 -0
ml4t/diagnostic/evaluation/metrics/__init__.py +133 -0
ml4t/diagnostic/evaluation/metrics/basic.py +160 -0
ml4t/diagnostic/evaluation/metrics/conditional_ic.py +469 -0
ml4t/diagnostic/evaluation/metrics/feature_outcome.py +475 -0
ml4t/diagnostic/evaluation/metrics/ic_statistics.py +446 -0
ml4t/diagnostic/evaluation/metrics/importance_analysis.py +338 -0
ml4t/diagnostic/evaluation/metrics/importance_classical.py +375 -0
ml4t/diagnostic/evaluation/metrics/importance_mda.py +371 -0
ml4t/diagnostic/evaluation/metrics/importance_shap.py +715 -0
ml4t/diagnostic/evaluation/metrics/information_coefficient.py +527 -0
ml4t/diagnostic/evaluation/metrics/interactions.py +772 -0
ml4t/diagnostic/evaluation/metrics/monotonicity.py +226 -0
ml4t/diagnostic/evaluation/metrics/risk_adjusted.py +324 -0
ml4t/diagnostic/evaluation/multi_signal.py +550 -0
ml4t/diagnostic/evaluation/portfolio_analysis/__init__.py +83 -0
ml4t/diagnostic/evaluation/portfolio_analysis/analysis.py +734 -0
ml4t/diagnostic/evaluation/portfolio_analysis/metrics.py +589 -0
ml4t/diagnostic/evaluation/portfolio_analysis/results.py +334 -0
ml4t/diagnostic/evaluation/report_generation.py +824 -0
ml4t/diagnostic/evaluation/signal_selector.py +452 -0
ml4t/diagnostic/evaluation/stat_registry.py +139 -0
ml4t/diagnostic/evaluation/stationarity/__init__.py +97 -0
ml4t/diagnostic/evaluation/stationarity/analysis.py +518 -0
ml4t/diagnostic/evaluation/stationarity/augmented_dickey_fuller.py +296 -0
ml4t/diagnostic/evaluation/stationarity/kpss_test.py +308 -0
ml4t/diagnostic/evaluation/stationarity/phillips_perron.py +365 -0
ml4t/diagnostic/evaluation/stats/AGENT.md +43 -0
ml4t/diagnostic/evaluation/stats/__init__.py +191 -0
ml4t/diagnostic/evaluation/stats/backtest_overfitting.py +219 -0
ml4t/diagnostic/evaluation/stats/bootstrap.py +228 -0
ml4t/diagnostic/evaluation/stats/deflated_sharpe_ratio.py +591 -0
ml4t/diagnostic/evaluation/stats/false_discovery_rate.py +295 -0
ml4t/diagnostic/evaluation/stats/hac_standard_errors.py +108 -0
ml4t/diagnostic/evaluation/stats/minimum_track_record.py +408 -0
ml4t/diagnostic/evaluation/stats/moments.py +164 -0
ml4t/diagnostic/evaluation/stats/rademacher_adjustment.py +436 -0
ml4t/diagnostic/evaluation/stats/reality_check.py +155 -0
ml4t/diagnostic/evaluation/stats/sharpe_inference.py +219 -0
ml4t/diagnostic/evaluation/themes.py +330 -0
ml4t/diagnostic/evaluation/threshold_analysis.py +957 -0
ml4t/diagnostic/evaluation/trade_analysis.py +1136 -0
ml4t/diagnostic/evaluation/trade_dashboard/__init__.py +32 -0
ml4t/diagnostic/evaluation/trade_dashboard/app.py +315 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/__init__.py +18 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/csv.py +82 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/html.py +276 -0
ml4t/diagnostic/evaluation/trade_dashboard/io.py +166 -0
ml4t/diagnostic/evaluation/trade_dashboard/normalize.py +304 -0
ml4t/diagnostic/evaluation/trade_dashboard/stats.py +386 -0
ml4t/diagnostic/evaluation/trade_dashboard/style.py +79 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/__init__.py +21 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/patterns.py +354 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/shap_analysis.py +280 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/stat_validation.py +186 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/worst_trades.py +236 -0
ml4t/diagnostic/evaluation/trade_dashboard/types.py +129 -0
ml4t/diagnostic/evaluation/trade_shap/__init__.py +102 -0
ml4t/diagnostic/evaluation/trade_shap/alignment.py +188 -0
ml4t/diagnostic/evaluation/trade_shap/characterize.py +413 -0
ml4t/diagnostic/evaluation/trade_shap/cluster.py +302 -0
ml4t/diagnostic/evaluation/trade_shap/explain.py +208 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/__init__.py +23 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/generator.py +290 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/matcher.py +251 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/templates.yaml +467 -0
ml4t/diagnostic/evaluation/trade_shap/models.py +386 -0
ml4t/diagnostic/evaluation/trade_shap/normalize.py +116 -0
ml4t/diagnostic/evaluation/trade_shap/pipeline.py +263 -0
ml4t/diagnostic/evaluation/trade_shap_dashboard.py +283 -0
ml4t/diagnostic/evaluation/trade_shap_diagnostics.py +588 -0
ml4t/diagnostic/evaluation/validated_cv.py +535 -0
ml4t/diagnostic/evaluation/visualization.py +1050 -0
ml4t/diagnostic/evaluation/volatility/__init__.py +45 -0
ml4t/diagnostic/evaluation/volatility/analysis.py +351 -0
ml4t/diagnostic/evaluation/volatility/arch.py +258 -0
ml4t/diagnostic/evaluation/volatility/garch.py +460 -0
ml4t/diagnostic/integration/__init__.py +48 -0
ml4t/diagnostic/integration/backtest_contract.py +671 -0
ml4t/diagnostic/integration/data_contract.py +316 -0
ml4t/diagnostic/integration/engineer_contract.py +226 -0
ml4t/diagnostic/logging/__init__.py +77 -0
ml4t/diagnostic/logging/logger.py +245 -0
ml4t/diagnostic/logging/performance.py +234 -0
ml4t/diagnostic/logging/progress.py +234 -0
ml4t/diagnostic/logging/wandb.py +412 -0
ml4t/diagnostic/metrics/__init__.py +9 -0
ml4t/diagnostic/metrics/percentiles.py +128 -0
ml4t/diagnostic/py.typed +1 -0
ml4t/diagnostic/reporting/__init__.py +43 -0
ml4t/diagnostic/reporting/base.py +130 -0
ml4t/diagnostic/reporting/html_renderer.py +275 -0
ml4t/diagnostic/reporting/json_renderer.py +51 -0
ml4t/diagnostic/reporting/markdown_renderer.py +117 -0
ml4t/diagnostic/results/AGENT.md +24 -0
ml4t/diagnostic/results/__init__.py +105 -0
ml4t/diagnostic/results/barrier_results/__init__.py +36 -0
ml4t/diagnostic/results/barrier_results/hit_rate.py +304 -0
ml4t/diagnostic/results/barrier_results/precision_recall.py +266 -0
ml4t/diagnostic/results/barrier_results/profit_factor.py +297 -0
ml4t/diagnostic/results/barrier_results/tearsheet.py +397 -0
ml4t/diagnostic/results/barrier_results/time_to_target.py +305 -0
ml4t/diagnostic/results/barrier_results/validation.py +38 -0
ml4t/diagnostic/results/base.py +177 -0
ml4t/diagnostic/results/event_results.py +349 -0
ml4t/diagnostic/results/feature_results.py +787 -0
ml4t/diagnostic/results/multi_signal_results.py +431 -0
ml4t/diagnostic/results/portfolio_results.py +281 -0
ml4t/diagnostic/results/sharpe_results.py +448 -0
ml4t/diagnostic/results/signal_results/__init__.py +74 -0
ml4t/diagnostic/results/signal_results/ic.py +581 -0
ml4t/diagnostic/results/signal_results/irtc.py +110 -0
ml4t/diagnostic/results/signal_results/quantile.py +392 -0
ml4t/diagnostic/results/signal_results/tearsheet.py +456 -0
ml4t/diagnostic/results/signal_results/turnover.py +213 -0
ml4t/diagnostic/results/signal_results/validation.py +147 -0
ml4t/diagnostic/signal/AGENT.md +17 -0
ml4t/diagnostic/signal/__init__.py +69 -0
ml4t/diagnostic/signal/_report.py +152 -0
ml4t/diagnostic/signal/_utils.py +261 -0
ml4t/diagnostic/signal/core.py +275 -0
ml4t/diagnostic/signal/quantile.py +148 -0
ml4t/diagnostic/signal/result.py +214 -0
ml4t/diagnostic/signal/signal_ic.py +129 -0
ml4t/diagnostic/signal/turnover.py +182 -0
ml4t/diagnostic/splitters/AGENT.md +19 -0
ml4t/diagnostic/splitters/__init__.py +36 -0
ml4t/diagnostic/splitters/base.py +501 -0
ml4t/diagnostic/splitters/calendar.py +421 -0
ml4t/diagnostic/splitters/calendar_config.py +91 -0
ml4t/diagnostic/splitters/combinatorial.py +1064 -0
ml4t/diagnostic/splitters/config.py +322 -0
ml4t/diagnostic/splitters/cpcv/__init__.py +57 -0
ml4t/diagnostic/splitters/cpcv/combinations.py +119 -0
ml4t/diagnostic/splitters/cpcv/partitioning.py +263 -0
ml4t/diagnostic/splitters/cpcv/purge_engine.py +379 -0
ml4t/diagnostic/splitters/cpcv/windows.py +190 -0
ml4t/diagnostic/splitters/group_isolation.py +329 -0
ml4t/diagnostic/splitters/persistence.py +316 -0
ml4t/diagnostic/splitters/utils.py +207 -0
ml4t/diagnostic/splitters/walk_forward.py +757 -0
ml4t/diagnostic/utils/__init__.py +42 -0
ml4t/diagnostic/utils/config.py +542 -0
ml4t/diagnostic/utils/dependencies.py +318 -0
ml4t/diagnostic/utils/sessions.py +127 -0
ml4t/diagnostic/validation/__init__.py +54 -0
ml4t/diagnostic/validation/dataframe.py +274 -0
ml4t/diagnostic/validation/returns.py +280 -0
ml4t/diagnostic/validation/timeseries.py +299 -0
ml4t/diagnostic/visualization/AGENT.md +19 -0
ml4t/diagnostic/visualization/__init__.py +223 -0
ml4t/diagnostic/visualization/backtest/__init__.py +98 -0
ml4t/diagnostic/visualization/backtest/cost_attribution.py +762 -0
ml4t/diagnostic/visualization/backtest/executive_summary.py +895 -0
ml4t/diagnostic/visualization/backtest/interactive_controls.py +673 -0
ml4t/diagnostic/visualization/backtest/statistical_validity.py +874 -0
ml4t/diagnostic/visualization/backtest/tearsheet.py +565 -0
ml4t/diagnostic/visualization/backtest/template_system.py +373 -0
ml4t/diagnostic/visualization/backtest/trade_plots.py +1172 -0
ml4t/diagnostic/visualization/barrier_plots.py +782 -0
ml4t/diagnostic/visualization/core.py +1060 -0
ml4t/diagnostic/visualization/dashboards/__init__.py +36 -0
ml4t/diagnostic/visualization/dashboards/base.py +582 -0
ml4t/diagnostic/visualization/dashboards/importance.py +801 -0
ml4t/diagnostic/visualization/dashboards/interaction.py +263 -0
ml4t/diagnostic/visualization/dashboards.py +43 -0
ml4t/diagnostic/visualization/data_extraction/__init__.py +48 -0
ml4t/diagnostic/visualization/data_extraction/importance.py +649 -0
ml4t/diagnostic/visualization/data_extraction/interaction.py +504 -0
ml4t/diagnostic/visualization/data_extraction/types.py +113 -0
ml4t/diagnostic/visualization/data_extraction/validation.py +66 -0
ml4t/diagnostic/visualization/feature_plots.py +888 -0
ml4t/diagnostic/visualization/interaction_plots.py +618 -0
ml4t/diagnostic/visualization/portfolio/__init__.py +41 -0
ml4t/diagnostic/visualization/portfolio/dashboard.py +514 -0
ml4t/diagnostic/visualization/portfolio/drawdown_plots.py +341 -0
ml4t/diagnostic/visualization/portfolio/returns_plots.py +487 -0
ml4t/diagnostic/visualization/portfolio/risk_plots.py +301 -0
ml4t/diagnostic/visualization/report_generation.py +1343 -0
ml4t/diagnostic/visualization/signal/__init__.py +103 -0
ml4t/diagnostic/visualization/signal/dashboard.py +911 -0
ml4t/diagnostic/visualization/signal/event_plots.py +514 -0
ml4t/diagnostic/visualization/signal/ic_plots.py +635 -0
ml4t/diagnostic/visualization/signal/multi_signal_dashboard.py +974 -0
ml4t/diagnostic/visualization/signal/multi_signal_plots.py +603 -0
ml4t/diagnostic/visualization/signal/quantile_plots.py +625 -0
ml4t/diagnostic/visualization/signal/turnover_plots.py +400 -0
ml4t/diagnostic/visualization/trade_shap/__init__.py +90 -0
ml4t_diagnostic-0.1.0a1.dist-info/METADATA +1044 -0
ml4t_diagnostic-0.1.0a1.dist-info/RECORD +242 -0
ml4t_diagnostic-0.1.0a1.dist-info/WHEEL +4 -0
ml4t_diagnostic-0.1.0a1.dist-info/licenses/LICENSE +21 -0

ml4t/diagnostic/splitters/calendar.py ADDED Viewed

@@ -0,0 +1,421 @@
+"""Calendar-aware time parsing for financial data cross-validation.
+This module provides calendar-aware time period calculations for time-series CV,
+ensuring that train/test splits respect trading calendar boundaries (sessions, weeks).
+Key Features:
+-----------
+- Uses pandas_market_calendars for accurate trading session detection
+- For intraday data: Sessions are atomic units (don't split trading sessions)
+- For 'D' selections: Select complete trading sessions
+- For 'W' selections: Select complete trading weeks (groups of sessions)
+- Handles varying data density (dollar bars, trade bars) correctly
+Background:
+----------
+Traditional time-based CV approaches use fixed sample counts computed from
+time periods, which fails for activity-based data (dollar bars, trade bars) where
+sample density varies with market activity. This module ensures proper time-based
+selection by using calendar boundaries as atomic units.
+Example Issue (Dollar Bars):
+- High volatility week: 100K samples in 7 calendar days
+- Low volatility week: 65K samples in 7 calendar days
+- Fixed sample approach: 82K samples = 3.14 to 5.0 weeks (WRONG!)
+- Calendar approach: Exactly 7 calendar days with varying samples (CORRECT!)
+"""
+from typing import Any, cast
+import numpy as np
+import pandas as pd
+import pytz
+try:
+    import pandas_market_calendars as mcal
+    HAS_MARKET_CALENDARS = True
+except ImportError:
+    HAS_MARKET_CALENDARS = False
+from ml4t.diagnostic.splitters.calendar_config import CalendarConfig
+class TradingCalendar:
+    """Trading calendar for session-aware time period calculations.
+    This class handles proper timezone conversion and trading session detection
+    for financial time-series cross-validation.
+    Parameters
+    ----------
+    config : CalendarConfig or str
+        Calendar configuration or exchange name (will use default config)
+    Attributes
+    ----------
+    config : CalendarConfig
+        Configuration for calendar and timezone handling
+    calendar : mcal.MarketCalendar
+        The underlying market calendar instance
+    tz : pytz.timezone
+        Timezone object for conversions
+    """
+    def __init__(self, config: CalendarConfig | str = "CME_Equity"):
+        """Initialize trading calendar with configuration."""
+        if not HAS_MARKET_CALENDARS:
+            raise ImportError(
+                "pandas_market_calendars is required for calendar-aware CV. "
+                "Install with: pip install pandas_market_calendars"
+            )
+        # Handle string input (exchange name) by creating default config
+        if isinstance(config, str):
+            from ml4t.diagnostic.splitters.calendar_config import CalendarConfig
+            config = CalendarConfig(exchange=config, timezone="UTC", localize_naive=True)
+        self.config = config
+        self.calendar = mcal.get_calendar(config.exchange)
+        self.tz = pytz.timezone(config.timezone)
+    def _ensure_timezone_aware(self, timestamps: pd.DatetimeIndex) -> pd.DatetimeIndex:
+        """Ensure timestamps are timezone-aware.
+        Parameters
+        ----------
+        timestamps : pd.DatetimeIndex
+            Input timestamps (may be tz-naive or tz-aware)
+        Returns
+        -------
+        pd.DatetimeIndex
+            Timezone-aware timestamps in calendar's timezone
+        """
+        if timestamps.tz is None:
+            # Tz-naive data
+            if self.config.localize_naive:
+                # Localize to calendar timezone
+                return timestamps.tz_localize(self.tz)
+            else:
+                raise ValueError(
+                    f"Data is timezone-naive but localize_naive=False in config. "
+                    f"Either localize data to {self.config.timezone} or set "
+                    f"localize_naive=True in CalendarConfig."
+                )
+        else:
+            # Tz-aware data - convert to calendar timezone
+            return timestamps.tz_convert(self.tz)
+    def get_sessions(
+        self,
+        timestamps: pd.DatetimeIndex,
+    ) -> pd.Series:
+        """Assign each timestamp to its trading session date (vectorized).
+        A trading session for futures typically runs from Sunday 5pm CT to Friday 4pm CT.
+        For stocks, it's the standard trading day.
+        Uses vectorized pandas operations for efficiency - handles 1M+ timestamps quickly.
+        Parameters
+        ----------
+        timestamps : pd.DatetimeIndex
+            Timestamps to assign to sessions (may be tz-naive or tz-aware)
+        Returns
+        -------
+        pd.Series
+            Session dates for each timestamp (tz-naive dates, index matches timestamps)
+        """
+        # Ensure all timestamps are in calendar timezone
+        timestamps_tz = self._ensure_timezone_aware(timestamps)
+        # Get schedule for the data period (with buffer for edge cases)
+        start_date = timestamps_tz[0].normalize() - pd.Timedelta(days=7)
+        end_date = timestamps_tz[-1].normalize() + pd.Timedelta(days=7)
+        # Get schedule (~250 sessions/year, very small)
+        schedule = self.calendar.schedule(start_date=start_date, end_date=end_date)
+        # Ensure schedule is in calendar timezone
+        if schedule["market_open"].dt.tz is None:
+            # Schedule is tz-naive - localize to calendar timezone
+            schedule["market_open"] = schedule["market_open"].dt.tz_localize(self.tz)
+            schedule["market_close"] = schedule["market_close"].dt.tz_localize(self.tz)
+        else:
+            # Schedule is tz-aware - convert to calendar timezone
+            schedule["market_open"] = schedule["market_open"].dt.tz_convert(self.tz)
+            schedule["market_close"] = schedule["market_close"].dt.tz_convert(self.tz)
+        # Vectorized assignment using merge_asof
+        # Create DataFrame with timestamps, preserving original index
+        df_ts = pd.DataFrame(
+            {"timestamp": timestamps_tz, "original_idx": range(len(timestamps_tz))}
+        )
+        # Create DataFrame with session boundaries
+        df_sessions = pd.DataFrame(
+            {
+                "session_date": schedule.index,
+                "market_open": schedule["market_open"],
+                "market_close": schedule["market_close"],
+            }
+        ).reset_index(drop=True)
+        # Sort for merge_asof (requires sorted data)
+        df_ts_sorted = df_ts.sort_values("timestamp")
+        df_sessions_sorted = df_sessions.sort_values("market_open")
+        # First, assign based on market_open (find the session that opened before this timestamp)
+        df_merged = pd.merge_asof(
+            df_ts_sorted,
+            df_sessions_sorted,
+            left_on="timestamp",
+            right_on="market_open",
+            direction="backward",
+        )
+        # Now filter: only keep assignments where timestamp < market_close
+        # For timestamps outside any session, assign to next session
+        within_session = df_merged["timestamp"] < df_merged["market_close"]
+        # For timestamps outside sessions, use forward merge (next session)
+        if not within_session.all():
+            df_outside = df_merged[~within_session][["timestamp", "original_idx"]]
+            if len(df_outside) > 0:
+                df_outside_merged = pd.merge_asof(
+                    df_outside,
+                    df_sessions_sorted,
+                    left_on="timestamp",
+                    right_on="market_open",
+                    direction="forward",
+                )
+                # Update session assignments for outside timestamps
+                df_merged.loc[~within_session, "session_date"] = df_outside_merged[
+                    "session_date"
+                ].values
+        # Return series with original index order
+        result = df_merged.sort_values("original_idx").set_index(timestamps)["session_date"]
+        return result
+    def count_samples_in_period(
+        self,
+        timestamps: pd.DatetimeIndex,
+        period_spec: str,
+    ) -> list[int]:
+        """Count samples in complete calendar periods across the dataset.
+        This method identifies complete periods (sessions, weeks, months) and counts
+        samples in each, providing the basis for calendar-aware fold creation.
+        Parameters
+        ----------
+        timestamps : pd.DatetimeIndex
+            Full dataset timestamps (may be tz-naive or tz-aware)
+        period_spec : str
+            Period specification (e.g., '1D', '4W', '3M')
+        Returns
+        -------
+        list[int]
+            Sample counts for each complete period found
+        Notes
+        -----
+        For intraday data with 'D' spec: Returns samples per session
+        For intraday data with 'W' spec: Returns samples per trading week
+        For daily data: Returns samples per calendar period
+        """
+        import re
+        # Ensure timezone-aware
+        timestamps_tz = self._ensure_timezone_aware(timestamps)
+        # Parse period specification
+        match = re.match(r"(\d+)([DWM])", period_spec.upper())
+        if not match:
+            raise ValueError(
+                f"Invalid period specification '{period_spec}'. Use format like '1D', '4W', '3M'"
+            )
+        n_periods = int(match.group(1))
+        freq = match.group(2)
+        # Determine if data is intraday (multiple samples per day)
+        df = pd.DataFrame({"timestamp": timestamps_tz})
+        # Cast to Any for DatetimeIndex.normalize() which is valid but type stubs don't recognize
+        daily_counts = df.groupby(cast(Any, timestamps_tz).normalize()).size()
+        is_intraday = (daily_counts > 1).any()
+        if is_intraday and freq in ["D", "W"]:
+            # Use trading calendar sessions
+            return self._count_samples_by_sessions(timestamps_tz, freq, n_periods)
+        else:
+            # Use calendar periods for daily data or monthly specs
+            return self._count_samples_by_calendar(timestamps_tz, freq, n_periods)
+    def _count_samples_by_sessions(
+        self,
+        timestamps: pd.DatetimeIndex,
+        freq: str,
+        n_periods: int,
+    ) -> list[int]:
+        """Count samples by trading sessions.
+        For 'D': Each session is one period
+        For 'W': Each n_periods sessions form one period (e.g., 5 sessions = 1 week)
+        """
+        # Assign each timestamp to its session
+        sessions = self.get_sessions(timestamps)
+        # Get unique sessions in order
+        unique_sessions = np.sort(cast(Any, sessions.unique()))
+        if freq == "D":
+            # Each session is one period
+            sample_counts = []
+            for session in unique_sessions:
+                count = (sessions == session).sum()
+                sample_counts.append(count)
+            return sample_counts
+        elif freq == "W":
+            # Group sessions into weeks, then count samples in n_periods weeks
+            # For '4W': 4 weeks × 5 sessions/week = 20 sessions per period
+            # Standard trading week = 5 sessions (Mon-Fri)
+            sessions_per_week = 5
+            sessions_per_period = sessions_per_week * n_periods  # e.g., 5 × 4 = 20
+            sample_counts = []
+            for i in range(0, len(unique_sessions), sessions_per_period):
+                period_sessions = unique_sessions[i : i + sessions_per_period]
+                if len(period_sessions) == sessions_per_period:
+                    # Only count complete periods (complete 4-week blocks)
+                    count = sessions.isin(period_sessions).sum()
+                    sample_counts.append(count)
+            return sample_counts
+        return []
+    def _count_samples_by_calendar(
+        self,
+        timestamps: pd.DatetimeIndex,
+        freq: str,
+        _n_periods: int,
+    ) -> list[int]:
+        """Count samples by calendar periods (for daily data or monthly specs)."""
+        # Group by calendar period
+        if freq == "D":
+            period_groups = cast(Any, timestamps).normalize()
+        elif freq == "W":
+            # Group by week start (Monday)
+            period_groups = timestamps.to_period("W").to_timestamp()
+        elif freq == "M":
+            # Group by month start
+            period_groups = timestamps.to_period("M").to_timestamp()
+        else:
+            raise ValueError(f"Unsupported frequency: {freq}")
+        # Count samples per period
+        df = pd.DataFrame({"period": period_groups})
+        counts = df.groupby("period").size()
+        return counts.values.tolist()
+def parse_time_size_calendar_aware(
+    size_spec: str,
+    timestamps: pd.DatetimeIndex,
+    calendar: TradingCalendar | None = None,
+) -> int:
+    """Parse time-based size specification using calendar-aware logic.
+    This function replaces the naive sample-counting approach with proper
+    calendar-based selection that respects trading session boundaries.
+    Parameters
+    ----------
+    size_spec : str
+        Time period specification (e.g., '4W', '1D', '3M')
+    timestamps : pd.DatetimeIndex
+        Timestamps from the dataset
+    calendar : TradingCalendar, optional
+        Trading calendar to use. If None, uses naive time-based calculation.
+    Returns
+    -------
+    int
+        Number of samples corresponding to the time period
+    Notes
+    -----
+    Key difference from naive approach:
+    - Naive: Computes median samples/period, returns fixed count
+    - Calendar-aware: Returns sample count for actual calendar period
+    For activity-based data (dollar bars, trade bars), the calendar-aware
+    approach correctly allows sample counts to vary by market activity.
+    Examples
+    --------
+    >>> timestamps = pd.date_range('2024-01-01', periods=10000, freq='1min')
+    >>> calendar = TradingCalendar('CME_Equity')
+    >>> # Returns samples in exactly 4 trading weeks
+    >>> n_samples = parse_time_size_calendar_aware('4W', timestamps, calendar)
+    """
+    if calendar is None:
+        # Fallback to naive time-based calculation
+        return _parse_time_size_naive(size_spec, timestamps)
+    # Use calendar-aware counting
+    sample_counts = calendar.count_samples_in_period(timestamps, size_spec)
+    if not sample_counts:
+        raise ValueError(
+            f"Could not find any complete periods matching '{size_spec}' in the provided timestamps"
+        )
+    # Use median sample count as representative value
+    # This handles variability in activity-based data (dollar/trade bars)
+    median_count = int(np.median(sample_counts))
+    return median_count
+def _parse_time_size_naive(
+    size_spec: str,
+    timestamps: pd.DatetimeIndex,
+) -> int:
+    """Naive time-based size calculation (fallback when no calendar provided).
+    This is the original ml4t-diagnostic logic - kept for backward compatibility.
+    """
+    # Parse the time period
+    try:
+        time_delta = pd.Timedelta(size_spec)
+    except ValueError:
+        try:
+            offset = pd.tseries.frequencies.to_offset(size_spec)
+            ref_date = timestamps[0]
+            time_delta = (ref_date + offset) - ref_date
+        except Exception as e:
+            raise ValueError(
+                f"Invalid time specification '{size_spec}'. "
+                f"Use pandas offset aliases like '4W', '30D', '3M', '1Y'. "
+                f"Error: {e}"
+            ) from e
+    # Simple proportion-based calculation
+    total_duration = timestamps[-1] - timestamps[0]
+    if total_duration.total_seconds() == 0:
+        raise ValueError("Cannot calculate time-based size for single-timestamp data")
+    n_samples = len(timestamps)
+    samples_per_second = n_samples / total_duration.total_seconds()
+    size_in_samples = int(samples_per_second * time_delta.total_seconds())
+    return size_in_samples

ml4t/diagnostic/splitters/calendar_config.py ADDED Viewed

@@ -0,0 +1,91 @@
+"""Configuration for calendar-aware cross-validation.
+This module defines configuration schemas for trading calendar integration,
+ensuring proper timezone handling and session awareness.
+"""
+from pydantic import BaseModel, Field
+class CalendarConfig(BaseModel):
+    """Configuration for trading calendar in cross-validation.
+    This configuration ensures proper handling of:
+    - Trading sessions (don't split session boundaries)
+    - Timezones (consistent tz-aware comparisons)
+    - Market-specific calendars (CME, NYSE, LSE, etc.)
+    Attributes
+    ----------
+    exchange : str
+        Name of the exchange calendar from pandas_market_calendars.
+        Examples: 'CME_Equity', 'NYSE', 'LSE', 'TSX', 'HKEX'
+        See: https://pandas-market-calendars.readthedocs.io/
+    timezone : str, default='UTC'
+        Timezone for calendar operations. All timestamps will be converted
+        to this timezone for calendar comparisons.
+        - 'UTC': Universal Coordinated Time (default, safest)
+        - 'America/New_York': US Eastern (NYSE, NASDAQ)
+        - 'America/Chicago': US Central (CME futures)
+        - 'Europe/London': UK (LSE)
+        - See pytz documentation for full list
+    localize_naive : bool, default=True
+        If True, tz-naive data will be localized to the specified timezone.
+        If False, tz-naive data will raise an error.
+        Recommended: True for safety (assumes data is in calendar timezone)
+    Examples
+    --------
+    For CME futures (NQ, ES, etc.):
+    >>> config = CalendarConfig(
+    ...     exchange='CME_Equity',
+    ...     timezone='America/Chicago'
+    ... )
+    For US equities:
+    >>> config = CalendarConfig(
+    ...     exchange='NYSE',
+    ...     timezone='America/New_York'
+    ... )
+    For international markets:
+    >>> config = CalendarConfig(
+    ...     exchange='LSE',
+    ...     timezone='Europe/London'
+    ... )
+    """
+    exchange: str = Field(..., description="Exchange calendar name from pandas_market_calendars")
+    timezone: str = Field(
+        default="UTC", description="Timezone for calendar operations (pytz timezone name)"
+    )
+    localize_naive: bool = Field(
+        default=True, description="Whether to localize tz-naive data to the specified timezone"
+    )
+    class Config:
+        """Pydantic configuration."""
+        frozen = True  # Immutable after creation
+    def __repr__(self) -> str:
+        """String representation."""
+        return (
+            f"CalendarConfig(exchange='{self.exchange}', "
+            f"timezone='{self.timezone}', "
+            f"localize_naive={self.localize_naive})"
+        )
+# Preset configurations for common markets
+CME_CONFIG = CalendarConfig(exchange="CME_Equity", timezone="America/Chicago", localize_naive=True)
+NYSE_CONFIG = CalendarConfig(exchange="NYSE", timezone="America/New_York", localize_naive=True)
+NASDAQ_CONFIG = CalendarConfig(exchange="NASDAQ", timezone="America/New_York", localize_naive=True)
+LSE_CONFIG = CalendarConfig(exchange="LSE", timezone="Europe/London", localize_naive=True)