PyPI - ml4t-diagnostic - Versions diffs - 0.1.0a1__py3-none-any.whl - Mend

ml4t-diagnostic 0.1.0a1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

ml4t/diagnostic/AGENT.md +25 -0
ml4t/diagnostic/__init__.py +166 -0
ml4t/diagnostic/backends/__init__.py +10 -0
ml4t/diagnostic/backends/adapter.py +192 -0
ml4t/diagnostic/backends/polars_backend.py +899 -0
ml4t/diagnostic/caching/__init__.py +40 -0
ml4t/diagnostic/caching/cache.py +331 -0
ml4t/diagnostic/caching/decorators.py +131 -0
ml4t/diagnostic/caching/smart_cache.py +339 -0
ml4t/diagnostic/config/AGENT.md +24 -0
ml4t/diagnostic/config/README.md +267 -0
ml4t/diagnostic/config/__init__.py +219 -0
ml4t/diagnostic/config/barrier_config.py +277 -0
ml4t/diagnostic/config/base.py +301 -0
ml4t/diagnostic/config/event_config.py +148 -0
ml4t/diagnostic/config/feature_config.py +404 -0
ml4t/diagnostic/config/multi_signal_config.py +55 -0
ml4t/diagnostic/config/portfolio_config.py +215 -0
ml4t/diagnostic/config/report_config.py +391 -0
ml4t/diagnostic/config/sharpe_config.py +202 -0
ml4t/diagnostic/config/signal_config.py +206 -0
ml4t/diagnostic/config/trade_analysis_config.py +310 -0
ml4t/diagnostic/config/validation.py +279 -0
ml4t/diagnostic/core/__init__.py +29 -0
ml4t/diagnostic/core/numba_utils.py +315 -0
ml4t/diagnostic/core/purging.py +372 -0
ml4t/diagnostic/core/sampling.py +471 -0
ml4t/diagnostic/errors/__init__.py +205 -0
ml4t/diagnostic/evaluation/AGENT.md +26 -0
ml4t/diagnostic/evaluation/__init__.py +437 -0
ml4t/diagnostic/evaluation/autocorrelation.py +531 -0
ml4t/diagnostic/evaluation/barrier_analysis.py +1050 -0
ml4t/diagnostic/evaluation/binary_metrics.py +910 -0
ml4t/diagnostic/evaluation/dashboard.py +715 -0
ml4t/diagnostic/evaluation/diagnostic_plots.py +1037 -0
ml4t/diagnostic/evaluation/distribution/__init__.py +499 -0
ml4t/diagnostic/evaluation/distribution/moments.py +299 -0
ml4t/diagnostic/evaluation/distribution/tails.py +777 -0
ml4t/diagnostic/evaluation/distribution/tests.py +470 -0
ml4t/diagnostic/evaluation/drift/__init__.py +139 -0
ml4t/diagnostic/evaluation/drift/analysis.py +432 -0
ml4t/diagnostic/evaluation/drift/domain_classifier.py +517 -0
ml4t/diagnostic/evaluation/drift/population_stability_index.py +310 -0
ml4t/diagnostic/evaluation/drift/wasserstein.py +388 -0
ml4t/diagnostic/evaluation/event_analysis.py +647 -0
ml4t/diagnostic/evaluation/excursion.py +390 -0
ml4t/diagnostic/evaluation/feature_diagnostics.py +873 -0
ml4t/diagnostic/evaluation/feature_outcome.py +666 -0
ml4t/diagnostic/evaluation/framework.py +935 -0
ml4t/diagnostic/evaluation/metric_registry.py +255 -0
ml4t/diagnostic/evaluation/metrics/AGENT.md +23 -0
ml4t/diagnostic/evaluation/metrics/__init__.py +133 -0
ml4t/diagnostic/evaluation/metrics/basic.py +160 -0
ml4t/diagnostic/evaluation/metrics/conditional_ic.py +469 -0
ml4t/diagnostic/evaluation/metrics/feature_outcome.py +475 -0
ml4t/diagnostic/evaluation/metrics/ic_statistics.py +446 -0
ml4t/diagnostic/evaluation/metrics/importance_analysis.py +338 -0
ml4t/diagnostic/evaluation/metrics/importance_classical.py +375 -0
ml4t/diagnostic/evaluation/metrics/importance_mda.py +371 -0
ml4t/diagnostic/evaluation/metrics/importance_shap.py +715 -0
ml4t/diagnostic/evaluation/metrics/information_coefficient.py +527 -0
ml4t/diagnostic/evaluation/metrics/interactions.py +772 -0
ml4t/diagnostic/evaluation/metrics/monotonicity.py +226 -0
ml4t/diagnostic/evaluation/metrics/risk_adjusted.py +324 -0
ml4t/diagnostic/evaluation/multi_signal.py +550 -0
ml4t/diagnostic/evaluation/portfolio_analysis/__init__.py +83 -0
ml4t/diagnostic/evaluation/portfolio_analysis/analysis.py +734 -0
ml4t/diagnostic/evaluation/portfolio_analysis/metrics.py +589 -0
ml4t/diagnostic/evaluation/portfolio_analysis/results.py +334 -0
ml4t/diagnostic/evaluation/report_generation.py +824 -0
ml4t/diagnostic/evaluation/signal_selector.py +452 -0
ml4t/diagnostic/evaluation/stat_registry.py +139 -0
ml4t/diagnostic/evaluation/stationarity/__init__.py +97 -0
ml4t/diagnostic/evaluation/stationarity/analysis.py +518 -0
ml4t/diagnostic/evaluation/stationarity/augmented_dickey_fuller.py +296 -0
ml4t/diagnostic/evaluation/stationarity/kpss_test.py +308 -0
ml4t/diagnostic/evaluation/stationarity/phillips_perron.py +365 -0
ml4t/diagnostic/evaluation/stats/AGENT.md +43 -0
ml4t/diagnostic/evaluation/stats/__init__.py +191 -0
ml4t/diagnostic/evaluation/stats/backtest_overfitting.py +219 -0
ml4t/diagnostic/evaluation/stats/bootstrap.py +228 -0
ml4t/diagnostic/evaluation/stats/deflated_sharpe_ratio.py +591 -0
ml4t/diagnostic/evaluation/stats/false_discovery_rate.py +295 -0
ml4t/diagnostic/evaluation/stats/hac_standard_errors.py +108 -0
ml4t/diagnostic/evaluation/stats/minimum_track_record.py +408 -0
ml4t/diagnostic/evaluation/stats/moments.py +164 -0
ml4t/diagnostic/evaluation/stats/rademacher_adjustment.py +436 -0
ml4t/diagnostic/evaluation/stats/reality_check.py +155 -0
ml4t/diagnostic/evaluation/stats/sharpe_inference.py +219 -0
ml4t/diagnostic/evaluation/themes.py +330 -0
ml4t/diagnostic/evaluation/threshold_analysis.py +957 -0
ml4t/diagnostic/evaluation/trade_analysis.py +1136 -0
ml4t/diagnostic/evaluation/trade_dashboard/__init__.py +32 -0
ml4t/diagnostic/evaluation/trade_dashboard/app.py +315 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/__init__.py +18 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/csv.py +82 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/html.py +276 -0
ml4t/diagnostic/evaluation/trade_dashboard/io.py +166 -0
ml4t/diagnostic/evaluation/trade_dashboard/normalize.py +304 -0
ml4t/diagnostic/evaluation/trade_dashboard/stats.py +386 -0
ml4t/diagnostic/evaluation/trade_dashboard/style.py +79 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/__init__.py +21 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/patterns.py +354 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/shap_analysis.py +280 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/stat_validation.py +186 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/worst_trades.py +236 -0
ml4t/diagnostic/evaluation/trade_dashboard/types.py +129 -0
ml4t/diagnostic/evaluation/trade_shap/__init__.py +102 -0
ml4t/diagnostic/evaluation/trade_shap/alignment.py +188 -0
ml4t/diagnostic/evaluation/trade_shap/characterize.py +413 -0
ml4t/diagnostic/evaluation/trade_shap/cluster.py +302 -0
ml4t/diagnostic/evaluation/trade_shap/explain.py +208 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/__init__.py +23 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/generator.py +290 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/matcher.py +251 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/templates.yaml +467 -0
ml4t/diagnostic/evaluation/trade_shap/models.py +386 -0
ml4t/diagnostic/evaluation/trade_shap/normalize.py +116 -0
ml4t/diagnostic/evaluation/trade_shap/pipeline.py +263 -0
ml4t/diagnostic/evaluation/trade_shap_dashboard.py +283 -0
ml4t/diagnostic/evaluation/trade_shap_diagnostics.py +588 -0
ml4t/diagnostic/evaluation/validated_cv.py +535 -0
ml4t/diagnostic/evaluation/visualization.py +1050 -0
ml4t/diagnostic/evaluation/volatility/__init__.py +45 -0
ml4t/diagnostic/evaluation/volatility/analysis.py +351 -0
ml4t/diagnostic/evaluation/volatility/arch.py +258 -0
ml4t/diagnostic/evaluation/volatility/garch.py +460 -0
ml4t/diagnostic/integration/__init__.py +48 -0
ml4t/diagnostic/integration/backtest_contract.py +671 -0
ml4t/diagnostic/integration/data_contract.py +316 -0
ml4t/diagnostic/integration/engineer_contract.py +226 -0
ml4t/diagnostic/logging/__init__.py +77 -0
ml4t/diagnostic/logging/logger.py +245 -0
ml4t/diagnostic/logging/performance.py +234 -0
ml4t/diagnostic/logging/progress.py +234 -0
ml4t/diagnostic/logging/wandb.py +412 -0
ml4t/diagnostic/metrics/__init__.py +9 -0
ml4t/diagnostic/metrics/percentiles.py +128 -0
ml4t/diagnostic/py.typed +1 -0
ml4t/diagnostic/reporting/__init__.py +43 -0
ml4t/diagnostic/reporting/base.py +130 -0
ml4t/diagnostic/reporting/html_renderer.py +275 -0
ml4t/diagnostic/reporting/json_renderer.py +51 -0
ml4t/diagnostic/reporting/markdown_renderer.py +117 -0
ml4t/diagnostic/results/AGENT.md +24 -0
ml4t/diagnostic/results/__init__.py +105 -0
ml4t/diagnostic/results/barrier_results/__init__.py +36 -0
ml4t/diagnostic/results/barrier_results/hit_rate.py +304 -0
ml4t/diagnostic/results/barrier_results/precision_recall.py +266 -0
ml4t/diagnostic/results/barrier_results/profit_factor.py +297 -0
ml4t/diagnostic/results/barrier_results/tearsheet.py +397 -0
ml4t/diagnostic/results/barrier_results/time_to_target.py +305 -0
ml4t/diagnostic/results/barrier_results/validation.py +38 -0
ml4t/diagnostic/results/base.py +177 -0
ml4t/diagnostic/results/event_results.py +349 -0
ml4t/diagnostic/results/feature_results.py +787 -0
ml4t/diagnostic/results/multi_signal_results.py +431 -0
ml4t/diagnostic/results/portfolio_results.py +281 -0
ml4t/diagnostic/results/sharpe_results.py +448 -0
ml4t/diagnostic/results/signal_results/__init__.py +74 -0
ml4t/diagnostic/results/signal_results/ic.py +581 -0
ml4t/diagnostic/results/signal_results/irtc.py +110 -0
ml4t/diagnostic/results/signal_results/quantile.py +392 -0
ml4t/diagnostic/results/signal_results/tearsheet.py +456 -0
ml4t/diagnostic/results/signal_results/turnover.py +213 -0
ml4t/diagnostic/results/signal_results/validation.py +147 -0
ml4t/diagnostic/signal/AGENT.md +17 -0
ml4t/diagnostic/signal/__init__.py +69 -0
ml4t/diagnostic/signal/_report.py +152 -0
ml4t/diagnostic/signal/_utils.py +261 -0
ml4t/diagnostic/signal/core.py +275 -0
ml4t/diagnostic/signal/quantile.py +148 -0
ml4t/diagnostic/signal/result.py +214 -0
ml4t/diagnostic/signal/signal_ic.py +129 -0
ml4t/diagnostic/signal/turnover.py +182 -0
ml4t/diagnostic/splitters/AGENT.md +19 -0
ml4t/diagnostic/splitters/__init__.py +36 -0
ml4t/diagnostic/splitters/base.py +501 -0
ml4t/diagnostic/splitters/calendar.py +421 -0
ml4t/diagnostic/splitters/calendar_config.py +91 -0
ml4t/diagnostic/splitters/combinatorial.py +1064 -0
ml4t/diagnostic/splitters/config.py +322 -0
ml4t/diagnostic/splitters/cpcv/__init__.py +57 -0
ml4t/diagnostic/splitters/cpcv/combinations.py +119 -0
ml4t/diagnostic/splitters/cpcv/partitioning.py +263 -0
ml4t/diagnostic/splitters/cpcv/purge_engine.py +379 -0
ml4t/diagnostic/splitters/cpcv/windows.py +190 -0
ml4t/diagnostic/splitters/group_isolation.py +329 -0
ml4t/diagnostic/splitters/persistence.py +316 -0
ml4t/diagnostic/splitters/utils.py +207 -0
ml4t/diagnostic/splitters/walk_forward.py +757 -0
ml4t/diagnostic/utils/__init__.py +42 -0
ml4t/diagnostic/utils/config.py +542 -0
ml4t/diagnostic/utils/dependencies.py +318 -0
ml4t/diagnostic/utils/sessions.py +127 -0
ml4t/diagnostic/validation/__init__.py +54 -0
ml4t/diagnostic/validation/dataframe.py +274 -0
ml4t/diagnostic/validation/returns.py +280 -0
ml4t/diagnostic/validation/timeseries.py +299 -0
ml4t/diagnostic/visualization/AGENT.md +19 -0
ml4t/diagnostic/visualization/__init__.py +223 -0
ml4t/diagnostic/visualization/backtest/__init__.py +98 -0
ml4t/diagnostic/visualization/backtest/cost_attribution.py +762 -0
ml4t/diagnostic/visualization/backtest/executive_summary.py +895 -0
ml4t/diagnostic/visualization/backtest/interactive_controls.py +673 -0
ml4t/diagnostic/visualization/backtest/statistical_validity.py +874 -0
ml4t/diagnostic/visualization/backtest/tearsheet.py +565 -0
ml4t/diagnostic/visualization/backtest/template_system.py +373 -0
ml4t/diagnostic/visualization/backtest/trade_plots.py +1172 -0
ml4t/diagnostic/visualization/barrier_plots.py +782 -0
ml4t/diagnostic/visualization/core.py +1060 -0
ml4t/diagnostic/visualization/dashboards/__init__.py +36 -0
ml4t/diagnostic/visualization/dashboards/base.py +582 -0
ml4t/diagnostic/visualization/dashboards/importance.py +801 -0
ml4t/diagnostic/visualization/dashboards/interaction.py +263 -0
ml4t/diagnostic/visualization/dashboards.py +43 -0
ml4t/diagnostic/visualization/data_extraction/__init__.py +48 -0
ml4t/diagnostic/visualization/data_extraction/importance.py +649 -0
ml4t/diagnostic/visualization/data_extraction/interaction.py +504 -0
ml4t/diagnostic/visualization/data_extraction/types.py +113 -0
ml4t/diagnostic/visualization/data_extraction/validation.py +66 -0
ml4t/diagnostic/visualization/feature_plots.py +888 -0
ml4t/diagnostic/visualization/interaction_plots.py +618 -0
ml4t/diagnostic/visualization/portfolio/__init__.py +41 -0
ml4t/diagnostic/visualization/portfolio/dashboard.py +514 -0
ml4t/diagnostic/visualization/portfolio/drawdown_plots.py +341 -0
ml4t/diagnostic/visualization/portfolio/returns_plots.py +487 -0
ml4t/diagnostic/visualization/portfolio/risk_plots.py +301 -0
ml4t/diagnostic/visualization/report_generation.py +1343 -0
ml4t/diagnostic/visualization/signal/__init__.py +103 -0
ml4t/diagnostic/visualization/signal/dashboard.py +911 -0
ml4t/diagnostic/visualization/signal/event_plots.py +514 -0
ml4t/diagnostic/visualization/signal/ic_plots.py +635 -0
ml4t/diagnostic/visualization/signal/multi_signal_dashboard.py +974 -0
ml4t/diagnostic/visualization/signal/multi_signal_plots.py +603 -0
ml4t/diagnostic/visualization/signal/quantile_plots.py +625 -0
ml4t/diagnostic/visualization/signal/turnover_plots.py +400 -0
ml4t/diagnostic/visualization/trade_shap/__init__.py +90 -0
ml4t_diagnostic-0.1.0a1.dist-info/METADATA +1044 -0
ml4t_diagnostic-0.1.0a1.dist-info/RECORD +242 -0
ml4t_diagnostic-0.1.0a1.dist-info/WHEEL +4 -0
ml4t_diagnostic-0.1.0a1.dist-info/licenses/LICENSE +21 -0

ml4t/diagnostic/core/sampling.py ADDED Viewed

@@ -0,0 +1,471 @@
+"""Stratified and subsampling logic for financial time-series.
+This module provides sampling strategies that preserve important
+characteristics of financial data while reducing computational load
+or balancing classes.
+"""
+from typing import TYPE_CHECKING, Any
+import numpy as np
+import pandas as pd
+import polars as pl
+if TYPE_CHECKING:
+    from numpy.typing import NDArray
+def block_bootstrap(
+    indices: "NDArray[np.intp]",
+    n_samples: int,
+    sample_length: int | None = None,
+    random_state: int | None = None,
+) -> "NDArray[np.intp]":
+    """Block bootstrap for time series with temporal structure.
+    This method samples random blocks (contiguous sequences) of observations and includes subsequent
+    observations to preserve temporal structure and label overlap patterns.
+    Based on López de Prado (2018).
+    Parameters
+    ----------
+    indices : np.ndarray
+        Array of indices to sample from
+    n_samples : int
+        Number of bootstrap samples to generate
+    sample_length : int, optional
+        Length of each sequential sample. If None, uses average
+        length from original data
+    random_state : int, optional
+        Random seed for reproducibility
+    Returns:
+    -------
+    np.ndarray
+        Bootstrap sample indices
+    Raises:
+    ------
+    ValueError
+        If n_samples <= 0, if indices is empty, or if parameters are invalid
+    Examples:
+    --------
+    >>> indices = np.arange(100)
+    >>> bootstrap_idx = block_bootstrap(indices, n_samples=80, sample_length=5)
+    >>> len(bootstrap_idx)
+    80
+    """
+    # Import here to avoid circular dependency
+    from ml4t.diagnostic.core.numba_utils import block_bootstrap_numba
+    # Input validation
+    if n_samples <= 0:
+        raise ValueError(f"n_samples must be positive, got {n_samples}")
+    if len(indices) == 0:
+        raise ValueError("indices array cannot be empty")
+    n_indices = len(indices)
+    if sample_length is None:
+        # Default to 10% of data length, minimum 1
+        sample_length = max(1, n_indices // 10)
+    elif sample_length <= 0:
+        raise ValueError(f"sample_length must be positive, got {sample_length}")
+    # Set random seed
+    if random_state is None:
+        random_state = np.random.randint(0, 2**31 - 1)
+    # Use Numba-optimized function
+    return block_bootstrap_numba(indices, n_samples, sample_length, random_state)
+def stratified_sample_time_series(
+    data: pd.DataFrame | pl.DataFrame,
+    stratify_column: str,
+    sample_frac: float = 0.5,
+    time_column: str | None = None,
+    preserve_order: bool = True,
+    random_state: int | None = None,
+) -> pd.DataFrame | pl.DataFrame:
+    """Stratified sampling that preserves time series properties.
+    Parameters
+    ----------
+    data : pd.DataFrame or pl.DataFrame
+        Input data to sample from
+    stratify_column : str
+        Column to use for stratification
+    sample_frac : float
+        Fraction of data to sample from each stratum
+    time_column : str, optional
+        Time column for maintaining temporal order
+    preserve_order : bool
+        Whether to preserve temporal ordering within strata
+    random_state : int, optional
+        Random seed for reproducibility
+    Returns:
+    -------
+    pd.DataFrame or pl.DataFrame
+        Stratified sample preserving input type
+    Examples:
+    --------
+    >>> df = pd.DataFrame({
+    ...     'time': pd.date_range('2020-01-01', periods=1000),
+    ...     'label': np.random.choice([-1, 0, 1], 1000),
+    ...     'feature': np.random.randn(1000)
+    ... })
+    >>> sampled = stratified_sample_time_series(
+    ...     df, stratify_column='label', sample_frac=0.3
+    ... )
+    """
+    rng = np.random.RandomState(random_state)
+    if isinstance(data, pl.DataFrame):
+        # Polars implementation
+        unique_values = data[stratify_column].unique().to_list()
+        sampled_dfs = []
+        for value in unique_values:
+            stratum_df = data.filter(pl.col(stratify_column) == value)
+            n_stratum = len(stratum_df)
+            n_sample = int(n_stratum * sample_frac)
+            if n_sample > 0:
+                if preserve_order and time_column:
+                    # Sample by time blocks to preserve structure
+                    block_size = max(1, n_stratum // (n_sample // 10 + 1))
+                    sampled_indices: list[int] = []
+                    for i in range(0, n_stratum - block_size + 1, block_size):
+                        if rng.random() < sample_frac:
+                            sampled_indices.extend(
+                                range(i, min(i + block_size, n_stratum)),
+                            )
+                    sampled_stratum = stratum_df[sampled_indices[:n_sample]]
+                else:
+                    # Random sampling
+                    sample_indices = rng.choice(n_stratum, n_sample, replace=False)
+                    sampled_stratum = stratum_df[sorted(sample_indices)]
+                sampled_dfs.append(sampled_stratum)
+        result = pl.concat(sampled_dfs)
+        if time_column and preserve_order:
+            result = result.sort(time_column)
+    elif isinstance(data, pd.DataFrame):
+        # Pandas implementation - explicit casts to ensure proper type narrowing
+        # Use completely separate variable names from Polars branch to avoid mypy redefinition errors
+        data_pandas: pd.DataFrame = data
+        unique_vals_pd = data_pandas[stratify_column].unique()  # Returns ndarray
+        collected_dfs: list[pd.DataFrame] = []
+        for val in unique_vals_pd:
+            stratum: pd.DataFrame = data_pandas[data_pandas[stratify_column] == val]
+            n_rows = len(stratum)
+            n_to_sample = int(n_rows * sample_frac)
+            if n_to_sample > 0:
+                selected: pd.DataFrame
+                if preserve_order:
+                    # Sample contiguous blocks
+                    blk_size = max(1, n_rows // (n_to_sample // 10 + 1))
+                    idx_list: list[Any] = []
+                    for j in range(0, n_rows - blk_size + 1, blk_size):
+                        if rng.random() < sample_frac:
+                            idx_list.extend(
+                                stratum.index[j : j + blk_size].tolist(),
+                            )
+                    selected = stratum.loc[idx_list[:n_to_sample]]
+                else:
+                    selected = stratum.sample(
+                        n=n_to_sample,
+                        random_state=random_state,
+                    )
+                collected_dfs.append(selected)
+        result_pd = pd.concat(collected_dfs)
+        if time_column and preserve_order:
+            result_pd = result_pd.sort_values(time_column)
+        return result_pd
+    else:
+        raise TypeError(f"data must be pd.DataFrame or pl.DataFrame, got {type(data)}")
+    return result
+def sample_weights_by_importance(
+    returns: "NDArray[Any]",
+    method: str = "return_magnitude",
+    decay_factor: float = 0.94,
+) -> "NDArray[Any]":
+    """Calculate sampling weights based on importance criteria.
+    Parameters
+    ----------
+    returns : np.ndarray
+        Array of returns or outcomes
+    method : str
+        Method for calculating importance weights:
+        - 'return_magnitude': Weight by absolute return size
+        - 'recency': Exponential decay weights
+        - 'volatility': Weight by local volatility
+    decay_factor : float
+        Decay factor for recency weighting
+    Returns:
+    -------
+    np.ndarray
+        Sampling weights (sum to 1)
+    Raises:
+    ------
+    ValueError
+        If returns is empty, method is unknown, or decay_factor is invalid
+    Examples:
+    --------
+    >>> returns = np.random.randn(100) * 0.02
+    >>> weights = sample_weights_by_importance(returns, method='recency')
+    >>> weights.sum()
+    1.0
+    """
+    # Input validation
+    if len(returns) == 0:
+        raise ValueError("returns array cannot be empty")
+    if not 0 < decay_factor < 1:
+        raise ValueError(f"decay_factor must be in (0, 1), got {decay_factor}")
+    valid_methods = ["return_magnitude", "recency", "volatility"]
+    if method not in valid_methods:
+        raise ValueError(f"method must be one of {valid_methods}, got '{method}'")
+    n_samples = len(returns)
+    if method == "return_magnitude":
+        # Weight by absolute return magnitude
+        weights = np.abs(returns)
+        # Handle case where all returns are zero
+        if np.sum(weights) == 0:
+            weights = np.ones(n_samples)  # Equal weights if all returns are zero
+        weights = weights / weights.sum()
+    elif method == "recency":
+        # Exponential decay weights (more recent = higher weight)
+        time_weights = decay_factor ** np.arange(n_samples - 1, -1, -1)
+        weights = time_weights / time_weights.sum()
+    elif method == "volatility":
+        # Weight by local volatility (20-period rolling std)
+        if n_samples < 2:
+            # Can't calculate volatility with less than 2 samples
+            weights = np.ones(n_samples) / n_samples
+        else:
+            volatility: NDArray[Any] = (
+                pd.Series(returns).rolling(20, min_periods=1).std().to_numpy()
+            )
+            # Handle case where volatility is all NaN or zero
+            if np.all(np.isnan(volatility)) or float(np.nansum(volatility)) == 0:
+                weights = np.ones(n_samples)  # Equal weights
+            else:
+                weights = volatility
+            # Replace any remaining NaN values
+            weights = np.nan_to_num(weights, nan=1.0)
+            weights = weights / weights.sum()
+    # Final safety check - ensure weights are valid probabilities
+    weights = np.nan_to_num(weights, nan=1 / n_samples, posinf=1 / n_samples, neginf=0)
+    # Ensure weights sum to 1
+    weights_sum = weights.sum()
+    if weights_sum <= 0:
+        # Fallback to equal weights
+        weights = np.ones(n_samples) / n_samples
+    else:
+        weights = weights / weights_sum
+    return weights
+def balanced_subsample(
+    X: "NDArray[Any]",
+    y: "NDArray[Any]",
+    minority_weight: float = 1.0,
+    method: str = "undersample",
+    random_state: int | None = None,
+) -> tuple["NDArray[Any]", "NDArray[Any]"]:
+    """Balance classes through strategic subsampling.
+    Parameters
+    ----------
+    X : np.ndarray
+        Feature matrix
+    y : np.ndarray
+        Labels (assumed to be -1, 0, 1 for financial ML)
+    minority_weight : float
+        Weight given to minority class preservation
+    method : str
+        Balancing method:
+        - 'undersample': Undersample majority class
+        - 'hybrid': Combination of under and oversampling
+    random_state : int, optional
+        Random seed
+    Returns:
+    -------
+    X_balanced : np.ndarray
+        Balanced feature matrix
+    y_balanced : np.ndarray
+        Balanced labels
+    """
+    rng = np.random.RandomState(random_state)
+    # Get class counts
+    unique_labels, counts = np.unique(y, return_counts=True)
+    min_count = counts.min()
+    counts.max()
+    if method == "undersample":
+        # Undersample to match minority class
+        balanced_indices: list[int] = []
+        for label in unique_labels:
+            label_indices = np.where(y == label)[0]
+            if len(label_indices) > min_count:
+                # Undersample this class
+                if label == 0:  # Neutral class in financial ML
+                    # More aggressive undersampling for neutral class
+                    n_sample = int(min_count * (2 - minority_weight))
+                else:
+                    n_sample = min_count
+                sampled = rng.choice(label_indices, n_sample, replace=False)
+            else:
+                # Keep all minority samples
+                sampled = label_indices
+            balanced_indices.extend(sampled)
+    elif method == "hybrid":
+        # Combination approach
+        balanced_indices = []
+        target_count = int(min_count * (1 + minority_weight))
+        for label in unique_labels:
+            label_indices = np.where(y == label)[0]
+            if len(label_indices) > target_count:
+                # Undersample
+                sampled = rng.choice(label_indices, target_count, replace=False)
+            elif len(label_indices) < target_count:
+                # Oversample with replacement
+                sampled = rng.choice(label_indices, target_count, replace=True)
+            else:
+                sampled = label_indices
+            balanced_indices.extend(sampled)
+    else:
+        raise ValueError(f"Unknown method: {method}")
+    # Shuffle the indices
+    balanced_arr: NDArray[np.intp] = np.array(balanced_indices, dtype=np.intp)
+    rng.shuffle(balanced_arr)
+    return X[balanced_arr], y[balanced_arr]
+def event_based_sample(
+    data: pd.DataFrame | pl.DataFrame,
+    event_column: str,
+    n_samples: int | None = None,
+    sample_frac: float | None = None,
+    min_event_spacing: int | None = None,
+    random_state: int | None = None,
+) -> pd.DataFrame | pl.DataFrame:
+    """Sample based on events ensuring minimum spacing.
+    This is useful for event-driven strategies where you want to
+    sample events (like price movements) with minimum time between them.
+    Parameters
+    ----------
+    data : pd.DataFrame or pl.DataFrame
+        Input data
+    event_column : str
+        Column indicating events (boolean or binary)
+    n_samples : int, optional
+        Number of events to sample
+    sample_frac : float, optional
+        Fraction of events to sample
+    min_event_spacing : int, optional
+        Minimum spacing between sampled events
+    random_state : int, optional
+        Random seed
+    Returns:
+    -------
+    pd.DataFrame or pl.DataFrame
+        Sampled data containing selected events
+    """
+    if n_samples is None and sample_frac is None:
+        raise ValueError("Either n_samples or sample_frac must be specified")
+    rng = np.random.RandomState(random_state)
+    if isinstance(data, pl.DataFrame):
+        # Get event indices
+        event_mask_pl = data[event_column].cast(bool)
+        event_indices = np.where(event_mask_pl.to_numpy())[0]
+    elif isinstance(data, pd.DataFrame):
+        # Pandas - explicit isinstance for type narrowing
+        event_mask_pd = data[event_column].astype(bool)
+        event_indices = np.where(event_mask_pd.to_numpy())[0]
+    else:
+        raise TypeError(f"data must be pd.DataFrame or pl.DataFrame, got {type(data)}")
+    if n_samples is None:
+        if sample_frac is None:
+            raise ValueError("Either n_samples or sample_frac must be provided")
+        n_samples = int(len(event_indices) * sample_frac)
+    # Sample events with spacing constraint
+    sampled_events: list[int] = []
+    available_indices = list(event_indices)
+    while len(sampled_events) < n_samples and available_indices:
+        # Sample an event
+        idx = rng.choice(len(available_indices))
+        event_idx = available_indices[idx]
+        sampled_events.append(event_idx)
+        # Remove nearby events from available pool
+        if min_event_spacing is not None:
+            available_indices = [
+                i for i in available_indices if abs(i - event_idx) > min_event_spacing
+            ]
+        else:
+            available_indices.pop(idx)
+    # Return data at sampled event indices
+    if isinstance(data, pl.DataFrame):
+        return data[sorted(sampled_events)]
+    return data.iloc[sorted(sampled_events)]

ml4t/diagnostic/errors/__init__.py ADDED Viewed

@@ -0,0 +1,205 @@
+"""
+ML4T Diagnostic Error Handling Framework
+Provides a comprehensive exception hierarchy for systematic error handling
+across the ML4T Diagnostic library. All exceptions preserve context information and
+provide actionable error messages.
+Exception Hierarchy:
+    QEvalError (base)
+    ├── ConfigurationError      # Configuration and setup errors
+    ├── ValidationError         # Data validation failures
+    ├── ComputationError        # Calculation and numerical errors
+    ├── DataError              # Data access and format errors
+    └── IntegrationError       # External library integration errors
+Example:
+    >>> from ml4t.diagnostic.errors import ValidationError
+    >>> try:
+    ...     validate_returns(returns)
+    ... except ValidationError as e:
+    ...     print(f"Validation failed: {e}")
+    ...     print(f"Context: {e.context}")
+"""
+from typing import Any
+class QEvalError(Exception):
+    """
+    Base exception for all ML4T Diagnostic errors.
+    All ML4T Diagnostic exceptions inherit from this base class, providing
+    consistent error handling and context preservation.
+    Attributes:
+        message: Human-readable error description
+        context: Additional error context (dict)
+        cause: Original exception if error was wrapped
+    Example:
+        >>> raise QEvalError(
+        ...     "Operation failed",
+        ...     context={"operation": "compute_sharpe", "reason": "insufficient_data"}
+        ... )
+    """
+    def __init__(
+        self,
+        message: str,
+        context: dict[str, Any] | None = None,
+        cause: Exception | None = None,
+    ):
+        """
+        Initialize ML4T Diagnostic error.
+        Args:
+            message: Error description
+            context: Additional error context
+            cause: Original exception (for error chaining)
+        """
+        super().__init__(message)
+        self.message = message
+        self.context = context or {}
+        self.cause = cause
+    def __str__(self) -> str:
+        """Format error message with context."""
+        parts = [self.message]
+        if self.context:
+            parts.append("\nContext:")
+            for key, value in self.context.items():
+                parts.append(f"  {key}: {value}")
+        if self.cause:
+            parts.append(f"\nCaused by: {type(self.cause).__name__}: {self.cause}")
+        return "".join(parts)
+    def __repr__(self) -> str:
+        """Detailed representation."""
+        return f"{self.__class__.__name__}(message={self.message!r}, context={self.context!r}, cause={self.cause!r})"
+class ConfigurationError(QEvalError):
+    """
+    Configuration and setup errors.
+    Raised when:
+    - Invalid configuration values
+    - Missing required configuration
+    - Incompatible settings
+    - Setup/initialization failures
+    Example:
+        >>> from ml4t.diagnostic.config import QEvalConfig
+        >>> try:
+        ...     config = QEvalConfig(n_splits=-1)  # Invalid
+        ... except ConfigurationError as e:
+        ...     print(f"Configuration error: {e}")
+    """
+    pass
+class ValidationError(QEvalError):
+    """
+    Data validation failures.
+    Raised when:
+    - Required columns missing
+    - Data type mismatches
+    - Value constraints violated
+    - Schema validation failures
+    Note:
+        This is distinct from the ValidationError in ml4t-diagnostic.validation.
+        The validation module uses this exception type for all validation failures.
+    Example:
+        >>> from ml4t.diagnostic.validation import validate_returns
+        >>> try:
+        ...     validate_returns(invalid_returns)
+        ... except ValidationError as e:
+        ...     print(f"Validation failed: {e}")
+        ...     print(f"Details: {e.context}")
+    """
+    pass
+class ComputationError(QEvalError):
+    """
+    Calculation and numerical errors.
+    Raised when:
+    - Numerical instability (division by zero, overflow)
+    - Insufficient data for calculation
+    - Algorithm convergence failures
+    - Invalid mathematical operations
+    Example:
+        >>> from ml4t.diagnostic.metrics import sharpe_ratio
+        >>> try:
+        ...     sr = sharpe_ratio([])  # Empty data
+        ... except ComputationError as e:
+        ...     print(f"Computation failed: {e}")
+    """
+    pass
+class DataError(QEvalError):
+    """
+    Data access and format errors.
+    Raised when:
+    - Data cannot be loaded
+    - Unexpected data format
+    - Missing expected data
+    - Data corruption
+    Example:
+        >>> from ml4t.diagnostic.integration.qfeatures import load_features
+        >>> try:
+        ...     features = load_features("missing_file.parquet")
+        ... except DataError as e:
+        ...     print(f"Data error: {e}")
+    """
+    pass
+class IntegrationError(QEvalError):
+    """
+    External library integration errors.
+    Raised when:
+    - QFeatures integration fails
+    - QEngine integration fails
+    - External API errors
+    - Version compatibility issues
+    Example:
+        >>> from ml4t.diagnostic.integration.qfeatures import FeaturesAdapter
+        >>> try:
+        ...     adapter = FeaturesAdapter()
+        ...     features = adapter.load("data.parquet")
+        ... except IntegrationError as e:
+        ...     print(f"Integration error: {e}")
+        ...     print(f"Library: {e.context.get('library')}")
+    """
+    pass
+# Public API
+__all__ = [
+    "QEvalError",
+    "ConfigurationError",
+    "ValidationError",
+    "ComputationError",
+    "DataError",
+    "IntegrationError",
+]

ml4t/diagnostic/evaluation/AGENT.md ADDED Viewed

@@ -0,0 +1,26 @@
+# evaluation/ - Analysis Framework
+## Subdirectories
+| Directory | Purpose |
+|-----------|---------|
+| [stats/](stats/AGENT.md) | DSR, RAS, FDR, HAC |
+| [metrics/](metrics/AGENT.md) | IC, importance, interactions |
+| distribution/ | Moments, tails, tests |
+| drift/ | PSI, Wasserstein |
+| stationarity/ | ADF, KPSS, PP |
+## Key Modules
+| File | Lines | Purpose |
+|------|-------|---------|
+| framework.py | 935 | `Evaluator` class |
+| validated_cv.py | ~200 | `ValidatedCrossValidation` |
+| barrier_analysis.py | 1050 | `BarrierAnalysis` |
+| binary_metrics.py | 910 | Classification metrics |
+| trade_analysis.py | 1078 | Trade-level analysis |
+| autocorrelation.py | 531 | ACF/PACF |
+## Key Classes
+`Evaluator`, `ValidatedCrossValidation`, `BarrierAnalysis`, `FeatureDiagnostics`