PyPI - ml4t-diagnostic - Versions diffs - 0.1.0a1__py3-none-any.whl - Mend

ml4t-diagnostic 0.1.0a1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

ml4t/diagnostic/AGENT.md +25 -0
ml4t/diagnostic/__init__.py +166 -0
ml4t/diagnostic/backends/__init__.py +10 -0
ml4t/diagnostic/backends/adapter.py +192 -0
ml4t/diagnostic/backends/polars_backend.py +899 -0
ml4t/diagnostic/caching/__init__.py +40 -0
ml4t/diagnostic/caching/cache.py +331 -0
ml4t/diagnostic/caching/decorators.py +131 -0
ml4t/diagnostic/caching/smart_cache.py +339 -0
ml4t/diagnostic/config/AGENT.md +24 -0
ml4t/diagnostic/config/README.md +267 -0
ml4t/diagnostic/config/__init__.py +219 -0
ml4t/diagnostic/config/barrier_config.py +277 -0
ml4t/diagnostic/config/base.py +301 -0
ml4t/diagnostic/config/event_config.py +148 -0
ml4t/diagnostic/config/feature_config.py +404 -0
ml4t/diagnostic/config/multi_signal_config.py +55 -0
ml4t/diagnostic/config/portfolio_config.py +215 -0
ml4t/diagnostic/config/report_config.py +391 -0
ml4t/diagnostic/config/sharpe_config.py +202 -0
ml4t/diagnostic/config/signal_config.py +206 -0
ml4t/diagnostic/config/trade_analysis_config.py +310 -0
ml4t/diagnostic/config/validation.py +279 -0
ml4t/diagnostic/core/__init__.py +29 -0
ml4t/diagnostic/core/numba_utils.py +315 -0
ml4t/diagnostic/core/purging.py +372 -0
ml4t/diagnostic/core/sampling.py +471 -0
ml4t/diagnostic/errors/__init__.py +205 -0
ml4t/diagnostic/evaluation/AGENT.md +26 -0
ml4t/diagnostic/evaluation/__init__.py +437 -0
ml4t/diagnostic/evaluation/autocorrelation.py +531 -0
ml4t/diagnostic/evaluation/barrier_analysis.py +1050 -0
ml4t/diagnostic/evaluation/binary_metrics.py +910 -0
ml4t/diagnostic/evaluation/dashboard.py +715 -0
ml4t/diagnostic/evaluation/diagnostic_plots.py +1037 -0
ml4t/diagnostic/evaluation/distribution/__init__.py +499 -0
ml4t/diagnostic/evaluation/distribution/moments.py +299 -0
ml4t/diagnostic/evaluation/distribution/tails.py +777 -0
ml4t/diagnostic/evaluation/distribution/tests.py +470 -0
ml4t/diagnostic/evaluation/drift/__init__.py +139 -0
ml4t/diagnostic/evaluation/drift/analysis.py +432 -0
ml4t/diagnostic/evaluation/drift/domain_classifier.py +517 -0
ml4t/diagnostic/evaluation/drift/population_stability_index.py +310 -0
ml4t/diagnostic/evaluation/drift/wasserstein.py +388 -0
ml4t/diagnostic/evaluation/event_analysis.py +647 -0
ml4t/diagnostic/evaluation/excursion.py +390 -0
ml4t/diagnostic/evaluation/feature_diagnostics.py +873 -0
ml4t/diagnostic/evaluation/feature_outcome.py +666 -0
ml4t/diagnostic/evaluation/framework.py +935 -0
ml4t/diagnostic/evaluation/metric_registry.py +255 -0
ml4t/diagnostic/evaluation/metrics/AGENT.md +23 -0
ml4t/diagnostic/evaluation/metrics/__init__.py +133 -0
ml4t/diagnostic/evaluation/metrics/basic.py +160 -0
ml4t/diagnostic/evaluation/metrics/conditional_ic.py +469 -0
ml4t/diagnostic/evaluation/metrics/feature_outcome.py +475 -0
ml4t/diagnostic/evaluation/metrics/ic_statistics.py +446 -0
ml4t/diagnostic/evaluation/metrics/importance_analysis.py +338 -0
ml4t/diagnostic/evaluation/metrics/importance_classical.py +375 -0
ml4t/diagnostic/evaluation/metrics/importance_mda.py +371 -0
ml4t/diagnostic/evaluation/metrics/importance_shap.py +715 -0
ml4t/diagnostic/evaluation/metrics/information_coefficient.py +527 -0
ml4t/diagnostic/evaluation/metrics/interactions.py +772 -0
ml4t/diagnostic/evaluation/metrics/monotonicity.py +226 -0
ml4t/diagnostic/evaluation/metrics/risk_adjusted.py +324 -0
ml4t/diagnostic/evaluation/multi_signal.py +550 -0
ml4t/diagnostic/evaluation/portfolio_analysis/__init__.py +83 -0
ml4t/diagnostic/evaluation/portfolio_analysis/analysis.py +734 -0
ml4t/diagnostic/evaluation/portfolio_analysis/metrics.py +589 -0
ml4t/diagnostic/evaluation/portfolio_analysis/results.py +334 -0
ml4t/diagnostic/evaluation/report_generation.py +824 -0
ml4t/diagnostic/evaluation/signal_selector.py +452 -0
ml4t/diagnostic/evaluation/stat_registry.py +139 -0
ml4t/diagnostic/evaluation/stationarity/__init__.py +97 -0
ml4t/diagnostic/evaluation/stationarity/analysis.py +518 -0
ml4t/diagnostic/evaluation/stationarity/augmented_dickey_fuller.py +296 -0
ml4t/diagnostic/evaluation/stationarity/kpss_test.py +308 -0
ml4t/diagnostic/evaluation/stationarity/phillips_perron.py +365 -0
ml4t/diagnostic/evaluation/stats/AGENT.md +43 -0
ml4t/diagnostic/evaluation/stats/__init__.py +191 -0
ml4t/diagnostic/evaluation/stats/backtest_overfitting.py +219 -0
ml4t/diagnostic/evaluation/stats/bootstrap.py +228 -0
ml4t/diagnostic/evaluation/stats/deflated_sharpe_ratio.py +591 -0
ml4t/diagnostic/evaluation/stats/false_discovery_rate.py +295 -0
ml4t/diagnostic/evaluation/stats/hac_standard_errors.py +108 -0
ml4t/diagnostic/evaluation/stats/minimum_track_record.py +408 -0
ml4t/diagnostic/evaluation/stats/moments.py +164 -0
ml4t/diagnostic/evaluation/stats/rademacher_adjustment.py +436 -0
ml4t/diagnostic/evaluation/stats/reality_check.py +155 -0
ml4t/diagnostic/evaluation/stats/sharpe_inference.py +219 -0
ml4t/diagnostic/evaluation/themes.py +330 -0
ml4t/diagnostic/evaluation/threshold_analysis.py +957 -0
ml4t/diagnostic/evaluation/trade_analysis.py +1136 -0
ml4t/diagnostic/evaluation/trade_dashboard/__init__.py +32 -0
ml4t/diagnostic/evaluation/trade_dashboard/app.py +315 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/__init__.py +18 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/csv.py +82 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/html.py +276 -0
ml4t/diagnostic/evaluation/trade_dashboard/io.py +166 -0
ml4t/diagnostic/evaluation/trade_dashboard/normalize.py +304 -0
ml4t/diagnostic/evaluation/trade_dashboard/stats.py +386 -0
ml4t/diagnostic/evaluation/trade_dashboard/style.py +79 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/__init__.py +21 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/patterns.py +354 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/shap_analysis.py +280 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/stat_validation.py +186 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/worst_trades.py +236 -0
ml4t/diagnostic/evaluation/trade_dashboard/types.py +129 -0
ml4t/diagnostic/evaluation/trade_shap/__init__.py +102 -0
ml4t/diagnostic/evaluation/trade_shap/alignment.py +188 -0
ml4t/diagnostic/evaluation/trade_shap/characterize.py +413 -0
ml4t/diagnostic/evaluation/trade_shap/cluster.py +302 -0
ml4t/diagnostic/evaluation/trade_shap/explain.py +208 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/__init__.py +23 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/generator.py +290 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/matcher.py +251 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/templates.yaml +467 -0
ml4t/diagnostic/evaluation/trade_shap/models.py +386 -0
ml4t/diagnostic/evaluation/trade_shap/normalize.py +116 -0
ml4t/diagnostic/evaluation/trade_shap/pipeline.py +263 -0
ml4t/diagnostic/evaluation/trade_shap_dashboard.py +283 -0
ml4t/diagnostic/evaluation/trade_shap_diagnostics.py +588 -0
ml4t/diagnostic/evaluation/validated_cv.py +535 -0
ml4t/diagnostic/evaluation/visualization.py +1050 -0
ml4t/diagnostic/evaluation/volatility/__init__.py +45 -0
ml4t/diagnostic/evaluation/volatility/analysis.py +351 -0
ml4t/diagnostic/evaluation/volatility/arch.py +258 -0
ml4t/diagnostic/evaluation/volatility/garch.py +460 -0
ml4t/diagnostic/integration/__init__.py +48 -0
ml4t/diagnostic/integration/backtest_contract.py +671 -0
ml4t/diagnostic/integration/data_contract.py +316 -0
ml4t/diagnostic/integration/engineer_contract.py +226 -0
ml4t/diagnostic/logging/__init__.py +77 -0
ml4t/diagnostic/logging/logger.py +245 -0
ml4t/diagnostic/logging/performance.py +234 -0
ml4t/diagnostic/logging/progress.py +234 -0
ml4t/diagnostic/logging/wandb.py +412 -0
ml4t/diagnostic/metrics/__init__.py +9 -0
ml4t/diagnostic/metrics/percentiles.py +128 -0
ml4t/diagnostic/py.typed +1 -0
ml4t/diagnostic/reporting/__init__.py +43 -0
ml4t/diagnostic/reporting/base.py +130 -0
ml4t/diagnostic/reporting/html_renderer.py +275 -0
ml4t/diagnostic/reporting/json_renderer.py +51 -0
ml4t/diagnostic/reporting/markdown_renderer.py +117 -0
ml4t/diagnostic/results/AGENT.md +24 -0
ml4t/diagnostic/results/__init__.py +105 -0
ml4t/diagnostic/results/barrier_results/__init__.py +36 -0
ml4t/diagnostic/results/barrier_results/hit_rate.py +304 -0
ml4t/diagnostic/results/barrier_results/precision_recall.py +266 -0
ml4t/diagnostic/results/barrier_results/profit_factor.py +297 -0
ml4t/diagnostic/results/barrier_results/tearsheet.py +397 -0
ml4t/diagnostic/results/barrier_results/time_to_target.py +305 -0
ml4t/diagnostic/results/barrier_results/validation.py +38 -0
ml4t/diagnostic/results/base.py +177 -0
ml4t/diagnostic/results/event_results.py +349 -0
ml4t/diagnostic/results/feature_results.py +787 -0
ml4t/diagnostic/results/multi_signal_results.py +431 -0
ml4t/diagnostic/results/portfolio_results.py +281 -0
ml4t/diagnostic/results/sharpe_results.py +448 -0
ml4t/diagnostic/results/signal_results/__init__.py +74 -0
ml4t/diagnostic/results/signal_results/ic.py +581 -0
ml4t/diagnostic/results/signal_results/irtc.py +110 -0
ml4t/diagnostic/results/signal_results/quantile.py +392 -0
ml4t/diagnostic/results/signal_results/tearsheet.py +456 -0
ml4t/diagnostic/results/signal_results/turnover.py +213 -0
ml4t/diagnostic/results/signal_results/validation.py +147 -0
ml4t/diagnostic/signal/AGENT.md +17 -0
ml4t/diagnostic/signal/__init__.py +69 -0
ml4t/diagnostic/signal/_report.py +152 -0
ml4t/diagnostic/signal/_utils.py +261 -0
ml4t/diagnostic/signal/core.py +275 -0
ml4t/diagnostic/signal/quantile.py +148 -0
ml4t/diagnostic/signal/result.py +214 -0
ml4t/diagnostic/signal/signal_ic.py +129 -0
ml4t/diagnostic/signal/turnover.py +182 -0
ml4t/diagnostic/splitters/AGENT.md +19 -0
ml4t/diagnostic/splitters/__init__.py +36 -0
ml4t/diagnostic/splitters/base.py +501 -0
ml4t/diagnostic/splitters/calendar.py +421 -0
ml4t/diagnostic/splitters/calendar_config.py +91 -0
ml4t/diagnostic/splitters/combinatorial.py +1064 -0
ml4t/diagnostic/splitters/config.py +322 -0
ml4t/diagnostic/splitters/cpcv/__init__.py +57 -0
ml4t/diagnostic/splitters/cpcv/combinations.py +119 -0
ml4t/diagnostic/splitters/cpcv/partitioning.py +263 -0
ml4t/diagnostic/splitters/cpcv/purge_engine.py +379 -0
ml4t/diagnostic/splitters/cpcv/windows.py +190 -0
ml4t/diagnostic/splitters/group_isolation.py +329 -0
ml4t/diagnostic/splitters/persistence.py +316 -0
ml4t/diagnostic/splitters/utils.py +207 -0
ml4t/diagnostic/splitters/walk_forward.py +757 -0
ml4t/diagnostic/utils/__init__.py +42 -0
ml4t/diagnostic/utils/config.py +542 -0
ml4t/diagnostic/utils/dependencies.py +318 -0
ml4t/diagnostic/utils/sessions.py +127 -0
ml4t/diagnostic/validation/__init__.py +54 -0
ml4t/diagnostic/validation/dataframe.py +274 -0
ml4t/diagnostic/validation/returns.py +280 -0
ml4t/diagnostic/validation/timeseries.py +299 -0
ml4t/diagnostic/visualization/AGENT.md +19 -0
ml4t/diagnostic/visualization/__init__.py +223 -0
ml4t/diagnostic/visualization/backtest/__init__.py +98 -0
ml4t/diagnostic/visualization/backtest/cost_attribution.py +762 -0
ml4t/diagnostic/visualization/backtest/executive_summary.py +895 -0
ml4t/diagnostic/visualization/backtest/interactive_controls.py +673 -0
ml4t/diagnostic/visualization/backtest/statistical_validity.py +874 -0
ml4t/diagnostic/visualization/backtest/tearsheet.py +565 -0
ml4t/diagnostic/visualization/backtest/template_system.py +373 -0
ml4t/diagnostic/visualization/backtest/trade_plots.py +1172 -0
ml4t/diagnostic/visualization/barrier_plots.py +782 -0
ml4t/diagnostic/visualization/core.py +1060 -0
ml4t/diagnostic/visualization/dashboards/__init__.py +36 -0
ml4t/diagnostic/visualization/dashboards/base.py +582 -0
ml4t/diagnostic/visualization/dashboards/importance.py +801 -0
ml4t/diagnostic/visualization/dashboards/interaction.py +263 -0
ml4t/diagnostic/visualization/dashboards.py +43 -0
ml4t/diagnostic/visualization/data_extraction/__init__.py +48 -0
ml4t/diagnostic/visualization/data_extraction/importance.py +649 -0
ml4t/diagnostic/visualization/data_extraction/interaction.py +504 -0
ml4t/diagnostic/visualization/data_extraction/types.py +113 -0
ml4t/diagnostic/visualization/data_extraction/validation.py +66 -0
ml4t/diagnostic/visualization/feature_plots.py +888 -0
ml4t/diagnostic/visualization/interaction_plots.py +618 -0
ml4t/diagnostic/visualization/portfolio/__init__.py +41 -0
ml4t/diagnostic/visualization/portfolio/dashboard.py +514 -0
ml4t/diagnostic/visualization/portfolio/drawdown_plots.py +341 -0
ml4t/diagnostic/visualization/portfolio/returns_plots.py +487 -0
ml4t/diagnostic/visualization/portfolio/risk_plots.py +301 -0
ml4t/diagnostic/visualization/report_generation.py +1343 -0
ml4t/diagnostic/visualization/signal/__init__.py +103 -0
ml4t/diagnostic/visualization/signal/dashboard.py +911 -0
ml4t/diagnostic/visualization/signal/event_plots.py +514 -0
ml4t/diagnostic/visualization/signal/ic_plots.py +635 -0
ml4t/diagnostic/visualization/signal/multi_signal_dashboard.py +974 -0
ml4t/diagnostic/visualization/signal/multi_signal_plots.py +603 -0
ml4t/diagnostic/visualization/signal/quantile_plots.py +625 -0
ml4t/diagnostic/visualization/signal/turnover_plots.py +400 -0
ml4t/diagnostic/visualization/trade_shap/__init__.py +90 -0
ml4t_diagnostic-0.1.0a1.dist-info/METADATA +1044 -0
ml4t_diagnostic-0.1.0a1.dist-info/RECORD +242 -0
ml4t_diagnostic-0.1.0a1.dist-info/WHEEL +4 -0
ml4t_diagnostic-0.1.0a1.dist-info/licenses/LICENSE +21 -0

ml4t/diagnostic/utils/__init__.py ADDED Viewed

@@ -0,0 +1,42 @@
+"""Utility functions for ml4t-diagnostic.
+This module contains helper functions, configuration loaders, and other
+utilities used throughout the library.
+"""
+from ml4t.diagnostic.utils.config import (
+    ConfigError,
+    EvaluationConfig,
+    create_example_config,
+    load_config,
+)
+from ml4t.diagnostic.utils.dependencies import (
+    DEPS,
+    DependencyInfo,
+    OptionalDependencies,
+    check_dependency,
+    get_dependency_summary,
+    require_dependency,
+    warn_if_missing,
+)
+from ml4t.diagnostic.utils.sessions import (
+    assign_session_dates,
+    get_complete_sessions,
+)
+__all__: list[str] = [
+    "ConfigError",
+    "EvaluationConfig",
+    "create_example_config",
+    "load_config",
+    "assign_session_dates",
+    "get_complete_sessions",
+    # Dependency checking
+    "DEPS",
+    "DependencyInfo",
+    "OptionalDependencies",
+    "check_dependency",
+    "require_dependency",
+    "warn_if_missing",
+    "get_dependency_summary",
+]

ml4t/diagnostic/utils/config.py ADDED Viewed

@@ -0,0 +1,542 @@
+"""Configuration management for ml4t-diagnostic with Pydantic schema validation.
+This module provides YAML-based configuration loading and validation
+for evaluation workflows, allowing users to define complex evaluation
+pipelines in configuration files with comprehensive validation.
+"""
+import os
+from pathlib import Path
+from typing import Any, Literal, cast
+import yaml
+from pydantic import BaseModel, Field, field_validator, model_validator
+class ConfigError(Exception):
+    """Raised when configuration is invalid."""
+class SplitterConfig(BaseModel):
+    """Configuration schema for cross-validation splitters."""
+    type: Literal["PurgedWalkForwardCV", "CombinatorialPurgedCV"] = Field(
+        description="Type of cross-validation splitter",
+    )
+    params: dict[str, Any] = Field(
+        default_factory=dict,
+        description="Parameters for the splitter",
+    )
+    @field_validator("params")
+    @classmethod
+    def validate_splitter_params(cls, v: dict[str, Any], info) -> dict[str, Any]:
+        """Validate splitter-specific parameters."""
+        splitter_type = info.data.get("type")
+        if splitter_type == "PurgedWalkForwardCV":
+            # Validate walk-forward specific parameters
+            if "n_splits" in v and (v["n_splits"] < 2 or v["n_splits"] > 50):
+                raise ValueError("n_splits must be between 2 and 50")
+            if "test_size" in v and (v["test_size"] <= 0 or v["test_size"] >= 1):
+                raise ValueError("test_size must be between 0 and 1")
+        elif splitter_type == "CombinatorialPurgedCV":
+            # Validate combinatorial specific parameters
+            if "n_groups" in v and (v["n_groups"] < 2 or v["n_groups"] > 20):
+                raise ValueError("n_groups must be between 2 and 20")
+        return v
+class DataConfig(BaseModel):
+    """Configuration schema for data handling parameters."""
+    label_horizon: int = Field(
+        ge=0,
+        le=252,
+        default=20,
+        description="Forward-looking period of labels (in periods)",
+    )
+    embargo_pct: float = Field(
+        ge=0.0,
+        le=1.0,
+        default=0.01,
+        description="Embargo percentage to prevent leakage",
+    )
+    min_samples_per_fold: int = Field(
+        ge=10,
+        le=10000,
+        default=100,
+        description="Minimum number of samples required per fold",
+    )
+class VisualizationConfig(BaseModel):
+    """Configuration schema for visualization settings."""
+    theme: Literal["default", "dark", "light"] = Field(
+        default="default",
+        description="Visualization theme",
+    )
+    export_format: Literal["html", "png", "pdf", "svg"] = Field(
+        default="html",
+        description="Export format for visualizations",
+    )
+    include_dashboard: bool = Field(
+        default=True,
+        description="Whether to include interactive dashboard",
+    )
+class LoggingConfig(BaseModel):
+    """Configuration schema for logging settings."""
+    level: Literal["DEBUG", "INFO", "WARNING", "ERROR"] = Field(
+        default="INFO",
+        description="Logging level",
+    )
+    use_wandb: bool = Field(
+        default=False,
+        description="Whether to use Weights & Biases logging",
+    )
+    wandb_project: str | None = Field(default=None, description="W&B project name")
+    wandb_entity: str | None = Field(default=None, description="W&B entity name")
+    @model_validator(mode="after")
+    def validate_wandb_config(self):
+        """Validate W&B configuration consistency."""
+        if self.use_wandb and not self.wandb_project:
+            raise ValueError("wandb_project is required when use_wandb=True")
+        return self
+class EvaluatorConfig(BaseModel):
+    """Configuration schema for the main Evaluator class."""
+    tier: int = Field(
+        ge=1,
+        le=3,
+        default=2,
+        description="Validation tier level (1=rigorous, 2=standard, 3=fast)",
+    )
+    confidence_level: float = Field(
+        gt=0.0,
+        lt=1.0,
+        default=0.05,
+        description="Significance level for statistical tests",
+    )
+    bootstrap_samples: int = Field(
+        ge=100,
+        le=10000,
+        default=1000,
+        description="Number of bootstrap samples for confidence intervals",
+    )
+    random_state: int | None = Field(
+        ge=0,
+        le=2**31 - 1,
+        default=None,
+        description="Random seed for reproducible results",
+    )
+    n_jobs: int = Field(
+        ge=-1,
+        le=128,
+        default=1,
+        description="Number of parallel jobs (-1 for all cores)",
+    )
+class QEvalConfig(BaseModel):
+    """Complete configuration schema for ml4t-diagnostic evaluation workflows."""
+    evaluation: EvaluatorConfig = Field(
+        default_factory=EvaluatorConfig,
+        description="Main evaluator configuration",
+    )
+    splitter: SplitterConfig = Field(
+        description="Cross-validation splitter configuration",
+    )
+    metrics: list[Literal["ic", "sharpe", "sortino", "max_drawdown", "hit_rate"]] = Field(
+        default=["ic", "sharpe", "hit_rate"],
+        min_length=1,
+        max_length=10,
+        description="List of metrics to compute",
+    )
+    statistical_tests: dict[Literal["tier_1", "tier_2", "tier_3"], list[str]] = Field(
+        default={"tier_1": ["dsr", "fdr"], "tier_2": ["hac_ic"], "tier_3": []},
+        description="Statistical tests by tier",
+    )
+    data: DataConfig = Field(
+        default_factory=DataConfig,
+        description="Data handling configuration",
+    )
+    visualization: VisualizationConfig = Field(
+        default_factory=VisualizationConfig,
+        description="Visualization settings",
+    )
+    logging: LoggingConfig = Field(
+        default_factory=LoggingConfig,
+        description="Logging configuration",
+    )
+    @field_validator("metrics")
+    @classmethod
+    def validate_metrics_non_empty(cls, v: list[str]) -> list[str]:
+        """Ensure at least one metric is specified."""
+        if not v:
+            raise ValueError("At least one metric must be specified")
+        return v
+    @model_validator(mode="after")
+    def validate_tier_consistency(self):
+        """Validate configuration consistency across tiers."""
+        tier = self.evaluation.tier
+        # Tier 1 should use CombinatorialPurgedCV for maximum rigor
+        if tier == 1 and self.splitter.type != "CombinatorialPurgedCV":
+            raise ValueError(
+                "Tier 1 evaluation should use CombinatorialPurgedCV for maximum rigor",
+            )
+        # Tier 3 should have minimal statistical tests
+        if tier == 3 and len(self.statistical_tests.get("tier_3", [])) > 2:
+            raise ValueError(
+                "Tier 3 is designed for fast screening - limit statistical tests",
+            )
+        return self
+class EvaluationConfigManager:
+    """Enhanced configuration manager with Pydantic validation.
+    This class loads and validates YAML configuration files
+    for ml4t-diagnostic evaluation pipelines using Pydantic schemas.
+    """
+    def __init__(self, config_path: str | Path | None = None):
+        """Initialize configuration manager.
+        Parameters
+        ----------
+        config_path : str or Path, optional
+            Path to YAML configuration file. If None, uses defaults.
+        """
+        # Start with default configuration
+        default_config = self._create_default_config()
+        if config_path is not None:
+            # Load and merge user configuration
+            user_config = self._load_from_yaml(config_path)
+            self.config = self._merge_configs(default_config, user_config)
+        else:
+            self.config = default_config
+    def _create_default_config(self) -> QEvalConfig:
+        """Create default configuration with all required fields."""
+        return QEvalConfig(
+            splitter=SplitterConfig(
+                type="PurgedWalkForwardCV",
+                params={
+                    "n_splits": 5,
+                    "test_size": 0.2,
+                    "gap": 0,
+                    "expanding": True,
+                },
+            ),
+        )
+    def _load_from_yaml(self, config_path: str | Path) -> dict[str, Any]:
+        """Load configuration from YAML file with validation.
+        Parameters
+        ----------
+        config_path : str or Path
+            Path to YAML configuration file
+        Returns:
+        -------
+        dict
+            Raw configuration dictionary
+        Raises:
+        ------
+        ConfigError
+            If file cannot be loaded or contains invalid YAML
+        """
+        config_path = Path(config_path)
+        if not config_path.exists():
+            raise ConfigError(f"Configuration file not found: {config_path}")
+        try:
+            with open(config_path) as f:
+                user_config = yaml.safe_load(f)
+        except yaml.YAMLError as e:
+            raise ConfigError(f"Invalid YAML in {config_path}: {e}") from e
+        if user_config is None:
+            user_config = {}
+        return user_config
+    def _merge_configs(
+        self,
+        base_config: QEvalConfig,
+        user_config: dict[str, Any],
+    ) -> QEvalConfig:
+        """Merge user configuration with base configuration using Pydantic validation.
+        Parameters
+        ----------
+        base_config : QEvalConfig
+            Base configuration schema
+        user_config : dict
+            User configuration from YAML
+        Returns:
+        -------
+        QEvalConfig
+            Validated and merged configuration
+        Raises:
+        ------
+        ConfigError
+            If user configuration is invalid
+        """
+        try:
+            # Convert base config to dict for merging
+            base_dict = base_config.model_dump()
+            # Recursively merge dictionaries
+            merged_dict = self._deep_merge_dicts(base_dict, user_config)
+            # Validate merged configuration with Pydantic
+            return QEvalConfig.model_validate(merged_dict)
+        except Exception as e:
+            raise ConfigError(f"Configuration validation failed: {e}") from e
+    def _deep_merge_dicts(
+        self,
+        base: dict[str, Any],
+        override: dict[str, Any],
+    ) -> dict[str, Any]:
+        """Recursively merge two dictionaries."""
+        merged = base.copy()
+        for key, value in override.items():
+            if key in merged and isinstance(merged[key], dict) and isinstance(value, dict):
+                merged[key] = self._deep_merge_dicts(merged[key], value)
+            else:
+                merged[key] = value
+        return merged
+    def get(self, key: str, default: Any = None) -> Any:
+        """Get configuration value by dot-separated key path.
+        Parameters
+        ----------
+        key : str
+            Dot-separated key path (e.g., 'evaluation.tier')
+        default : Any, optional
+            Default value if key not found
+        Returns:
+        -------
+        Any
+            Configuration value
+        """
+        keys = key.split(".")
+        value = self.config.model_dump()
+        try:
+            for k in keys:
+                value = value[k]
+            return value
+        except (KeyError, TypeError):
+            return default
+    def validate(self) -> None:
+        """Validate the current configuration.
+        This method is automatically called during initialization,
+        but can be used to re-validate after manual modifications.
+        Raises:
+        ------
+        ConfigError
+            If configuration is invalid
+        """
+        try:
+            # Pydantic validation happens automatically during model creation
+            # This method is kept for API compatibility
+            self.config.model_validate(self.config.model_dump())
+        except Exception as e:
+            raise ConfigError(f"Configuration validation failed: {e}") from e
+    def save_to_yaml(self, config_path: str | Path) -> None:
+        """Save current configuration to YAML file.
+        Parameters
+        ----------
+        config_path : str or Path
+            Path where to save the configuration
+        """
+        config_path = Path(config_path)
+        try:
+            with open(config_path, "w") as f:
+                # Convert Pydantic model to dict and save as YAML
+                config_dict = self.config.model_dump(exclude_none=True)
+                yaml.dump(config_dict, f, default_flow_style=False, sort_keys=False)
+        except OSError as e:
+            raise ConfigError(f"Cannot write to {config_path}: {e}") from e
+    def create_evaluator(self) -> Any:
+        """Create Evaluator instance from configuration.
+        Returns:
+        -------
+        ml4t-diagnostic.Evaluator
+            Configured evaluator instance
+        """
+        from ml4t.diagnostic.evaluation.framework import Evaluator
+        from ml4t.diagnostic.splitters import CombinatorialPurgedCV, PurgedWalkForwardCV
+        # Create splitter
+        splitter_type = self.config.splitter.type
+        splitter_params = self.config.splitter.params.copy()
+        # Add data-specific parameters
+        if "label_horizon" not in splitter_params:
+            splitter_params["label_horizon"] = self.config.data.label_horizon
+        if "embargo_pct" not in splitter_params:
+            splitter_params["embargo_pct"] = self.config.data.embargo_pct
+        if splitter_type == "PurgedWalkForwardCV":
+            splitter = PurgedWalkForwardCV(**splitter_params)
+        else:  # CombinatorialPurgedCV
+            splitter = CombinatorialPurgedCV(**splitter_params)
+        # Get tier-specific configuration
+        tier = self.config.evaluation.tier
+        tier_key = cast(Literal["tier_1", "tier_2", "tier_3"], f"tier_{tier}")
+        statistical_tests = self.config.statistical_tests[tier_key]
+        # Create evaluator
+        evaluator = Evaluator(
+            splitter=splitter,
+            metrics=list(self.config.metrics) if self.config.metrics else None,
+            statistical_tests=statistical_tests,
+            tier=tier,
+            confidence_level=self.config.evaluation.confidence_level,
+            bootstrap_samples=self.config.evaluation.bootstrap_samples,
+            random_state=self.config.evaluation.random_state,
+            n_jobs=self.config.evaluation.n_jobs,
+        )
+        return evaluator
+    def __repr__(self) -> str:
+        """String representation of the configuration."""
+        return f"EvaluationConfigManager(tier={self.config.evaluation.tier}, metrics={self.config.metrics})"
+# Backward compatibility alias
+EvaluationConfig = EvaluationConfigManager
+def load_config(
+    config_path: str | Path | None = None,
+) -> EvaluationConfigManager:
+    """Load configuration from file or environment.
+    Parameters
+    ----------
+    config_path : str or Path, optional
+        Path to configuration file. If None, checks QEVAL_CONFIG
+        environment variable, then looks for ml4t-diagnostic.yaml in current
+        directory.
+    Returns:
+    -------
+    EvaluationConfigManager
+        Loaded configuration
+    """
+    if config_path is None:
+        # Check environment variable
+        config_path = os.environ.get("QEVAL_CONFIG")
+        if config_path is None:
+            # Check current directory
+            default_path = Path("mlquant.evaluation.yaml")
+            if default_path.exists():
+                config_path = default_path
+    return EvaluationConfigManager(config_path)
+# Example configuration template
+EXAMPLE_CONFIG = """# ml4t-diagnostic Configuration File
+# =======================
+evaluation:
+  tier: 2                    # Validation tier (1, 2, or 3)
+  confidence_level: 0.05     # Significance level for tests
+  bootstrap_samples: 1000    # Number of bootstrap samples
+  random_state: 42          # Random seed for reproducibility
+  n_jobs: 1                 # Number of parallel jobs
+splitter:
+  type: PurgedWalkForwardCV  # or CombinatorialPurgedCV
+  params:
+    n_splits: 5
+    test_size: 0.2
+    gap: 0
+    expanding: true
+metrics:
+  - ic
+  - sharpe
+  - hit_rate
+  - max_drawdown
+statistical_tests:
+  tier_1:
+    - dsr
+    - fdr
+  tier_2:
+    - hac_ic
+  tier_3: []
+data:
+  label_horizon: 20          # Forward-looking period for labels
+  embargo_pct: 0.01         # Embargo as percentage of data
+  min_samples_per_fold: 100  # Minimum samples per CV fold
+visualization:
+  theme: default            # Visualization theme
+  export_format: html       # Output format (html, png, svg)
+  include_dashboard: true   # Generate full dashboard
+logging:
+  level: INFO
+  use_wandb: false
+  wandb_project: null
+  wandb_entity: null
+"""
+def create_example_config(output_path: str | Path = "mlquant.evaluation.yaml") -> None:
+    """Create an example configuration file.
+    Parameters
+    ----------
+    output_path : str or Path
+        Path for example configuration file
+    """
+    with open(output_path, "w") as f:
+        f.write(EXAMPLE_CONFIG)
+    print(f"Example configuration created at: {output_path}")