PyPI - ml4t-diagnostic - Versions diffs - 0.1.0a1__py3-none-any.whl - Mend

ml4t-diagnostic 0.1.0a1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

ml4t/diagnostic/AGENT.md +25 -0
ml4t/diagnostic/__init__.py +166 -0
ml4t/diagnostic/backends/__init__.py +10 -0
ml4t/diagnostic/backends/adapter.py +192 -0
ml4t/diagnostic/backends/polars_backend.py +899 -0
ml4t/diagnostic/caching/__init__.py +40 -0
ml4t/diagnostic/caching/cache.py +331 -0
ml4t/diagnostic/caching/decorators.py +131 -0
ml4t/diagnostic/caching/smart_cache.py +339 -0
ml4t/diagnostic/config/AGENT.md +24 -0
ml4t/diagnostic/config/README.md +267 -0
ml4t/diagnostic/config/__init__.py +219 -0
ml4t/diagnostic/config/barrier_config.py +277 -0
ml4t/diagnostic/config/base.py +301 -0
ml4t/diagnostic/config/event_config.py +148 -0
ml4t/diagnostic/config/feature_config.py +404 -0
ml4t/diagnostic/config/multi_signal_config.py +55 -0
ml4t/diagnostic/config/portfolio_config.py +215 -0
ml4t/diagnostic/config/report_config.py +391 -0
ml4t/diagnostic/config/sharpe_config.py +202 -0
ml4t/diagnostic/config/signal_config.py +206 -0
ml4t/diagnostic/config/trade_analysis_config.py +310 -0
ml4t/diagnostic/config/validation.py +279 -0
ml4t/diagnostic/core/__init__.py +29 -0
ml4t/diagnostic/core/numba_utils.py +315 -0
ml4t/diagnostic/core/purging.py +372 -0
ml4t/diagnostic/core/sampling.py +471 -0
ml4t/diagnostic/errors/__init__.py +205 -0
ml4t/diagnostic/evaluation/AGENT.md +26 -0
ml4t/diagnostic/evaluation/__init__.py +437 -0
ml4t/diagnostic/evaluation/autocorrelation.py +531 -0
ml4t/diagnostic/evaluation/barrier_analysis.py +1050 -0
ml4t/diagnostic/evaluation/binary_metrics.py +910 -0
ml4t/diagnostic/evaluation/dashboard.py +715 -0
ml4t/diagnostic/evaluation/diagnostic_plots.py +1037 -0
ml4t/diagnostic/evaluation/distribution/__init__.py +499 -0
ml4t/diagnostic/evaluation/distribution/moments.py +299 -0
ml4t/diagnostic/evaluation/distribution/tails.py +777 -0
ml4t/diagnostic/evaluation/distribution/tests.py +470 -0
ml4t/diagnostic/evaluation/drift/__init__.py +139 -0
ml4t/diagnostic/evaluation/drift/analysis.py +432 -0
ml4t/diagnostic/evaluation/drift/domain_classifier.py +517 -0
ml4t/diagnostic/evaluation/drift/population_stability_index.py +310 -0
ml4t/diagnostic/evaluation/drift/wasserstein.py +388 -0
ml4t/diagnostic/evaluation/event_analysis.py +647 -0
ml4t/diagnostic/evaluation/excursion.py +390 -0
ml4t/diagnostic/evaluation/feature_diagnostics.py +873 -0
ml4t/diagnostic/evaluation/feature_outcome.py +666 -0
ml4t/diagnostic/evaluation/framework.py +935 -0
ml4t/diagnostic/evaluation/metric_registry.py +255 -0
ml4t/diagnostic/evaluation/metrics/AGENT.md +23 -0
ml4t/diagnostic/evaluation/metrics/__init__.py +133 -0
ml4t/diagnostic/evaluation/metrics/basic.py +160 -0
ml4t/diagnostic/evaluation/metrics/conditional_ic.py +469 -0
ml4t/diagnostic/evaluation/metrics/feature_outcome.py +475 -0
ml4t/diagnostic/evaluation/metrics/ic_statistics.py +446 -0
ml4t/diagnostic/evaluation/metrics/importance_analysis.py +338 -0
ml4t/diagnostic/evaluation/metrics/importance_classical.py +375 -0
ml4t/diagnostic/evaluation/metrics/importance_mda.py +371 -0
ml4t/diagnostic/evaluation/metrics/importance_shap.py +715 -0
ml4t/diagnostic/evaluation/metrics/information_coefficient.py +527 -0
ml4t/diagnostic/evaluation/metrics/interactions.py +772 -0
ml4t/diagnostic/evaluation/metrics/monotonicity.py +226 -0
ml4t/diagnostic/evaluation/metrics/risk_adjusted.py +324 -0
ml4t/diagnostic/evaluation/multi_signal.py +550 -0
ml4t/diagnostic/evaluation/portfolio_analysis/__init__.py +83 -0
ml4t/diagnostic/evaluation/portfolio_analysis/analysis.py +734 -0
ml4t/diagnostic/evaluation/portfolio_analysis/metrics.py +589 -0
ml4t/diagnostic/evaluation/portfolio_analysis/results.py +334 -0
ml4t/diagnostic/evaluation/report_generation.py +824 -0
ml4t/diagnostic/evaluation/signal_selector.py +452 -0
ml4t/diagnostic/evaluation/stat_registry.py +139 -0
ml4t/diagnostic/evaluation/stationarity/__init__.py +97 -0
ml4t/diagnostic/evaluation/stationarity/analysis.py +518 -0
ml4t/diagnostic/evaluation/stationarity/augmented_dickey_fuller.py +296 -0
ml4t/diagnostic/evaluation/stationarity/kpss_test.py +308 -0
ml4t/diagnostic/evaluation/stationarity/phillips_perron.py +365 -0
ml4t/diagnostic/evaluation/stats/AGENT.md +43 -0
ml4t/diagnostic/evaluation/stats/__init__.py +191 -0
ml4t/diagnostic/evaluation/stats/backtest_overfitting.py +219 -0
ml4t/diagnostic/evaluation/stats/bootstrap.py +228 -0
ml4t/diagnostic/evaluation/stats/deflated_sharpe_ratio.py +591 -0
ml4t/diagnostic/evaluation/stats/false_discovery_rate.py +295 -0
ml4t/diagnostic/evaluation/stats/hac_standard_errors.py +108 -0
ml4t/diagnostic/evaluation/stats/minimum_track_record.py +408 -0
ml4t/diagnostic/evaluation/stats/moments.py +164 -0
ml4t/diagnostic/evaluation/stats/rademacher_adjustment.py +436 -0
ml4t/diagnostic/evaluation/stats/reality_check.py +155 -0
ml4t/diagnostic/evaluation/stats/sharpe_inference.py +219 -0
ml4t/diagnostic/evaluation/themes.py +330 -0
ml4t/diagnostic/evaluation/threshold_analysis.py +957 -0
ml4t/diagnostic/evaluation/trade_analysis.py +1136 -0
ml4t/diagnostic/evaluation/trade_dashboard/__init__.py +32 -0
ml4t/diagnostic/evaluation/trade_dashboard/app.py +315 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/__init__.py +18 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/csv.py +82 -0
ml4t/diagnostic/evaluation/trade_dashboard/export/html.py +276 -0
ml4t/diagnostic/evaluation/trade_dashboard/io.py +166 -0
ml4t/diagnostic/evaluation/trade_dashboard/normalize.py +304 -0
ml4t/diagnostic/evaluation/trade_dashboard/stats.py +386 -0
ml4t/diagnostic/evaluation/trade_dashboard/style.py +79 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/__init__.py +21 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/patterns.py +354 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/shap_analysis.py +280 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/stat_validation.py +186 -0
ml4t/diagnostic/evaluation/trade_dashboard/tabs/worst_trades.py +236 -0
ml4t/diagnostic/evaluation/trade_dashboard/types.py +129 -0
ml4t/diagnostic/evaluation/trade_shap/__init__.py +102 -0
ml4t/diagnostic/evaluation/trade_shap/alignment.py +188 -0
ml4t/diagnostic/evaluation/trade_shap/characterize.py +413 -0
ml4t/diagnostic/evaluation/trade_shap/cluster.py +302 -0
ml4t/diagnostic/evaluation/trade_shap/explain.py +208 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/__init__.py +23 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/generator.py +290 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/matcher.py +251 -0
ml4t/diagnostic/evaluation/trade_shap/hypotheses/templates.yaml +467 -0
ml4t/diagnostic/evaluation/trade_shap/models.py +386 -0
ml4t/diagnostic/evaluation/trade_shap/normalize.py +116 -0
ml4t/diagnostic/evaluation/trade_shap/pipeline.py +263 -0
ml4t/diagnostic/evaluation/trade_shap_dashboard.py +283 -0
ml4t/diagnostic/evaluation/trade_shap_diagnostics.py +588 -0
ml4t/diagnostic/evaluation/validated_cv.py +535 -0
ml4t/diagnostic/evaluation/visualization.py +1050 -0
ml4t/diagnostic/evaluation/volatility/__init__.py +45 -0
ml4t/diagnostic/evaluation/volatility/analysis.py +351 -0
ml4t/diagnostic/evaluation/volatility/arch.py +258 -0
ml4t/diagnostic/evaluation/volatility/garch.py +460 -0
ml4t/diagnostic/integration/__init__.py +48 -0
ml4t/diagnostic/integration/backtest_contract.py +671 -0
ml4t/diagnostic/integration/data_contract.py +316 -0
ml4t/diagnostic/integration/engineer_contract.py +226 -0
ml4t/diagnostic/logging/__init__.py +77 -0
ml4t/diagnostic/logging/logger.py +245 -0
ml4t/diagnostic/logging/performance.py +234 -0
ml4t/diagnostic/logging/progress.py +234 -0
ml4t/diagnostic/logging/wandb.py +412 -0
ml4t/diagnostic/metrics/__init__.py +9 -0
ml4t/diagnostic/metrics/percentiles.py +128 -0
ml4t/diagnostic/py.typed +1 -0
ml4t/diagnostic/reporting/__init__.py +43 -0
ml4t/diagnostic/reporting/base.py +130 -0
ml4t/diagnostic/reporting/html_renderer.py +275 -0
ml4t/diagnostic/reporting/json_renderer.py +51 -0
ml4t/diagnostic/reporting/markdown_renderer.py +117 -0
ml4t/diagnostic/results/AGENT.md +24 -0
ml4t/diagnostic/results/__init__.py +105 -0
ml4t/diagnostic/results/barrier_results/__init__.py +36 -0
ml4t/diagnostic/results/barrier_results/hit_rate.py +304 -0
ml4t/diagnostic/results/barrier_results/precision_recall.py +266 -0
ml4t/diagnostic/results/barrier_results/profit_factor.py +297 -0
ml4t/diagnostic/results/barrier_results/tearsheet.py +397 -0
ml4t/diagnostic/results/barrier_results/time_to_target.py +305 -0
ml4t/diagnostic/results/barrier_results/validation.py +38 -0
ml4t/diagnostic/results/base.py +177 -0
ml4t/diagnostic/results/event_results.py +349 -0
ml4t/diagnostic/results/feature_results.py +787 -0
ml4t/diagnostic/results/multi_signal_results.py +431 -0
ml4t/diagnostic/results/portfolio_results.py +281 -0
ml4t/diagnostic/results/sharpe_results.py +448 -0
ml4t/diagnostic/results/signal_results/__init__.py +74 -0
ml4t/diagnostic/results/signal_results/ic.py +581 -0
ml4t/diagnostic/results/signal_results/irtc.py +110 -0
ml4t/diagnostic/results/signal_results/quantile.py +392 -0
ml4t/diagnostic/results/signal_results/tearsheet.py +456 -0
ml4t/diagnostic/results/signal_results/turnover.py +213 -0
ml4t/diagnostic/results/signal_results/validation.py +147 -0
ml4t/diagnostic/signal/AGENT.md +17 -0
ml4t/diagnostic/signal/__init__.py +69 -0
ml4t/diagnostic/signal/_report.py +152 -0
ml4t/diagnostic/signal/_utils.py +261 -0
ml4t/diagnostic/signal/core.py +275 -0
ml4t/diagnostic/signal/quantile.py +148 -0
ml4t/diagnostic/signal/result.py +214 -0
ml4t/diagnostic/signal/signal_ic.py +129 -0
ml4t/diagnostic/signal/turnover.py +182 -0
ml4t/diagnostic/splitters/AGENT.md +19 -0
ml4t/diagnostic/splitters/__init__.py +36 -0
ml4t/diagnostic/splitters/base.py +501 -0
ml4t/diagnostic/splitters/calendar.py +421 -0
ml4t/diagnostic/splitters/calendar_config.py +91 -0
ml4t/diagnostic/splitters/combinatorial.py +1064 -0
ml4t/diagnostic/splitters/config.py +322 -0
ml4t/diagnostic/splitters/cpcv/__init__.py +57 -0
ml4t/diagnostic/splitters/cpcv/combinations.py +119 -0
ml4t/diagnostic/splitters/cpcv/partitioning.py +263 -0
ml4t/diagnostic/splitters/cpcv/purge_engine.py +379 -0
ml4t/diagnostic/splitters/cpcv/windows.py +190 -0
ml4t/diagnostic/splitters/group_isolation.py +329 -0
ml4t/diagnostic/splitters/persistence.py +316 -0
ml4t/diagnostic/splitters/utils.py +207 -0
ml4t/diagnostic/splitters/walk_forward.py +757 -0
ml4t/diagnostic/utils/__init__.py +42 -0
ml4t/diagnostic/utils/config.py +542 -0
ml4t/diagnostic/utils/dependencies.py +318 -0
ml4t/diagnostic/utils/sessions.py +127 -0
ml4t/diagnostic/validation/__init__.py +54 -0
ml4t/diagnostic/validation/dataframe.py +274 -0
ml4t/diagnostic/validation/returns.py +280 -0
ml4t/diagnostic/validation/timeseries.py +299 -0
ml4t/diagnostic/visualization/AGENT.md +19 -0
ml4t/diagnostic/visualization/__init__.py +223 -0
ml4t/diagnostic/visualization/backtest/__init__.py +98 -0
ml4t/diagnostic/visualization/backtest/cost_attribution.py +762 -0
ml4t/diagnostic/visualization/backtest/executive_summary.py +895 -0
ml4t/diagnostic/visualization/backtest/interactive_controls.py +673 -0
ml4t/diagnostic/visualization/backtest/statistical_validity.py +874 -0
ml4t/diagnostic/visualization/backtest/tearsheet.py +565 -0
ml4t/diagnostic/visualization/backtest/template_system.py +373 -0
ml4t/diagnostic/visualization/backtest/trade_plots.py +1172 -0
ml4t/diagnostic/visualization/barrier_plots.py +782 -0
ml4t/diagnostic/visualization/core.py +1060 -0
ml4t/diagnostic/visualization/dashboards/__init__.py +36 -0
ml4t/diagnostic/visualization/dashboards/base.py +582 -0
ml4t/diagnostic/visualization/dashboards/importance.py +801 -0
ml4t/diagnostic/visualization/dashboards/interaction.py +263 -0
ml4t/diagnostic/visualization/dashboards.py +43 -0
ml4t/diagnostic/visualization/data_extraction/__init__.py +48 -0
ml4t/diagnostic/visualization/data_extraction/importance.py +649 -0
ml4t/diagnostic/visualization/data_extraction/interaction.py +504 -0
ml4t/diagnostic/visualization/data_extraction/types.py +113 -0
ml4t/diagnostic/visualization/data_extraction/validation.py +66 -0
ml4t/diagnostic/visualization/feature_plots.py +888 -0
ml4t/diagnostic/visualization/interaction_plots.py +618 -0
ml4t/diagnostic/visualization/portfolio/__init__.py +41 -0
ml4t/diagnostic/visualization/portfolio/dashboard.py +514 -0
ml4t/diagnostic/visualization/portfolio/drawdown_plots.py +341 -0
ml4t/diagnostic/visualization/portfolio/returns_plots.py +487 -0
ml4t/diagnostic/visualization/portfolio/risk_plots.py +301 -0
ml4t/diagnostic/visualization/report_generation.py +1343 -0
ml4t/diagnostic/visualization/signal/__init__.py +103 -0
ml4t/diagnostic/visualization/signal/dashboard.py +911 -0
ml4t/diagnostic/visualization/signal/event_plots.py +514 -0
ml4t/diagnostic/visualization/signal/ic_plots.py +635 -0
ml4t/diagnostic/visualization/signal/multi_signal_dashboard.py +974 -0
ml4t/diagnostic/visualization/signal/multi_signal_plots.py +603 -0
ml4t/diagnostic/visualization/signal/quantile_plots.py +625 -0
ml4t/diagnostic/visualization/signal/turnover_plots.py +400 -0
ml4t/diagnostic/visualization/trade_shap/__init__.py +90 -0
ml4t_diagnostic-0.1.0a1.dist-info/METADATA +1044 -0
ml4t_diagnostic-0.1.0a1.dist-info/RECORD +242 -0
ml4t_diagnostic-0.1.0a1.dist-info/WHEEL +4 -0
ml4t_diagnostic-0.1.0a1.dist-info/licenses/LICENSE +21 -0

ml4t/diagnostic/integration/data_contract.py ADDED Viewed

@@ -0,0 +1,316 @@
+"""ML4T Data integration contract for data quality validation.
+This module defines the API contract between ML4T Data and ML4T Diagnostic for
+data quality assessment. ML4T Data can use these contracts to report data quality
+to ML4T Diagnostic for validation before feature engineering.
+Example workflow:
+    >>> from ml4t.data import DataManager
+    >>> from ml4t.diagnostic.integration import DataQualityReport, DataAnomaly
+    >>>
+    >>> # 1. Load data with quality report
+    >>> dm = DataManager(storage_config)
+    >>> data, quality = dm.load_with_quality("AAPL", start="2020-01-01")
+    >>>
+    >>> # 2. Check quality before proceeding
+    >>> if not quality.is_acceptable():
+    ...     print(quality.summary())
+    ...     raise DataQualityError(quality.recommendations)
+    >>>
+    >>> # 3. Proceed with feature engineering
+    >>> features = compute_features(data)
+"""
+from __future__ import annotations
+from datetime import datetime
+from enum import Enum
+from pydantic import BaseModel, Field
+class AnomalyType(str, Enum):
+    """Types of data anomalies that can be detected.
+    These anomaly types align with common data quality issues in financial data:
+    - MISSING_DATA: Gaps in the data (e.g., missing trading days)
+    - STALE_DATA: Same value repeated (stuck price feed)
+    - PRICE_SPIKE: Abnormal price movement (e.g., >10 std devs)
+    - NEGATIVE_PRICE: Invalid negative price (should be positive)
+    - ZERO_VOLUME: No trading activity (suspicious for liquid assets)
+    - OHLC_VIOLATION: High < Low or similar OHLC logic errors
+    - TIMESTAMP_GAP: Unexpected gap in timestamps
+    - DUPLICATE_TIMESTAMP: Same timestamp appears multiple times
+    - OUTLIER: Statistical outlier (not necessarily error)
+    """
+    MISSING_DATA = "missing_data"
+    STALE_DATA = "stale_data"
+    PRICE_SPIKE = "price_spike"
+    NEGATIVE_PRICE = "negative_price"
+    ZERO_VOLUME = "zero_volume"
+    OHLC_VIOLATION = "ohlc_violation"
+    TIMESTAMP_GAP = "timestamp_gap"
+    DUPLICATE_TIMESTAMP = "duplicate_timestamp"
+    OUTLIER = "outlier"
+class Severity(str, Enum):
+    """Severity level of data anomalies.
+    - INFO: Informational, no action needed
+    - WARNING: Potential issue, review recommended
+    - ERROR: Definite issue, correction needed
+    - CRITICAL: Severe issue, data may be unusable
+    """
+    INFO = "info"
+    WARNING = "warning"
+    ERROR = "error"
+    CRITICAL = "critical"
+class DataAnomaly(BaseModel):
+    """Record of a single data anomaly detected.
+    Represents a specific data quality issue found during validation.
+    Used to communicate detailed findings from ML4T Data to ML4T Diagnostic.
+    Attributes:
+        anomaly_type: Type of anomaly detected
+        severity: Severity level
+        timestamp: When the anomaly occurred
+        symbol: Which asset (if multi-asset)
+        description: Human-readable description
+        value: The problematic value (if applicable)
+        expected_range: Expected value range (if applicable)
+        suggested_fix: Recommended correction
+    Example:
+        >>> anomaly = DataAnomaly(
+        ...     anomaly_type=AnomalyType.PRICE_SPIKE,
+        ...     severity=Severity.ERROR,
+        ...     timestamp=datetime(2024, 1, 15, 10, 30),
+        ...     symbol="AAPL",
+        ...     description="Price moved 15 std devs in 1 minute",
+        ...     value=999.99,
+        ...     expected_range=(150.0, 200.0),
+        ...     suggested_fix="Replace with interpolated value"
+        ... )
+    """
+    anomaly_type: AnomalyType = Field(..., description="Type of anomaly")
+    severity: Severity = Field(..., description="Severity level")
+    timestamp: datetime = Field(..., description="When anomaly occurred")
+    symbol: str | None = Field(None, description="Asset symbol (if applicable)")
+    description: str = Field(..., description="Human-readable description")
+    value: float | None = Field(None, description="Problematic value")
+    expected_range: tuple[float, float] | None = Field(None, description="Expected value range")
+    suggested_fix: str | None = Field(None, description="Recommended correction")
+class DataQualityMetrics(BaseModel):
+    """Quantitative metrics for data quality assessment.
+    These metrics provide a numerical summary of data quality that can be
+    used for automated quality gates.
+    Attributes:
+        completeness: Fraction of expected data points present [0.0, 1.0]
+        timeliness: How up-to-date the data is (e.g., minutes since last update)
+        accuracy_score: Estimated data accuracy based on validation checks [0.0, 1.0]
+        consistency_score: How consistent the data is (no OHLC violations, etc.) [0.0, 1.0]
+        n_records: Total number of records
+        n_anomalies: Total anomalies detected
+        n_critical: Number of critical severity anomalies
+        n_error: Number of error severity anomalies
+        n_warning: Number of warning severity anomalies
+    Example:
+        >>> metrics = DataQualityMetrics(
+        ...     completeness=0.98,
+        ...     timeliness=5.0,
+        ...     accuracy_score=0.95,
+        ...     consistency_score=1.0,
+        ...     n_records=10000,
+        ...     n_anomalies=12,
+        ...     n_critical=0,
+        ...     n_error=2,
+        ...     n_warning=10
+        ... )
+    """
+    completeness: float = Field(..., ge=0.0, le=1.0, description="Data completeness [0,1]")
+    timeliness: float = Field(..., ge=0.0, description="Minutes since last update")
+    accuracy_score: float = Field(..., ge=0.0, le=1.0, description="Accuracy score [0,1]")
+    consistency_score: float = Field(..., ge=0.0, le=1.0, description="Consistency score [0,1]")
+    n_records: int = Field(..., ge=0, description="Total records")
+    n_anomalies: int = Field(..., ge=0, description="Total anomalies")
+    n_critical: int = Field(default=0, ge=0, description="Critical anomalies")
+    n_error: int = Field(default=0, ge=0, description="Error anomalies")
+    n_warning: int = Field(default=0, ge=0, description="Warning anomalies")
+class DataQualityReport(BaseModel):
+    """Complete data quality report from ML4T Data.
+    This is the primary output format for data quality validation.
+    ML4T Data generates this report when loading data, and ML4T Diagnostic
+    can use it to decide whether to proceed with analysis.
+    Attributes:
+        symbol: Asset symbol or identifier
+        source: Data source/provider name
+        date_range: Start and end dates of the data
+        frequency: Data frequency (e.g., "1min", "1d", "tick")
+        metrics: Quantitative quality metrics
+        anomalies: List of detected anomalies
+        recommendations: Human-readable recommendations
+        is_production_ready: Whether data meets production quality standards
+        created_at: When this report was generated
+    Example:
+        >>> report = DataQualityReport(
+        ...     symbol="AAPL",
+        ...     source="databento",
+        ...     date_range=(datetime(2024, 1, 1), datetime(2024, 6, 30)),
+        ...     frequency="1min",
+        ...     metrics=DataQualityMetrics(
+        ...         completeness=0.995,
+        ...         timeliness=1.0,
+        ...         accuracy_score=0.99,
+        ...         consistency_score=1.0,
+        ...         n_records=100000,
+        ...         n_anomalies=3,
+        ...     ),
+        ...     anomalies=[],
+        ...     recommendations=["Data quality is excellent"],
+        ...     is_production_ready=True
+        ... )
+    """
+    symbol: str = Field(..., description="Asset symbol")
+    source: str = Field(..., description="Data source/provider")
+    date_range: tuple[datetime, datetime] = Field(..., description="Data date range")
+    frequency: str = Field(..., description="Data frequency (1min, 1d, tick)")
+    metrics: DataQualityMetrics = Field(..., description="Quality metrics")
+    anomalies: list[DataAnomaly] = Field(default_factory=list, description="Detected anomalies")
+    recommendations: list[str] = Field(default_factory=list, description="Recommendations")
+    is_production_ready: bool = Field(..., description="Meets production standards")
+    created_at: datetime = Field(
+        default_factory=datetime.utcnow, description="Report generation time"
+    )
+    def is_acceptable(
+        self,
+        min_completeness: float = 0.95,
+        max_critical: int = 0,
+        max_errors: int = 5,
+    ) -> bool:
+        """Check if data quality meets acceptance criteria.
+        Parameters
+        ----------
+        min_completeness : float, default 0.95
+            Minimum acceptable completeness ratio
+        max_critical : int, default 0
+            Maximum allowed critical anomalies
+        max_errors : int, default 5
+            Maximum allowed error anomalies
+        Returns
+        -------
+        bool
+            True if data meets all criteria
+        """
+        return (
+            self.metrics.completeness >= min_completeness
+            and self.metrics.n_critical <= max_critical
+            and self.metrics.n_error <= max_errors
+        )
+    def summary(self) -> str:
+        """Generate human-readable summary of data quality.
+        Returns
+        -------
+        str
+            Formatted summary string
+        """
+        lines = [
+            "=" * 50,
+            f"Data Quality Report: {self.symbol}",
+            "=" * 50,
+            "",
+            f"Source: {self.source}",
+            f"Date range: {self.date_range[0].date()} to {self.date_range[1].date()}",
+            f"Frequency: {self.frequency}",
+            f"Records: {self.metrics.n_records:,}",
+            "",
+            "--- Quality Metrics ---",
+            f"Completeness: {self.metrics.completeness:.1%}",
+            f"Accuracy: {self.metrics.accuracy_score:.1%}",
+            f"Consistency: {self.metrics.consistency_score:.1%}",
+            "",
+            "--- Anomalies ---",
+            f"Critical: {self.metrics.n_critical}",
+            f"Errors: {self.metrics.n_error}",
+            f"Warnings: {self.metrics.n_warning}",
+            "",
+            f"Production Ready: {'YES' if self.is_production_ready else 'NO'}",
+        ]
+        if self.recommendations:
+            lines.append("")
+            lines.append("--- Recommendations ---")
+            for rec in self.recommendations:
+                lines.append(f"  - {rec}")
+        return "\n".join(lines)
+    def to_dict(self) -> dict:
+        """Export to dictionary format.
+        Returns
+        -------
+        dict
+            Dictionary representation suitable for JSON serialization
+        """
+        return self.model_dump(mode="json")
+class DataValidationRequest(BaseModel):
+    """Request from ML4T Diagnostic to ML4T Data for validation.
+    Allows ML4T Diagnostic to specify what validation checks are needed.
+    ML4T Data can use this to customize the quality report.
+    Attributes:
+        symbol: Asset to validate
+        date_range: Date range to validate (optional)
+        checks: Specific checks to run
+        thresholds: Custom thresholds for validation
+        include_details: Whether to include detailed anomaly records
+    Example:
+        >>> request = DataValidationRequest(
+        ...     symbol="AAPL",
+        ...     checks=["completeness", "price_spikes", "ohlc_validation"],
+        ...     thresholds={"price_spike_std": 5.0},
+        ...     include_details=True
+        ... )
+    """
+    symbol: str = Field(..., description="Asset to validate")
+    date_range: tuple[datetime, datetime] | None = Field(
+        None, description="Optional date range to validate"
+    )
+    checks: list[str] = Field(
+        default_factory=lambda: ["completeness", "stale_data", "price_spikes", "ohlc_validation"],
+        description="Validation checks to run",
+    )
+    thresholds: dict[str, float] = Field(
+        default_factory=dict, description="Custom thresholds for validation checks"
+    )
+    include_details: bool = Field(default=True, description="Include detailed anomaly records")

ml4t/diagnostic/integration/engineer_contract.py ADDED Viewed

@@ -0,0 +1,226 @@
+"""ML4T Engineer integration contract for preprocessing recommendations.
+This module defines the API contract between ML4T Diagnostic and ML4T Engineer for feature
+preprocessing recommendations. After evaluating features, ML4T Diagnostic can recommend
+transforms that ML4T Engineer should apply.
+Example workflow:
+    >>> from ml4t.diagnostic.evaluation import FeatureEvaluator
+    >>> from ml4t.diagnostic.integration import EngineerConfig
+    >>>
+    >>> # 1. Evaluate features
+    >>> evaluator = FeatureEvaluator(config)
+    >>> results = evaluator.evaluate(features_df)
+    >>>
+    >>> # 2. Get preprocessing recommendations
+    >>> eng_config = results.to_engineer_config()
+    >>>
+    >>> # 3. Export for ML4T Engineer
+    >>> preprocessing_dict = eng_config.to_dict()
+    >>>
+    >>> # 4. Use with ML4T Engineer
+    >>> # from ml4t.engineer import PreprocessingPipeline
+    >>> # pipeline = PreprocessingPipeline(preprocessing_dict)
+    >>> # transformed = pipeline.transform(features_df)
+"""
+from __future__ import annotations
+from enum import Enum
+from pydantic import BaseModel, Field
+class TransformType(str, Enum):
+    """Supported transform types matching ML4T Engineer API.
+    These transforms align with ML4T Engineer's PreprocessingPipeline.
+    Each transform addresses specific statistical issues:
+    - NONE: Feature is good as-is
+    - LOG: Reduce right skew, stabilize variance
+    - SQRT: Reduce right skew (milder than log)
+    - STANDARDIZE: Zero mean, unit variance (z-score)
+    - NORMALIZE: Scale to [0, 1] range
+    - WINSORIZE: Cap outliers at percentiles
+    - DIFF: First difference for non-stationary series
+    """
+    NONE = "none"
+    LOG = "log"
+    SQRT = "sqrt"
+    STANDARDIZE = "standardize"
+    NORMALIZE = "normalize"
+    WINSORIZE = "winsorize"
+    DIFF = "diff"
+class PreprocessingRecommendation(BaseModel):
+    """Recommendation for preprocessing a single feature.
+    ML4T Diagnostic generates these recommendations based on diagnostics:
+    - Stationarity tests → recommend differencing
+    - Distribution analysis → recommend transforms for skew
+    - Outlier detection → recommend winsorization
+    - Scale issues → recommend normalization
+    Attributes:
+        feature_name: Name of the feature
+        transform: Recommended transform type
+        reason: Human-readable explanation of why this transform
+        confidence: Confidence in recommendation [0.0, 1.0]
+        diagnostics: Optional diagnostic details that led to recommendation
+    Example:
+        >>> rec = PreprocessingRecommendation(
+        ...     feature_name="returns",
+        ...     transform=TransformType.DIFF,
+        ...     reason="Feature is non-stationary (ADF p=0.82)",
+        ...     confidence=0.95
+        ... )
+    """
+    feature_name: str = Field(..., description="Feature name")
+    transform: TransformType = Field(..., description="Recommended transform")
+    reason: str = Field(..., description="Explanation for recommendation")
+    confidence: float = Field(..., ge=0.0, le=1.0, description="Confidence [0.0, 1.0]")
+    diagnostics: dict[str, float] | None = Field(
+        None, description="Optional diagnostic values (e.g., {'adf_pvalue': 0.82})"
+    )
+class EngineerConfig(BaseModel):
+    """Configuration for ML4T Engineer PreprocessingPipeline.
+    This is the output format that ML4T Engineer can consume.
+    Contains recommendations for all features that need preprocessing.
+    Attributes:
+        recommendations: List of feature preprocessing recommendations
+        metadata: Optional metadata about evaluation context
+    Example:
+        >>> config = EngineerConfig(recommendations=[
+        ...     PreprocessingRecommendation(
+        ...         feature_name="rsi_14",
+        ...         transform=TransformType.WINSORIZE,
+        ...         reason="Outliers detected at 1st and 99th percentile",
+        ...         confidence=0.85
+        ...     ),
+        ...     PreprocessingRecommendation(
+        ...         feature_name="log_returns",
+        ...         transform=TransformType.NONE,
+        ...         reason="Already stationary and normally distributed",
+        ...         confidence=0.90
+        ...     )
+        ... ])
+        >>> eng_dict = config.to_dict()
+    """
+    recommendations: list[PreprocessingRecommendation] = Field(
+        ..., description="Feature preprocessing recommendations"
+    )
+    metadata: dict[str, str] | None = Field(
+        None, description="Optional metadata (e.g., eval timestamp, config)"
+    )
+    def to_dict(self) -> dict[str, dict[str, str | float | dict[str, float]]]:
+        """Export to ML4T Engineer-compatible format.
+        Returns dictionary mapping feature names to preprocessing configs:
+            {
+                "feature_name": {
+                    "transform": "diff",
+                    "reason": "Non-stationary",
+                    "confidence": 0.95,
+                    "diagnostics": {...}
+                }
+            }
+        Returns:
+            Dictionary in ML4T Engineer PreprocessingPipeline format
+        Example:
+            >>> config.to_dict()
+            {
+                'rsi_14': {
+                    'transform': 'winsorize',
+                    'reason': 'Outliers detected',
+                    'confidence': 0.85
+                }
+            }
+        """
+        result: dict[str, dict[str, str | float | dict[str, float]]] = {}
+        for rec in self.recommendations:
+            feature_dict: dict[str, str | float | dict[str, float]] = {
+                "transform": rec.transform.value,
+                "reason": rec.reason,
+                "confidence": rec.confidence,
+            }
+            if rec.diagnostics:
+                feature_dict["diagnostics"] = rec.diagnostics
+            result[rec.feature_name] = feature_dict
+        return result
+    def get_recommendations_by_transform(
+        self, transform: TransformType
+    ) -> list[PreprocessingRecommendation]:
+        """Filter recommendations by transform type.
+        Useful for analyzing patterns in recommendations:
+        - How many features need differencing?
+        - Which features can stay unchanged?
+        Args:
+            transform: Transform type to filter by
+        Returns:
+            List of recommendations with matching transform
+        Example:
+            >>> config.get_recommendations_by_transform(TransformType.DIFF)
+            [PreprocessingRecommendation(feature_name='returns', ...)]
+        """
+        return [rec for rec in self.recommendations if rec.transform == transform]
+    def summary(self) -> str:
+        """Human-readable summary of recommendations.
+        Returns:
+            Formatted summary string
+        Example:
+            >>> print(config.summary())
+            ML4T Engineer Preprocessing Recommendations
+            ==========================================
+            Total features: 5
+            - DIFF: 2 features
+            - WINSORIZE: 1 feature
+            - NONE: 2 features
+        """
+        lines = ["ML4T Engineer Preprocessing Recommendations", "=" * 44]
+        lines.append(f"Total features: {len(self.recommendations)}")
+        lines.append("")
+        # Count by transform type
+        transform_counts: dict[TransformType, int] = {}
+        for rec in self.recommendations:
+            transform_counts[rec.transform] = transform_counts.get(rec.transform, 0) + 1
+        # Sort by count (descending)
+        for transform, count in sorted(transform_counts.items(), key=lambda x: x[1], reverse=True):
+            lines.append(f"  {transform.value.upper()}: {count} features")
+        # Show high-confidence recommendations
+        high_conf = [rec for rec in self.recommendations if rec.confidence >= 0.9]
+        if high_conf:
+            lines.append("")
+            lines.append(f"High-confidence recommendations (≥0.9): {len(high_conf)}")
+            for rec in high_conf[:5]:  # Show top 5
+                lines.append(
+                    f"  {rec.feature_name}: {rec.transform.value} (conf={rec.confidence:.2f})"
+                )
+            if len(high_conf) > 5:
+                lines.append(f"  ... and {len(high_conf) - 5} more")
+        return "\n".join(lines)

ml4t/diagnostic/logging/__init__.py ADDED Viewed

@@ -0,0 +1,77 @@
+"""
+ML4T Diagnostic Logging and Debugging Infrastructure
+Provides structured logging with levels, progress tracking, debug mode,
+and performance metrics for ML4T Diagnostic library operations.
+Features:
+- Structured JSON logging
+- Configurable log levels (DEBUG, INFO, WARNING, ERROR)
+- Progress indicators for long-running operations
+- Debug mode for intermediate results
+- Performance metrics tracking
+- Context-aware logging
+- Weights & Biases integration
+Example:
+    >>> from ml4t.diagnostic.logging import get_logger, set_log_level, LogLevel
+    >>> logger = get_logger(__name__)
+    >>> set_log_level(LogLevel.DEBUG)
+    >>> logger.info("Computing Sharpe ratio", n_samples=100)
+    >>> with logger.timed("sharpe_computation"):
+    ...     sharpe = compute_sharpe_ratio(returns)
+"""
+# Structured logging
+from ml4t.diagnostic.logging.logger import (
+    LogLevel,
+    QEvalLogger,
+    configure_logging,
+    get_log_level,
+    get_logger,
+    set_log_level,
+)
+# Performance metrics
+from ml4t.diagnostic.logging.performance import (
+    PerformanceMonitor,
+    PerformanceTracker,
+    get_performance_monitor,
+    measure_time,
+    timed,
+)
+# Progress tracking
+from ml4t.diagnostic.logging.progress import (
+    ProgressBar,
+    ProgressTracker,
+    progress_indicator,
+    spinner,
+)
+# Experiment tracking (Weights & Biases)
+from ml4t.diagnostic.logging.wandb import WandbLogger, log_experiment
+__all__: list[str] = [
+    # Logger
+    "QEvalLogger",
+    "get_logger",
+    "set_log_level",
+    "get_log_level",
+    "configure_logging",
+    "LogLevel",
+    # Progress
+    "ProgressBar",
+    "progress_indicator",
+    "ProgressTracker",
+    "spinner",
+    # Performance
+    "PerformanceTracker",
+    "PerformanceMonitor",
+    "get_performance_monitor",
+    "timed",
+    "measure_time",
+    # WandB
+    "WandbLogger",
+    "log_experiment",
+]