PyPI - aponyx - Versions diffs - 0.1.18__py3-none-any.whl - Mend

aponyx 0.1.18__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (104) hide show

aponyx/__init__.py +14 -0
aponyx/backtest/__init__.py +31 -0
aponyx/backtest/adapters.py +77 -0
aponyx/backtest/config.py +84 -0
aponyx/backtest/engine.py +560 -0
aponyx/backtest/protocols.py +101 -0
aponyx/backtest/registry.py +334 -0
aponyx/backtest/strategy_catalog.json +50 -0
aponyx/cli/__init__.py +5 -0
aponyx/cli/commands/__init__.py +8 -0
aponyx/cli/commands/clean.py +349 -0
aponyx/cli/commands/list.py +302 -0
aponyx/cli/commands/report.py +167 -0
aponyx/cli/commands/run.py +377 -0
aponyx/cli/main.py +125 -0
aponyx/config/__init__.py +82 -0
aponyx/data/__init__.py +99 -0
aponyx/data/bloomberg_config.py +306 -0
aponyx/data/bloomberg_instruments.json +26 -0
aponyx/data/bloomberg_securities.json +42 -0
aponyx/data/cache.py +294 -0
aponyx/data/fetch.py +659 -0
aponyx/data/fetch_registry.py +135 -0
aponyx/data/loaders.py +205 -0
aponyx/data/providers/__init__.py +13 -0
aponyx/data/providers/bloomberg.py +383 -0
aponyx/data/providers/file.py +111 -0
aponyx/data/registry.py +500 -0
aponyx/data/requirements.py +96 -0
aponyx/data/sample_data.py +415 -0
aponyx/data/schemas.py +60 -0
aponyx/data/sources.py +171 -0
aponyx/data/synthetic_params.json +46 -0
aponyx/data/transforms.py +336 -0
aponyx/data/validation.py +308 -0
aponyx/docs/__init__.py +24 -0
aponyx/docs/adding_data_providers.md +682 -0
aponyx/docs/cdx_knowledge_base.md +455 -0
aponyx/docs/cdx_overlay_strategy.md +135 -0
aponyx/docs/cli_guide.md +607 -0
aponyx/docs/governance_design.md +551 -0
aponyx/docs/logging_design.md +251 -0
aponyx/docs/performance_evaluation_design.md +265 -0
aponyx/docs/python_guidelines.md +786 -0
aponyx/docs/signal_registry_usage.md +369 -0
aponyx/docs/signal_suitability_design.md +558 -0
aponyx/docs/visualization_design.md +277 -0
aponyx/evaluation/__init__.py +11 -0
aponyx/evaluation/performance/__init__.py +24 -0
aponyx/evaluation/performance/adapters.py +109 -0
aponyx/evaluation/performance/analyzer.py +384 -0
aponyx/evaluation/performance/config.py +320 -0
aponyx/evaluation/performance/decomposition.py +304 -0
aponyx/evaluation/performance/metrics.py +761 -0
aponyx/evaluation/performance/registry.py +327 -0
aponyx/evaluation/performance/report.py +541 -0
aponyx/evaluation/suitability/__init__.py +67 -0
aponyx/evaluation/suitability/config.py +143 -0
aponyx/evaluation/suitability/evaluator.py +389 -0
aponyx/evaluation/suitability/registry.py +328 -0
aponyx/evaluation/suitability/report.py +398 -0
aponyx/evaluation/suitability/scoring.py +367 -0
aponyx/evaluation/suitability/tests.py +303 -0
aponyx/examples/01_generate_synthetic_data.py +53 -0
aponyx/examples/02_fetch_data_file.py +82 -0
aponyx/examples/03_fetch_data_bloomberg.py +104 -0
aponyx/examples/04_compute_signal.py +164 -0
aponyx/examples/05_evaluate_suitability.py +224 -0
aponyx/examples/06_run_backtest.py +242 -0
aponyx/examples/07_analyze_performance.py +214 -0
aponyx/examples/08_visualize_results.py +272 -0
aponyx/main.py +7 -0
aponyx/models/__init__.py +45 -0
aponyx/models/config.py +83 -0
aponyx/models/indicator_transformation.json +52 -0
aponyx/models/indicators.py +292 -0
aponyx/models/metadata.py +447 -0
aponyx/models/orchestrator.py +213 -0
aponyx/models/registry.py +860 -0
aponyx/models/score_transformation.json +42 -0
aponyx/models/signal_catalog.json +29 -0
aponyx/models/signal_composer.py +513 -0
aponyx/models/signal_transformation.json +29 -0
aponyx/persistence/__init__.py +16 -0
aponyx/persistence/json_io.py +132 -0
aponyx/persistence/parquet_io.py +378 -0
aponyx/py.typed +0 -0
aponyx/reporting/__init__.py +10 -0
aponyx/reporting/generator.py +517 -0
aponyx/visualization/__init__.py +20 -0
aponyx/visualization/app.py +37 -0
aponyx/visualization/plots.py +309 -0
aponyx/visualization/visualizer.py +242 -0
aponyx/workflows/__init__.py +18 -0
aponyx/workflows/concrete_steps.py +720 -0
aponyx/workflows/config.py +122 -0
aponyx/workflows/engine.py +279 -0
aponyx/workflows/registry.py +116 -0
aponyx/workflows/steps.py +180 -0
aponyx-0.1.18.dist-info/METADATA +552 -0
aponyx-0.1.18.dist-info/RECORD +104 -0
aponyx-0.1.18.dist-info/WHEEL +4 -0
aponyx-0.1.18.dist-info/entry_points.txt +2 -0
aponyx-0.1.18.dist-info/licenses/LICENSE +21 -0

aponyx/evaluation/suitability/config.py ADDED Viewed

@@ -0,0 +1,143 @@
+"""
+Configuration for signal-product suitability evaluation.
+Defines immutable configuration parameters for the suitability evaluation
+process including lags, thresholds, and component weights.
+"""
+from dataclasses import dataclass, field
+@dataclass(frozen=True)
+class SuitabilityConfig:
+    """
+    Configuration for signal-product suitability evaluation.
+    This immutable dataclass defines all parameters controlling the evaluation
+    process, including forecast horizons, sample requirements, decision thresholds,
+    and component weights for composite scoring.
+    Parameters
+    ----------
+    lags : list[int]
+        Forecast horizons to test (e.g., [1, 3, 5] for 1-, 3-, and 5-day ahead).
+        Must be non-empty list of positive integers.
+    min_obs : int
+        Minimum number of valid observations required for reliable inference.
+        Must be at least 100. Default: 500.
+    rolling_window : int
+        Rolling window size in observations for stability analysis.
+        Must be at least 50. Default: 252 (~1 year for daily data).
+    pass_threshold : float
+        Composite score threshold for PASS decision (proceed to backtest).
+        Must satisfy: 0 < hold_threshold < pass_threshold < 1.
+        Default: 0.7.
+    hold_threshold : float
+        Composite score threshold for HOLD decision (marginal, requires judgment).
+        Must satisfy: 0 < hold_threshold < pass_threshold < 1.
+        Default: 0.4.
+    data_health_weight : float
+        Weight for data health component in composite score.
+        Must be non-negative. All weights must sum to 1.0.
+        Default: 0.2.
+    predictive_weight : float
+        Weight for predictive association component in composite score.
+        Must be non-negative. All weights must sum to 1.0.
+        Default: 0.4.
+    economic_weight : float
+        Weight for economic relevance component in composite score.
+        Must be non-negative. All weights must sum to 1.0.
+        Default: 0.2.
+    stability_weight : float
+        Weight for temporal stability component in composite score.
+        Must be non-negative. All weights must sum to 1.0.
+        Default: 0.2.
+    Raises
+    ------
+    ValueError
+        If any validation constraint is violated.
+    Examples
+    --------
+    >>> config = SuitabilityConfig()  # Use defaults
+    >>> config = SuitabilityConfig(lags=[1, 5, 10], min_obs=1000)
+    >>> config = SuitabilityConfig(
+    ...     pass_threshold=0.75,
+    ...     hold_threshold=0.5,
+    ...     predictive_weight=0.5,
+    ...     economic_weight=0.3,
+    ...     data_health_weight=0.1,
+    ...     stability_weight=0.1,
+    ... )
+    """
+    lags: list[int] = field(default_factory=lambda: [1, 3, 5])
+    min_obs: int = 500
+    rolling_window: int = 252
+    pass_threshold: float = 0.7
+    hold_threshold: float = 0.4
+    data_health_weight: float = 0.2
+    predictive_weight: float = 0.4
+    economic_weight: float = 0.2
+    stability_weight: float = 0.2
+    def __post_init__(self) -> None:
+        """
+        Validate configuration parameters.
+        Checks that lags are valid, thresholds are properly ordered,
+        weights are non-negative and sum to 1.0, and minimum observations
+        are sufficient.
+        Raises
+        ------
+        ValueError
+            If any validation constraint is violated.
+        """
+        # Validate lags
+        if not self.lags:
+            raise ValueError("lags must be a non-empty list")
+        if not all(isinstance(lag, int) and lag > 0 for lag in self.lags):
+            raise ValueError(f"All lags must be positive integers, got {self.lags}")
+        # Validate thresholds ordering
+        if not (0 < self.hold_threshold < self.pass_threshold < 1):
+            raise ValueError(
+                f"Thresholds must satisfy 0 < hold ({self.hold_threshold}) "
+                f"< pass ({self.pass_threshold}) < 1"
+            )
+        # Validate weights
+        weights = [
+            self.data_health_weight,
+            self.predictive_weight,
+            self.economic_weight,
+            self.stability_weight,
+        ]
+        if not all(w >= 0 for w in weights):
+            raise ValueError(
+                f"All weights must be non-negative, got {dict(zip(['data_health', 'predictive', 'economic', 'stability'], weights))}"
+            )
+        weight_sum = sum(weights)
+        if abs(weight_sum - 1.0) > 1e-6:
+            raise ValueError(
+                f"Weights must sum to 1.0, got {weight_sum:.6f}. "
+                f"Weights: data_health={self.data_health_weight}, "
+                f"predictive={self.predictive_weight}, "
+                f"economic={self.economic_weight}, "
+                f"stability={self.stability_weight}"
+            )
+        # Validate minimum observations
+        if self.min_obs < 100:
+            raise ValueError(
+                f"min_obs must be at least 100 for reliable inference, got {self.min_obs}"
+            )
+        # Validate rolling window
+        if self.rolling_window < 50:
+            raise ValueError(
+                f"rolling_window must be at least 50 for meaningful statistics, got {self.rolling_window}"
+            )

aponyx/evaluation/suitability/evaluator.py ADDED Viewed

@@ -0,0 +1,389 @@
+"""
+Core suitability evaluation logic.
+Orchestrates statistical tests, scoring, and decision logic to evaluate
+whether a signal contains meaningful predictive information for a traded product.
+"""
+import logging
+from dataclasses import dataclass, asdict
+from datetime import datetime
+from typing import Any
+import numpy as np
+import pandas as pd
+from aponyx.evaluation.suitability.config import SuitabilityConfig
+logger = logging.getLogger(__name__)
+@dataclass
+class SuitabilityResult:
+    """
+    Result container for signal-product suitability evaluation.
+    Contains decision, component scores, diagnostics, and metadata from
+    the evaluation process.
+    Attributes
+    ----------
+    decision : str
+        Overall decision: "PASS" (proceed to backtest), "HOLD" (marginal),
+        or "FAIL" (do not backtest).
+    composite_score : float
+        Weighted average of component scores (0-1 scale).
+    data_health_score : float
+        Data quality and sufficiency score (0-1 scale).
+    predictive_score : float
+        Statistical association strength score (0-1 scale).
+    economic_score : float
+        Economic relevance/impact score (0-1 scale).
+    stability_score : float
+        Temporal consistency score (0-1 scale).
+    valid_obs : int
+        Number of valid observations after alignment.
+    missing_pct : float
+        Percentage of missing data.
+    correlations : dict[int, float]
+        Pearson correlations by lag horizon.
+    betas : dict[int, float]
+        Regression coefficients by lag horizon.
+    t_stats : dict[int, float]
+        T-statistics by lag horizon.
+    effect_size_bps : float
+        Economic impact estimate (bps per 1σ signal change).
+    sign_consistency_ratio : float
+        Proportion of rolling windows with consistent sign.
+    beta_cv : float
+        Coefficient of variation of rolling betas.
+    n_windows : int
+        Number of valid rolling windows analyzed.
+    timestamp : str
+        ISO timestamp of evaluation.
+    config : SuitabilityConfig
+        Configuration used for evaluation.
+    """
+    decision: str
+    composite_score: float
+    data_health_score: float
+    predictive_score: float
+    economic_score: float
+    stability_score: float
+    valid_obs: int
+    missing_pct: float
+    correlations: dict[int, float]
+    betas: dict[int, float]
+    t_stats: dict[int, float]
+    effect_size_bps: float
+    sign_consistency_ratio: float
+    beta_cv: float
+    n_windows: int
+    timestamp: str
+    config: SuitabilityConfig
+    def to_dict(self) -> dict[str, Any]:
+        """
+        Convert result to dictionary for JSON serialization.
+        Returns
+        -------
+        dict[str, Any]
+            Structured dictionary with component scores, metrics, and metadata.
+        """
+        return {
+            "decision": self.decision,
+            "composite_score": self.composite_score,
+            "component_scores": {
+                "data_health": self.data_health_score,
+                "predictive": self.predictive_score,
+                "economic": self.economic_score,
+                "stability": self.stability_score,
+            },
+            "metrics": {
+                "valid_obs": self.valid_obs,
+                "missing_pct": self.missing_pct,
+                "correlations": self.correlations,
+                "betas": self.betas,
+                "t_stats": self.t_stats,
+                "effect_size_bps": self.effect_size_bps,
+                "sign_consistency_ratio": self.sign_consistency_ratio,
+                "beta_cv": self.beta_cv,
+                "n_windows": self.n_windows,
+            },
+            "timestamp": self.timestamp,
+            "config": asdict(self.config),
+        }
+def compute_forward_returns(
+    spread_series: pd.Series,
+    lags: list[int],
+) -> dict[int, pd.Series]:
+    """
+    Compute forward-looking returns (changes) from spread series.
+    For credit spreads, forward returns represent the change in spread from
+    time t to time t+lag. This is the target variable for predictive evaluation.
+    Parameters
+    ----------
+    spread_series : pd.Series
+        Time series of spread levels with DatetimeIndex.
+    lags : list[int]
+        List of forward horizons (e.g., [1, 3, 5] for 1-, 3-, 5-day ahead).
+    Returns
+    -------
+    dict[int, pd.Series]
+        Dictionary mapping lag → forward return series.
+        Each series has the same index as input, with NaN at the end where
+        forward data is not available.
+    Notes
+    -----
+    Forward returns are computed as: spread[t+lag] - spread[t]
+    For credit spreads, positive return = widening, negative = tightening.
+    Examples
+    --------
+    >>> spreads = pd.Series([100, 102, 98, 101], index=pd.date_range('2020-01-01', periods=4))
+    >>> fwd_returns = compute_forward_returns(spreads, [1, 2])
+    >>> fwd_returns[1]  # 1-day forward: [102-100, 98-102, 101-98, NaN]
+    """
+    logger.debug(
+        "Computing forward returns for %d lags: %s",
+        len(lags),
+        lags,
+    )
+    forward_returns = {}
+    for lag in lags:
+        # Shift backwards to get future values aligned to current index
+        forward_returns[lag] = spread_series.shift(-lag) - spread_series
+    logger.debug(
+        "Computed forward returns with %d observations per lag",
+        len(spread_series) - max(lags) if lags else len(spread_series),
+    )
+    return forward_returns
+def evaluate_signal_suitability(
+    signal: pd.Series,
+    target_change: pd.Series,
+    config: SuitabilityConfig | None = None,
+) -> SuitabilityResult:
+    """
+    Evaluate whether signal contains predictive information for target product.
+    This is the main entry point for suitability evaluation. Orchestrates
+    statistical tests, scoring, and decision logic.
+    Parameters
+    ----------
+    signal : pd.Series
+        Signal time series with DatetimeIndex and .name attribute.
+        Should be z-score normalized for interpretability.
+    target_change : pd.Series
+        Target series (e.g., spread levels) with DatetimeIndex.
+        Forward returns will be computed internally for each lag horizon.
+    config : SuitabilityConfig, optional
+        Evaluation configuration. If None, uses defaults.
+    Returns
+    -------
+    SuitabilityResult
+        Comprehensive evaluation result with decision, scores, and diagnostics.
+    Raises
+    ------
+    ValueError
+        If signal or target lack required attributes (DatetimeIndex, name).
+    Notes
+    -----
+    This function does NOT include trading rules, costs, or position sizing.
+    It purely evaluates the statistical and economic relationship between
+    signal and target.
+    The function computes forward-looking returns (target[t+lag] - target[t])
+    internally for each configured lag horizon.
+    Examples
+    --------
+    >>> signal = compute_spread_momentum(cdx_df, config)
+    >>> result = evaluate_signal_suitability(signal, cdx_df['spread'])
+    >>> print(result.decision, result.composite_score)
+    """
+    from aponyx.evaluation.suitability import tests, scoring
+    if config is None:
+        config = SuitabilityConfig()
+    logger.info(
+        "Starting suitability evaluation: signal=%s, config=%s",
+        getattr(signal, "name", "unnamed"),
+        config,
+    )
+    # Validate inputs
+    if not isinstance(signal.index, pd.DatetimeIndex):
+        raise ValueError("Signal must have DatetimeIndex")
+    if not isinstance(target_change.index, pd.DatetimeIndex):
+        raise ValueError("Target must have DatetimeIndex")
+    # Align signal and target on common dates
+    aligned_df = pd.DataFrame({"signal": signal, "target": target_change}).dropna()
+    signal_aligned = aligned_df["signal"]
+    target_aligned = aligned_df["target"]
+    logger.debug(
+        "Aligned data: original_signal=%d, original_target=%d, aligned=%d",
+        len(signal),
+        len(target_change),
+        len(aligned_df),
+    )
+    # Compute data health metrics
+    valid_obs = len(aligned_df)
+    total_obs = max(len(signal), len(target_change))
+    missing_pct = (1 - valid_obs / total_obs) * 100 if total_obs > 0 else 100.0
+    logger.debug(
+        "Data health: valid_obs=%d, missing_pct=%.2f%%",
+        valid_obs,
+        missing_pct,
+    )
+    # Score data health
+    data_health_score = scoring.score_data_health(
+        valid_obs=valid_obs,
+        missing_pct=missing_pct,
+        min_obs=config.min_obs,
+    )
+    logger.info("Data health score: %.3f", data_health_score)
+    # Compute predictive statistics for all configured lags
+    logger.debug("Computing stats for %d lags: %s", len(config.lags), config.lags)
+    correlations = {}
+    betas = {}
+    t_stats = {}
+    for lag in config.lags:
+        # Compute forward returns for this lag
+        target_fwd = target_change.shift(-lag)
+        # Align signal with forward target
+        aligned_lag = pd.DataFrame({"signal": signal, "target": target_fwd}).dropna()
+        signal_lag = aligned_lag["signal"]
+        target_lag = aligned_lag["target"]
+        # Compute correlation
+        correlations[lag] = tests.compute_correlation(signal_lag, target_lag)
+        # Compute regression stats
+        regression_stats = tests.compute_regression_stats(signal_lag, target_lag)
+        betas[lag] = regression_stats["beta"]
+        t_stats[lag] = regression_stats["t_stat"]
+        logger.debug(
+            "Lag %d: n=%d, corr=%.3f, beta=%.3f, t_stat=%.3f",
+            lag,
+            len(signal_lag),
+            correlations[lag],
+            betas[lag],
+            t_stats[lag],
+        )
+    # Score predictive association using mean |t-stat| across all lags
+    mean_abs_tstat = np.mean([abs(t) for t in t_stats.values()])
+    predictive_score = scoring.score_predictive(mean_abs_tstat)
+    logger.info(
+        "Predictive score: %.3f (mean |t-stat|=%.3f across %d lags)",
+        predictive_score,
+        mean_abs_tstat,
+        len(config.lags),
+    )
+    # Compute economic relevance
+    avg_beta = np.mean(list(betas.values()))
+    signal_std = signal_aligned.std()
+    effect_size_bps = abs(avg_beta * signal_std)
+    logger.debug("Economic impact: effect_size=%.3f bps", effect_size_bps)
+    # Score economic relevance
+    economic_score = scoring.score_economic(effect_size_bps)
+    logger.info("Economic score: %.3f", economic_score)
+    # Compute temporal stability using rolling window approach
+    rolling_betas = tests.compute_rolling_betas(
+        signal_aligned,
+        target_aligned,
+        window=config.rolling_window,
+    )
+    # Compute stability metrics
+    stability_metrics = tests.compute_stability_metrics(rolling_betas, avg_beta)
+    sign_consistency_ratio = stability_metrics["sign_consistency_ratio"]
+    beta_cv = stability_metrics["beta_cv"]
+    n_windows = stability_metrics["n_windows"]
+    logger.debug(
+        "Stability: sign_ratio=%.3f, CV=%.3f, n_windows=%d",
+        sign_consistency_ratio,
+        beta_cv,
+        n_windows,
+    )
+    # Score stability
+    stability_score = scoring.score_stability(sign_consistency_ratio, beta_cv)
+    logger.info("Stability score: %.3f", stability_score)
+    # Compute composite score
+    composite_score = scoring.compute_composite_score(
+        data_health_score=data_health_score,
+        predictive_score=predictive_score,
+        economic_score=economic_score,
+        stability_score=stability_score,
+        config=config,
+    )
+    logger.info("Composite score: %.3f", composite_score)
+    # Assign decision
+    decision = scoring.assign_decision(composite_score, config)
+    logger.info("Decision: %s", decision)
+    # Create result
+    result = SuitabilityResult(
+        decision=decision,
+        composite_score=composite_score,
+        data_health_score=data_health_score,
+        predictive_score=predictive_score,
+        economic_score=economic_score,
+        stability_score=stability_score,
+        valid_obs=valid_obs,
+        missing_pct=missing_pct,
+        correlations=correlations,
+        betas=betas,
+        t_stats=t_stats,
+        effect_size_bps=effect_size_bps,
+        sign_consistency_ratio=sign_consistency_ratio,
+        beta_cv=beta_cv,
+        n_windows=n_windows,
+        timestamp=datetime.now().isoformat(),
+        config=config,
+    )
+    logger.info(
+        "Evaluation complete: signal=%s, decision=%s, score=%.3f",
+        getattr(signal, "name", "unnamed"),
+        decision,
+        composite_score,
+    )
+    return result