PyPI - invarlock - Versions diffs - 0.3.5__py3-none-any.whl → 0.3.6__py3-none-any.whl - Mend

invarlock 0.3.5py3-none-any.whl → 0.3.6py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (48) hide show

invarlock/__init__.py +1 -1
invarlock/_data/runtime/tiers.yaml +57 -30
invarlock/adapters/__init__.py +1 -1
invarlock/calibration/spectral_null.py +15 -10
invarlock/calibration/variance_ve.py +0 -2
invarlock/cli/commands/calibrate.py +6 -2
invarlock/cli/commands/certify.py +58 -39
invarlock/cli/commands/doctor.py +3 -1
invarlock/cli/commands/explain_gates.py +57 -8
invarlock/cli/commands/report.py +1 -1
invarlock/cli/commands/run.py +159 -61
invarlock/cli/commands/verify.py +78 -4
invarlock/cli/config.py +21 -5
invarlock/core/api.py +45 -5
invarlock/core/auto_tuning.py +65 -20
invarlock/core/contracts.py +7 -1
invarlock/core/registry.py +2 -2
invarlock/core/runner.py +314 -50
invarlock/eval/bench.py +0 -13
invarlock/eval/data.py +14 -28
invarlock/eval/metrics.py +4 -1
invarlock/eval/primary_metric.py +23 -0
invarlock/eval/tail_stats.py +230 -0
invarlock/guards/_estimators.py +154 -0
invarlock/guards/policies.py +16 -6
invarlock/guards/rmt.py +625 -544
invarlock/guards/spectral.py +348 -110
invarlock/guards/tier_config.py +32 -30
invarlock/guards/variance.py +5 -29
invarlock/guards_ref/rmt_ref.py +23 -23
invarlock/model_profile.py +42 -15
invarlock/reporting/certificate.py +225 -46
invarlock/reporting/certificate_schema.py +2 -1
invarlock/reporting/dataset_hashing.py +15 -2
invarlock/reporting/guards_analysis.py +197 -274
invarlock/reporting/normalizer.py +6 -0
invarlock/reporting/policy_utils.py +38 -36
invarlock/reporting/primary_metric_utils.py +71 -17
invarlock/reporting/render.py +61 -0
invarlock/reporting/report.py +1 -1
invarlock/reporting/report_types.py +5 -2
invarlock/reporting/validate.py +1 -18
{invarlock-0.3.5.dist-info → invarlock-0.3.6.dist-info}/METADATA +6 -6
{invarlock-0.3.5.dist-info → invarlock-0.3.6.dist-info}/RECORD +48 -46
{invarlock-0.3.5.dist-info → invarlock-0.3.6.dist-info}/WHEEL +0 -0
{invarlock-0.3.5.dist-info → invarlock-0.3.6.dist-info}/entry_points.txt +0 -0
{invarlock-0.3.5.dist-info → invarlock-0.3.6.dist-info}/licenses/LICENSE +0 -0
{invarlock-0.3.5.dist-info → invarlock-0.3.6.dist-info}/top_level.txt +0 -0

invarlock/reporting/guards_analysis.py CHANGED Viewed

@@ -1,18 +1,30 @@
 # mypy: ignore-errors
 from __future__ import annotations
+import hashlib
+import json
 import math
 from typing import Any, no_type_check
 from invarlock.core.auto_tuning import get_tier_policies
-from .policy_utils import _promote_legacy_multiple_testing_key, _resolve_policy_tier
+from .policy_utils import _resolve_policy_tier
 from .report_types import RunReport
+def _measurement_contract_digest(contract: Any) -> str | None:
+    if not isinstance(contract, dict) or not contract:
+        return None
+    try:
+        canonical = json.dumps(contract, sort_keys=True, default=str)
+    except Exception:
+        return None
+    return hashlib.sha256(canonical.encode()).hexdigest()[:16]
 @no_type_check
 def _extract_invariants(report: RunReport) -> dict[str, Any]:
-    """Extract invariant check results (matches legacy shape used in tests)."""
+    """Extract invariant check results (matches the shape used in tests)."""
     invariants_data = (report.get("metrics", {}) or {}).get("invariants", {})
     failures: list[dict[str, Any]] = []
     summary: dict[str, Any] = {}
@@ -299,10 +311,10 @@ def _extract_spectral_analysis(
     families: dict[str, dict[str, Any]] = {}
     family_caps: dict[str, dict[str, float]] = {}
     top_z_scores: dict[str, list[dict[str, Any]]] = {}
+    deadband_used: float | None = None
     if isinstance(guard_metrics, dict):
         # Resolve deadband from policy/metrics/defaults
-        deadband_used: float | None = None
         try:
             db_raw = guard_policy.get("deadband") if guard_policy else None
             if db_raw is None and isinstance(guard_metrics, dict):
@@ -314,16 +326,12 @@ def _extract_spectral_analysis(
         except Exception:
             deadband_used = None
-        # Resolve sigma_quantile for summary (policy aliases supported)
+        # Resolve sigma_quantile for summary
         sigma_q_used: float | None = None
         try:
             pol_sq = None
             if isinstance(guard_policy, dict):
-                pol_sq = (
-                    guard_policy.get("sigma_quantile")
-                    or guard_policy.get("contraction")
-                    or guard_policy.get("kappa")
-                )
+                pol_sq = guard_policy.get("sigma_quantile")
             if pol_sq is None:
                 pol_sq = default_sigma_quantile
             if pol_sq is not None:
@@ -371,7 +379,7 @@ def _extract_spectral_analysis(
             else {}
         )
         if not families:
-            # Prefer z-summary when available; accept legacy 'family_stats' too
+            # Prefer z-summary when available; accept 'family_stats' too
             fzs = guard_metrics.get("family_z_summary")
             if not isinstance(fzs, dict) or not fzs:
                 fzs = guard_metrics.get("family_stats")
@@ -493,7 +501,7 @@ def _extract_spectral_analysis(
         for source in sources:
             if not isinstance(source, dict):
                 continue
-            candidate = source.get("multiple_testing") or source.get("multipletesting")
+            candidate = source.get("multiple_testing")
             if isinstance(candidate, dict) and candidate:
                 return candidate
         return None
@@ -505,20 +513,13 @@ def _extract_spectral_analysis(
     policy_out: dict[str, Any] | None = None
     if isinstance(guard_policy, dict) and guard_policy:
         policy_out = dict(guard_policy)
-        _promote_legacy_multiple_testing_key(policy_out)
         if default_sigma_quantile is not None:
-            sq = (
-                policy_out.get("sigma_quantile")
-                or policy_out.get("contraction")
-                or policy_out.get("kappa")
-            )
+            sq = policy_out.get("sigma_quantile")
             if sq is not None:
                 try:
                     policy_out["sigma_quantile"] = float(sq)
                 except Exception:
                     pass
-        policy_out.pop("contraction", None)
-        policy_out.pop("kappa", None)
         if tier == "balanced":
             policy_out["correction_enabled"] = False
             policy_out["max_spectral_norm"] = None
@@ -532,7 +533,7 @@ def _extract_spectral_analysis(
         "families": families,
         "family_caps": family_caps,
     }
-    # Attach status to summary for backward-compatibility in tests
+    # Surface a stable/capped status on the summary for schema parity.
     try:
         summary["status"] = "stable" if int(caps_applied) == 0 else "capped"
     except Exception:
@@ -594,6 +595,40 @@ def _extract_spectral_analysis(
             result["top_violations"] = top_violations
     if family_quantiles:
         result["family_z_quantiles"] = family_quantiles
+    result["evaluated"] = bool(spectral_guard)
+    measurement_contract = None
+    try:
+        mc = (
+            guard_metrics.get("measurement_contract")
+            if isinstance(guard_metrics, dict)
+            else None
+        )
+        if isinstance(mc, dict) and mc:
+            measurement_contract = mc
+    except Exception:
+        measurement_contract = None
+    baseline_contract = None
+    try:
+        bc = (
+            baseline_spectral.get("measurement_contract")
+            if isinstance(baseline_spectral, dict)
+            else None
+        )
+        if isinstance(bc, dict) and bc:
+            baseline_contract = bc
+    except Exception:
+        baseline_contract = None
+    mc_hash = _measurement_contract_digest(measurement_contract)
+    baseline_hash = _measurement_contract_digest(baseline_contract)
+    if measurement_contract is not None:
+        result["measurement_contract"] = measurement_contract
+    if mc_hash:
+        result["measurement_contract_hash"] = mc_hash
+    if baseline_hash:
+        result["baseline_measurement_contract_hash"] = baseline_hash
+    if mc_hash and baseline_hash:
+        result["measurement_contract_match"] = bool(mc_hash == baseline_hash)
     result["caps_exceeded"] = bool(caps_exceeded)
     try:
         summary["caps_exceeded"] = bool(caps_exceeded)
@@ -624,24 +659,22 @@ def _extract_spectral_analysis(
 def _extract_rmt_analysis(
     report: RunReport, baseline: dict[str, Any]
 ) -> dict[str, Any]:
+    """Extract RMT analysis using activation edge-risk ε-band semantics."""
     tier = _resolve_policy_tier(report)
     tier_policies = get_tier_policies()
     tier_defaults = tier_policies.get(tier, tier_policies.get("balanced", {}))
     default_epsilon_map = (
         tier_defaults.get("rmt", {}).get("epsilon_by_family")
         if isinstance(tier_defaults, dict)
         else {}
     )
-    if not default_epsilon_map and isinstance(tier_defaults, dict):
-        default_epsilon_map = (tier_defaults.get("rmt", {}) or {}).get("epsilon", {})
     default_epsilon_map = {
         str(family): float(value)
         for family, value in (default_epsilon_map or {}).items()
-        if isinstance(value, int | float)
+        if isinstance(value, int | float) and math.isfinite(float(value))
     }
-    outliers_guarded = 0
-    outliers_bare = 0
     epsilon_default = 0.1
     try:
         eps_def = (
@@ -653,278 +686,168 @@ def _extract_rmt_analysis(
             epsilon_default = float(eps_def)
     except Exception:
         pass
-    stable = True
-    explicit_stability = False
-    max_ratio = 0.0
-    max_deviation_ratio = 1.0
-    mean_deviation_ratio = 1.0
-    epsilon_map: dict[str, float] = {}
-    baseline_outliers_per_family: dict[str, int] = {}
-    outliers_per_family: dict[str, int] = {}
-    epsilon_violations: list[Any] = []
-    margin_used = None
-    deadband_used = None
-    policy_out: dict[str, Any] | None = None
+    baseline_rmt = baseline.get("rmt", {}) if isinstance(baseline, dict) else {}
+    baseline_edge_by_family: dict[str, float] = {}
+    baseline_contract = None
+    if isinstance(baseline_rmt, dict) and baseline_rmt:
+        bc = baseline_rmt.get("measurement_contract")
+        if isinstance(bc, dict) and bc:
+            baseline_contract = bc
+        base = baseline_rmt.get("edge_risk_by_family") or baseline_rmt.get(
+            "edge_risk_by_family_base"
+        )
+        if isinstance(base, dict):
+            for k, v in base.items():
+                if isinstance(v, int | float) and math.isfinite(float(v)):
+                    baseline_edge_by_family[str(k)] = float(v)
+    rmt_guard = None
+    guard_metrics: dict[str, Any] = {}
+    guard_policy: dict[str, Any] = {}
     for guard in report.get("guards", []) or []:
         if str(guard.get("name", "")).lower() == "rmt":
+            rmt_guard = guard
             guard_metrics = guard.get("metrics", {}) or {}
             guard_policy = guard.get("policy", {}) or {}
-            if isinstance(guard_policy, dict) and guard_policy:
-                policy_out = dict(guard_policy)
-                if "epsilon_by_family" not in policy_out and isinstance(
-                    policy_out.get("epsilon"), dict
-                ):
-                    policy_out["epsilon_by_family"] = dict(policy_out["epsilon"])
-                if isinstance(policy_out.get("margin"), int | float) and math.isfinite(
-                    float(policy_out.get("margin"))
-                ):
-                    margin_used = float(policy_out.get("margin"))
-                if isinstance(
-                    policy_out.get("deadband"), int | float
-                ) and math.isfinite(float(policy_out.get("deadband"))):
-                    deadband_used = float(policy_out.get("deadband"))
-                if isinstance(
-                    policy_out.get("epsilon_default"), int | float
-                ) and math.isfinite(float(policy_out.get("epsilon_default"))):
-                    epsilon_default = float(policy_out.get("epsilon_default"))
-            if isinstance(
-                guard_metrics.get("epsilon_default"), int | float
-            ) and math.isfinite(float(guard_metrics.get("epsilon_default"))):
-                epsilon_default = float(guard_metrics.get("epsilon_default"))
-            outliers_guarded = guard_metrics.get(
-                "rmt_outliers", guard_metrics.get("layers_flagged", outliers_guarded)
-            )
-            max_ratio = guard_metrics.get("max_ratio", 0.0)
-            epsilon_map = guard_metrics.get("epsilon_by_family", {}) or epsilon_map
-            if not epsilon_map and isinstance(guard_policy, dict):
-                eps_src = guard_policy.get("epsilon_by_family") or guard_policy.get(
-                    "epsilon"
-                )
-                if isinstance(eps_src, dict):
-                    try:
-                        epsilon_map = {
-                            str(k): float(v)
-                            for k, v in eps_src.items()
-                            if isinstance(v, int | float) and math.isfinite(float(v))
-                        }
-                    except Exception:
-                        pass
-            baseline_outliers_per_family = (
-                guard_metrics.get("baseline_outliers_per_family", {})
-                or baseline_outliers_per_family
-            )
-            outliers_per_family = (
-                guard_metrics.get("outliers_per_family", {}) or outliers_per_family
-            )
-            epsilon_violations = guard_metrics.get(
-                "epsilon_violations", epsilon_violations
-            )
-            if outliers_per_family:
-                outliers_guarded = sum(
-                    int(v)
-                    for v in outliers_per_family.values()
-                    if isinstance(v, int | float)
-                )
-            if baseline_outliers_per_family:
-                outliers_bare = sum(
-                    int(v)
-                    for v in baseline_outliers_per_family.values()
-                    if isinstance(v, int | float)
-                )
-            flagged_rate = guard_metrics.get("flagged_rate", 0.0)
-            stable = flagged_rate <= 0.5
-            max_mp_ratio = guard_metrics.get("max_mp_ratio_final", 0.0)
-            mean_mp_ratio = guard_metrics.get("mean_mp_ratio_final", 0.0)
-            baseline_max = None
-            baseline_mean = None
-            baseline_rmt = baseline.get("rmt", {}) if isinstance(baseline, dict) else {}
-            if baseline_rmt:
-                baseline_max = baseline_rmt.get(
-                    "max_mp_ratio", baseline_rmt.get("max_mp_ratio_final")
-                )
-                baseline_mean = baseline_rmt.get(
-                    "mean_mp_ratio", baseline_rmt.get("mean_mp_ratio_final")
-                )
-                outliers_bare = baseline_rmt.get(
-                    "outliers", baseline_rmt.get("rmt_outliers", 0)
-                )
-            if baseline_max is None:
-                baseline_metrics = (
-                    baseline.get("metrics", {}) if isinstance(baseline, dict) else {}
-                )
-                if "rmt" in baseline_metrics:
-                    baseline_rmt_metrics = baseline_metrics["rmt"]
-                    baseline_max = baseline_rmt_metrics.get("max_mp_ratio_final")
-                    baseline_mean = baseline_rmt_metrics.get("mean_mp_ratio_final")
-            if baseline_max is None and isinstance(guard.get("baseline_metrics"), dict):
-                gb = guard.get("baseline_metrics")
-                baseline_max = gb.get("max_mp_ratio")
-                baseline_mean = gb.get("mean_mp_ratio")
-            if baseline_max is not None and baseline_max > 0:
-                max_deviation_ratio = max_mp_ratio / baseline_max
-            else:
-                max_deviation_ratio = 1.0
-            if baseline_mean is not None and baseline_mean > 0:
-                mean_deviation_ratio = mean_mp_ratio / baseline_mean
-            else:
-                mean_deviation_ratio = 1.0
-            if isinstance(guard_metrics.get("stable"), bool):
-                stable = bool(guard_metrics.get("stable"))
-                explicit_stability = True
             break
-    # Fallback: use metrics.rmt and/or top-level rmt section when guard is absent
-    if outliers_guarded == 0:
-        rmt_metrics = (report.get("metrics", {}) or {}).get("rmt", {})
-        if isinstance(rmt_metrics, dict):
-            try:
-                outliers_guarded = int(rmt_metrics.get("outliers", 0) or 0)
-            except Exception:
-                outliers_guarded = 0
-            if isinstance(rmt_metrics.get("stable"), bool):
-                stable = bool(rmt_metrics.get("stable"))
-                explicit_stability = True
-        rmt_top = report.get("rmt", {}) if isinstance(report.get("rmt"), dict) else {}
-        if isinstance(rmt_top, dict):
-            fams = rmt_top.get("families", {})
-            if isinstance(fams, dict) and fams:
-                for fam, rec in fams.items():
-                    if not isinstance(rec, dict):
-                        continue
-                    try:
-                        outliers_per_family[str(fam)] = int(
-                            rec.get("outliers_guarded", 0) or 0
-                        )
-                        baseline_outliers_per_family[str(fam)] = int(
-                            rec.get("outliers_bare", 0) or 0
-                        )
-                        if rec.get("epsilon") is not None:
-                            try:
-                                epsilon_map[str(fam)] = float(rec.get("epsilon"))
-                            except Exception:
-                                pass
-                    except Exception:
-                        continue
-            try:
-                if outliers_bare == 0:
-                    outliers_bare = int(rmt_top.get("outliers", 0) or 0)
-            except Exception:
-                pass
-    # If stability not explicitly provided, derive from outlier behavior
-    if not explicit_stability:
-        try:
-            if outliers_guarded == 0 and outliers_bare == 0:
-                stable = True
-            elif outliers_guarded <= outliers_bare:
-                stable = True
-            else:
-                stable = (outliers_guarded - outliers_bare) / max(
-                    outliers_bare, 1
-                ) <= 0.5
-        except Exception:
-            pass
+    policy_out: dict[str, Any] | None = None
+    if isinstance(guard_policy, dict) and guard_policy:
+        policy_out = dict(guard_policy)
+        if isinstance(policy_out.get("epsilon_default"), int | float) and math.isfinite(
+            float(policy_out.get("epsilon_default"))
+        ):
+            epsilon_default = float(policy_out.get("epsilon_default"))
+    if isinstance(guard_metrics.get("epsilon_default"), int | float) and math.isfinite(
+        float(guard_metrics.get("epsilon_default"))
+    ):
+        epsilon_default = float(guard_metrics.get("epsilon_default"))
+    edge_base: dict[str, float] = {}
+    edge_cur: dict[str, float] = {}
+    if isinstance(guard_metrics, dict) and guard_metrics:
+        base = guard_metrics.get("edge_risk_by_family_base") or {}
+        cur = guard_metrics.get("edge_risk_by_family") or {}
+        if isinstance(base, dict):
+            for k, v in base.items():
+                if isinstance(v, int | float) and math.isfinite(float(v)):
+                    edge_base[str(k)] = float(v)
+        if isinstance(cur, dict):
+            for k, v in cur.items():
+                if isinstance(v, int | float) and math.isfinite(float(v)):
+                    edge_cur[str(k)] = float(v)
+    if not edge_base and baseline_edge_by_family:
+        edge_base = dict(baseline_edge_by_family)
-    delta_per_family = {
-        k: int(outliers_per_family.get(k, 0))
-        - int(baseline_outliers_per_family.get(k, 0))
-        for k in set(outliers_per_family) | set(baseline_outliers_per_family)
-    }
-    delta_total = int(outliers_guarded) - int(outliers_bare)
-    # Conservative baseline fallback when not available
-    if outliers_bare == 0 and outliers_guarded > 0:
-        # Assume baseline had fewer outliers to make acceptance harder
-        outliers_bare = max(0, outliers_guarded - 1)
-    # Recompute stability from epsilon rule when not explicitly provided
-    if not explicit_stability:
-        try:
-            if outliers_per_family and baseline_outliers_per_family:
-                families_union = set(outliers_per_family) | set(
-                    baseline_outliers_per_family
+    epsilon_map: dict[str, float] = {}
+    eps_src = guard_metrics.get("epsilon_by_family") or {}
+    if not eps_src and isinstance(guard_policy, dict):
+        eps_src = guard_policy.get("epsilon_by_family") or {}
+    if isinstance(eps_src, dict):
+        for k, v in eps_src.items():
+            if isinstance(v, int | float) and math.isfinite(float(v)):
+                epsilon_map[str(k)] = float(v)
+    epsilon_violations = guard_metrics.get("epsilon_violations") or []
+    if not (isinstance(epsilon_violations, list) and epsilon_violations):
+        epsilon_violations = []
+        families = set(edge_cur) | set(edge_base)
+        for family in families:
+            base = float(edge_base.get(family, 0.0) or 0.0)
+            cur = float(edge_cur.get(family, 0.0) or 0.0)
+            if base <= 0.0:
+                continue
+            eps = float(
+                epsilon_map.get(
+                    family, default_epsilon_map.get(family, epsilon_default)
                 )
-                checks: list[bool] = []
-                for fam in families_union:
-                    guarded = int(outliers_per_family.get(fam, 0) or 0)
-                    bare = int(baseline_outliers_per_family.get(fam, 0) or 0)
-                    eps_val = float(epsilon_map.get(fam, epsilon_default))
-                    allowed = math.ceil(bare * (1.0 + eps_val))
-                    checks.append(guarded <= allowed)
-                if checks:
-                    stable = all(checks)
-            elif outliers_bare > 0:
-                stable = outliers_guarded <= (
-                    outliers_bare * (1.0 + float(epsilon_default))
+            )
+            allowed = (1.0 + eps) * base
+            if cur > allowed:
+                delta = (cur / base) - 1.0 if base > 0 else float("inf")
+                epsilon_violations.append(
+                    {
+                        "family": family,
+                        "edge_base": base,
+                        "edge_cur": cur,
+                        "delta": float(delta),
+                        "allowed": allowed,
+                        "epsilon": eps,
+                    }
                 )
-        except Exception:
-            pass
-    # Compute epsilon scalar (fallback) and detailed family breakdown
-    if epsilon_map:
-        epsilon_scalar = max(float(v) for v in epsilon_map.values())
-    elif default_epsilon_map:
-        try:
-            epsilon_scalar = max(float(v) for v in default_epsilon_map.values())
-        except Exception:
-            epsilon_scalar = float(epsilon_default)
-    else:
-        epsilon_scalar = float(epsilon_default)
-    try:
-        epsilon_scalar = round(float(epsilon_scalar), 3)
-    except Exception:
-        epsilon_scalar = float(epsilon_default)
-    def _to_int(v: Any) -> int:
-        try:
-            return int(v)
-        except (TypeError, ValueError):
-            return 0
+    stable = bool(guard_metrics.get("stable", not epsilon_violations))
-    families = (
-        set(outliers_per_family) | set(baseline_outliers_per_family) | set(epsilon_map)
+    families_all = sorted(
+        set(edge_base) | set(edge_cur) | set(epsilon_map) | set(default_epsilon_map)
     )
-    family_breakdown = {
-        family: {
-            "bare": _to_int(baseline_outliers_per_family.get(family, 0)),
-            "guarded": _to_int(outliers_per_family.get(family, 0)),
-            "epsilon": float(epsilon_map.get(family, epsilon_scalar)),
+    family_breakdown: dict[str, dict[str, Any]] = {}
+    ratios: list[float] = []
+    deltas: list[float] = []
+    for family in families_all:
+        base = float(edge_base.get(family, 0.0) or 0.0)
+        cur = float(edge_cur.get(family, 0.0) or 0.0)
+        eps = float(
+            epsilon_map.get(family, default_epsilon_map.get(family, epsilon_default))
+        )
+        allowed = (1.0 + eps) * base if base > 0.0 else None
+        ratio = (cur / base) if base > 0.0 else None
+        delta = ((cur / base) - 1.0) if base > 0.0 else None
+        if isinstance(ratio, float) and math.isfinite(ratio):
+            ratios.append(ratio)
+        if isinstance(delta, float) and math.isfinite(delta):
+            deltas.append(delta)
+        family_breakdown[family] = {
+            "edge_base": base,
+            "edge_cur": cur,
+            "epsilon": eps,
+            "allowed": allowed,
+            "ratio": ratio,
+            "delta": delta,
         }
-        for family in sorted(families)
-    }
-    # Stringify per-family dict keys for stability
-    outliers_per_family = {str(k): _to_int(v) for k, v in outliers_per_family.items()}
-    baseline_outliers_per_family = {
-        str(k): _to_int(v) for k, v in baseline_outliers_per_family.items()
-    }
-    delta_per_family = {str(k): _to_int(v) for k, v in delta_per_family.items()}
+    measurement_contract = None
+    try:
+        mc = (
+            guard_metrics.get("measurement_contract")
+            if isinstance(guard_metrics, dict)
+            else None
+        )
+        if isinstance(mc, dict) and mc:
+            measurement_contract = mc
+    except Exception:
+        measurement_contract = None
+    mc_hash = _measurement_contract_digest(measurement_contract)
+    baseline_hash = _measurement_contract_digest(baseline_contract)
-    result = {
-        "outliers_bare": outliers_bare,
-        "outliers_guarded": outliers_guarded,
-        "epsilon": epsilon_scalar,
+    result: dict[str, Any] = {
+        "tier": tier,
+        "edge_risk_by_family_base": dict(edge_base),
+        "edge_risk_by_family": dict(edge_cur),
         "epsilon_default": float(epsilon_default),
-        "epsilon_by_family": epsilon_map,
-        "outliers_per_family": outliers_per_family,
-        "baseline_outliers_per_family": baseline_outliers_per_family,
-        "delta_per_family": delta_per_family,
-        "delta_total": delta_total,
-        "epsilon_violations": epsilon_violations,
+        "epsilon_by_family": dict(epsilon_map),
+        "epsilon_violations": list(epsilon_violations),
         "stable": stable,
         "status": "stable" if stable else "unstable",
-        "max_ratio": max_ratio,
-        "max_deviation_ratio": max_deviation_ratio,
-        "mean_deviation_ratio": mean_deviation_ratio,
+        "max_edge_ratio": max(ratios) if ratios else None,
+        "max_edge_delta": max(deltas) if deltas else None,
+        "mean_edge_delta": (sum(deltas) / len(deltas)) if deltas else None,
         "families": family_breakdown,
+        "evaluated": bool(rmt_guard),
     }
-    if margin_used is not None:
-        result["margin"] = float(margin_used)
-    if deadband_used is not None:
-        result["deadband"] = float(deadband_used)
     if policy_out:
         result["policy"] = policy_out
+    if measurement_contract is not None:
+        result["measurement_contract"] = measurement_contract
+    if mc_hash:
+        result["measurement_contract_hash"] = mc_hash
+    if baseline_hash:
+        result["baseline_measurement_contract_hash"] = baseline_hash
+    if mc_hash and baseline_hash:
+        result["measurement_contract_match"] = bool(mc_hash == baseline_hash)
     return result

invarlock/reporting/normalizer.py CHANGED Viewed

@@ -183,6 +183,7 @@ def normalize_run_report(report: Mapping[str, Any] | RunReport) -> RunReport:
         "spectral",
         "rmt",
         "invariants",
+        "primary_metric_tail",
         "logloss_delta_ci",
         "bootstrap",
         "reduction",
@@ -237,6 +238,11 @@ def normalize_run_report(report: Mapping[str, Any] | RunReport) -> RunReport:
         flags=flags,
     )
+    # keep context when provided (profile/assurance provenance)
+    ctx = src.get("context")
+    if isinstance(ctx, Mapping):
+        out["context"] = dict(ctx)
     # keep evaluation_windows if provided (for deeper pairing-based features)
     ew = src.get("evaluation_windows")
     if isinstance(ew, dict):

invarlock 0.3.5__py3-none-any.whl → 0.3.6__py3-none-any.whl

invarlock 0.3.5py3-none-any.whl → 0.3.6py3-none-any.whl