PyPI - invarlock - Versions diffs - 0.3.6__py3-none-any.whl → 0.3.8__py3-none-any.whl - Mend

invarlock 0.3.6py3-none-any.whl → 0.3.8py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (73) hide show

invarlock/__init__.py +4 -4
invarlock/adapters/__init__.py +10 -14
invarlock/adapters/auto.py +37 -50
invarlock/adapters/capabilities.py +2 -2
invarlock/adapters/hf_causal.py +418 -0
invarlock/adapters/{hf_onnx.py → hf_causal_onnx.py} +3 -3
invarlock/adapters/hf_loading.py +7 -7
invarlock/adapters/hf_mixin.py +53 -9
invarlock/adapters/{hf_bert.py → hf_mlm.py} +4 -11
invarlock/adapters/{hf_t5.py → hf_seq2seq.py} +9 -9
invarlock/assurance/__init__.py +15 -23
invarlock/cli/adapter_auto.py +32 -26
invarlock/cli/app.py +128 -27
invarlock/cli/commands/__init__.py +2 -2
invarlock/cli/commands/calibrate.py +48 -4
invarlock/cli/commands/doctor.py +8 -10
invarlock/cli/commands/evaluate.py +986 -0
invarlock/cli/commands/explain_gates.py +25 -17
invarlock/cli/commands/export_html.py +11 -9
invarlock/cli/commands/plugins.py +13 -9
invarlock/cli/commands/report.py +326 -92
invarlock/cli/commands/run.py +1160 -228
invarlock/cli/commands/verify.py +157 -97
invarlock/cli/config.py +1 -1
invarlock/cli/determinism.py +1 -1
invarlock/cli/doctor_helpers.py +4 -5
invarlock/cli/output.py +193 -0
invarlock/cli/provenance.py +4 -4
invarlock/core/bootstrap.py +1 -1
invarlock/core/registry.py +9 -11
invarlock/core/retry.py +14 -14
invarlock/core/runner.py +112 -26
invarlock/edits/noop.py +2 -2
invarlock/edits/quant_rtn.py +67 -39
invarlock/eval/__init__.py +1 -1
invarlock/eval/bench.py +14 -10
invarlock/eval/data.py +68 -23
invarlock/eval/metrics.py +59 -1
invarlock/eval/primary_metric.py +1 -1
invarlock/eval/tasks/__init__.py +12 -0
invarlock/eval/tasks/classification.py +48 -0
invarlock/eval/tasks/qa.py +36 -0
invarlock/eval/tasks/text_generation.py +102 -0
invarlock/guards/invariants.py +19 -10
invarlock/guards/rmt.py +2 -2
invarlock/guards/spectral.py +1 -1
invarlock/guards/variance.py +2 -2
invarlock/model_profile.py +64 -62
invarlock/observability/health.py +6 -6
invarlock/observability/metrics.py +108 -0
invarlock/plugins/hf_bnb_adapter.py +32 -21
invarlock/reporting/__init__.py +18 -4
invarlock/reporting/guards_analysis.py +154 -4
invarlock/reporting/html.py +61 -11
invarlock/reporting/normalizer.py +9 -2
invarlock/reporting/policy_utils.py +1 -1
invarlock/reporting/primary_metric_utils.py +11 -11
invarlock/reporting/render.py +876 -510
invarlock/reporting/report.py +72 -30
invarlock/reporting/{certificate.py → report_builder.py} +252 -99
invarlock/reporting/{certificate_schema.py → report_schema.py} +22 -22
invarlock/reporting/report_types.py +6 -1
invarlock/reporting/telemetry.py +86 -0
invarlock-0.3.8.dist-info/METADATA +283 -0
{invarlock-0.3.6.dist-info → invarlock-0.3.8.dist-info}/RECORD +69 -64
{invarlock-0.3.6.dist-info → invarlock-0.3.8.dist-info}/WHEEL +1 -1
{invarlock-0.3.6.dist-info → invarlock-0.3.8.dist-info}/entry_points.txt +5 -3
invarlock/adapters/hf_gpt2.py +0 -404
invarlock/adapters/hf_llama.py +0 -487
invarlock/cli/commands/certify.py +0 -422
invarlock-0.3.6.dist-info/METADATA +0 -588
{invarlock-0.3.6.dist-info → invarlock-0.3.8.dist-info}/licenses/LICENSE +0 -0
{invarlock-0.3.6.dist-info → invarlock-0.3.8.dist-info}/top_level.txt +0 -0

invarlock/reporting/report.py CHANGED Viewed

@@ -16,11 +16,9 @@ from typing import Any, cast
 from invarlock.cli._evidence import maybe_dump_guard_evidence
-from .certificate import (
-    make_certificate,
-)
 from .normalizer import normalize_run_report
-from .render import render_certificate_markdown
+from .render import render_report_markdown
+from .report_builder import make_report
 from .report_types import RunReport, validate_report
@@ -160,17 +158,19 @@ def to_html(
     return "\n".join(html_parts)
-def to_certificate(report: RunReport, baseline: RunReport, format: str = "json") -> str:
+def to_evaluation_report(
+    report: RunReport, baseline: RunReport, format: str = "json"
+) -> str:
     """
-    Convert RunReport to certificate format.
+    Convert RunReport to evaluation report format.
     Args:
-        report: Primary RunReport to certify
+        report: Primary RunReport to evaluate
         baseline: Baseline RunReport for comparison
         format: Output format ("json" or "markdown")
     Returns:
-        Formatted certificate string
+        Formatted evaluation report string
     """
     if not validate_report(report):
         raise ValueError("Invalid primary RunReport structure")
@@ -178,15 +178,14 @@ def to_certificate(report: RunReport, baseline: RunReport, format: str = "json")
     if not _validate_baseline_or_report(baseline):
         raise ValueError("Invalid baseline RunReport structure")
-    # Generate certificate
-    certificate = make_certificate(report, baseline)
+    evaluation_report = make_report(report, baseline)
     if format == "json":
-        return json.dumps(certificate, indent=2, ensure_ascii=False)
+        return json.dumps(evaluation_report, indent=2, ensure_ascii=False)
     elif format == "markdown":
-        return render_certificate_markdown(certificate)
+        return render_report_markdown(evaluation_report)
     else:
-        raise ValueError(f"Unsupported certificate format: {format}")
+        raise ValueError(f"Unsupported evaluation report format: {format}")
 def save_report(
@@ -203,9 +202,9 @@ def save_report(
     Args:
         report: RunReport to save
         output_dir: Directory to save reports in
-        formats: List of formats to generate ("json", "markdown", "html", "cert")
+        formats: List of formats to generate ("json", "markdown", "html", "report")
         compare: Optional comparison report
-        baseline: Optional baseline report for certificate generation
+        baseline: Optional baseline report for evaluation report generation
         filename_prefix: Prefix for generated filenames
     Returns:
@@ -238,31 +237,34 @@ def save_report(
             f.write(to_html(report, compare))
         saved_files["html"] = html_path
-    if "cert" in formats:
+    if "report" in formats:
         if baseline is None:
-            raise ValueError("Baseline report required for certificate generation")
+            raise ValueError(
+                "Baseline report required for evaluation report generation"
+            )
-        # Generate certificate JSON in canonical path/name
-        cert_json_path = output_path / "evaluation.cert.json"
-        with open(cert_json_path, "w", encoding="utf-8") as f:
-            f.write(to_certificate(report, baseline, format="json"))
-        saved_files["cert"] = cert_json_path
+        report_json = to_evaluation_report(report, baseline, format="json")
+        report_json_path = output_path / "evaluation.report.json"
+        with open(report_json_path, "w", encoding="utf-8") as f:
+            f.write(report_json)
+        saved_files["report"] = report_json_path
         # Also emit a markdown variant for human consumption
-        cert_md_path = output_path / f"{filename_prefix}_certificate.md"
-        with open(cert_md_path, "w", encoding="utf-8") as f:
-            f.write(to_certificate(report, baseline, format="markdown"))
-        saved_files["cert_md"] = cert_md_path
+        report_md = to_evaluation_report(report, baseline, format="markdown")
+        report_md_path = output_path / "evaluation_report.md"
+        with open(report_md_path, "w", encoding="utf-8") as f:
+            f.write(report_md)
+        saved_files["report_md"] = report_md_path
         # Emit a lightweight manifest to serve as an evidence bundle index
         try:
             from datetime import datetime as _dt
-            manifest = {
+            manifest: dict[str, Any] = {
                 "generated_at": _dt.now().isoformat(),
                 "files": {
-                    "certificate_json": str(cert_json_path),
-                    "certificate_markdown": str(cert_md_path),
+                    "evaluation_report_json": str(report_json_path),
+                    "evaluation_report_markdown": str(report_md_path),
                 },
                 "summary": {
                     "run_model": (report.get("meta", {}) or {}).get("model_id"),
@@ -270,6 +272,40 @@ def save_report(
                     "seed": (report.get("meta", {}) or {}).get("seed"),
                 },
             }
+            # Surface quick triage fields without opening the evaluation report.
+            try:
+                from .render import compute_console_validation_block
+                evaluation_report_obj = json.loads(report_json)
+                if not isinstance(evaluation_report_obj, dict):
+                    raise TypeError("evaluation report JSON did not decode to a dict")
+                block = compute_console_validation_block(evaluation_report_obj)
+                rows = block.get("rows", []) or []
+                gates_total = len(rows)
+                gates_passed = sum(
+                    1 for r in rows if isinstance(r, dict) and bool(r.get("ok"))
+                )
+                overall_status = "PASS" if block.get("overall_pass") else "FAIL"
+                pm_ratio = None
+                pm = evaluation_report_obj.get("primary_metric", {}) or {}
+                if isinstance(pm, dict):
+                    ratio = pm.get("ratio_vs_baseline")
+                    if isinstance(ratio, int | float):
+                        pm_ratio = float(ratio)
+                manifest["summary"].update(
+                    {
+                        "overall_status": overall_status,
+                        "primary_metric_ratio": pm_ratio,
+                        "gates_passed": gates_passed,
+                        "gates_total": gates_total,
+                    }
+                )
+            except Exception:
+                pass
             # Write debug evidence (tiny) when requested via env
             guard_payload = {}
             try:
@@ -900,4 +936,10 @@ def _get_default_css() -> str:
 # Export public API
-__all__ = ["to_json", "to_markdown", "to_html", "to_certificate", "save_report"]
+__all__ = [
+    "to_json",
+    "to_markdown",
+    "to_html",
+    "to_evaluation_report",
+    "save_report",
+]

invarlock 0.3.6__py3-none-any.whl → 0.3.8__py3-none-any.whl

invarlock 0.3.6py3-none-any.whl → 0.3.8py3-none-any.whl