npm - audrey - Versions diffs - 1.0.1 → 1.0.3 - Mend

audrey 1.0.1 → 1.0.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (235) hide show

package/CHANGELOG.md +57 -0
package/README.md +13 -3
package/benchmarks/adapter-self-test.mjs +6 -2
package/benchmarks/adapters/example-allow.mjs +5 -2
package/benchmarks/adapters/mem0-platform.mjs +19 -12
package/benchmarks/adapters/zep-cloud.mjs +51 -27
package/benchmarks/baselines.js +11 -6
package/benchmarks/build-leaderboard.mjs +36 -23
package/benchmarks/cases.js +24 -12
package/benchmarks/create-conformance-card.mjs +12 -3
package/benchmarks/create-submission-bundle.mjs +22 -8
package/benchmarks/dry-run-external-adapters.mjs +24 -12
package/benchmarks/guardbench.js +263 -123
package/benchmarks/output/adapter-self-test/guardbench-adapter-self-test.json +4 -4
package/benchmarks/output/external/guardbench-external-dry-run.json +1 -1
package/benchmarks/output/external/guardbench-external-evidence.json +1 -1
package/benchmarks/output/guardbench-conformance-card.json +12 -12
package/benchmarks/output/guardbench-raw.json +106 -106
package/benchmarks/output/guardbench-summary.json +168 -168
package/benchmarks/output/leaderboard/guardbench-leaderboard.json +5 -5
package/benchmarks/output/leaderboard/guardbench-leaderboard.md +2 -2
package/benchmarks/output/submission-bundle/guardbench-conformance-card.json +12 -12
package/benchmarks/output/submission-bundle/guardbench-raw.json +106 -106
package/benchmarks/output/submission-bundle/guardbench-summary.json +168 -168
package/benchmarks/output/submission-bundle/submission-manifest.json +11 -11
package/benchmarks/output/submission-bundle/validation-report.json +1 -1
package/benchmarks/output/summary.json +58 -58
package/benchmarks/perf-snapshot.js +12 -9
package/benchmarks/perf.bench.js +14 -6
package/benchmarks/public-paths.mjs +11 -5
package/benchmarks/reference-results.js +10 -5
package/benchmarks/report.js +48 -27
package/benchmarks/run-external-guardbench.mjs +47 -25
package/benchmarks/run.js +112 -59
package/benchmarks/validate-adapter-module.mjs +13 -10
package/benchmarks/validate-adapter-registry.mjs +16 -5
package/benchmarks/validate-guardbench-artifacts.mjs +76 -19
package/benchmarks/verify-external-evidence.mjs +86 -31
package/benchmarks/verify-publication-artifacts.mjs +34 -11
package/benchmarks/verify-submission-bundle.mjs +9 -4
package/dist/mcp-server/config.d.ts +1 -1
package/dist/mcp-server/config.d.ts.map +1 -1
package/dist/mcp-server/config.js +5 -3
package/dist/mcp-server/config.js.map +1 -1
package/dist/mcp-server/index.d.ts +7 -347
package/dist/mcp-server/index.d.ts.map +1 -1
package/dist/mcp-server/index.js +289 -256
package/dist/mcp-server/index.js.map +1 -1
package/dist/mcp-server/tool-schemas.d.ts +341 -0
package/dist/mcp-server/tool-schemas.d.ts.map +1 -0
package/dist/mcp-server/tool-schemas.js +248 -0
package/dist/mcp-server/tool-schemas.js.map +1 -0
package/dist/mcp-server/tool-validation.d.ts +17 -0
package/dist/mcp-server/tool-validation.d.ts.map +1 -0
package/dist/mcp-server/tool-validation.js +41 -0
package/dist/mcp-server/tool-validation.js.map +1 -0
package/dist/src/action-key.d.ts.map +1 -1
package/dist/src/action-key.js +6 -2
package/dist/src/action-key.js.map +1 -1
package/dist/src/adaptive.d.ts.map +1 -1
package/dist/src/adaptive.js +4 -2
package/dist/src/adaptive.js.map +1 -1
package/dist/src/affect.d.ts.map +1 -1
package/dist/src/affect.js +8 -5
package/dist/src/affect.js.map +1 -1
package/dist/src/audrey.d.ts +1 -1
package/dist/src/audrey.d.ts.map +1 -1
package/dist/src/audrey.js +93 -49
package/dist/src/audrey.js.map +1 -1
package/dist/src/capsule.d.ts.map +1 -1
package/dist/src/capsule.js +37 -15
package/dist/src/capsule.js.map +1 -1
package/dist/src/causal.d.ts +1 -1
package/dist/src/causal.d.ts.map +1 -1
package/dist/src/causal.js +4 -2
package/dist/src/causal.js.map +1 -1
package/dist/src/confidence.d.ts.map +1 -1
package/dist/src/confidence.js +5 -5
package/dist/src/confidence.js.map +1 -1
package/dist/src/consolidate.d.ts.map +1 -1
package/dist/src/consolidate.js +17 -9
package/dist/src/consolidate.js.map +1 -1
package/dist/src/context.js +1 -1
package/dist/src/context.js.map +1 -1
package/dist/src/controller.d.ts.map +1 -1
package/dist/src/controller.js +24 -13
package/dist/src/controller.js.map +1 -1
package/dist/src/db.d.ts.map +1 -1
package/dist/src/db.js +78 -27
package/dist/src/db.js.map +1 -1
package/dist/src/decay.d.ts +1 -1
package/dist/src/decay.d.ts.map +1 -1
package/dist/src/decay.js +1 -1
package/dist/src/decay.js.map +1 -1
package/dist/src/embedding.d.ts +12 -4
package/dist/src/embedding.d.ts.map +1 -1
package/dist/src/embedding.js +18 -16
package/dist/src/embedding.js.map +1 -1
package/dist/src/encode.d.ts.map +1 -1
package/dist/src/encode.js +5 -4
package/dist/src/encode.js.map +1 -1
package/dist/src/events.d.ts +3 -2
package/dist/src/events.d.ts.map +1 -1
package/dist/src/events.js +7 -3
package/dist/src/events.js.map +1 -1
package/dist/src/export.d.ts.map +1 -1
package/dist/src/export.js +21 -7
package/dist/src/export.js.map +1 -1
package/dist/src/feedback.d.ts.map +1 -1
package/dist/src/feedback.js +1 -1
package/dist/src/feedback.js.map +1 -1
package/dist/src/forget.d.ts.map +1 -1
package/dist/src/forget.js +12 -6
package/dist/src/forget.js.map +1 -1
package/dist/src/fts.d.ts.map +1 -1
package/dist/src/fts.js +20 -8
package/dist/src/fts.js.map +1 -1
package/dist/src/hybrid-recall.d.ts.map +1 -1
package/dist/src/hybrid-recall.js +12 -6
package/dist/src/hybrid-recall.js.map +1 -1
package/dist/src/impact.d.ts.map +1 -1
package/dist/src/impact.js +26 -10
package/dist/src/impact.js.map +1 -1
package/dist/src/import.d.ts.map +1 -1
package/dist/src/import.js +11 -6
package/dist/src/import.js.map +1 -1
package/dist/src/index.d.ts +3 -3
package/dist/src/index.d.ts.map +1 -1
package/dist/src/index.js +3 -3
package/dist/src/index.js.map +1 -1
package/dist/src/interference.d.ts.map +1 -1
package/dist/src/interference.js +10 -5
package/dist/src/interference.js.map +1 -1
package/dist/src/introspect.d.ts.map +1 -1
package/dist/src/introspect.js +12 -6
package/dist/src/introspect.js.map +1 -1
package/dist/src/llm.d.ts +2 -2
package/dist/src/llm.d.ts.map +1 -1
package/dist/src/llm.js +6 -6
package/dist/src/llm.js.map +1 -1
package/dist/src/migrate.d.ts.map +1 -1
package/dist/src/migrate.js +10 -4
package/dist/src/migrate.js.map +1 -1
package/dist/src/preflight.d.ts.map +1 -1
package/dist/src/preflight.js +6 -8
package/dist/src/preflight.js.map +1 -1
package/dist/src/profile.d.ts.map +1 -1
package/dist/src/profile.js.map +1 -1
package/dist/src/promote.d.ts.map +1 -1
package/dist/src/promote.js +16 -7
package/dist/src/promote.js.map +1 -1
package/dist/src/prompts.d.ts.map +1 -1
package/dist/src/prompts.js +1 -2
package/dist/src/prompts.js.map +1 -1
package/dist/src/recall.d.ts.map +1 -1
package/dist/src/recall.js +85 -18
package/dist/src/recall.js.map +1 -1
package/dist/src/redact.d.ts.map +1 -1
package/dist/src/redact.js +9 -4
package/dist/src/redact.js.map +1 -1
package/dist/src/reflexes.d.ts.map +1 -1
package/dist/src/reflexes.js +1 -7
package/dist/src/reflexes.js.map +1 -1
package/dist/src/rollback.d.ts.map +1 -1
package/dist/src/rollback.js +4 -2
package/dist/src/rollback.js.map +1 -1
package/dist/src/routes.d.ts.map +1 -1
package/dist/src/routes.js +33 -13
package/dist/src/routes.js.map +1 -1
package/dist/src/rules-compiler.d.ts.map +1 -1
package/dist/src/rules-compiler.js +24 -2
package/dist/src/rules-compiler.js.map +1 -1
package/dist/src/server.js +2 -2
package/dist/src/server.js.map +1 -1
package/dist/src/tool-trace.d.ts +2 -2
package/dist/src/tool-trace.d.ts.map +1 -1
package/dist/src/tool-trace.js +12 -4
package/dist/src/tool-trace.js.map +1 -1
package/dist/src/types.d.ts.map +1 -1
package/dist/src/ulid.js +1 -1
package/dist/src/ulid.js.map +1 -1
package/dist/src/utils.d.ts.map +1 -1
package/dist/src/utils.js.map +1 -1
package/dist/src/validate.d.ts.map +1 -1
package/dist/src/validate.js +20 -10
package/dist/src/validate.js.map +1 -1
package/docs/paper/07-evaluation.md +5 -5
package/docs/paper/audrey-paper-v1.md +5 -5
package/docs/paper/evidence-ledger.md +1 -1
package/docs/paper/output/arxiv/arxiv-manifest.json +4 -4
package/docs/paper/output/arxiv/main.tex +5 -5
package/docs/paper/output/arxiv-compile-report.json +3 -3
package/docs/paper/output/submission-bundle/README.md +13 -3
package/docs/paper/output/submission-bundle/benchmarks/output/adapter-self-test/guardbench-adapter-self-test.json +4 -4
package/docs/paper/output/submission-bundle/benchmarks/output/external/guardbench-external-dry-run.json +1 -1
package/docs/paper/output/submission-bundle/benchmarks/output/external/guardbench-external-evidence.json +1 -1
package/docs/paper/output/submission-bundle/benchmarks/output/guardbench-conformance-card.json +12 -12
package/docs/paper/output/submission-bundle/benchmarks/output/guardbench-raw.json +106 -106
package/docs/paper/output/submission-bundle/benchmarks/output/guardbench-summary.json +168 -168
package/docs/paper/output/submission-bundle/benchmarks/output/leaderboard/guardbench-leaderboard.json +5 -5
package/docs/paper/output/submission-bundle/benchmarks/output/leaderboard/guardbench-leaderboard.md +2 -2
package/docs/paper/output/submission-bundle/benchmarks/output/submission-bundle/submission-manifest.json +11 -11
package/docs/paper/output/submission-bundle/benchmarks/output/submission-bundle/validation-report.json +1 -1
package/docs/paper/output/submission-bundle/benchmarks/output/summary.json +64 -64
package/docs/paper/output/submission-bundle/docs/paper/07-evaluation.md +5 -5
package/docs/paper/output/submission-bundle/docs/paper/audrey-paper-v1.md +5 -5
package/docs/paper/output/submission-bundle/docs/paper/evidence-ledger.md +1 -1
package/docs/paper/output/submission-bundle/docs/paper/output/arxiv/arxiv-manifest.json +4 -4
package/docs/paper/output/submission-bundle/docs/paper/output/arxiv/main.tex +5 -5
package/docs/paper/output/submission-bundle/docs/paper/output/arxiv-compile-report.json +3 -3
package/docs/paper/output/submission-bundle/package.json +17 -4
package/docs/paper/output/submission-bundle/paper-submission-manifest.json +34 -34
package/examples/fintech-ops-demo.js +12 -5
package/examples/healthcare-ops-demo.js +8 -4
package/examples/ollama-memory-agent.js +41 -13
package/examples/stripe-demo.js +12 -5
package/package.json +17 -4
package/scripts/audit-release-completion.mjs +179 -101
package/scripts/create-arxiv-source.mjs +20 -14
package/scripts/create-paper-submission-bundle.mjs +6 -2
package/scripts/finalize-release.mjs +111 -36
package/scripts/prepare-release-cut.mjs +14 -6
package/scripts/publish-release-bundle.mjs +62 -23
package/scripts/publish-release-github-api.mjs +89 -24
package/scripts/smoke-cli.js +9 -9
package/scripts/sync-paper-artifacts.mjs +5 -1
package/scripts/verify-arxiv-compile.mjs +52 -16
package/scripts/verify-arxiv-source.mjs +45 -15
package/scripts/verify-browser-launch-plan.mjs +28 -11
package/scripts/verify-browser-launch-results.mjs +32 -14
package/scripts/verify-paper-artifacts.mjs +539 -79
package/scripts/verify-paper-claims.mjs +48 -20
package/scripts/verify-paper-submission-bundle.mjs +22 -11
package/scripts/verify-publication-pack.mjs +23 -9
package/scripts/verify-release-readiness.mjs +211 -76

package/docs/paper/output/submission-bundle/benchmarks/output/leaderboard/guardbench-leaderboard.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "schemaVersion": "1.0.0",
   "suite": "GuardBench leaderboard",
-  "generatedAt": "2026-05-15T17:52:13.304Z",
+  "generatedAt": "2026-05-29T13:33:23.840Z",
   "ranking": [
     "verified bundle",
     "adapter conformance",
@@ -28,9 +28,9 @@
         "evidenceRecall": 1,
         "redactionLeaks": 0,
         "latency": {
-          "p50Ms": 2.465,
-          "p95Ms": 30.791,
-          "maxMs": 30.791
+          "p50Ms": 3.09,
+          "p95Ms": 28.181,
+          "maxMs": 28.181
         }
       },
       "conformance": {
@@ -41,7 +41,7 @@
       },
       "source": {
         "dir": "benchmarks/output/submission-bundle",
-        "manifestGeneratedAt": "2026-05-15T17:52:13.050Z",
+        "manifestGeneratedAt": "2026-05-29T13:33:23.534Z",
         "fileCount": 17
       },
       "verification": {

package/docs/paper/output/submission-bundle/benchmarks/output/leaderboard/guardbench-leaderboard.md CHANGED Viewed

@@ -1,7 +1,7 @@
 # GuardBench Leaderboard
-Generated: 2026-05-15T17:52:13.304Z
+Generated: 2026-05-29T13:33:23.840Z
 | Rank | Subject | Verified | Conformant | Full Contract | Decision Accuracy | Evidence Recall | Redaction Leaks | p95 Latency | Bundle |
 |---:|---|---:|---:|---:|---:|---:|---:|---:|---|
-| 1 | Audrey Guard | yes | yes | 100.0% | 100.0% | 100.0% | 0 | 30.791ms | benchmarks/output/submission-bundle |
+| 1 | Audrey Guard | yes | yes | 100.0% | 100.0% | 100.0% | 0 | 28.181ms | benchmarks/output/submission-bundle |

package/docs/paper/output/submission-bundle/benchmarks/output/submission-bundle/submission-manifest.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "schemaVersion": "1.0.0",
   "suite": "GuardBench submission bundle",
-  "generatedAt": "2026-05-15T17:52:13.050Z",
+  "generatedAt": "2026-05-29T13:33:23.534Z",
   "sourceDir": "benchmarks/output",
   "subject": {
     "name": "Audrey Guard",
@@ -16,9 +16,9 @@
     "evidenceRecall": 1,
     "redactionLeaks": 0,
     "latency": {
-      "p50Ms": 2.465,
-      "p95Ms": 30.791,
-      "maxMs": 30.791
+      "p50Ms": 3.09,
+      "p95Ms": 28.181,
+      "maxMs": 28.181
     }
   },
   "conformance": {
@@ -44,8 +44,8 @@
   "files": [
     {
       "path": "guardbench-conformance-card.json",
-      "bytes": 1735,
-      "sha256": "65d4a10afe10178e4e4e3d508e0e06ce5a4b28713debc27cf4d9b60a46050d2f"
+      "bytes": 1748,
+      "sha256": "88cba808b893cde3530f4e29317d4cf9ae3b20f08456c58d97d4e5300f5f9298"
     },
     {
       "path": "guardbench-manifest.json",
@@ -54,13 +54,13 @@
     },
     {
       "path": "guardbench-raw.json",
-      "bytes": 43455,
-      "sha256": "3b78d1a2432e7d72752f96d9ac4b2b49cf6f59eb65548fbadb21ea6adbb86b37"
+      "bytes": 43466,
+      "sha256": "66d4b69087258638f3572a40e1fd59bb84067034f899eaa2c27eed2dde554b2b"
     },
     {
       "path": "guardbench-summary.json",
-      "bytes": 69350,
-      "sha256": "21023f230b761f1b43f8ecabe519dd6b320c62ad56f0b6aa28bbcf7a2c8838f5"
+      "bytes": 69359,
+      "sha256": "91f264dd889e2c639a6fc6d1b867bc228b94c84ed5120345e23dddb79c11ee74"
     },
     {
       "path": "schemas/guardbench-adapter-registry.schema.json",
@@ -125,7 +125,7 @@
     {
       "path": "validation-report.json",
       "bytes": 739,
-      "sha256": "570d28760ad3611ccf4f08e98281a3fe659730463d13e96ff31073c7ee10ce65"
+      "sha256": "284c40f608508d59e8cdc8047371dfcf0a9824a891ff37b77035241ab5de275f"
     }
   ]
 }

package/docs/paper/output/submission-bundle/benchmarks/output/submission-bundle/validation-report.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "generatedAt": "2026-05-15T17:52:13.050Z",
+  "generatedAt": "2026-05-29T13:33:23.534Z",
   "sourceValidation": {
     "ok": true,
     "dir": "benchmarks/output",

package/docs/paper/output/submission-bundle/benchmarks/output/summary.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "generatedAt": "2026-05-15T17:52:00.842Z",
+  "generatedAt": "2026-05-29T13:33:19.790Z",
   "command": "node benchmarks/run.js --provider mock --dimensions 64",
   "config": {
     "provider": "mock",
@@ -23,13 +23,13 @@
         "system": "Audrey",
         "scorePercent": 100,
         "passRate": 100,
-        "avgDurationMs": 93.58333333333333
+        "avgDurationMs": 14.75
       },
       {
         "system": "Vector Only",
         "scorePercent": 41.66666666666667,
         "passRate": 25,
-        "avgDurationMs": 0.25
+        "avgDurationMs": 0.4166666666666667
       },
       {
         "system": "Keyword + Recency",
@@ -41,7 +41,7 @@
         "system": "Recent Window",
         "scorePercent": 37.5,
         "passRate": 25,
-        "avgDurationMs": 0
+        "avgDurationMs": 0.08333333333333333
       }
     ],
     "overall_scope": "comparable_suites",
@@ -170,25 +170,25 @@
             "system": "Audrey",
             "scorePercent": 100,
             "passRate": 100,
-            "avgDurationMs": 127.125
+            "avgDurationMs": 14.75
           },
           {
             "system": "Vector Only",
             "scorePercent": 56.25,
             "passRate": 37.5,
-            "avgDurationMs": 0.25
+            "avgDurationMs": 0.5
           },
           {
             "system": "Keyword + Recency",
             "scorePercent": 50,
             "passRate": 37.5,
-            "avgDurationMs": 0.75
+            "avgDurationMs": 0.875
           },
           {
             "system": "Recent Window",
             "scorePercent": 50,
             "passRate": 37.5,
-            "avgDurationMs": 0
+            "avgDurationMs": 0.125
           }
         ],
         "byFamily": [
@@ -277,7 +277,7 @@
             "results": [
               {
                 "system": "Audrey",
-                "durationMs": 564,
+                "durationMs": 22,
                 "passed": true,
                 "score": 1,
                 "summary": "retrieved expected evidence",
@@ -289,7 +289,7 @@
               },
               {
                 "system": "Vector Only",
-                "durationMs": 0,
+                "durationMs": 1,
                 "passed": true,
                 "score": 1,
                 "summary": "retrieved expected evidence",
@@ -301,7 +301,7 @@
               },
               {
                 "system": "Keyword + Recency",
-                "durationMs": 6,
+                "durationMs": 7,
                 "passed": true,
                 "score": 1,
                 "summary": "retrieved expected evidence",
@@ -336,7 +336,7 @@
             "results": [
               {
                 "system": "Audrey",
-                "durationMs": 19,
+                "durationMs": 13,
                 "passed": true,
                 "score": 1,
                 "summary": "retrieved expected evidence",
@@ -371,7 +371,7 @@
               },
               {
                 "system": "Recent Window",
-                "durationMs": 0,
+                "durationMs": 1,
                 "passed": false,
                 "score": 0.5,
                 "summary": "retrieved expected evidence, but conflicting evidence still appeared later",
@@ -394,7 +394,7 @@
             "results": [
               {
                 "system": "Audrey",
-                "durationMs": 287,
+                "durationMs": 13,
                 "passed": true,
                 "score": 1,
                 "summary": "retrieved expected evidence",
@@ -457,7 +457,7 @@
             "results": [
               {
                 "system": "Audrey",
-                "durationMs": 38,
+                "durationMs": 13,
                 "passed": true,
                 "score": 1,
                 "summary": "retrieved expected evidence",
@@ -518,7 +518,7 @@
             "results": [
               {
                 "system": "Audrey",
-                "durationMs": 26,
+                "durationMs": 13,
                 "passed": true,
                 "score": 1,
                 "summary": "correct abstention",
@@ -527,7 +527,7 @@
               },
               {
                 "system": "Vector Only",
-                "durationMs": 0,
+                "durationMs": 1,
                 "passed": false,
                 "score": 0.5,
                 "summary": "no leak, but retrieved tangential context",
@@ -574,7 +574,7 @@
             "results": [
               {
                 "system": "Audrey",
-                "durationMs": 20,
+                "durationMs": 13,
                 "passed": true,
                 "score": 1,
                 "summary": "retrieved expected evidence",
@@ -632,7 +632,7 @@
             "results": [
               {
                 "system": "Audrey",
-                "durationMs": 22,
+                "durationMs": 19,
                 "passed": true,
                 "score": 1,
                 "summary": "retrieved expected evidence",
@@ -693,7 +693,7 @@
             "results": [
               {
                 "system": "Audrey",
-                "durationMs": 41,
+                "durationMs": 12,
                 "passed": true,
                 "score": 1,
                 "summary": "correct abstention",
@@ -750,13 +750,13 @@
             "system": "Audrey",
             "scorePercent": 100,
             "passRate": 100,
-            "avgDurationMs": 26.5
+            "avgDurationMs": 14.75
           },
           {
             "system": "Keyword + Recency",
             "scorePercent": 25,
             "passRate": 0,
-            "avgDurationMs": 0.25
+            "avgDurationMs": 0
           },
           {
             "system": "Vector Only",
@@ -821,7 +821,7 @@
             "results": [
               {
                 "system": "Audrey",
-                "durationMs": 44,
+                "durationMs": 14,
                 "passed": true,
                 "score": 1,
                 "summary": "retrieved expected evidence",
@@ -832,7 +832,7 @@
               },
               {
                 "system": "Vector Only",
-                "durationMs": 1,
+                "durationMs": 0,
                 "passed": false,
                 "score": 0.5,
                 "summary": "retrieved expected evidence, but conflicting evidence still appeared later",
@@ -879,7 +879,7 @@
             "results": [
               {
                 "system": "Audrey",
-                "durationMs": 24,
+                "durationMs": 14,
                 "passed": true,
                 "score": 1,
                 "summary": "correct abstention",
@@ -899,7 +899,7 @@
               },
               {
                 "system": "Keyword + Recency",
-                "durationMs": 1,
+                "durationMs": 0,
                 "passed": false,
                 "score": 0.5,
                 "summary": "no leak, but retrieved tangential context",
@@ -932,7 +932,7 @@
             "results": [
               {
                 "system": "Audrey",
-                "durationMs": 17,
+                "durationMs": 16,
                 "passed": true,
                 "score": 1,
                 "summary": "retrieved expected evidence",
@@ -993,7 +993,7 @@
             "results": [
               {
                 "system": "Audrey",
-                "durationMs": 21,
+                "durationMs": 15,
                 "passed": true,
                 "score": 1,
                 "summary": "retrieved expected evidence",
@@ -1004,7 +1004,7 @@
               },
               {
                 "system": "Vector Only",
-                "durationMs": 0,
+                "durationMs": 1,
                 "passed": false,
                 "score": 0,
                 "summary": "missed target evidence",
@@ -1055,7 +1055,7 @@
             "system": "Audrey",
             "scorePercent": 100,
             "passRate": 100,
-            "avgDurationMs": 58.75
+            "avgDurationMs": 14
           },
           {
             "system": "Vector Only",
@@ -1073,7 +1073,7 @@
             "system": "Recent Window",
             "scorePercent": 0,
             "passRate": 0,
-            "avgDurationMs": 0
+            "avgDurationMs": 0.25
           }
         ],
         "byFamily": [
@@ -1118,7 +1118,7 @@
             "results": [
               {
                 "system": "Audrey",
-                "durationMs": 71,
+                "durationMs": 18,
                 "passed": true,
                 "score": 1,
                 "summary": "matched all required signals",
@@ -1176,7 +1176,7 @@
             "results": [
               {
                 "system": "Audrey",
-                "durationMs": 18,
+                "durationMs": 13,
                 "passed": true,
                 "score": 1,
                 "summary": "matched all required signals",
@@ -1211,7 +1211,7 @@
               },
               {
                 "system": "Recent Window",
-                "durationMs": 0,
+                "durationMs": 1,
                 "passed": false,
                 "score": 0,
                 "summary": "missed required signals: decision:block, warning:must_follow, reflex:block",
@@ -1234,12 +1234,12 @@
             "results": [
               {
                 "system": "Audrey",
-                "durationMs": 12,
+                "durationMs": 13,
                 "passed": true,
                 "score": 1,
                 "summary": "matched all required signals",
                 "topResults": [
-                  "guard_hardened:replay_rejected error:guard receipt already has an outcome: 01KRPC8H5YR3DZPZYEJCWPJQYP",
+                  "guard_hardened:replay_rejected error:guard receipt already has an outcome: 01KSSZ0Y0W5BPW0QA26ZDFWXGG",
                   "decision:caution verdict:caution risk:0.55 Caution: 1 memory signal, 1 medium severity found before acting.",
                   "warning:recent_failure severity:medium npm test failed 1x recently: Vitest failed with spawn EPERM Before re-running npm test, check what changed since the last failure."
                 ],
@@ -1292,12 +1292,12 @@
             "results": [
               {
                 "system": "Audrey",
-                "durationMs": 134,
+                "durationMs": 12,
                 "passed": true,
                 "score": 1,
                 "summary": "matched all required signals",
                 "topResults": [
-                  "guard_hardened:non_guard_receipt_rejected error:not a guard receipt: 01KRPC8HA0WVXFATHHNX8VBRYF",
+                  "guard_hardened:non_guard_receipt_rejected error:not a guard receipt: 01KSSZ0Y19FPR6G897395CDBTH",
                   "decision:go verdict:clear risk:0 No relevant memory risks, prior failures, or must-follow procedures were found."
                 ],
                 "retrievalSummary": "guard_hardened:non_guard_receipt_rejected error:not a guard receipt: 01K | decision:go verdict:clear risk:0 No relevant memory risks, prior failure"
@@ -1352,7 +1352,7 @@
         "results": [
           {
             "system": "Audrey",
-            "durationMs": 564,
+            "durationMs": 22,
             "passed": true,
             "score": 1,
             "summary": "retrieved expected evidence",
@@ -1364,7 +1364,7 @@
           },
           {
             "system": "Vector Only",
-            "durationMs": 0,
+            "durationMs": 1,
             "passed": true,
             "score": 1,
             "summary": "retrieved expected evidence",
@@ -1376,7 +1376,7 @@
           },
           {
             "system": "Keyword + Recency",
-            "durationMs": 6,
+            "durationMs": 7,
             "passed": true,
             "score": 1,
             "summary": "retrieved expected evidence",
@@ -1411,7 +1411,7 @@
         "results": [
           {
             "system": "Audrey",
-            "durationMs": 19,
+            "durationMs": 13,
             "passed": true,
             "score": 1,
             "summary": "retrieved expected evidence",
@@ -1446,7 +1446,7 @@
           },
           {
             "system": "Recent Window",
-            "durationMs": 0,
+            "durationMs": 1,
             "passed": false,
             "score": 0.5,
             "summary": "retrieved expected evidence, but conflicting evidence still appeared later",
@@ -1469,7 +1469,7 @@
         "results": [
           {
             "system": "Audrey",
-            "durationMs": 287,
+            "durationMs": 13,
             "passed": true,
             "score": 1,
             "summary": "retrieved expected evidence",
@@ -1532,7 +1532,7 @@
         "results": [
           {
             "system": "Audrey",
-            "durationMs": 38,
+            "durationMs": 13,
             "passed": true,
             "score": 1,
             "summary": "retrieved expected evidence",
@@ -1593,7 +1593,7 @@
         "results": [
           {
             "system": "Audrey",
-            "durationMs": 26,
+            "durationMs": 13,
             "passed": true,
             "score": 1,
             "summary": "correct abstention",
@@ -1602,7 +1602,7 @@
           },
           {
             "system": "Vector Only",
-            "durationMs": 0,
+            "durationMs": 1,
             "passed": false,
             "score": 0.5,
             "summary": "no leak, but retrieved tangential context",
@@ -1649,7 +1649,7 @@
         "results": [
           {
             "system": "Audrey",
-            "durationMs": 20,
+            "durationMs": 13,
             "passed": true,
             "score": 1,
             "summary": "retrieved expected evidence",
@@ -1707,7 +1707,7 @@
         "results": [
           {
             "system": "Audrey",
-            "durationMs": 22,
+            "durationMs": 19,
             "passed": true,
             "score": 1,
             "summary": "retrieved expected evidence",
@@ -1768,7 +1768,7 @@
         "results": [
           {
             "system": "Audrey",
-            "durationMs": 41,
+            "durationMs": 12,
             "passed": true,
             "score": 1,
             "summary": "correct abstention",
@@ -1824,7 +1824,7 @@
         "results": [
           {
             "system": "Audrey",
-            "durationMs": 44,
+            "durationMs": 14,
             "passed": true,
             "score": 1,
             "summary": "retrieved expected evidence",
@@ -1835,7 +1835,7 @@
           },
           {
             "system": "Vector Only",
-            "durationMs": 1,
+            "durationMs": 0,
             "passed": false,
             "score": 0.5,
             "summary": "retrieved expected evidence, but conflicting evidence still appeared later",
@@ -1882,7 +1882,7 @@
         "results": [
           {
             "system": "Audrey",
-            "durationMs": 24,
+            "durationMs": 14,
             "passed": true,
             "score": 1,
             "summary": "correct abstention",
@@ -1902,7 +1902,7 @@
           },
           {
             "system": "Keyword + Recency",
-            "durationMs": 1,
+            "durationMs": 0,
             "passed": false,
             "score": 0.5,
             "summary": "no leak, but retrieved tangential context",
@@ -1935,7 +1935,7 @@
         "results": [
           {
             "system": "Audrey",
-            "durationMs": 17,
+            "durationMs": 16,
             "passed": true,
             "score": 1,
             "summary": "retrieved expected evidence",
@@ -1996,7 +1996,7 @@
         "results": [
           {
             "system": "Audrey",
-            "durationMs": 21,
+            "durationMs": 15,
             "passed": true,
             "score": 1,
             "summary": "retrieved expected evidence",
@@ -2007,7 +2007,7 @@
           },
           {
             "system": "Vector Only",
-            "durationMs": 0,
+            "durationMs": 1,
             "passed": false,
             "score": 0,
             "summary": "missed target evidence",
@@ -2058,7 +2058,7 @@
         "results": [
           {
             "system": "Audrey",
-            "durationMs": 71,
+            "durationMs": 18,
             "passed": true,
             "score": 1,
             "summary": "matched all required signals",
@@ -2116,7 +2116,7 @@
         "results": [
           {
             "system": "Audrey",
-            "durationMs": 18,
+            "durationMs": 13,
             "passed": true,
             "score": 1,
             "summary": "matched all required signals",
@@ -2151,7 +2151,7 @@
           },
           {
             "system": "Recent Window",
-            "durationMs": 0,
+            "durationMs": 1,
             "passed": false,
             "score": 0,
             "summary": "missed required signals: decision:block, warning:must_follow, reflex:block",
@@ -2174,12 +2174,12 @@
         "results": [
           {
             "system": "Audrey",
-            "durationMs": 12,
+            "durationMs": 13,
             "passed": true,
             "score": 1,
             "summary": "matched all required signals",
             "topResults": [
-              "guard_hardened:replay_rejected error:guard receipt already has an outcome: 01KRPC8H5YR3DZPZYEJCWPJQYP",
+              "guard_hardened:replay_rejected error:guard receipt already has an outcome: 01KSSZ0Y0W5BPW0QA26ZDFWXGG",
               "decision:caution verdict:caution risk:0.55 Caution: 1 memory signal, 1 medium severity found before acting.",
               "warning:recent_failure severity:medium npm test failed 1x recently: Vitest failed with spawn EPERM Before re-running npm test, check what changed since the last failure."
             ],
@@ -2232,12 +2232,12 @@
         "results": [
           {
             "system": "Audrey",
-            "durationMs": 134,
+            "durationMs": 12,
             "passed": true,
             "score": 1,
             "summary": "matched all required signals",
             "topResults": [
-              "guard_hardened:non_guard_receipt_rejected error:not a guard receipt: 01KRPC8HA0WVXFATHHNX8VBRYF",
+              "guard_hardened:non_guard_receipt_rejected error:not a guard receipt: 01KSSZ0Y19FPR6G897395CDBTH",
               "decision:go verdict:clear risk:0 No relevant memory risks, prior failures, or must-follow procedures were found."
             ],
             "retrievalSummary": "guard_hardened:non_guard_receipt_rejected error:not a guard receipt: 01K | decision:go verdict:clear risk:0 No relevant memory risks, prior failure"

package/docs/paper/output/submission-bundle/docs/paper/07-evaluation.md CHANGED Viewed

@@ -24,14 +24,14 @@ These numbers measure Audrey's local call path under an in-process mock embeddin
 ## Behavioral Regression Result
-The current `benchmarks/output/summary.json` was generated on 2026-05-15T17:52:00.842Z with command `node benchmarks/run.js --provider mock --dimensions 64` (Ledger: E24). It reports:
+The current `benchmarks/output/summary.json` was generated on 2026-05-29T13:33:19.790Z with command `node benchmarks/run.js --provider mock --dimensions 64` (Ledger: E24). It reports:
 | System | Score Percent | Pass Rate | Average Duration Ms |
 |---|---:|---:|---:|
-| Audrey | 100 | 100 | 93.58333333333333 |
-| Vector Only | 41.66666666666667 | 25 | 0.25 |
+| Audrey | 100 | 100 | 14.75 |
+| Vector Only | 41.66666666666667 | 25 | 0.4166666666666667 |
 | Keyword + Recency | 41.66666666666667 | 25 | 0.5833333333333334 |
-| Recent Window | 37.5 | 25 | 0 |
+| Recent Window | 37.5 | 25 | 0.08333333333333333 |
 This output is a regression-gate result. The baselines are toy local baselines used to catch retrieval and lifecycle regressions in the Audrey codebase. They are not external systems, not tuned competitor implementations, and not GuardBench baselines (Ledger: E23-E24). The current suite covers retrieval and operation families such as information extraction, knowledge updates, multi-session reasoning, conflict resolution, procedural learning, privacy boundary, overwrite, delete-and-abstain, semantic merge, and procedural merge (Ledger: E23-E24).
@@ -55,7 +55,7 @@ It reports local adapters only, not external-system comparisons (Ledger: E46):
 | Evidence recall | 100% |
 | Redaction leaks | 0 |
 | Recall-degradation detection | 100% |
-| Guard latency p50 / p95 | 2.465 ms / 30.791 ms |
+| Guard latency p50 / p95 | 3.09 ms / 28.181 ms |
 | Published artifact raw-secret leaks | 0 |
 | Audrey Guard decision accuracy | 100% |
 | No-memory decision accuracy | 10% |