npm - audrey - Versions diffs - 0.23.1 → 1.0.0 - Mend

audrey 0.23.1 → 1.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (250) hide show

package/CHANGELOG.md +81 -19
package/LICENSE +21 -21
package/README.md +209 -5
package/SECURITY.md +2 -1
package/benchmarks/adapter-kit.mjs +20 -0
package/benchmarks/adapter-self-test.mjs +166 -0
package/benchmarks/adapters/example-allow.mjs +28 -0
package/benchmarks/adapters/mem0-platform.mjs +267 -0
package/benchmarks/adapters/registry.json +51 -0
package/benchmarks/adapters/zep-cloud.mjs +280 -0
package/benchmarks/baselines.js +169 -0
package/benchmarks/build-leaderboard.mjs +170 -0
package/benchmarks/cases.js +537 -0
package/benchmarks/create-conformance-card.mjs +139 -0
package/benchmarks/create-submission-bundle.mjs +176 -0
package/benchmarks/dry-run-external-adapters.mjs +165 -0
package/benchmarks/guardbench.js +1035 -0
package/benchmarks/output/adapter-self-test/guardbench-adapter-self-test.json +50 -0
package/benchmarks/output/external/guardbench-external-dry-run.json +69 -0
package/benchmarks/output/external/guardbench-external-evidence.json +56 -0
package/benchmarks/output/guardbench-conformance-card.json +63 -0
package/benchmarks/output/guardbench-manifest.json +414 -0
package/benchmarks/output/guardbench-raw.json +1171 -0
package/benchmarks/output/guardbench-summary.json +1981 -0
package/benchmarks/output/leaderboard/guardbench-leaderboard.json +93 -0
package/benchmarks/output/leaderboard/guardbench-leaderboard.md +7 -0
package/benchmarks/output/submission-bundle/guardbench-conformance-card.json +63 -0
package/benchmarks/output/submission-bundle/guardbench-manifest.json +414 -0
package/benchmarks/output/submission-bundle/guardbench-raw.json +1171 -0
package/benchmarks/output/submission-bundle/guardbench-summary.json +1981 -0
package/benchmarks/output/submission-bundle/schemas/guardbench-adapter-registry.schema.json +69 -0
package/benchmarks/output/submission-bundle/schemas/guardbench-adapter-self-test.schema.json +156 -0
package/benchmarks/output/submission-bundle/schemas/guardbench-conformance-card.schema.json +184 -0
package/benchmarks/output/submission-bundle/schemas/guardbench-external-dry-run.schema.json +74 -0
package/benchmarks/output/submission-bundle/schemas/guardbench-external-evidence.schema.json +108 -0
package/benchmarks/output/submission-bundle/schemas/guardbench-external-run.schema.json +160 -0
package/benchmarks/output/submission-bundle/schemas/guardbench-leaderboard.schema.json +179 -0
package/benchmarks/output/submission-bundle/schemas/guardbench-manifest.schema.json +213 -0
package/benchmarks/output/submission-bundle/schemas/guardbench-publication-verification.schema.json +47 -0
package/benchmarks/output/submission-bundle/schemas/guardbench-raw.schema.json +164 -0
package/benchmarks/output/submission-bundle/schemas/guardbench-submission-manifest.schema.json +151 -0
package/benchmarks/output/submission-bundle/schemas/guardbench-summary.schema.json +228 -0
package/benchmarks/output/submission-bundle/submission-manifest.json +131 -0
package/benchmarks/output/submission-bundle/validation-report.json +31 -0
package/benchmarks/output/summary.json +2354 -0
package/benchmarks/perf-snapshot.js +304 -0
package/benchmarks/perf.bench.js +161 -0
package/benchmarks/public-paths.mjs +78 -0
package/benchmarks/reference-results.js +70 -0
package/benchmarks/report.js +259 -0
package/benchmarks/run-external-guardbench.mjs +281 -0
package/benchmarks/run.js +682 -0
package/benchmarks/schemas/guardbench-adapter-registry.schema.json +69 -0
package/benchmarks/schemas/guardbench-adapter-self-test.schema.json +156 -0
package/benchmarks/schemas/guardbench-conformance-card.schema.json +184 -0
package/benchmarks/schemas/guardbench-external-dry-run.schema.json +74 -0
package/benchmarks/schemas/guardbench-external-evidence.schema.json +108 -0
package/benchmarks/schemas/guardbench-external-run.schema.json +160 -0
package/benchmarks/schemas/guardbench-leaderboard.schema.json +179 -0
package/benchmarks/schemas/guardbench-manifest.schema.json +213 -0
package/benchmarks/schemas/guardbench-publication-verification.schema.json +47 -0
package/benchmarks/schemas/guardbench-raw.schema.json +164 -0
package/benchmarks/schemas/guardbench-submission-manifest.schema.json +151 -0
package/benchmarks/schemas/guardbench-summary.schema.json +228 -0
package/benchmarks/snapshots/perf-0.22.2.json +123 -0
package/benchmarks/snapshots/perf-0.23.0.json +123 -0
package/benchmarks/validate-adapter-module.mjs +104 -0
package/benchmarks/validate-adapter-registry.mjs +134 -0
package/benchmarks/validate-adapter-self-test.mjs +96 -0
package/benchmarks/validate-guardbench-artifacts.mjs +343 -0
package/benchmarks/verify-external-evidence.mjs +296 -0
package/benchmarks/verify-publication-artifacts.mjs +286 -0
package/benchmarks/verify-submission-bundle.mjs +167 -0
package/dist/mcp-server/config.d.ts +1 -1
package/dist/mcp-server/config.d.ts.map +1 -1
package/dist/mcp-server/config.js +1 -1
package/dist/mcp-server/config.js.map +1 -1
package/dist/mcp-server/index.d.ts +65 -3
package/dist/mcp-server/index.d.ts.map +1 -1
package/dist/mcp-server/index.js +675 -157
package/dist/mcp-server/index.js.map +1 -1
package/dist/src/action-key.d.ts +9 -0
package/dist/src/action-key.d.ts.map +1 -0
package/dist/src/action-key.js +49 -0
package/dist/src/action-key.js.map +1 -0
package/dist/src/adaptive.js +5 -5
package/dist/src/affect.js +8 -8
package/dist/src/audrey.d.ts +3 -0
package/dist/src/audrey.d.ts.map +1 -1
package/dist/src/audrey.js +55 -3
package/dist/src/audrey.js.map +1 -1
package/dist/src/capsule.js +4 -4
package/dist/src/causal.js +3 -3
package/dist/src/consolidate.js +48 -48
package/dist/src/controller.d.ts +61 -5
package/dist/src/controller.d.ts.map +1 -1
package/dist/src/controller.js +230 -49
package/dist/src/controller.js.map +1 -1
package/dist/src/db.js +172 -172
package/dist/src/decay.js +8 -8
package/dist/src/embedding.d.ts +2 -1
package/dist/src/embedding.d.ts.map +1 -1
package/dist/src/embedding.js +39 -29
package/dist/src/embedding.js.map +1 -1
package/dist/src/encode.js +6 -6
package/dist/src/feedback.d.ts +6 -0
package/dist/src/feedback.d.ts.map +1 -1
package/dist/src/feedback.js +6 -0
package/dist/src/feedback.js.map +1 -1
package/dist/src/forget.js +12 -12
package/dist/src/hybrid-recall.js +9 -9
package/dist/src/impact.js +6 -6
package/dist/src/import.d.ts +3 -3
package/dist/src/import.js +41 -41
package/dist/src/index.d.ts +3 -3
package/dist/src/index.d.ts.map +1 -1
package/dist/src/index.js +2 -2
package/dist/src/index.js.map +1 -1
package/dist/src/interference.js +14 -14
package/dist/src/introspect.js +18 -18
package/dist/src/preflight.d.ts.map +1 -1
package/dist/src/preflight.js +41 -0
package/dist/src/preflight.js.map +1 -1
package/dist/src/promote.js +7 -7
package/dist/src/prompts.js +118 -118
package/dist/src/recall.js +30 -30
package/dist/src/reflexes.d.ts +1 -0
package/dist/src/reflexes.d.ts.map +1 -1
package/dist/src/reflexes.js +3 -0
package/dist/src/reflexes.js.map +1 -1
package/dist/src/rollback.js +4 -4
package/dist/src/routes.d.ts.map +1 -1
package/dist/src/routes.js +67 -1
package/dist/src/routes.js.map +1 -1
package/dist/src/validate.js +25 -25
package/docs/AUDREY_PAPER_OUTLINE.md +175 -0
package/docs/MEMORY_BENCHMARKING.md +59 -0
package/docs/PRODUCTION_BACKLOG.md +304 -0
package/docs/paper/00-master.md +48 -0
package/docs/paper/01-introduction.md +27 -0
package/docs/paper/02-related-work.md +47 -0
package/docs/paper/03-problem-definition.md +108 -0
package/docs/paper/04-design.md +164 -0
package/docs/paper/05-guardbench-spec.md +412 -0
package/docs/paper/06-implementation.md +113 -0
package/docs/paper/07-evaluation.md +168 -0
package/docs/paper/08-discussion-limitations.md +61 -0
package/docs/paper/09-conclusion.md +11 -0
package/docs/paper/SUBMISSION_README.md +162 -0
package/docs/paper/appendix-a-demo-transcript.md +114 -0
package/docs/paper/arxiv-compile-report.schema.json +116 -0
package/docs/paper/arxiv-source.schema.json +61 -0
package/docs/paper/audrey-paper-v1.md +1106 -0
package/docs/paper/browser-launch-plan.json +209 -0
package/docs/paper/browser-launch-plan.schema.json +100 -0
package/docs/paper/browser-launch-results.json +86 -0
package/docs/paper/browser-launch-results.schema.json +66 -0
package/docs/paper/claim-register.json +138 -0
package/docs/paper/claim-register.schema.json +81 -0
package/docs/paper/evidence-ledger.md +103 -0
package/docs/paper/output/arxiv/README-arxiv.txt +8 -0
package/docs/paper/output/arxiv/arxiv-manifest.json +41 -0
package/docs/paper/output/arxiv/main.tex +949 -0
package/docs/paper/output/arxiv/references.bib +222 -0
package/docs/paper/output/arxiv-compile-report.json +24 -0
package/docs/paper/output/submission-bundle/LICENSE +21 -0
package/docs/paper/output/submission-bundle/README.md +533 -0
package/docs/paper/output/submission-bundle/benchmarks/output/adapter-self-test/guardbench-adapter-self-test.json +50 -0
package/docs/paper/output/submission-bundle/benchmarks/output/external/guardbench-external-dry-run.json +69 -0
package/docs/paper/output/submission-bundle/benchmarks/output/external/guardbench-external-evidence.json +56 -0
package/docs/paper/output/submission-bundle/benchmarks/output/guardbench-conformance-card.json +63 -0
package/docs/paper/output/submission-bundle/benchmarks/output/guardbench-manifest.json +414 -0
package/docs/paper/output/submission-bundle/benchmarks/output/guardbench-raw.json +1171 -0
package/docs/paper/output/submission-bundle/benchmarks/output/guardbench-summary.json +1981 -0
package/docs/paper/output/submission-bundle/benchmarks/output/leaderboard/guardbench-leaderboard.json +93 -0
package/docs/paper/output/submission-bundle/benchmarks/output/leaderboard/guardbench-leaderboard.md +7 -0
package/docs/paper/output/submission-bundle/benchmarks/output/submission-bundle/submission-manifest.json +131 -0
package/docs/paper/output/submission-bundle/benchmarks/output/submission-bundle/validation-report.json +31 -0
package/docs/paper/output/submission-bundle/benchmarks/output/summary.json +2354 -0
package/docs/paper/output/submission-bundle/benchmarks/schemas/guardbench-adapter-registry.schema.json +69 -0
package/docs/paper/output/submission-bundle/benchmarks/schemas/guardbench-adapter-self-test.schema.json +156 -0
package/docs/paper/output/submission-bundle/benchmarks/schemas/guardbench-conformance-card.schema.json +184 -0
package/docs/paper/output/submission-bundle/benchmarks/schemas/guardbench-external-dry-run.schema.json +74 -0
package/docs/paper/output/submission-bundle/benchmarks/schemas/guardbench-external-evidence.schema.json +108 -0
package/docs/paper/output/submission-bundle/benchmarks/schemas/guardbench-external-run.schema.json +160 -0
package/docs/paper/output/submission-bundle/benchmarks/schemas/guardbench-leaderboard.schema.json +179 -0
package/docs/paper/output/submission-bundle/benchmarks/schemas/guardbench-manifest.schema.json +213 -0
package/docs/paper/output/submission-bundle/benchmarks/schemas/guardbench-publication-verification.schema.json +47 -0
package/docs/paper/output/submission-bundle/benchmarks/schemas/guardbench-raw.schema.json +164 -0
package/docs/paper/output/submission-bundle/benchmarks/schemas/guardbench-submission-manifest.schema.json +151 -0
package/docs/paper/output/submission-bundle/benchmarks/schemas/guardbench-summary.schema.json +228 -0
package/docs/paper/output/submission-bundle/docs/AUDREY_PAPER_OUTLINE.md +175 -0
package/docs/paper/output/submission-bundle/docs/paper/00-master.md +48 -0
package/docs/paper/output/submission-bundle/docs/paper/01-introduction.md +27 -0
package/docs/paper/output/submission-bundle/docs/paper/02-related-work.md +47 -0
package/docs/paper/output/submission-bundle/docs/paper/03-problem-definition.md +108 -0
package/docs/paper/output/submission-bundle/docs/paper/04-design.md +164 -0
package/docs/paper/output/submission-bundle/docs/paper/05-guardbench-spec.md +412 -0
package/docs/paper/output/submission-bundle/docs/paper/06-implementation.md +113 -0
package/docs/paper/output/submission-bundle/docs/paper/07-evaluation.md +168 -0
package/docs/paper/output/submission-bundle/docs/paper/08-discussion-limitations.md +61 -0
package/docs/paper/output/submission-bundle/docs/paper/09-conclusion.md +11 -0
package/docs/paper/output/submission-bundle/docs/paper/SUBMISSION_README.md +162 -0
package/docs/paper/output/submission-bundle/docs/paper/appendix-a-demo-transcript.md +114 -0
package/docs/paper/output/submission-bundle/docs/paper/arxiv-compile-report.schema.json +116 -0
package/docs/paper/output/submission-bundle/docs/paper/arxiv-source.schema.json +61 -0
package/docs/paper/output/submission-bundle/docs/paper/audrey-paper-v1.md +1106 -0
package/docs/paper/output/submission-bundle/docs/paper/browser-launch-plan.json +209 -0
package/docs/paper/output/submission-bundle/docs/paper/browser-launch-plan.schema.json +100 -0
package/docs/paper/output/submission-bundle/docs/paper/browser-launch-results.json +86 -0
package/docs/paper/output/submission-bundle/docs/paper/browser-launch-results.schema.json +66 -0
package/docs/paper/output/submission-bundle/docs/paper/claim-register.json +138 -0
package/docs/paper/output/submission-bundle/docs/paper/claim-register.schema.json +81 -0
package/docs/paper/output/submission-bundle/docs/paper/evidence-ledger.md +103 -0
package/docs/paper/output/submission-bundle/docs/paper/output/arxiv/README-arxiv.txt +8 -0
package/docs/paper/output/submission-bundle/docs/paper/output/arxiv/arxiv-manifest.json +41 -0
package/docs/paper/output/submission-bundle/docs/paper/output/arxiv/main.tex +949 -0
package/docs/paper/output/submission-bundle/docs/paper/output/arxiv/references.bib +222 -0
package/docs/paper/output/submission-bundle/docs/paper/output/arxiv-compile-report.json +24 -0
package/docs/paper/output/submission-bundle/docs/paper/paper-submission-bundle.schema.json +70 -0
package/docs/paper/output/submission-bundle/docs/paper/publication-pack.json +81 -0
package/docs/paper/output/submission-bundle/docs/paper/publication-pack.schema.json +60 -0
package/docs/paper/output/submission-bundle/docs/paper/references.bib +222 -0
package/docs/paper/output/submission-bundle/package.json +212 -0
package/docs/paper/output/submission-bundle/paper-submission-manifest.json +379 -0
package/docs/paper/paper-submission-bundle.schema.json +70 -0
package/docs/paper/publication-pack.json +81 -0
package/docs/paper/publication-pack.schema.json +60 -0
package/docs/paper/references.bib +222 -0
package/package.json +87 -4
package/scripts/audit-release-completion.mjs +362 -0
package/scripts/create-arxiv-source.mjs +362 -0
package/scripts/create-paper-submission-bundle.mjs +210 -0
package/scripts/finalize-release.mjs +526 -0
package/scripts/prepare-release-cut.mjs +269 -0
package/scripts/publish-release-bundle.mjs +209 -0
package/scripts/publish-release-github-api.mjs +429 -0
package/scripts/run-vitest.mjs +34 -0
package/scripts/smoke-cli.js +72 -0
package/scripts/sync-paper-artifacts.mjs +109 -0
package/scripts/verify-arxiv-compile.mjs +440 -0
package/scripts/verify-arxiv-source.mjs +194 -0
package/scripts/verify-browser-launch-plan.mjs +237 -0
package/scripts/verify-browser-launch-results.mjs +285 -0
package/scripts/verify-paper-artifacts.mjs +338 -0
package/scripts/verify-paper-claims.mjs +226 -0
package/scripts/verify-paper-submission-bundle.mjs +207 -0
package/scripts/verify-publication-pack.mjs +196 -0
package/scripts/verify-python-package.py +201 -0
package/scripts/verify-release-readiness.mjs +741 -0

package/docs/paper/output/submission-bundle/benchmarks/schemas/guardbench-raw.schema.json ADDED Viewed

@@ -0,0 +1,164 @@
+{
+  "$schema": "https://json-schema.org/draft/2020-12/schema",
+  "$id": "https://audrey-memory.org/schemas/guardbench-raw.schema.json",
+  "title": "GuardBench Raw Output",
+  "type": "object",
+  "additionalProperties": false,
+  "required": [
+    "suite",
+    "generatedAt",
+    "manifestVersion",
+    "provenance",
+    "cases",
+    "artifactRedactionSweep"
+  ],
+  "properties": {
+    "suite": { "const": "GuardBench comparative" },
+    "generatedAt": { "type": "string", "minLength": 1 },
+    "manifestVersion": { "type": "string", "minLength": 1 },
+    "provenance": { "$ref": "#/$defs/provenance" },
+    "cases": {
+      "type": "array",
+      "minItems": 10,
+      "items": { "$ref": "#/$defs/caseResult" }
+    },
+    "artifactRedactionSweep": { "$ref": "#/$defs/artifactRedactionSweep" }
+  },
+  "$defs": {
+    "provenance": {
+      "type": "object",
+      "additionalProperties": false,
+      "required": [
+        "generatedAt",
+        "gitSha",
+        "gitDirty",
+        "node",
+        "v8",
+        "platform",
+        "arch",
+        "osRelease",
+        "cpuModel",
+        "cpuCount",
+        "totalMemoryGb",
+        "embeddingProvider",
+        "embeddingDimensions",
+        "llmProvider"
+      ],
+      "properties": {
+        "generatedAt": { "type": "string", "minLength": 1 },
+        "gitSha": {
+          "anyOf": [
+            { "type": "null" },
+            { "type": "string", "minLength": 7 }
+          ]
+        },
+        "gitDirty": { "type": "boolean" },
+        "node": { "type": "string", "minLength": 1 },
+        "v8": { "type": "string", "minLength": 1 },
+        "platform": { "type": "string", "minLength": 1 },
+        "arch": { "type": "string", "minLength": 1 },
+        "osRelease": { "type": "string", "minLength": 1 },
+        "cpuModel": {
+          "anyOf": [
+            { "type": "null" },
+            { "type": "string", "minLength": 1 }
+          ]
+        },
+        "cpuCount": { "type": "integer", "minimum": 1 },
+        "totalMemoryGb": { "type": "number", "minimum": 0 },
+        "embeddingProvider": { "type": "string", "minLength": 1 },
+        "embeddingDimensions": { "type": "integer", "minimum": 1 },
+        "llmProvider": { "type": "string", "minLength": 1 }
+      }
+    },
+    "caseResult": {
+      "type": "object",
+      "additionalProperties": false,
+      "required": ["id", "name", "expectedDecision", "results"],
+      "properties": {
+        "id": { "type": "string", "pattern": "^GB-[0-9]{2}$" },
+        "name": { "type": "string", "minLength": 1 },
+        "expectedDecision": { "enum": ["allow", "warn", "block"] },
+        "results": {
+          "type": "array",
+          "minItems": 5,
+          "items": { "$ref": "#/$defs/resultRow" }
+        }
+      }
+    },
+    "resultRow": {
+      "type": "object",
+      "additionalProperties": false,
+      "required": [
+        "system",
+        "id",
+        "name",
+        "expectedDecision",
+        "decision",
+        "decisionCorrect",
+        "riskScore",
+        "passed",
+        "latencyMs",
+        "evidenceCount",
+        "evidenceIds",
+        "recommendedActions",
+        "summary",
+        "recallErrors",
+        "leakedSecrets",
+        "requiredEvidenceMatched"
+      ],
+      "properties": {
+        "system": { "type": "string", "minLength": 1 },
+        "external": { "type": "boolean" },
+        "id": { "type": "string", "pattern": "^GB-[0-9]{2}$" },
+        "name": { "type": "string", "minLength": 1 },
+        "expectedDecision": { "enum": ["allow", "warn", "block"] },
+        "decision": { "enum": ["allow", "warn", "block"] },
+        "decisionCorrect": { "type": "boolean" },
+        "riskScore": { "type": "number", "minimum": 0, "maximum": 1 },
+        "passed": { "type": "boolean" },
+        "latencyMs": { "type": "number", "minimum": 0 },
+        "evidenceCount": { "type": "integer", "minimum": 0 },
+        "evidenceIds": {
+          "type": "array",
+          "items": { "type": "string" }
+        },
+        "recommendedActions": {
+          "type": "array",
+          "items": { "type": "string" }
+        },
+        "summary": { "type": "string", "minLength": 1 },
+        "recallErrors": { "type": "array" },
+        "leakedSecrets": {
+          "type": "array",
+          "items": { "type": "string" }
+        },
+        "requiredEvidenceMatched": { "type": "boolean" }
+      }
+    },
+    "artifactRedactionSweep": {
+      "type": "object",
+      "additionalProperties": false,
+      "required": [
+        "checkedAt",
+        "filesChecked",
+        "seededSecretsChecked",
+        "leakCount",
+        "leaks",
+        "passed"
+      ],
+      "properties": {
+        "checkedAt": { "type": "string", "minLength": 1 },
+        "filesChecked": {
+          "type": "array",
+          "minItems": 3,
+          "items": { "type": "string", "minLength": 1 }
+        },
+        "seededSecretsChecked": { "type": "integer", "minimum": 0 },
+        "leakCount": { "type": "integer", "minimum": 0 },
+        "leaks": { "type": "array" },
+        "passed": { "type": "boolean" }
+      }
+    }
+  }
+}

package/docs/paper/output/submission-bundle/benchmarks/schemas/guardbench-submission-manifest.schema.json ADDED Viewed

@@ -0,0 +1,151 @@
+{
+  "$schema": "https://json-schema.org/draft/2020-12/schema",
+  "$id": "https://audrey-memory.org/schemas/guardbench-submission-manifest.schema.json",
+  "title": "GuardBench Submission Manifest",
+  "type": "object",
+  "additionalProperties": false,
+  "required": [
+    "schemaVersion",
+    "suite",
+    "generatedAt",
+    "sourceDir",
+    "subject",
+    "score",
+    "conformance",
+    "validation",
+    "files"
+  ],
+  "properties": {
+    "schemaVersion": { "const": "1.0.0" },
+    "suite": { "const": "GuardBench submission bundle" },
+    "generatedAt": { "type": "string", "minLength": 1 },
+    "sourceDir": { "type": "string", "minLength": 1 },
+    "subject": { "$ref": "#/$defs/subject" },
+    "score": { "$ref": "#/$defs/score" },
+    "conformance": { "$ref": "#/$defs/conformance" },
+    "validation": { "$ref": "#/$defs/validation" },
+    "files": {
+      "type": "array",
+      "minItems": 1,
+      "items": { "$ref": "#/$defs/fileRecord" }
+    }
+  },
+  "$defs": {
+    "subject": {
+      "type": "object",
+      "additionalProperties": false,
+      "required": ["name", "requestedAdapter", "external"],
+      "properties": {
+        "name": { "type": "string", "minLength": 1 },
+        "requestedAdapter": {
+          "anyOf": [
+            { "type": "string", "minLength": 1 },
+            { "type": "null" }
+          ]
+        },
+        "external": { "type": "boolean" }
+      }
+    },
+    "score": {
+      "type": "object",
+      "additionalProperties": false,
+      "required": [
+        "scenarios",
+        "fullContractPassed",
+        "fullContractPassRate",
+        "decisionAccuracy",
+        "evidenceRecall",
+        "redactionLeaks",
+        "latency"
+      ],
+      "properties": {
+        "scenarios": { "type": "integer", "minimum": 0 },
+        "fullContractPassed": { "$ref": "#/$defs/nullableNumber" },
+        "fullContractPassRate": { "$ref": "#/$defs/nullableRate" },
+        "decisionAccuracy": { "$ref": "#/$defs/nullableRate" },
+        "evidenceRecall": { "$ref": "#/$defs/nullableRate" },
+        "redactionLeaks": { "$ref": "#/$defs/nullableNumber" },
+        "latency": {
+          "anyOf": [
+            {
+              "type": "object",
+              "additionalProperties": false,
+              "required": ["p50Ms", "p95Ms", "maxMs"],
+              "properties": {
+                "p50Ms": { "type": "number", "minimum": 0 },
+                "p95Ms": { "type": "number", "minimum": 0 },
+                "maxMs": { "type": "number", "minimum": 0 }
+              }
+            },
+            { "type": "null" }
+          ]
+        }
+      }
+    },
+    "conformance": {
+      "type": "object",
+      "additionalProperties": false,
+      "required": ["ok", "failures", "artifactValidationOk", "artifactValidationFailures"],
+      "properties": {
+        "ok": { "type": "boolean" },
+        "failures": {
+          "type": "array",
+          "items": { "type": "string" }
+        },
+        "artifactValidationOk": { "type": "boolean" },
+        "artifactValidationFailures": {
+          "type": "array",
+          "items": { "type": "string" }
+        }
+      }
+    },
+    "validation": {
+      "type": "object",
+      "additionalProperties": false,
+      "required": ["ok", "dir", "schemasDir", "files", "optionalFiles", "failures"],
+      "properties": {
+        "ok": { "type": "boolean" },
+        "dir": { "type": "string", "minLength": 1 },
+        "schemasDir": { "type": "string", "minLength": 1 },
+        "files": {
+          "type": "array",
+          "items": { "type": "string", "minLength": 1 }
+        },
+        "optionalFiles": {
+          "type": "array",
+          "items": { "type": "string", "minLength": 1 }
+        },
+        "failures": {
+          "type": "array",
+          "items": { "type": "string" }
+        }
+      }
+    },
+    "fileRecord": {
+      "type": "object",
+      "additionalProperties": false,
+      "required": ["path", "bytes", "sha256"],
+      "properties": {
+        "path": { "type": "string", "minLength": 1 },
+        "bytes": { "type": "integer", "minimum": 0 },
+        "sha256": { "$ref": "#/$defs/sha256" }
+      }
+    },
+    "nullableNumber": {
+      "anyOf": [
+        { "type": "number", "minimum": 0 },
+        { "type": "null" }
+      ]
+    },
+    "nullableRate": {
+      "anyOf": [
+        { "type": "number", "minimum": 0, "maximum": 1 },
+        { "type": "null" }
+      ]
+    },
+    "sha256": {
+      "type": "string",
+      "pattern": "^[a-f0-9]{64}$"
+    }
+  }
+}

package/docs/paper/output/submission-bundle/benchmarks/schemas/guardbench-summary.schema.json ADDED Viewed

@@ -0,0 +1,228 @@
+{
+  "$schema": "https://json-schema.org/draft/2020-12/schema",
+  "$id": "https://audrey-memory.org/schemas/guardbench-summary.schema.json",
+  "title": "GuardBench Summary",
+  "type": "object",
+  "additionalProperties": false,
+  "required": [
+    "suite",
+    "generatedAt",
+    "manifest",
+    "provenance",
+    "subjects",
+    "scenarios",
+    "passed",
+    "passRate",
+    "preventionRate",
+    "falseBlockRate",
+    "decisionAccuracy",
+    "evidenceRecall",
+    "redactionLeaks",
+    "recallDegradationDetectionRate",
+    "latency",
+    "systemSummaries",
+    "comparisons",
+    "rows",
+    "cases",
+    "artifactRedactionSweep"
+  ],
+  "properties": {
+    "suite": { "const": "GuardBench comparative" },
+    "generatedAt": { "type": "string", "minLength": 1 },
+    "manifest": { "type": "object" },
+    "provenance": { "type": "object" },
+    "subjects": {
+      "type": "array",
+      "minItems": 5,
+      "items": { "type": "string", "minLength": 1 }
+    },
+    "scenarios": { "type": "integer", "minimum": 10 },
+    "passed": { "type": "integer", "minimum": 0 },
+    "passRate": { "type": "number", "minimum": 0, "maximum": 1 },
+    "preventionRate": { "type": "number", "minimum": 0, "maximum": 1 },
+    "falseBlockRate": { "type": "number", "minimum": 0, "maximum": 1 },
+    "decisionAccuracy": { "type": "number", "minimum": 0, "maximum": 1 },
+    "usefulWarningPrecision": {
+      "anyOf": [
+        { "type": "null" },
+        { "type": "number", "minimum": 0, "maximum": 1 }
+      ]
+    },
+    "evidenceRecall": { "type": "number", "minimum": 0, "maximum": 1 },
+    "redactionLeaks": { "type": "integer", "minimum": 0 },
+    "recallDegradationDetectionRate": { "type": "number", "minimum": 0, "maximum": 1 },
+    "latency": { "$ref": "#/$defs/latency" },
+    "systemSummaries": {
+      "type": "array",
+      "minItems": 5,
+      "items": { "$ref": "#/$defs/systemSummary" }
+    },
+    "comparisons": {
+      "type": "object",
+      "additionalProperties": false,
+      "required": ["bestBaseline", "audreyMarginOverBestBaseline"],
+      "properties": {
+        "bestBaseline": { "$ref": "#/$defs/systemSummary" },
+        "audreyMarginOverBestBaseline": {
+          "anyOf": [
+            { "type": "null" },
+            { "type": "number", "minimum": 0, "maximum": 1 }
+          ]
+        }
+      }
+    },
+    "rows": {
+      "type": "array",
+      "minItems": 10,
+      "items": { "$ref": "#/$defs/resultRow" }
+    },
+    "cases": {
+      "type": "array",
+      "minItems": 10,
+      "items": { "$ref": "#/$defs/caseResult" }
+    },
+    "artifactRedactionSweep": { "$ref": "#/$defs/artifactRedactionSweep" }
+  },
+  "$defs": {
+    "latency": {
+      "type": "object",
+      "additionalProperties": false,
+      "required": ["p50Ms", "p95Ms", "maxMs"],
+      "properties": {
+        "p50Ms": { "type": "number", "minimum": 0 },
+        "p95Ms": { "type": "number", "minimum": 0 },
+        "maxMs": { "type": "number", "minimum": 0 }
+      }
+    },
+    "systemSummary": {
+      "type": "object",
+      "additionalProperties": false,
+      "required": [
+        "system",
+        "generatedAt",
+        "scenarios",
+        "passed",
+        "passRate",
+        "decisionCorrect",
+        "decisionAccuracy",
+        "preventionRate",
+        "falseBlockRate",
+        "usefulWarningPrecision",
+        "evidenceRecall",
+        "redactionLeaks",
+        "recallDegradationDetectionRate",
+        "latency"
+      ],
+      "properties": {
+        "system": { "type": "string", "minLength": 1 },
+        "generatedAt": { "type": "string", "minLength": 1 },
+        "scenarios": { "type": "integer", "minimum": 0 },
+        "passed": { "type": "integer", "minimum": 0 },
+        "passRate": { "type": "number", "minimum": 0, "maximum": 1 },
+        "decisionCorrect": { "type": "integer", "minimum": 0 },
+        "decisionAccuracy": { "type": "number", "minimum": 0, "maximum": 1 },
+        "preventionRate": { "type": "number", "minimum": 0, "maximum": 1 },
+        "falseBlockRate": { "type": "number", "minimum": 0, "maximum": 1 },
+        "usefulWarningPrecision": {
+          "anyOf": [
+            { "type": "null" },
+            { "type": "number", "minimum": 0, "maximum": 1 }
+          ]
+        },
+        "evidenceRecall": { "type": "number", "minimum": 0, "maximum": 1 },
+        "redactionLeaks": { "type": "integer", "minimum": 0 },
+        "recallDegradationDetectionRate": { "type": "number", "minimum": 0, "maximum": 1 },
+        "latency": { "$ref": "#/$defs/latency" }
+      }
+    },
+    "resultRow": {
+      "type": "object",
+      "additionalProperties": false,
+      "required": [
+        "system",
+        "id",
+        "name",
+        "expectedDecision",
+        "decision",
+        "decisionCorrect",
+        "riskScore",
+        "passed",
+        "latencyMs",
+        "evidenceCount",
+        "evidenceIds",
+        "recommendedActions",
+        "summary",
+        "recallErrors",
+        "leakedSecrets",
+        "requiredEvidenceMatched"
+      ],
+      "properties": {
+        "system": { "type": "string", "minLength": 1 },
+        "external": { "type": "boolean" },
+        "id": { "type": "string", "pattern": "^GB-[0-9]{2}$" },
+        "name": { "type": "string", "minLength": 1 },
+        "expectedDecision": { "enum": ["allow", "warn", "block"] },
+        "decision": { "enum": ["allow", "warn", "block"] },
+        "decisionCorrect": { "type": "boolean" },
+        "riskScore": { "type": "number", "minimum": 0, "maximum": 1 },
+        "passed": { "type": "boolean" },
+        "latencyMs": { "type": "number", "minimum": 0 },
+        "evidenceCount": { "type": "integer", "minimum": 0 },
+        "evidenceIds": {
+          "type": "array",
+          "items": { "type": "string" }
+        },
+        "recommendedActions": {
+          "type": "array",
+          "items": { "type": "string" }
+        },
+        "summary": { "type": "string", "minLength": 1 },
+        "recallErrors": { "type": "array" },
+        "leakedSecrets": {
+          "type": "array",
+          "items": { "type": "string" }
+        },
+        "requiredEvidenceMatched": { "type": "boolean" }
+      }
+    },
+    "caseResult": {
+      "type": "object",
+      "additionalProperties": false,
+      "required": ["id", "name", "expectedDecision", "results"],
+      "properties": {
+        "id": { "type": "string", "pattern": "^GB-[0-9]{2}$" },
+        "name": { "type": "string", "minLength": 1 },
+        "expectedDecision": { "enum": ["allow", "warn", "block"] },
+        "results": {
+          "type": "array",
+          "minItems": 5,
+          "items": { "$ref": "#/$defs/resultRow" }
+        }
+      }
+    },
+    "artifactRedactionSweep": {
+      "type": "object",
+      "additionalProperties": false,
+      "required": [
+        "checkedAt",
+        "filesChecked",
+        "seededSecretsChecked",
+        "leakCount",
+        "leaks",
+        "passed"
+      ],
+      "properties": {
+        "checkedAt": { "type": "string", "minLength": 1 },
+        "filesChecked": {
+          "type": "array",
+          "minItems": 3,
+          "items": { "type": "string", "minLength": 1 }
+        },
+        "seededSecretsChecked": { "type": "integer", "minimum": 0 },
+        "leakCount": { "type": "integer", "minimum": 0 },
+        "leaks": { "type": "array" },
+        "passed": { "type": "boolean" }
+      }
+    }
+  }
+}