npm - @miriad-systems/nuum - Versions diffs - 0.1.8 → 0.1.9 - Mend

@miriad-systems/nuum 0.1.8 → 0.1.9

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (2) hide show

package/dist/index.js +37 -8
package/package.json +1 -1

package/dist/index.js CHANGED Viewed

@@ -31657,8 +31657,9 @@ var Config;
     tokenBudgets: exports_external.object({
       mainAgentContext: exports_external.number().default(180000),
       temporalBudget: exports_external.number().default(64000),
-      compactionThreshold: exports_external.number().default(1e5),
-      compactionTarget: exports_external.number().default(80000),
+      compactionThreshold: exports_external.number().default(80000),
+      compactionTarget: exports_external.number().default(60000),
+      compactionHardLimit: exports_external.number().default(150000),
       recencyBufferMessages: exports_external.number().default(10),
       temporalQueryBudget: exports_external.number().default(512000),
       ltmReflectBudget: exports_external.number().default(180000),
@@ -34650,11 +34651,12 @@ async function shouldTriggerCompaction(temporal, workers2, config) {
   const viewTokens = await getEffectiveViewTokens(temporal);
   return viewTokens > config.compactionThreshold;
 }
+var FIXED_OVERHEAD_TOKENS = 40000;
 async function getEffectiveViewTokens(temporal) {
   const messages = await temporal.getMessages();
   const summaries = await temporal.getSummaries();
   const view = buildTemporalView({ budget: 0, messages, summaries });
-  return view.totalTokens;
+  return view.totalTokens + FIXED_OVERHEAD_TOKENS;
 }
 async function getMessagesToCompact(temporal) {
   const lastEndId = await temporal.getLastSummaryEndId();
@@ -34750,16 +34752,17 @@ async function runAgentLoop(options) {
     totalOutputTokens += response.usage.completionTokens;
     const anthropicMeta = response.providerMetadata?.anthropic;
     if (anthropicMeta) {
-      const cacheCreation = anthropicMeta.cacheCreationInputTokens ?? 0;
+      const cacheWrite = anthropicMeta.cacheCreationInputTokens ?? 0;
       const cacheRead = anthropicMeta.cacheReadInputTokens ?? 0;
-      const uncached = response.usage.promptTokens - cacheCreation - cacheRead;
+      const uncached = response.usage.promptTokens;
+      const total = cacheRead + cacheWrite + uncached;
       log5.info("token usage", {
-        input: response.usage.promptTokens,
+        input: total,
         output: response.usage.completionTokens,
-        cacheWrite: cacheCreation,
+        cacheWrite,
         cacheRead,
         uncached,
-        cacheHitRate: response.usage.promptTokens > 0 ? `${Math.round(cacheRead / response.usage.promptTokens * 100)}%` : "0%"
+        cacheHitRate: total > 0 ? `${Math.round(cacheRead / total * 100)}%` : "0%"
       });
     }
     if (response.text) {
@@ -45136,6 +45139,32 @@ async function runAgent(prompt, options) {
   const { storage, onEvent, abortSignal, onBeforeTurn } = options;
   const sessionId = Identifier.ascending("session");
   await initializeMcp();
+  const config2 = Config.get();
+  const softLimit = config2.tokenBudgets.compactionThreshold;
+  const hardLimit = config2.tokenBudgets.compactionHardLimit;
+  const tokensBefore = await getEffectiveViewTokens(storage.temporal);
+  if (tokensBefore > hardLimit) {
+    log10.error("context overflow - refusing turn", { tokens: tokensBefore, hardLimit });
+    throw new Error(`Context overflow: ${tokensBefore} tokens exceeds hard limit of ${hardLimit}. ` + `Run 'miriad-code --compact' to reduce context size before continuing.`);
+  }
+  if (tokensBefore > softLimit) {
+    log10.warn("approaching token limit, running compaction before turn", {
+      tokens: tokensBefore,
+      softLimit,
+      target: config2.tokenBudgets.compactionTarget
+    });
+    await runMemoryCuration(storage, { force: true });
+    const tokensAfter = await getEffectiveViewTokens(storage.temporal);
+    if (tokensAfter > softLimit) {
+      log10.warn("compaction didn't reduce tokens below soft limit", {
+        before: tokensBefore,
+        after: tokensAfter,
+        softLimit
+      });
+    } else {
+      log10.info("pre-turn compaction successful", { before: tokensBefore, after: tokensAfter });
+    }
+  }
   const model = Provider.getModelForTier("reasoning");
   const ctx = await buildAgentContext(storage);
   const userMessageId = Identifier.ascending("message");

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@miriad-systems/nuum",
-  "version": "0.1.8",
+  "version": "0.1.9",
   "description": "AI coding agent with continuous memory - infinite context across sessions",
   "type": "module",
   "bin": {