npm - @rex_koh/subagent-budget-guard - Versions diffs - 0.1.1 → 0.1.3 - Mend

@rex_koh/subagent-budget-guard 0.1.1 → 0.1.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (5) hide show

package/.claude-plugin/plugin.json +11 -18
package/README.md +3 -1
package/lib/guard.js +108 -30
package/lib/verifier.js +1 -1
package/package.json +1 -1

package/.claude-plugin/plugin.json CHANGED Viewed

@@ -2,7 +2,7 @@
   "name": "subagent-budget-guard",
   "displayName": "Subagent Budget Guard",
   "description": "Hard-deny subagent launches, record verified subagent usage, and enforce a session budget against Claude Code's 5-hour rate-limit percentage.",
-  "version": "0.1.1",
+  "version": "0.1.3",
   "author": {
     "name": "ClaudeSubAgentSuppressor"
   },
@@ -15,14 +15,6 @@
     "hooks"
   ],
   "userConfig": {
-    "max_subagents_per_session": {
-      "type": "number",
-      "title": "Max subagents per session",
-      "description": "Maximum normal Agent tool subagents allowed in one Claude Code session. The default 0 blocks all new subagents.",
-      "default": 0,
-      "min": 0,
-      "required": true
-    },
     "max_concurrent_subagents": {
       "type": "number",
       "title": "Max concurrent subagents",
@@ -31,14 +23,6 @@
       "min": 0,
       "required": true
     },
-    "max_agent_team_tasks_per_session": {
-      "type": "number",
-      "title": "Max agent-team tasks per session",
-      "description": "Maximum agent-team tasks that may be created in one session. The default 0 suppresses agent-team task creation.",
-      "default": 0,
-      "min": 0,
-      "required": true
-    },
     "max_subagent_tokens_per_session": {
       "type": "number",
       "title": "Max verified subagent tokens per session",
@@ -47,6 +31,15 @@
       "min": 0,
       "required": true
     },
+    "subagent_token_warning_threshold_percent": {
+      "type": "number",
+      "title": "Subagent token warning threshold percent",
+      "description": "Warn Claude to stop using subagents once verified subagent token usage reaches this percentage of max_subagent_tokens_per_session.",
+      "default": 95,
+      "min": 1,
+      "max": 100,
+      "required": true
+    },
     "session_five_hour_budget_percent": {
       "type": "number",
       "title": "Session 5-hour budget percent",
@@ -68,7 +61,7 @@
     "enforcement_enabled": {
       "type": "boolean",
       "title": "Enable enforcement",
-      "description": "When true, hooks deny over-budget subagents, agent-team tasks, and prompts. When false, the plugin records usage without blocking.",
+      "description": "When true, hooks deny over-budget subagents and prompts. When false, the plugin records usage without blocking.",
       "default": true,
       "required": true
     }

package/README.md CHANGED Viewed

@@ -43,4 +43,6 @@ Offline verification:
 node bin/verify.js --offline
 ```
-The plugin is strict by default: `max_subagents_per_session`, `max_concurrent_subagents`, and `max_agent_team_tasks_per_session` all default to `0`.
+The plugin is strict by default: `max_concurrent_subagents` defaults to `0`, so normal subagent launches are blocked unless raised.
+`max_subagent_tokens_per_session` is enforced from verified `Agent.totalTokens` values after each completed subagent. `subagent_token_warning_threshold_percent` defaults to `95`; once verified subagent usage reaches that percentage, the plugin tells Claude to stop using subagents and blocks future subagent launches. Claude Code does not expose mid-run per-token subagent streaming to hooks, so a single running subagent can only be evaluated when it reports its final token total.

package/lib/guard.js CHANGED Viewed

@@ -16,10 +16,9 @@ import path from 'node:path';
 export const PLUGIN_NAME = 'subagent-budget-guard';
 export const DEFAULT_CONFIG = Object.freeze({
-  max_subagents_per_session: 0,
   max_concurrent_subagents: 0,
-  max_agent_team_tasks_per_session: 0,
   max_subagent_tokens_per_session: 0,
+  subagent_token_warning_threshold_percent: 95,
   session_five_hour_budget_percent: 25,
   absolute_five_hour_ceiling_percent: 95,
   enforcement_enabled: true
@@ -80,6 +79,10 @@ export function loadConfig(env = process.env) {
     100,
     config.absolute_five_hour_ceiling_percent
   );
+  config.subagent_token_warning_threshold_percent = Math.min(
+    100,
+    Math.max(1, config.subagent_token_warning_threshold_percent)
+  );
   return config;
 }
@@ -127,6 +130,9 @@ function initialState(sessionId) {
       verifiedTokens: 0,
       totalDurationMs: 0,
       totalToolUseCount: 0,
+      tokenBudgetWarnings: 0,
+      tokenBudgetExceeded: false,
+      lastTokenBudgetNoticeAt: null,
       runs: []
     },
     agentTeam: {
@@ -193,7 +199,23 @@ async function acquireLock(sessionId, env, timeoutMs = 3000) {
 }
 async function readState(sessionId, env) {
-  return readJson(stateFile(sessionId, env), initialState(sessionId));
+  return normalizeState(await readJson(stateFile(sessionId, env), initialState(sessionId)), sessionId);
+}
+function normalizeState(state, sessionId) {
+  const fresh = initialState(sessionId);
+  state.subagents = { ...fresh.subagents, ...(state.subagents || {}) };
+  state.agentTeam = { ...fresh.agentTeam, ...(state.agentTeam || {}) };
+  state.rateLimits = {
+    ...fresh.rateLimits,
+    ...(state.rateLimits || {}),
+    fiveHour: {
+      ...fresh.rateLimits.fiveHour,
+      ...(state.rateLimits?.fiveHour || {})
+    }
+  };
+  state.events = Array.isArray(state.events) ? state.events : [];
+  return state;
 }
 async function updateState(sessionId, env, updater) {
@@ -300,19 +322,61 @@ function fiveHourBudgetDecision(state, config) {
   return null;
 }
+function formatCount(value) {
+  return Number(value || 0).toLocaleString('en-US');
+}
+function subagentTokenBudgetStatus(state, config) {
+  const limit = config.max_subagent_tokens_per_session;
+  if (!limit || limit <= 0) return null;
+  const used = Number(state.subagents.verifiedTokens || 0);
+  const percent = limit > 0 ? (used / limit) * 100 : 0;
+  const warningThreshold = config.subagent_token_warning_threshold_percent;
+  return {
+    used,
+    limit,
+    percent,
+    warningThreshold,
+    warningTokens: Math.ceil((limit * warningThreshold) / 100),
+    atWarning: percent >= warningThreshold,
+    atCap: used >= limit
+  };
+}
+function subagentTokenBudgetDecision(state, config, { includeWarning = true } = {}) {
+  if (!config.enforcement_enabled) return null;
+  const status = subagentTokenBudgetStatus(state, config);
+  if (!status) return null;
+  if (status.atCap) {
+    return {
+      severity: 'cap',
+      status,
+      reason: `Verified subagent token cap reached: ${formatCount(status.used)}/${formatCount(status.limit)} tokens (${status.percent.toFixed(1)}%). Stop using subagents and ask the user before continuing.`
+    };
+  }
+  if (includeWarning && status.atWarning) {
+    return {
+      severity: 'warning',
+      status,
+      reason: `Verified subagent token usage reached ${status.percent.toFixed(1)}% of the configured cap (${formatCount(status.used)}/${formatCount(status.limit)} tokens; warning threshold ${status.warningThreshold}%). Stop using subagents and ask the user before continuing.`
+    };
+  }
+  return null;
+}
 function agentDenyReason(state, config) {
   if (!config.enforcement_enabled) return null;
   const budgetReason = fiveHourBudgetDecision(state, config);
   if (budgetReason) return budgetReason;
-  if (config.max_subagents_per_session === 0) {
-    return 'Subagent launch denied: max_subagents_per_session is 0.';
-  }
-  if (state.subagents.allowed >= config.max_subagents_per_session) {
-    return `Subagent launch denied: max_subagents_per_session ${config.max_subagents_per_session} already reached.`;
-  }
+  const tokenBudgetReason = subagentTokenBudgetDecision(state, config);
+  if (tokenBudgetReason) return tokenBudgetReason.reason;
   if (config.max_concurrent_subagents === 0) {
     return 'Subagent launch denied: max_concurrent_subagents is 0.';
@@ -322,13 +386,6 @@ function agentDenyReason(state, config) {
     return `Subagent launch denied: max_concurrent_subagents ${config.max_concurrent_subagents} already reached.`;
   }
-  if (
-    config.max_subagent_tokens_per_session > 0 &&
-    state.subagents.verifiedTokens >= config.max_subagent_tokens_per_session
-  ) {
-    return `Subagent launch denied: verified subagent tokens ${state.subagents.verifiedTokens} reached max_subagent_tokens_per_session ${config.max_subagent_tokens_per_session}.`;
-  }
   return null;
 }
@@ -387,11 +444,13 @@ function usageTotal(usage = {}) {
 export async function handlePostToolUseAgent(input, env = process.env) {
   const sessionId = input?.session_id || 'unknown-session';
+  const config = loadConfig(env);
   const response = input?.tool_response || {};
   const status = response.status || 'unknown';
   const totalTokens =
     numberOrNull(response.totalTokens) ?? usageTotal(response.usage || {});
   const verified = status === 'completed' && totalTokens > 0;
+  let tokenBudgetNotice = null;
   await updateState(sessionId, env, (state) => {
     const run = {
@@ -419,6 +478,14 @@ export async function handlePostToolUseAgent(input, env = process.env) {
       state.subagents.verifiedTokens += totalTokens;
       state.subagents.totalDurationMs += run.totalDurationMs;
       state.subagents.totalToolUseCount += run.totalToolUseCount;
+      tokenBudgetNotice = subagentTokenBudgetDecision(state, config);
+      if (tokenBudgetNotice) {
+        state.subagents.tokenBudgetWarnings += 1;
+        state.subagents.lastTokenBudgetNoticeAt = nowIso();
+        if (tokenBudgetNotice.severity === 'cap') {
+          state.subagents.tokenBudgetExceeded = true;
+        }
+      }
     } else if (status === 'async_launched') {
       state.subagents.backgroundLaunched += 1;
     }
@@ -430,9 +497,22 @@ export async function handlePostToolUseAgent(input, env = process.env) {
       verified,
       totalTokens: run.totalTokens
     });
+    if (tokenBudgetNotice) {
+      pushEvent(state, {
+        type: 'subagent-token-budget-notice',
+        severity: tokenBudgetNotice.severity,
+        used: tokenBudgetNotice.status.used,
+        limit: tokenBudgetNotice.status.limit,
+        percent: tokenBudgetNotice.status.percent
+      });
+    }
     return state;
   });
+  if (tokenBudgetNotice) {
+    return { exitCode: 2, stdout: null, stderr: tokenBudgetNotice.reason };
+  }
   return { exitCode: 0, stdout: null, stderr: '' };
 }
@@ -474,14 +554,6 @@ function taskDenyReason(state, config) {
   const budgetReason = fiveHourBudgetDecision(state, config);
   if (budgetReason) return budgetReason;
-  if (config.max_agent_team_tasks_per_session === 0) {
-    return 'Agent-team task denied: max_agent_team_tasks_per_session is 0.';
-  }
-  if (state.agentTeam.created >= config.max_agent_team_tasks_per_session) {
-    return `Agent-team task denied: max_agent_team_tasks_per_session ${config.max_agent_team_tasks_per_session} already reached.`;
-  }
   return null;
 }
@@ -548,7 +620,10 @@ export async function handleUserPromptSubmit(input, env = process.env) {
   const sessionId = input?.session_id || 'unknown-session';
   const config = loadConfig(env);
   const state = await readState(sessionId, env);
-  const reason = fiveHourBudgetDecision(state, config);
+  const tokenBudgetReason = subagentTokenBudgetDecision(state, config, {
+    includeWarning: false
+  });
+  const reason = tokenBudgetReason?.reason || fiveHourBudgetDecision(state, config);
   if (!reason) {
     return { exitCode: 0, stdout: null, stderr: '' };
@@ -606,6 +681,7 @@ export async function buildReport(sessionId, env = process.env) {
     fiveHour.latestUsedPercentage !== null && fiveHour.baselineUsedPercentage !== null
       ? Math.max(0, fiveHour.latestUsedPercentage - fiveHour.baselineUsedPercentage)
       : null;
+  const tokenBudget = subagentTokenBudgetStatus(state, config);
   return {
     plugin: PLUGIN_NAME,
@@ -614,9 +690,10 @@ export async function buildReport(sessionId, env = process.env) {
     state,
     summary: {
       verifiedTokenLabel: `${state.subagents.verifiedTokens.toLocaleString('en-US')} verified tokens`,
-      subagentLaunches: `${state.subagents.allowed}/${config.max_subagents_per_session}`,
+      subagentTokenBudget: tokenBudget
+        ? `${formatCount(tokenBudget.used)}/${formatCount(tokenBudget.limit)} verified tokens (${tokenBudget.percent.toFixed(1)}%)`
+        : 'no verified-token cap',
       activeSubagents: `${state.subagents.active}/${config.max_concurrent_subagents}`,
-      agentTeamTasks: `${state.agentTeam.created}/${config.max_agent_team_tasks_per_session}`,
       fiveHourBudget:
         consumed === null
           ? '5-hour usage unavailable'
@@ -634,6 +711,7 @@ export function formatReport(report) {
     `Enforcement: ${config.enforcement_enabled ? 'enabled' : 'disabled'}`,
     `Subagents: allowed ${state.subagents.allowed}, denied ${state.subagents.denied}, active ${state.subagents.active}, lifecycle starts ${state.subagents.lifecycleStarted}, lifecycle stops ${state.subagents.lifecycleStopped}`,
     `Verified usage: ${summary.verifiedTokenLabel}, ${state.subagents.totalToolUseCount} subagent tool calls, ${state.subagents.totalDurationMs} ms`,
+    `Subagent token budget: ${summary.subagentTokenBudget}`,
     `Background launches: ${state.subagents.backgroundLaunched} lifecycle-counted, token totals pending`,
     `Agent-team tasks: created ${state.agentTeam.created}, denied ${state.agentTeam.denied}, completed ${state.agentTeam.completed}`,
     `5-hour budget: ${summary.fiveHourBudget}`
@@ -771,8 +849,8 @@ export async function renderStatusLine(input, {
   const guardSegment =
     fiveHour.latestUsedPercentage === null
-      ? `SBG agents ${report.state.subagents.active}/${report.config.max_concurrent_subagents} | 5h unknown`
-      : `SBG agents ${report.state.subagents.active}/${report.config.max_concurrent_subagents} | 5h ${fiveHour.latestUsedPercentage.toFixed(1)}%`;
+      ? `SBG agents ${report.state.subagents.active}/${report.config.max_concurrent_subagents} | tokens ${report.summary.subagentTokenBudget} | 5h unknown`
+      : `SBG agents ${report.state.subagents.active}/${report.config.max_concurrent_subagents} | tokens ${report.summary.subagentTokenBudget} | 5h ${fiveHour.latestUsedPercentage.toFixed(1)}%`;
   return previous ? `${previous} | ${guardSegment}` : guardSegment;
 }

package/lib/verifier.js CHANGED Viewed

@@ -87,7 +87,7 @@ export async function runOfflineVerification({
         entry.source?.package === '@rex_koh/subagent-budget-guard',
         'marketplace npm package mismatch'
       );
-      assert(entry.source?.version === '0.1.1', 'marketplace npm version mismatch');
+      assert(entry.source?.version === '0.1.3', 'marketplace npm version mismatch');
       return marketplacePath;
     });
   } else {

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@rex_koh/subagent-budget-guard",
-  "version": "0.1.1",
+  "version": "0.1.3",
   "description": "Claude Code plugin that blocks subagents by default, records verified subagent usage, and enforces 5-hour usage budgets.",
   "license": "MIT",
   "author": "ClaudeSubAgentSuppressor",