npm - @swarmclawai/swarmclaw - Versions diffs - 0.6.7 → 0.7.0 - Mend

@swarmclawai/swarmclaw 0.6.7 → 0.7.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (203) hide show

package/README.md +82 -39
package/next.config.ts +31 -6
package/package.json +3 -2
package/src/app/api/agents/[id]/thread/route.ts +1 -0
package/src/app/api/agents/route.ts +19 -5
package/src/app/api/approvals/route.ts +22 -0
package/src/app/api/chatrooms/[id]/chat/route.ts +4 -0
package/src/app/api/clawhub/install/route.ts +2 -2
package/src/app/api/eval/run/route.ts +37 -0
package/src/app/api/eval/scenarios/route.ts +24 -0
package/src/app/api/eval/suite/route.ts +29 -0
package/src/app/api/mcp-servers/[id]/conformance/route.ts +26 -0
package/src/app/api/mcp-servers/[id]/invoke/route.ts +81 -0
package/src/app/api/memory/graph/route.ts +46 -0
package/src/app/api/memory/route.ts +36 -5
package/src/app/api/notifications/route.ts +3 -0
package/src/app/api/plugins/install/route.ts +57 -5
package/src/app/api/plugins/marketplace/route.ts +73 -22
package/src/app/api/plugins/route.ts +61 -1
package/src/app/api/plugins/ui/route.ts +34 -0
package/src/app/api/sessions/[id]/checkpoints/route.ts +31 -0
package/src/app/api/sessions/[id]/restore/route.ts +36 -0
package/src/app/api/settings/route.ts +62 -0
package/src/app/api/setup/doctor/route.ts +22 -5
package/src/app/api/souls/[id]/route.ts +65 -0
package/src/app/api/souls/route.ts +70 -0
package/src/app/api/tasks/[id]/approve/route.ts +4 -3
package/src/app/api/tasks/[id]/route.ts +16 -3
package/src/app/api/tasks/route.ts +10 -2
package/src/app/api/usage/route.ts +9 -2
package/src/app/globals.css +27 -0
package/src/app/page.tsx +10 -5
package/src/cli/index.js +37 -0
package/src/components/activity/activity-feed.tsx +9 -2
package/src/components/agents/agent-avatar.tsx +5 -1
package/src/components/agents/agent-card.tsx +55 -9
package/src/components/agents/agent-sheet.tsx +112 -34
package/src/components/agents/inspector-panel.tsx +1 -1
package/src/components/agents/soul-library-picker.tsx +84 -13
package/src/components/auth/access-key-gate.tsx +63 -54
package/src/components/auth/user-picker.tsx +37 -32
package/src/components/chat/activity-moment.tsx +2 -0
package/src/components/chat/chat-area.tsx +11 -0
package/src/components/chat/chat-header.tsx +69 -25
package/src/components/chat/chat-tool-toggles.tsx +2 -2
package/src/components/chat/checkpoint-timeline.tsx +112 -0
package/src/components/chat/code-block.tsx +3 -1
package/src/components/chat/exec-approval-card.tsx +8 -1
package/src/components/chat/message-bubble.tsx +164 -4
package/src/components/chat/message-list.tsx +46 -4
package/src/components/chat/session-approval-card.tsx +80 -0
package/src/components/chat/session-debug-panel.tsx +106 -84
package/src/components/chat/streaming-bubble.tsx +6 -5
package/src/components/chat/task-approval-card.tsx +78 -0
package/src/components/chat/thinking-indicator.tsx +48 -12
package/src/components/chat/tool-call-bubble.tsx +3 -0
package/src/components/chat/tool-request-banner.tsx +39 -20
package/src/components/chatrooms/chatroom-list.tsx +11 -4
package/src/components/chatrooms/chatroom-sheet.tsx +7 -2
package/src/components/connectors/connector-list.tsx +33 -11
package/src/components/connectors/connector-sheet.tsx +37 -7
package/src/components/home/home-view.tsx +54 -24
package/src/components/input/chat-input.tsx +22 -1
package/src/components/knowledge/knowledge-list.tsx +17 -18
package/src/components/knowledge/knowledge-sheet.tsx +9 -5
package/src/components/layout/app-layout.tsx +87 -19
package/src/components/mcp-servers/mcp-server-list.tsx +352 -50
package/src/components/mcp-servers/mcp-server-sheet.tsx +25 -9
package/src/components/memory/memory-browser.tsx +73 -45
package/src/components/memory/memory-graph-view.tsx +203 -0
package/src/components/memory/memory-list.tsx +20 -13
package/src/components/plugins/plugin-list.tsx +214 -60
package/src/components/plugins/plugin-sheet.tsx +119 -24
package/src/components/projects/project-list.tsx +17 -9
package/src/components/providers/provider-list.tsx +21 -6
package/src/components/providers/provider-sheet.tsx +42 -25
package/src/components/runs/run-list.tsx +17 -13
package/src/components/schedules/schedule-card.tsx +10 -3
package/src/components/schedules/schedule-list.tsx +2 -2
package/src/components/schedules/schedule-sheet.tsx +28 -9
package/src/components/secrets/secret-sheet.tsx +7 -2
package/src/components/secrets/secrets-list.tsx +18 -5
package/src/components/sessions/new-session-sheet.tsx +183 -376
package/src/components/sessions/session-card.tsx +10 -2
package/src/components/settings/gateway-connection-panel.tsx +9 -8
package/src/components/shared/command-palette.tsx +13 -5
package/src/components/shared/empty-state.tsx +20 -8
package/src/components/shared/hint-tip.tsx +31 -0
package/src/components/shared/notification-center.tsx +134 -86
package/src/components/shared/profile-sheet.tsx +4 -0
package/src/components/shared/settings/plugin-manager.tsx +360 -135
package/src/components/shared/settings/section-capability-policy.tsx +3 -3
package/src/components/shared/settings/section-runtime-loop.tsx +149 -4
package/src/components/skills/clawhub-browser.tsx +1 -0
package/src/components/skills/skill-list.tsx +31 -12
package/src/components/skills/skill-sheet.tsx +20 -7
package/src/components/tasks/approvals-panel.tsx +224 -0
package/src/components/tasks/task-board.tsx +20 -12
package/src/components/tasks/task-card.tsx +21 -7
package/src/components/tasks/task-column.tsx +4 -3
package/src/components/tasks/task-list.tsx +1 -1
package/src/components/tasks/task-sheet.tsx +130 -1
package/src/components/ui/dialog.tsx +1 -0
package/src/components/ui/sheet.tsx +1 -0
package/src/components/usage/metrics-dashboard.tsx +72 -48
package/src/components/wallets/wallet-panel.tsx +65 -41
package/src/components/wallets/wallet-section.tsx +9 -3
package/src/components/webhooks/webhook-list.tsx +21 -12
package/src/components/webhooks/webhook-sheet.tsx +13 -3
package/src/lib/approval-display.test.ts +45 -0
package/src/lib/approval-display.ts +62 -0
package/src/lib/clipboard.ts +38 -0
package/src/lib/memory.ts +8 -0
package/src/lib/providers/claude-cli.ts +5 -3
package/src/lib/providers/index.ts +67 -21
package/src/lib/runtime-loop.ts +3 -2
package/src/lib/server/approvals.ts +150 -0
package/src/lib/server/chat-execution.ts +319 -74
package/src/lib/server/chatroom-helpers.ts +63 -5
package/src/lib/server/chatroom-orchestration.ts +74 -0
package/src/lib/server/clawhub-client.ts +82 -6
package/src/lib/server/connectors/manager.ts +27 -1
package/src/lib/server/context-manager.ts +132 -50
package/src/lib/server/cost.test.ts +73 -0
package/src/lib/server/cost.ts +165 -34
package/src/lib/server/daemon-state.ts +112 -1
package/src/lib/server/data-dir.ts +18 -1
package/src/lib/server/eval/runner.ts +126 -0
package/src/lib/server/eval/scenarios.ts +218 -0
package/src/lib/server/eval/scorer.ts +96 -0
package/src/lib/server/eval/store.ts +37 -0
package/src/lib/server/eval/types.ts +48 -0
package/src/lib/server/execution-log.ts +12 -8
package/src/lib/server/guardian.ts +34 -0
package/src/lib/server/heartbeat-service.ts +53 -1
package/src/lib/server/integrity-monitor.ts +208 -0
package/src/lib/server/langgraph-checkpoint.ts +10 -0
package/src/lib/server/link-understanding.ts +55 -0
package/src/lib/server/llm-response-cache.test.ts +102 -0
package/src/lib/server/llm-response-cache.ts +227 -0
package/src/lib/server/main-agent-loop.ts +115 -16
package/src/lib/server/main-session.ts +6 -3
package/src/lib/server/mcp-conformance.test.ts +18 -0
package/src/lib/server/mcp-conformance.ts +233 -0
package/src/lib/server/memory-db.ts +193 -19
package/src/lib/server/memory-retrieval.test.ts +56 -0
package/src/lib/server/mmr.ts +73 -0
package/src/lib/server/orchestrator-lg.ts +7 -1
package/src/lib/server/orchestrator.ts +4 -3
package/src/lib/server/plugins.ts +662 -132
package/src/lib/server/process-manager.ts +18 -0
package/src/lib/server/query-expansion.ts +57 -0
package/src/lib/server/queue.ts +280 -11
package/src/lib/server/runtime-settings.ts +9 -0
package/src/lib/server/session-run-manager.test.ts +23 -0
package/src/lib/server/session-run-manager.ts +32 -2
package/src/lib/server/session-tools/canvas.ts +85 -50
package/src/lib/server/session-tools/chatroom.ts +130 -127
package/src/lib/server/session-tools/connector.ts +233 -454
package/src/lib/server/session-tools/context-mgmt.ts +87 -105
package/src/lib/server/session-tools/crud.ts +84 -7
package/src/lib/server/session-tools/delegate.ts +351 -752
package/src/lib/server/session-tools/discovery.ts +198 -0
package/src/lib/server/session-tools/edit_file.ts +82 -0
package/src/lib/server/session-tools/file-send.test.ts +39 -0
package/src/lib/server/session-tools/file.ts +257 -425
package/src/lib/server/session-tools/git.ts +87 -47
package/src/lib/server/session-tools/http.ts +95 -33
package/src/lib/server/session-tools/index.ts +217 -138
package/src/lib/server/session-tools/memory.ts +154 -239
package/src/lib/server/session-tools/monitor.ts +126 -0
package/src/lib/server/session-tools/normalize-tool-args.test.ts +61 -0
package/src/lib/server/session-tools/normalize-tool-args.ts +48 -0
package/src/lib/server/session-tools/openclaw-nodes.ts +82 -99
package/src/lib/server/session-tools/openclaw-workspace.ts +103 -93
package/src/lib/server/session-tools/platform.ts +86 -0
package/src/lib/server/session-tools/plugin-creator.ts +239 -0
package/src/lib/server/session-tools/sample-ui.ts +97 -0
package/src/lib/server/session-tools/sandbox.ts +175 -148
package/src/lib/server/session-tools/schedule.ts +78 -0
package/src/lib/server/session-tools/session-info.ts +104 -410
package/src/lib/server/session-tools/shell-normalize.test.ts +43 -0
package/src/lib/server/session-tools/shell.ts +171 -143
package/src/lib/server/session-tools/subagent.ts +77 -77
package/src/lib/server/session-tools/wallet.ts +182 -106
package/src/lib/server/session-tools/web.ts +181 -327
package/src/lib/server/storage.ts +36 -0
package/src/lib/server/stream-agent-chat.ts +348 -242
package/src/lib/server/task-quality-gate.test.ts +44 -0
package/src/lib/server/task-quality-gate.ts +67 -0
package/src/lib/server/task-validation.test.ts +78 -0
package/src/lib/server/task-validation.ts +67 -2
package/src/lib/server/tool-aliases.ts +68 -0
package/src/lib/server/tool-capability-policy.ts +24 -5
package/src/lib/server/tool-retry.ts +62 -0
package/src/lib/server/transcript-repair.ts +72 -0
package/src/lib/setup-defaults.ts +1 -0
package/src/lib/tasks.ts +7 -1
package/src/lib/tool-definitions.ts +24 -23
package/src/lib/validation/schemas.ts +13 -0
package/src/lib/view-routes.ts +2 -23
package/src/stores/use-app-store.ts +23 -1
package/src/types/index.ts +155 -10

package/src/lib/server/cost.ts CHANGED Viewed

@@ -1,3 +1,6 @@
+import type { Agent, UsageRecord } from '@/types'
+import { loadSessions, loadUsage } from './storage'
 // Model cost table: [inputCostPer1M, outputCostPer1M] in USD
 const MODEL_COSTS: Record<string, [number, number]> = {
   // Anthropic
@@ -11,7 +14,7 @@ const MODEL_COSTS: Record<string, [number, number]> = {
   'gpt-4.1': [2, 8],
   'gpt-4.1-mini': [0.4, 1.6],
   'gpt-4.1-nano': [0.1, 0.4],
-  'o3': [10, 40],
+  o3: [10, 40],
   'o3-mini': [1.1, 4.4],
   'o4-mini': [1.1, 4.4],
   // OpenAI embeddings
@@ -19,6 +22,38 @@ const MODEL_COSTS: Record<string, [number, number]> = {
   'text-embedding-3-large': [0.13, 0],
 }
+const ONE_HOUR_MS = 60 * 60 * 1000
+const WARNING_RATIO = 0.8
+type GenericRecord = Record<string, unknown>
+type SessionsMap = Record<string, GenericRecord>
+type UsageMap = Record<string, unknown>
+function parsePositiveBudget(value: unknown): number | null {
+  if (typeof value !== 'number' || !Number.isFinite(value) || value <= 0) return null
+  return value
+}
+function toDateBoundaries(now: number) {
+  const d = new Date(now)
+  const dayStart = new Date(d)
+  dayStart.setHours(0, 0, 0, 0)
+  const monthStart = new Date(d.getFullYear(), d.getMonth(), 1)
+  return {
+    hourStartTs: now - ONE_HOUR_MS,
+    dayStartTs: dayStart.getTime(),
+    monthStartTs: monthStart.getTime(),
+  }
+}
+function getAgentSessionIds(agentId: string, sessions: SessionsMap): Set<string> {
+  const ids = new Set<string>()
+  for (const [sid, session] of Object.entries(sessions)) {
+    if (session?.agentId === agentId) ids.add(sid)
+  }
+  return ids
+}
 export function estimateCost(model: string, inputTokens: number, outputTokens: number): number {
   const costs = MODEL_COSTS[model]
   if (!costs) return 0
@@ -30,41 +65,141 @@ export function getModelCosts(): Record<string, [number, number]> {
   return { ...MODEL_COSTS }
 }
-// --- Agent Monthly Budget ---
-import { loadUsage, loadSessions } from './storage'
-import type { Agent, UsageRecord } from '@/types'
+export interface AgentSpendWindows {
+  hourly: number
+  daily: number
+  monthly: number
+}
-/**
- * Sum the estimated cost for an agent in the current calendar month.
- * Usage records are keyed by sessionId; we resolve agentId through sessions.
- */
-export function getAgentMonthlySpend(agentId: string): number {
-  const sessions = loadSessions()
-  // Build a set of sessionIds linked to this agent
-  const agentSessionIds = new Set<string>()
-  for (const [sid, session] of Object.entries(sessions)) {
-    if (session?.agentId === agentId) agentSessionIds.add(sid)
+export function getAgentSpendWindows(
+  agentId: string,
+  now = Date.now(),
+  opts?: { sessions?: SessionsMap; usage?: UsageMap },
+): AgentSpendWindows {
+  const sessions = opts?.sessions ?? (loadSessions() as SessionsMap)
+  const usage = opts?.usage ?? (loadUsage() as UsageMap)
+  const agentSessionIds = getAgentSessionIds(agentId, sessions)
+  if (agentSessionIds.size === 0) {
+    return { hourly: 0, daily: 0, monthly: 0 }
   }
-  if (agentSessionIds.size === 0) return 0
-  const now = new Date()
-  const monthStart = new Date(now.getFullYear(), now.getMonth(), 1).getTime()
+  const { hourStartTs, dayStartTs, monthStartTs } = toDateBoundaries(now)
+  const spend: AgentSpendWindows = { hourly: 0, daily: 0, monthly: 0 }
-  const usage = loadUsage()
-  let total = 0
   for (const sid of agentSessionIds) {
-    const records = usage[sid]
-    if (!Array.isArray(records)) continue
-    for (const record of records) {
+    const raw = usage[sid]
+    if (!Array.isArray(raw)) continue
+    for (const record of raw) {
       const r = record as UsageRecord
-      if (typeof r.timestamp !== 'number' || r.timestamp < monthStart) continue
-      if (typeof r.estimatedCost === 'number' && Number.isFinite(r.estimatedCost) && r.estimatedCost > 0) {
-        total += r.estimatedCost
-      }
+      const ts = typeof r?.timestamp === 'number' ? r.timestamp : 0
+      if (ts <= 0) continue
+      const cost = typeof r?.estimatedCost === 'number' ? r.estimatedCost : 0
+      if (!Number.isFinite(cost) || cost <= 0) continue
+      if (ts >= monthStartTs) spend.monthly += cost
+      if (ts >= dayStartTs) spend.daily += cost
+      if (ts >= hourStartTs) spend.hourly += cost
     }
   }
-  return total
+  return spend
+}
+export function getAgentMonthlySpend(
+  agentId: string,
+  now = Date.now(),
+  opts?: { sessions?: SessionsMap; usage?: UsageMap },
+): number {
+  return getAgentSpendWindows(agentId, now, opts).monthly
+}
+export function getAgentDailySpend(
+  agentId: string,
+  now = Date.now(),
+  opts?: { sessions?: SessionsMap; usage?: UsageMap },
+): number {
+  return getAgentSpendWindows(agentId, now, opts).daily
+}
+export function getAgentHourlySpend(
+  agentId: string,
+  now = Date.now(),
+  opts?: { sessions?: SessionsMap; usage?: UsageMap },
+): number {
+  return getAgentSpendWindows(agentId, now, opts).hourly
+}
+export type AgentBudgetWindow = 'hourly' | 'daily' | 'monthly'
+export interface AgentBudgetStatus {
+  window: AgentBudgetWindow
+  spend: number
+  budget: number
+  ratio: number
+  message: string
+}
+export interface AgentBudgetCheckSummary {
+  ok: boolean
+  spend: AgentSpendWindows
+  exceeded: AgentBudgetStatus[]
+  warnings: AgentBudgetStatus[]
+}
+function budgetWindowLabel(window: AgentBudgetWindow): string {
+  if (window === 'hourly') return 'hourly'
+  if (window === 'daily') return 'daily'
+  return 'monthly'
+}
+function buildBudgetStatus(
+  agentName: string,
+  window: AgentBudgetWindow,
+  spend: number,
+  budget: number,
+  exceeded: boolean,
+): AgentBudgetStatus {
+  const ratio = budget > 0 ? spend / budget : 0
+  const label = budgetWindowLabel(window)
+  const message = exceeded
+    ? `Agent "${agentName}" has reached its ${label} budget: $${spend.toFixed(4)} spent of $${budget.toFixed(2)} cap.`
+    : `Agent "${agentName}" is nearing its ${label} budget: $${spend.toFixed(4)} of $${budget.toFixed(2)} (${Math.round(ratio * 100)}%).`
+  return { window, spend, budget, ratio, message }
+}
+export function checkAgentBudgetLimits(
+  agent: Agent,
+  now = Date.now(),
+  opts?: { sessions?: SessionsMap; usage?: UsageMap },
+): AgentBudgetCheckSummary {
+  const budgets: Partial<Record<AgentBudgetWindow, number>> = {
+    hourly: parsePositiveBudget(agent.hourlyBudget) ?? undefined,
+    daily: parsePositiveBudget(agent.dailyBudget) ?? undefined,
+    monthly: parsePositiveBudget(agent.monthlyBudget) ?? undefined,
+  }
+  const spend = getAgentSpendWindows(agent.id, now, opts)
+  const exceeded: AgentBudgetStatus[] = []
+  const warnings: AgentBudgetStatus[] = []
+  for (const window of ['hourly', 'daily', 'monthly'] as const) {
+    const budget = budgets[window]
+    if (!budget) continue
+    const windowSpend = spend[window]
+    if (windowSpend >= budget) {
+      exceeded.push(buildBudgetStatus(agent.name, window, windowSpend, budget, true))
+      continue
+    }
+    if (windowSpend >= budget * WARNING_RATIO) {
+      warnings.push(buildBudgetStatus(agent.name, window, windowSpend, budget, false))
+    }
+  }
+  return {
+    ok: exceeded.length === 0,
+    spend,
+    exceeded,
+    warnings,
+  }
 }
 export interface BudgetCheckResult {
@@ -75,14 +210,10 @@ export interface BudgetCheckResult {
 }
 /**
- * Check whether an agent is within its monthly budget.
- * Returns ok: true if no budget is set or spend is under the cap.
+ * Backwards-compatible monthly-only budget check.
  */
 export function checkBudget(agent: Agent): BudgetCheckResult {
-  const budget = typeof agent.monthlyBudget === 'number' && Number.isFinite(agent.monthlyBudget) && agent.monthlyBudget > 0
-    ? agent.monthlyBudget
-    : 0
+  const budget = parsePositiveBudget(agent.monthlyBudget) ?? 0
   if (budget <= 0) {
     return { ok: true, spend: 0, budget: 0 }
   }

package/src/lib/server/daemon-state.ts CHANGED Viewed

@@ -1,4 +1,4 @@
-import { loadQueue, loadSchedules, loadSessions, saveSessions, loadConnectors, saveConnectors, loadWebhookRetryQueue, upsertWebhookRetry, deleteWebhookRetry, loadWebhooks, loadAgents, appendWebhookLog, loadCredentials, decryptKey } from './storage'
+import { loadQueue, loadSchedules, loadSessions, saveSessions, loadConnectors, saveConnectors, loadWebhookRetryQueue, upsertWebhookRetry, deleteWebhookRetry, loadWebhooks, loadAgents, loadSettings, appendWebhookLog, loadCredentials, decryptKey } from './storage'
 import { notify } from './ws-hub'
 import { processNext, cleanupFinishedTaskSessions, validateCompletedTasksQueue, recoverStalledRunningTasks } from './queue'
 import { startScheduler, stopScheduler } from './scheduler'
@@ -17,9 +17,11 @@ import { hasOpenClawAgents, ensureGatewayConnected, disconnectGateway, getGatewa
 import { enqueueSessionRun } from './session-run-manager'
 import { WORKSPACE_DIR } from './data-dir'
 import { genId } from '@/lib/id'
+import path from 'node:path'
 import type { WebhookRetryEntry } from '@/types'
 import { createNotification } from '@/lib/server/create-notification'
 import { pingProvider, OPENAI_COMPATIBLE_DEFAULTS } from '@/lib/server/provider-health'
+import { runIntegrityMonitor } from '@/lib/server/integrity-monitor'
 const QUEUE_CHECK_INTERVAL = 30_000 // 30 seconds
 const BROWSER_SWEEP_INTERVAL = 60_000 // 60 seconds
@@ -80,6 +82,7 @@ const ds: {
   healthIntervalId: ReturnType<typeof setInterval> | null
   memoryConsolidationTimeoutId: ReturnType<typeof setTimeout> | null
   memoryConsolidationIntervalId: ReturnType<typeof setInterval> | null
+  evalSchedulerIntervalId: ReturnType<typeof setInterval> | null
   /** Session IDs we've already alerted as stale (alert-once semantics). */
   staleSessionIds: Set<string>
   connectorRestartState: Map<string, { lastAttemptAt: number; failCount: number; wakeAttempts: number }>
@@ -87,6 +90,8 @@ const ds: {
   openclawDownAgentIds: Set<string>
   /** Per-agent auto-repair state for OpenClaw gateways. */
   openclawRepairState: Map<string, { attempts: number; lastAttemptAt: number; cooldownUntil: number }>
+  lastIntegrityCheckAt: number | null
+  lastIntegrityDriftCount: number
   manualStopRequested: boolean
   running: boolean
   lastProcessedAt: number | null
@@ -97,10 +102,13 @@ const ds: {
   healthIntervalId: null,
   memoryConsolidationTimeoutId: null,
   memoryConsolidationIntervalId: null,
+  evalSchedulerIntervalId: null,
   staleSessionIds: new Set<string>(),
   connectorRestartState: new Map<string, { lastAttemptAt: number; failCount: number; wakeAttempts: number }>(),
   openclawDownAgentIds: new Set<string>(),
   openclawRepairState: new Map<string, { attempts: number; lastAttemptAt: number; cooldownUntil: number }>(),
+  lastIntegrityCheckAt: null,
+  lastIntegrityDriftCount: 0,
   manualStopRequested: false,
   running: false,
   lastProcessedAt: null,
@@ -111,6 +119,8 @@ if (!ds.staleSessionIds) ds.staleSessionIds = new Set<string>()
 if (!ds.connectorRestartState) ds.connectorRestartState = new Map<string, { lastAttemptAt: number; failCount: number; wakeAttempts: number }>()
 if (!ds.openclawDownAgentIds) ds.openclawDownAgentIds = new Set<string>()
 if (!ds.openclawRepairState) ds.openclawRepairState = new Map<string, { attempts: number; lastAttemptAt: number; cooldownUntil: number }>()
+if (ds.lastIntegrityCheckAt === undefined) ds.lastIntegrityCheckAt = null
+if (ds.lastIntegrityDriftCount === undefined) ds.lastIntegrityDriftCount = 0
 // Migrate from old issueLastAlertAt map if present (HMR across code versions)
 // eslint-disable-next-line @typescript-eslint/no-explicit-any
 if ((ds as any).issueLastAlertAt) delete (ds as any).issueLastAlertAt
@@ -118,6 +128,7 @@ if (ds.healthIntervalId === undefined) ds.healthIntervalId = null
 if (ds.manualStopRequested === undefined) ds.manualStopRequested = false
 if (ds.memoryConsolidationTimeoutId === undefined) ds.memoryConsolidationTimeoutId = null
 if (ds.memoryConsolidationIntervalId === undefined) ds.memoryConsolidationIntervalId = null
+if (ds.evalSchedulerIntervalId === undefined) ds.evalSchedulerIntervalId = null
 export function ensureDaemonStarted(source = 'unknown'): boolean {
   if (ds.running) return false
@@ -140,6 +151,7 @@ export function startDaemon(options?: { source?: string; manualStart?: boolean }
     startHealthMonitor()
     startHeartbeatService()
     startMemoryConsolidation()
+    startEvalScheduler()
     return
   }
   ds.running = true
@@ -155,6 +167,7 @@ export function startDaemon(options?: { source?: string; manualStart?: boolean }
     startHealthMonitor()
     startHeartbeatService()
     startMemoryConsolidation()
+    startEvalScheduler()
   } catch (err: unknown) {
     ds.running = false
     notify('daemon')
@@ -182,6 +195,7 @@ export function stopDaemon(options?: { source?: string; manualStop?: boolean })
   stopHealthMonitor()
   stopHeartbeatService()
   stopMemoryConsolidation()
+  stopEvalScheduler()
   stopAllConnectors().catch(() => {})
 }
@@ -725,6 +739,35 @@ async function runHealthChecks() {
     console.error('[daemon] OpenClaw gateway health check failed:', err instanceof Error ? err.message : String(err))
   }
+  // Integrity drift monitoring for identity/config/plugin files.
+  try {
+    const integrity = runIntegrityMonitor(loadSettings())
+    ds.lastIntegrityCheckAt = integrity.checkedAt
+    ds.lastIntegrityDriftCount = integrity.drifts.length
+    if (integrity.drifts.length > 0) {
+      for (const drift of integrity.drifts) {
+        const rel = path.relative(process.cwd(), drift.filePath)
+        const shortPath = rel && !rel.startsWith('..') ? rel : drift.filePath
+        const action = drift.type === 'created'
+          ? 'created'
+          : drift.type === 'deleted'
+            ? 'deleted'
+            : 'modified'
+        createNotification({
+          type: drift.type === 'deleted' ? 'error' : 'warning',
+          title: `Integrity drift detected (${drift.kind})`,
+          message: `${shortPath} was ${action}.`,
+          dedupKey: `integrity:${drift.id}:${drift.nextHash || 'missing'}`,
+          entityType: 'session',
+          entityId: drift.id,
+        })
+      }
+      await sendHealthAlert(`Integrity monitor detected ${integrity.drifts.length} file drift event(s).`)
+    }
+  } catch (err: unknown) {
+    console.error('[daemon] Integrity monitor check failed:', err instanceof Error ? err.message : String(err))
+  }
   // Process webhook retry queue
   try {
     await processWebhookRetries()
@@ -785,6 +828,69 @@ function stopMemoryConsolidation() {
   }
 }
+// --- Eval scheduler ---
+const EVAL_DEFAULT_INTERVAL_MS = 24 * 3600_000 // 24 hours
+function parseCronToMs(cron: string | null | undefined): number | null {
+  if (!cron || typeof cron !== 'string') return null
+  // Simple heuristic: extract hours from common cron patterns like "0 */6 * * *"
+  const hourMatch = cron.match(/\*\/(\d+)/)
+  if (hourMatch) return parseInt(hourMatch[1], 10) * 3600_000
+  return EVAL_DEFAULT_INTERVAL_MS
+}
+async function runEvalSchedulerTick() {
+  try {
+    const settings = loadSettings()
+    if (!settings.autonomyEvalEnabled) return
+    const { runEvalSuite } = await import('./eval/runner')
+    const agents = loadAgents()
+    const heartbeatAgentIds = Object.keys(agents).filter(
+      (id) => agents[id].heartbeatEnabled === true,
+    )
+    for (const agentId of heartbeatAgentIds) {
+      try {
+        const result = await runEvalSuite(agentId)
+        console.log(
+          `[daemon:eval] Agent ${agents[agentId].name}: ${result.percentage}% (${result.totalScore}/${result.maxScore})`,
+        )
+        createNotification({
+          title: `Eval: ${agents[agentId].name} scored ${result.percentage}%`,
+          message: `${result.runs.length} scenarios, ${result.totalScore}/${result.maxScore} points`,
+          type: result.percentage >= 60 ? 'info' : 'warning',
+        })
+      } catch (err: unknown) {
+        console.error(`[daemon:eval] Failed for agent ${agentId}:`, err instanceof Error ? err.message : String(err))
+      }
+    }
+  } catch (err: unknown) {
+    console.error('[daemon:eval] Scheduler tick error:', err instanceof Error ? err.message : String(err))
+  }
+}
+function startEvalScheduler() {
+  if (ds.evalSchedulerIntervalId) return
+  try {
+    const settings = loadSettings()
+    if (!settings.autonomyEvalEnabled) return
+    const intervalMs = parseCronToMs(settings.autonomyEvalCron) || EVAL_DEFAULT_INTERVAL_MS
+    ds.evalSchedulerIntervalId = setInterval(runEvalSchedulerTick, intervalMs)
+    console.log(`[daemon:eval] Eval scheduler started (interval=${Math.round(intervalMs / 3600_000)}h)`)
+  } catch {
+    // Eval scheduling is optional — don't block daemon start
+  }
+}
+function stopEvalScheduler() {
+  if (ds.evalSchedulerIntervalId) {
+    clearInterval(ds.evalSchedulerIntervalId)
+    ds.evalSchedulerIntervalId = null
+  }
+}
 export async function runDaemonHealthCheckNow() {
   await runHealthChecks()
 }
@@ -823,6 +929,11 @@ export function getDaemonStatus() {
       staleSessions: ds.staleSessionIds.size,
       connectorsInBackoff: ds.connectorRestartState.size,
       checkIntervalSec: Math.trunc(HEALTH_CHECK_INTERVAL / 1000),
+      integrity: {
+        enabled: loadSettings().integrityMonitorEnabled !== false,
+        lastCheckedAt: ds.lastIntegrityCheckAt,
+        lastDriftCount: ds.lastIntegrityDriftCount,
+      },
     },
     webhookRetry: {
       pendingRetries,

package/src/lib/server/data-dir.ts CHANGED Viewed

@@ -1,4 +1,21 @@
 import path from 'path'
+import os from 'os'
+import fs from 'fs'
 export const DATA_DIR = process.env.DATA_DIR || path.join(process.cwd(), 'data')
-export const WORKSPACE_DIR = path.join(DATA_DIR, 'workspace')
+// Workspace lives outside the project directory to avoid triggering Next.js HMR
+// when agents create/modify files. Falls back to data/workspace for Docker/CI.
+function resolveWorkspaceDir(): string {
+  if (process.env.WORKSPACE_DIR) return process.env.WORKSPACE_DIR
+  const external = path.join(os.homedir(), '.swarmclaw', 'workspace')
+  try {
+    fs.mkdirSync(external, { recursive: true })
+    return external
+  } catch {
+    // If we can't create the external dir (permissions, etc.), fall back to in-project
+    return path.join(DATA_DIR, 'workspace')
+  }
+}
+export const WORKSPACE_DIR = resolveWorkspaceDir()

package/src/lib/server/eval/runner.ts ADDED Viewed

@@ -0,0 +1,126 @@
+import { genId } from '@/lib/id'
+import type { EvalScenario, EvalRun, EvalSuiteResult } from './types'
+import { getScenario, EVAL_SCENARIOS } from './scenarios'
+import { scoreCriteria } from './scorer'
+import { saveEvalRun } from './store'
+import { loadSessions, saveSessions, loadAgents, loadCredentials, decryptKey } from '../storage'
+import { executeSessionChatTurn } from '../chat-execution'
+import type { Session } from '@/types'
+export async function runEvalScenario(scenarioId: string, agentId: string): Promise<EvalRun> {
+  const scenario = getScenario(scenarioId)
+  if (!scenario) throw new Error(`Unknown eval scenario: ${scenarioId}`)
+  const agents = loadAgents() as Record<string, Record<string, unknown>>
+  const agent = agents[agentId]
+  if (!agent) throw new Error(`Unknown agent: ${agentId}`)
+  const runId = genId()
+  const sessionId = `eval-${runId}`
+  const now = Date.now()
+  const run: EvalRun = {
+    id: runId,
+    scenarioId,
+    agentId,
+    status: 'running',
+    startedAt: now,
+    score: 0,
+    maxScore: scenario.scoringCriteria.reduce((sum, c) => sum + c.weight, 0),
+    details: [],
+    sessionId,
+  }
+  // Create temporary eval session
+  const sessions = loadSessions() as Record<string, Session>
+  const evalSession: Session = {
+    id: sessionId,
+    name: `Eval: ${scenario.name}`,
+    cwd: process.cwd(),
+    user: 'eval-runner',
+    provider: (agent.provider as Session['provider']) ?? 'anthropic',
+    model: (agent.model as string) ?? '',
+    credentialId: (agent.credentialId as string | null) ?? null,
+    apiEndpoint: (agent.apiEndpoint as string | null) ?? null,
+    claudeSessionId: null,
+    agentId,
+    tools: scenario.tools,
+    messages: [],
+    createdAt: now,
+    lastActiveAt: now,
+  }
+  sessions[sessionId] = evalSession
+  saveSessions(sessions)
+  try {
+    const result = await executeSessionChatTurn({
+      sessionId,
+      message: scenario.userMessage,
+      internal: true,
+      source: 'eval',
+    })
+    const judgeProvider = typeof agent.provider === 'string' ? agent.provider : undefined
+    const judgeModel = typeof agent.model === 'string' ? agent.model : undefined
+    let judgeApiKey: string | null = null
+    if (typeof agent.credentialId === 'string' && agent.credentialId) {
+      const creds = loadCredentials()
+      const cred = creds[agent.credentialId]
+      if (cred) {
+        try { judgeApiKey = decryptKey(cred.encryptedKey) } catch { /* skip undecryptable */ }
+      }
+    }
+    const judgeOpts = judgeProvider && judgeModel ? {
+      provider: judgeProvider,
+      model: judgeModel,
+      apiKey: judgeApiKey,
+      apiEndpoint: typeof agent.apiEndpoint === 'string' ? agent.apiEndpoint : undefined,
+    } : undefined
+    run.details = await scoreCriteria(
+      scenario.scoringCriteria,
+      result.text,
+      result.toolEvents || [],
+      judgeOpts,
+    )
+    run.score = run.details.reduce((sum, d) => sum + d.score, 0)
+    run.status = 'completed'
+    run.endedAt = Date.now()
+  } catch (err: unknown) {
+    run.status = 'failed'
+    run.error = err instanceof Error ? err.message : String(err)
+    run.endedAt = Date.now()
+  } finally {
+    // Clean up eval session
+    const currentSessions = loadSessions() as Record<string, Session>
+    delete currentSessions[sessionId]
+    saveSessions(currentSessions)
+  }
+  saveEvalRun(run)
+  return run
+}
+export async function runEvalSuite(agentId: string, categories?: string[]): Promise<EvalSuiteResult> {
+  const scenarios: EvalScenario[] = categories
+    ? EVAL_SCENARIOS.filter(s => categories.includes(s.category))
+    : EVAL_SCENARIOS
+  const runs: EvalRun[] = []
+  for (const scenario of scenarios) {
+    const evalRun = await runEvalScenario(scenario.id, agentId)
+    runs.push(evalRun)
+  }
+  const totalScore = runs.reduce((sum, r) => sum + r.score, 0)
+  const maxScore = runs.reduce((sum, r) => sum + r.maxScore, 0)
+  return {
+    agentId,
+    totalScore,
+    maxScore,
+    percentage: maxScore > 0 ? Math.round((totalScore / maxScore) * 100) : 0,
+    runs,
+    completedAt: Date.now(),
+  }
+}