npm - create-walle - Versions diffs - 0.9.11 → 0.9.13 - Mend

create-walle 0.9.11 → 0.9.13

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (167) hide show

package/README.md +3 -3
package/package.json +2 -2
package/template/bin/dev.sh +7 -1
package/template/bin/setup.js +53 -9
package/template/bin/sync-images.js +53 -0
package/template/builder-journal.md +17 -0
package/template/claude-task-manager/api-prompts.js +98 -13
package/template/claude-task-manager/api-reviews.js +82 -5
package/template/claude-task-manager/db.js +32 -5
package/template/claude-task-manager/docs/session-capture-foundation-design.md +1273 -0
package/template/claude-task-manager/lib/claude-desktop-sessions.js +696 -0
package/template/claude-task-manager/lib/coding-agent-models.js +49 -1
package/template/claude-task-manager/lib/session-capture.js +421 -0
package/template/claude-task-manager/lib/session-history.js +135 -15
package/template/claude-task-manager/lib/session-jobs.js +10 -5
package/template/claude-task-manager/lib/session-stream.js +87 -19
package/template/claude-task-manager/lib/setup-provider-config.js +115 -0
package/template/claude-task-manager/lib/walle-ctm-history.js +72 -0
package/template/claude-task-manager/lib/walle-session-context.js +61 -0
package/template/claude-task-manager/lib/walle-transcript.js +176 -0
package/template/claude-task-manager/public/css/setup.css +35 -8
package/template/claude-task-manager/public/css/walle-session.css +56 -0
package/template/claude-task-manager/public/css/walle.css +120 -0
package/template/claude-task-manager/public/index.html +814 -181
package/template/claude-task-manager/public/js/message-renderer.js +148 -19
package/template/claude-task-manager/public/js/reviews.js +120 -62
package/template/claude-task-manager/public/js/setup.js +75 -31
package/template/claude-task-manager/public/js/stream-view.js +115 -55
package/template/claude-task-manager/public/js/walle-session.js +84 -2
package/template/claude-task-manager/public/js/walle.js +308 -54
package/template/claude-task-manager/server.js +1092 -146
package/template/claude-task-manager/session-integrity.js +181 -54
package/template/claude-task-manager/session-utils.js +123 -41
package/template/claude-task-manager/workers/state-detectors/codex.js +5 -2
package/template/package.json +1 -1
package/template/wall-e/adapters/ctm.js +39 -18
package/template/wall-e/agent-runners/contract.js +17 -0
package/template/wall-e/agent-runners/index.js +22 -0
package/template/wall-e/agent-runtime/harness.js +212 -0
package/template/wall-e/agent-runtime/index.js +8 -0
package/template/wall-e/agent-runtime/registry.js +67 -0
package/template/wall-e/agent-runtime/session-store.js +179 -0
package/template/wall-e/agent-runtime/spawn.js +208 -0
package/template/wall-e/api-walle.js +174 -7
package/template/wall-e/brain.js +266 -28
package/template/wall-e/channels/policy.js +88 -0
package/template/wall-e/channels/registry.js +15 -1
package/template/wall-e/channels/reply-dispatcher.js +70 -0
package/template/wall-e/channels/session-bindings.js +51 -0
package/template/wall-e/chat/code-review-context.js +29 -0
package/template/wall-e/chat.js +188 -42
package/template/wall-e/coding/acp-adapter.js +188 -0
package/template/wall-e/coding/agent-catalog.js +129 -0
package/template/wall-e/coding/compaction-service.js +247 -0
package/template/wall-e/coding/execution-trace.js +3 -0
package/template/wall-e/coding/instruction-service.js +224 -0
package/template/wall-e/coding/model-message.js +67 -0
package/template/wall-e/coding/permission-rules-store.js +111 -0
package/template/wall-e/coding/permission-service.js +266 -0
package/template/wall-e/coding/prompt-bundle.js +67 -0
package/template/wall-e/coding/prompt-runtime.js +243 -0
package/template/wall-e/coding/provider-transform.js +188 -0
package/template/wall-e/coding/runtime-mode.js +132 -0
package/template/wall-e/coding/snapshot-service.js +155 -0
package/template/wall-e/coding/stream-processor.js +268 -0
package/template/wall-e/coding/task-tool.js +255 -0
package/template/wall-e/coding/tool-registry.js +361 -0
package/template/wall-e/coding/transcript-writer.js +143 -0
package/template/wall-e/coding/workspace-replay.js +324 -0
package/template/wall-e/coding-context.js +4 -22
package/template/wall-e/coding-orchestrator.js +307 -18
package/template/wall-e/coding-prompts.js +44 -3
package/template/wall-e/context/context-builder.js +43 -1
package/template/wall-e/context/topic-matcher.js +1 -1
package/template/wall-e/eval/agent-runner.js +59 -13
package/template/wall-e/eval/benchmarks/memory-retrieval.json +155 -57
package/template/wall-e/eval/benchmarks.js +100 -16
package/template/wall-e/eval/eval-orchestrator.js +218 -8
package/template/wall-e/eval/harvester.js +62 -5
package/template/wall-e/eval/head-to-head.js +23 -2
package/template/wall-e/eval/humaneval-adapter.js +30 -5
package/template/wall-e/eval/livecodebench-adapter.js +29 -5
package/template/wall-e/eval/manifest.js +186 -0
package/template/wall-e/eval/run-agent-benchmarks.js +66 -2
package/template/wall-e/eval/session-retrieval-benchmark.js +150 -0
package/template/wall-e/eval/session-transcripts.js +57 -4
package/template/wall-e/eval/swebench-adapter.js +109 -3
package/template/wall-e/evaluation/agent-router.js +53 -1
package/template/wall-e/evaluation/coding-quorum.js +48 -1
package/template/wall-e/evaluation/router.js +4 -2
package/template/wall-e/evaluation/tier-selector.js +11 -1
package/template/wall-e/extraction/contradiction.js +2 -2
package/template/wall-e/extraction/indexer.js +2 -1
package/template/wall-e/extraction/knowledge-extractor.js +2 -2
package/template/wall-e/hooks/cli.js +92 -0
package/template/wall-e/hooks/discovery.js +119 -0
package/template/wall-e/hooks/index.js +7 -0
package/template/wall-e/hooks/manifest.js +55 -0
package/template/wall-e/hooks/runtime.js +84 -0
package/template/wall-e/hooks/session-memory.js +225 -0
package/template/wall-e/http/auth.js +6 -2
package/template/wall-e/http/chat-api.js +54 -8
package/template/wall-e/integrations/claude-plugin/hooks/hooks.json +27 -0
package/template/wall-e/integrations/claude-plugin/hooks/walle-precompact-hook.sh +5 -0
package/template/wall-e/integrations/claude-plugin/hooks/walle-stop-hook.sh +5 -0
package/template/wall-e/integrations/codex-plugin/hooks/walle-hook.sh +7 -0
package/template/wall-e/integrations/codex-plugin/hooks.json +37 -0
package/template/wall-e/listening/calendar.js +3 -1
package/template/wall-e/llm/client.js +64 -10
package/template/wall-e/llm/google.js +39 -5
package/template/wall-e/llm/ollama.js +1 -1
package/template/wall-e/llm/ollama.plugin.json +1 -1
package/template/wall-e/llm/provider-availability.js +10 -0
package/template/wall-e/llm/provider-error.js +269 -0
package/template/wall-e/llm/tool-adapter.js +48 -12
package/template/wall-e/loops/boot.js +2 -1
package/template/wall-e/loops/initiative.js +2 -2
package/template/wall-e/loops/tasks.js +8 -47
package/template/wall-e/loops/workspace-prompts.js +20 -0
package/template/wall-e/mcp-server.js +442 -1
package/template/wall-e/memory/session-ingest-service.js +159 -0
package/template/wall-e/memory/source-indexer.js +289 -0
package/template/wall-e/plugins/discovery.js +83 -0
package/template/wall-e/plugins/manifest-loader.js +50 -10
package/template/wall-e/plugins/manifest-schema.js +69 -0
package/template/wall-e/plugins/model-catalog.js +55 -0
package/template/wall-e/prompts/coding/base.txt +2 -0
package/template/wall-e/prompts/coding/deepseek.txt +1 -0
package/template/wall-e/prompts/coding/memory-protocol.md +9 -0
package/template/wall-e/prompts/coding/plan.txt +1 -0
package/template/wall-e/runtime/execution-trace.js +220 -0
package/template/wall-e/security/audit.js +266 -0
package/template/wall-e/security/ssrf.js +236 -0
package/template/wall-e/session-files.js +303 -0
package/template/wall-e/skills/_bundled/slack-backfill/SKILL.md +3 -0
package/template/wall-e/skills/_bundled/slack-sync/SKILL.md +3 -0
package/template/wall-e/skills/internal-skill-registry.js +2 -2
package/template/wall-e/skills/script-skill-runner.js +143 -0
package/template/wall-e/skills/skill-executor.js +5 -6
package/template/wall-e/skills/skill-fallback.js +3 -1
package/template/wall-e/skills/skill-harness-registry.js +7 -8
package/template/wall-e/skills/skill-planner.js +52 -4
package/template/wall-e/skills/slack-ingest.js +11 -3
package/template/wall-e/sources/base.js +90 -0
package/template/wall-e/sources/builtin.js +33 -0
package/template/wall-e/sources/claude-code-jsonl.js +78 -0
package/template/wall-e/sources/codex-jsonl.js +125 -0
package/template/wall-e/sources/coding-session-utils.js +117 -0
package/template/wall-e/sources/contract-suite.js +59 -0
package/template/wall-e/sources/gemini-jsonl.js +85 -0
package/template/wall-e/sources/index.js +9 -0
package/template/wall-e/sources/jsonl-utils.js +181 -0
package/template/wall-e/sources/record-types.js +252 -0
package/template/wall-e/sources/registry.js +92 -0
package/template/wall-e/sources/transforms.js +100 -0
package/template/wall-e/sources/walle-jsonl.js +108 -0
package/template/wall-e/tools/coding-middleware.js +31 -1
package/template/wall-e/tools/file-tracker.js +25 -1
package/template/wall-e/tools/local-tools.js +75 -47
package/template/wall-e/tools/session-sharing.js +68 -1
package/template/wall-e/tools/shell-analyzer.js +1 -1
package/template/wall-e/tools/shell-policy.js +47 -0
package/template/wall-e/tools/snapshot.js +42 -0
package/template/wall-e/training/harvester.js +62 -5
package/template/wall-e/utils/repair.js +253 -1
package/template/website/index.html +3 -3
package/template/wall-e/skills/_bundled/slack-mentions/.watched-threads.json +0 -18

package/template/wall-e/agent-runtime/spawn.js ADDED Viewed

@@ -0,0 +1,208 @@
+'use strict';
+const { createAgentRunId, normalizeAgentMode, normalizeAgentRunResult } = require('../agent-runners/contract');
+const { createDefaultHarnessRegistry, selectAgentHarness } = require('./harness');
+const { createDefaultRuntimeRegistry } = require('./registry');
+const { defaultSessionStore } = require('./session-store');
+const {
+  attachTraceToResult,
+  createExecutionTrace,
+  finalizeTrace,
+  recordAttemptFinish,
+  recordAttemptStart,
+  recordSelection,
+} = require('../runtime/execution-trace');
+function normalizeAgentTaskRequest(input = {}) {
+  const task = input.task || input.prompt || '';
+  return {
+    id: input.id || input.runId || createAgentRunId(),
+    parentRunId: input.parentRunId || input.parentId || null,
+    harnessId: input.harnessId || null,
+    runtime: input.runtime || input.runtimePreference || 'cli-agent',
+    runnerId: input.runnerId || input.runner || input.agent || 'claude-code',
+    providerType: input.providerType || input.provider || 'unknown',
+    model: input.model || null,
+    mode: normalizeAgentMode(input.mode),
+    task,
+    prompt: task,
+    cwd: input.cwd || process.cwd(),
+    writeScope: Array.isArray(input.writeScope) ? input.writeScope : (input.writeScope ? [input.writeScope] : ['.']),
+    sandbox: input.sandbox || null,
+    timeoutMs: input.timeoutMs || 300000,
+    sessionId: input.sessionId || null,
+    persistent: Boolean(input.persistent),
+    cleanupPolicy: input.cleanupPolicy || (input.persistent ? 'manual' : 'delete-on-complete'),
+    threadId: input.threadId || null,
+    contextPolicy: input.contextPolicy || null,
+    attachments: Array.isArray(input.attachments) ? input.attachments : [],
+    reviewPolicy: input.reviewPolicy || null,
+    metadata: { ...(input.metadata || {}) },
+  };
+}
+async function spawnAgentSession(input = {}, deps = {}) {
+  const request = normalizeAgentTaskRequest(input);
+  const trace = deps.trace || createExecutionTrace({
+    runId: request.id,
+    parentRunId: request.parentRunId,
+    mode: request.mode,
+    provider: request.providerType,
+    model: request.model,
+    runnerId: request.runnerId,
+    harnessId: request.harnessId,
+    sessionId: request.sessionId || '',
+    cwd: request.cwd,
+    sandbox: request.sandbox,
+    taskType: 'agent-runtime',
+  });
+  if (deps.harnessRegistry || request.harnessId) {
+    const harnessRegistry = deps.harnessRegistry || createDefaultHarnessRegistry();
+    const selection = selectAgentHarness(request, [], {
+      registry: harnessRegistry,
+      providerAvailability: deps.providerAvailability,
+    });
+    if (!selection.selected) {
+      const error = `No supported agent harness found for ${request.harnessId || request.runnerId}`;
+      recordSelection(trace, selection);
+      finalizeTrace(trace, { status: 'failed', error });
+      return normalizeAgentRunResult({
+        runId: request.id,
+        parentRunId: request.parentRunId,
+        runnerId: request.runnerId,
+        providerType: request.providerType,
+        mode: request.mode,
+        sessionId: request.sessionId,
+        success: false,
+        stderr: error,
+        error,
+        trace,
+      });
+    }
+    recordSelection(trace, selection);
+    request.harnessId = selection.selected.id;
+    request.runnerId = selection.selected.runnerId;
+    request.providerType = selection.selected.providerType;
+    request.metadata = { ...request.metadata, harnessSelection: selection.reason };
+  }
+  const sessionStore = deps.sessionStore || defaultSessionStore;
+  const registry = deps.registry || createDefaultRuntimeRegistry({ runTask: deps.runTask });
+  const runtime = registry.getRuntime(request.runtime);
+  if (!runtime) {
+    const error = `Unknown agent runtime: ${request.runtime}`;
+    return normalizeAgentRunResult({
+      runId: request.id,
+      parentRunId: request.parentRunId,
+      runnerId: request.runnerId,
+      providerType: request.providerType,
+      mode: request.mode,
+      sessionId: request.sessionId,
+      success: false,
+      stderr: error,
+      error,
+    });
+  }
+  const existingSession = request.sessionId ? sessionStore.getSession(request.sessionId) : null;
+  const session = existingSession || sessionStore.createSession({
+    id: request.sessionId,
+    parentRunId: request.parentRunId,
+    runtime: request.runtime,
+    runnerId: request.runnerId,
+    harnessId: request.harnessId,
+    providerType: request.providerType,
+    model: request.model,
+    mode: request.mode,
+    cwd: request.cwd,
+    sandbox: request.sandbox,
+    task: request.task,
+    persistent: request.persistent,
+    cleanupPolicy: request.cleanupPolicy,
+    threadId: request.threadId,
+    metadata: request.metadata,
+  });
+  sessionStore.markRunning(session.id, {
+    parentRunId: request.parentRunId,
+    runtime: request.runtime,
+    runnerId: request.runnerId,
+    providerType: request.providerType,
+    model: request.model,
+    mode: request.mode,
+    cwd: request.cwd,
+    sandbox: request.sandbox,
+    task: request.task,
+  });
+  trace.sessionId = session.id;
+  trace.request.runnerId = request.runnerId;
+  trace.request.harnessId = request.harnessId;
+  trace.request.modelPreference = request.model || '';
+  const startedAt = Date.now();
+  const attempt = recordAttemptStart(trace, {
+    providerType: request.providerType,
+    model: request.model,
+    runnerId: request.runnerId,
+    harnessId: request.harnessId,
+  });
+  try {
+    const raw = await runtime.run({
+      ...request,
+      sessionId: session.id,
+      resumeHandle: session.resumeHandle,
+    });
+    const completedSession = sessionStore.markCompleted(session.id, raw || {}) || sessionStore.getSession(session.id);
+    recordAttemptFinish(trace, attempt.id, {
+      success: raw?.success !== false,
+      status: raw?.success === false ? 'failed' : 'completed',
+      error: raw?.error || raw?.stderr || null,
+      usage: raw?.usage || null,
+    });
+    trace.latencyMs = Date.now() - startedAt;
+    finalizeTrace(trace, { status: raw?.success === false ? 'failed' : 'completed' });
+    const normalized = normalizeAgentRunResult(raw || {}, {
+      runId: request.id,
+      parentRunId: request.parentRunId,
+      runnerId: request.runnerId,
+      harnessId: request.harnessId,
+      providerType: request.providerType,
+      mode: request.mode,
+      sessionId: session.id,
+      persistent: completedSession?.persistent,
+      cleanupPolicy: completedSession?.cleanupPolicy,
+      threadId: completedSession?.threadId,
+      sessionStatus: completedSession?.status,
+      trace,
+    });
+    return attachTraceToResult(normalized, trace);
+  } catch (err) {
+    const failedSession = sessionStore.markFailed(session.id, err) || sessionStore.getSession(session.id);
+    recordAttemptFinish(trace, attempt.id, { status: 'failed', error: err.message });
+    trace.latencyMs = Date.now() - startedAt;
+    finalizeTrace(trace, { status: 'failed', error: err.message });
+    return normalizeAgentRunResult({
+      runId: request.id,
+      parentRunId: request.parentRunId,
+      runnerId: request.runnerId,
+      harnessId: request.harnessId,
+      providerType: request.providerType,
+      mode: request.mode,
+      sessionId: session.id,
+      persistent: failedSession?.persistent,
+      cleanupPolicy: failedSession?.cleanupPolicy,
+      threadId: failedSession?.threadId,
+      sessionStatus: failedSession?.status,
+      success: false,
+      stderr: err.message,
+      error: err.message,
+      trace,
+    });
+  }
+}
+module.exports = {
+  normalizeAgentTaskRequest,
+  spawnAgentSession,
+};

package/template/wall-e/api-walle.js CHANGED Viewed

@@ -124,13 +124,25 @@ function _invalidateSkillSnapshot() {
 // Inspired by OpenCode Question service (packages/opencode/src/question/index.ts)
 const { QuestionManager } = require('./tools/question-manager');
 const _questionRegistry = new QuestionManager(null);
+const { PermissionService } = require('./coding/permission-service');
+const _permissionRegistry = new PermissionService();
 let _tasksBootstrapped = false;
+let _runtimeDefaultsSynced = false;
 function ensureBrainInit() {
   if (!brain) return false;
   try { brain.getDb(); } catch {
     try { brain.initDb(); } catch { return false; }
   }
+  if (!_runtimeDefaultsSynced) {
+    try {
+      const provider = brain.getKv('walle_provider');
+      const model = brain.getKv('walle_model');
+      if (provider) process.env.WALLE_PROVIDER = provider;
+      if (model) process.env.WALLE_MODEL = model;
+      _runtimeDefaultsSynced = true;
+    } catch {}
+  }
   // Bootstrap core tasks if DB is empty (first run)
   if (!_tasksBootstrapped) {
     _tasksBootstrapped = true;
@@ -830,6 +842,18 @@ function handleWalleApi(req, res, url) {
     }
     if (!hasApiKey && walleProvider === 'openai' && process.env.OPENAI_API_KEY) hasApiKey = true;
     if (!hasApiKey && walleProvider === 'google' && (process.env.GOOGLE_API_KEY || process.env.GEMINI_API_KEY)) hasApiKey = true;
+    if (!hasApiKey && walleProvider === 'anthropic') {
+      let authMethod = process.env.WALLE_AUTH_METHOD || '';
+      try { authMethod = brain?.getProviderAuthMethod?.('anthropic') || authMethod; } catch {}
+      if (authMethod === 'oauth_proxy' || authMethod === 'claude_cli' || authMethod === 'devbox') hasApiKey = true;
+      if (process.env.ANTHROPIC_AUTH_TOKEN || process.env.ANTHROPIC_BASE_URL) hasApiKey = true;
+    }
+    if (!hasApiKey && walleProvider === 'openai') {
+      let authMethod = process.env.WALLE_AUTH_METHOD || '';
+      try { authMethod = brain?.getProviderAuthMethod?.('openai') || authMethod; } catch {}
+      if (authMethod === 'codex_cli') hasApiKey = true;
+    }
+    if (!hasApiKey && walleProvider === 'deepseek' && process.env.DEEPSEEK_API_KEY) hasApiKey = true;
     if (!hasApiKey && (walleProvider === 'ollama' || walleProvider === 'mlx')) hasApiKey = true;
     let serviceAlerts = [];
@@ -939,8 +963,14 @@ function handleWalleApi(req, res, url) {
         const ownerName = body.ownerName || '';
         const providerConfig = body.providerConfig || null;
-        if (provider) brain.setKv('walle_provider', provider);
-        if (model) brain.setKv('walle_model', model);
+        if (provider) {
+          brain.setKv('walle_provider', provider);
+          process.env.WALLE_PROVIDER = provider;
+        }
+        if (model) {
+          brain.setKv('walle_model', model);
+          process.env.WALLE_MODEL = model;
+        }
         if (ownerName) brain.setKv('walle_owner_name', ownerName);
         if (provider && providerConfig) {
@@ -2616,6 +2646,63 @@ function handleWalleApi(req, res, url) {
     return true;
   }
+  // GET /api/wall-e/coding/sessions/:id/transcript?offset=&sequence=&limit=
+  // Replay durable Wall-E JSONL records for reconnecting clients without fs.watch.
+  const transcriptRangeMatch = p.match(/^\/api\/wall-e\/coding\/sessions\/([^/]+)\/transcript$/);
+  if (transcriptRangeMatch && m === 'GET') {
+    try {
+      const { WorkspaceReplay } = require('./coding/workspace-replay');
+      const replay = new WorkspaceReplay();
+      const range = replay.replayRange(decodeURIComponent(transcriptRangeMatch[1]), {
+        offset: params.get('offset') || 0,
+        sequence: params.get('sequence') || 0,
+        limitBytes: params.get('limit') || params.get('limitBytes') || undefined,
+      });
+      return jsonResponse(res, { ok: true, ...range }), true;
+    } catch (e) {
+      return jsonResponse(res, { error: e.message }, 500), true;
+    }
+  }
+  // POST /api/wall-e/coding/sessions/:id/transcript/append
+  // Direct append signal for CTM/ACP clients that already have structured parts.
+  const transcriptAppendMatch = p.match(/^\/api\/wall-e\/coding\/sessions\/([^/]+)\/transcript\/append$/);
+  if (transcriptAppendMatch && m === 'POST') {
+    readBody(req).then(body => {
+      try {
+        const { WorkspaceReplay } = require('./coding/workspace-replay');
+        const replay = new WorkspaceReplay();
+        const sessionId = decodeURIComponent(transcriptAppendMatch[1]);
+        const result = body.record
+          ? replay.appendRecord(sessionId, body.record)
+          : replay.appendPart(sessionId, body.partType || 'event', body.data || {}, {
+            cwd: body.cwd || '',
+            chatSessionId: body.chatSessionId || '',
+            parentUuid: body.parentUuid || null,
+          });
+        jsonResponse(res, { ok: true, ...result });
+      } catch (e) {
+        jsonResponse(res, { error: e.message }, 500);
+      }
+    }).catch(e => jsonResponse(res, { error: e.message }, 500));
+    return true;
+  }
+  // GET /api/wall-e/coding/sessions/:id/replay — rebuild message/part state from JSONL.
+  const replayStateMatch = p.match(/^\/api\/wall-e\/coding\/sessions\/([^/]+)\/replay$/);
+  if (replayStateMatch && m === 'GET') {
+    try {
+      const { WorkspaceReplay } = require('./coding/workspace-replay');
+      const replay = new WorkspaceReplay();
+      const state = replay.rebuildState(decodeURIComponent(replayStateMatch[1]), {
+        cwd: params.get('cwd') || '',
+      });
+      return jsonResponse(res, { ok: true, ...state }), true;
+    } catch (e) {
+      return jsonResponse(res, { error: e.message }, 500), true;
+    }
+  }
   // POST /api/wall-e/coding/question/:sessionId/answer — answer an interactive question
   // Inspired by OpenCode Question.reply() (packages/opencode/src/question/index.ts)
   if (m === 'POST' && p.match(/^\/api\/wall-e\/coding\/question\/[^/]+\/answer$/)) {
@@ -3043,21 +3130,42 @@ function handleWalleApi(req, res, url) {
   if (p === '/api/wall-e/eval/dashboard' && m === 'GET') {
     try {
       const leaderboard = brain.getBenchmarkLeaderboardWithDimensions({ days: 30 });
-      const shadowResults = brain.getShadowResults({ limit: 1, offset: 0 });
       const shadowTotal = (typeof brain.getShadowResults === 'function')
         ? brain.getShadowResults({}).length : 0;
+      const providerCount = new Set(leaderboard.map(r => r.provider).filter(Boolean)).size;
+      const benchmarkEvals = leaderboard.reduce((s, r) => s + (Number(r.total_evals) || 0), 0);
+      const trustedBenchmarkEvals = leaderboard.reduce((s, r) => s + (Number(r.trusted_evals) || 0), 0);
+      const trustedBenchmarkModels = leaderboard.filter(r => r.trust_status === 'trusted').length;
+      const provisionalBenchmarkModels = leaderboard.filter(r => r.trust_status === 'provisional').length;
+      const legacyBenchmarkModels = leaderboard.filter(r => r.trust_status === 'legacy').length;
       return jsonResponse(res, {
         data: {
-          providers: leaderboard.length,
-          totalEvals: leaderboard.reduce((s, r) => s + r.total_evals, 0) + shadowTotal,
+          providers: providerCount,
+          modelGroups: leaderboard.length,
+          totalEvals: benchmarkEvals + shadowTotal,
           shadowEvals: shadowTotal,
-          benchmarkEvals: leaderboard.reduce((s, r) => s + r.total_evals, 0),
+          benchmarkEvals,
+          trustedBenchmarkEvals,
+          trustedBenchmarkModels,
+          provisionalBenchmarkModels,
+          legacyBenchmarkModels,
           leaderboard,
         }
       }), true;
     } catch (e) {
       return jsonResponse(res, {
-        data: { providers: 0, totalEvals: 0, shadowEvals: 0, benchmarkEvals: 0, leaderboard: [] },
+        data: {
+          providers: 0,
+          modelGroups: 0,
+          totalEvals: 0,
+          shadowEvals: 0,
+          benchmarkEvals: 0,
+          trustedBenchmarkEvals: 0,
+          trustedBenchmarkModels: 0,
+          provisionalBenchmarkModels: 0,
+          legacyBenchmarkModels: 0,
+          leaderboard: [],
+        },
         error: e.message
       }), true;
     }
@@ -3399,6 +3507,7 @@ function handleWalleApi(req, res, url) {
   if (p === '/api/wall-e/eval/benchmarks' && m === 'GET') {
     try {
       const { listBenchmarkSuites, loadBenchmarkSuite } = require('./eval/benchmarks');
+      const { listAdapterSuites } = require('./eval/eval-orchestrator');
       const suites = [];
       const errors = [];
       for (const name of listBenchmarkSuites()) {
@@ -3415,6 +3524,7 @@ function handleWalleApi(req, res, url) {
           errors.push({ suite: name, error: e.message });
         }
       }
+      suites.push(...listAdapterSuites());
       return jsonResponse(res, errors.length ? { data: suites, errors } : { data: suites }), true;
     } catch (e) {
       return jsonResponse(res, { data: [], error: e.message }), true;
@@ -3426,6 +3536,30 @@ function handleWalleApi(req, res, url) {
     readBody(req).then(async body => {
       try {
         const data = typeof body === 'string' ? JSON.parse(body) : body;
+        const { isAdapterSuite, EvalOrchestrator } = require('./eval/eval-orchestrator');
+        if (isAdapterSuite(data.suite)) {
+          const { getAvailableProviders } = require('./eval/head-to-head');
+          const models = Array.isArray(data.models) && data.models.length
+            ? data.models
+            : Array.isArray(data.providers) && data.providers.length
+              ? data.providers.map(p => p.model).filter(Boolean)
+              : getAvailableProviders(brain).map(p => p.model);
+          const { runAgentLoop } = require('./coding-orchestrator');
+          const orchestrator = new EvalOrchestrator({
+            brain,
+            timeoutMs: data.timeoutMs || 600000,
+            concurrency: data.concurrency || 1,
+            budgetDollars: data.budgetDollars || 10,
+          });
+          const result = await orchestrator.run({
+            suite: data.suite,
+            models,
+            runAgentLoop,
+            maxTasks: data.maxTasks,
+            afterDate: data.afterDate,
+          });
+          return jsonResponse(res, { data: result });
+        }
         const { runBenchmark } = require('./eval/benchmarks');
         const result = await runBenchmark(brain, {
           suite: data.suite,
@@ -4179,6 +4313,38 @@ function handleWalleApi(req, res, url) {
     return true;
   }
+  // ── Coding Permission Requests ──
+  // GET /api/wall-e/permissions?session_id=... — list pending approvals
+  if (p === '/api/wall-e/permissions' && m === 'GET') {
+    try {
+      return jsonResponse(res, {
+        data: _permissionRegistry.list({ sessionId: params.get('session_id') || '' }),
+      }), true;
+    } catch (e) {
+      return jsonResponse(res, { error: e.message }, 500), true;
+    }
+  }
+  // POST /api/wall-e/permissions/:id/reply — reply once/always/reject
+  const permissionReplyMatch = p.match(/^\/api\/wall-e\/permissions\/([^/]+)\/reply$/);
+  if (permissionReplyMatch && m === 'POST') {
+    readBody(req).then(body => {
+      const reply = body.reply || body.decision;
+      if (!['once', 'always', 'reject'].includes(reply)) {
+        return jsonResponse(res, { error: 'reply must be once, always, or reject' }, 400);
+      }
+      const ok = _permissionRegistry.reply({
+        requestId: decodeURIComponent(permissionReplyMatch[1]),
+        reply,
+        message: body.message || '',
+      });
+      if (!ok) return jsonResponse(res, { error: 'Permission request not found' }, 404);
+      jsonResponse(res, { ok: true });
+    }).catch(e => jsonResponse(res, { error: e.message }, 500));
+    return true;
+  }
   const listeningHandled = handleListeningApi(req, res, url, { brain, ensureBrainInit });
   if (listeningHandled) return true;
@@ -4210,4 +4376,5 @@ module.exports = {
   // Test helpers
   _setReadDb,
   _setBrain,
+  _permissionRegistry,
 };