npm - vellum - Versions diffs - 0.2.0 → 0.2.2 - Mend

vellum 0.2.0 → 0.2.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (361) hide show

package/README.md +15 -2
package/bun.lock +5 -2
package/package.json +4 -2
package/scripts/capture-x-graphql.ts +562 -0
package/scripts/ipc/check-swift-decoder-drift.ts +2 -1
package/scripts/test.sh +5 -0
package/src/__tests__/__snapshots__/ipc-snapshot.test.ts.snap +161 -34
package/src/__tests__/account-registry.test.ts +2 -1
package/src/__tests__/agent-heartbeat-service.test.ts +250 -0
package/src/__tests__/app-bundler.test.ts +12 -33
package/src/__tests__/asset-materialize-tool.test.ts +16 -15
package/src/__tests__/asset-search-tool.test.ts +23 -22
package/src/__tests__/attachments-store.test.ts +56 -127
package/src/__tests__/browser-skill-baseline-tool-payload.test.ts +5 -4
package/src/__tests__/browser-skill-endstate.test.ts +5 -8
package/src/__tests__/call-bridge.test.ts +385 -0
package/src/__tests__/call-constants.test.ts +40 -0
package/src/__tests__/call-orchestrator.test.ts +454 -0
package/src/__tests__/call-recovery.test.ts +518 -0
package/src/__tests__/call-routes-http.test.ts +459 -0
package/src/__tests__/call-state-machine.test.ts +143 -0
package/src/__tests__/call-state.test.ts +133 -0
package/src/__tests__/call-store.test.ts +691 -0
package/src/__tests__/cli-discover.test.ts +1 -1
package/src/__tests__/commit-message-enrichment-service.test.ts +550 -0
package/src/__tests__/compaction.benchmark.test.ts +176 -0
package/src/__tests__/computer-use-tools.test.ts +250 -0
package/src/__tests__/config-schema.test.ts +348 -3
package/src/__tests__/conflict-store.test.ts +2 -1
package/src/__tests__/contacts-tools.test.ts +331 -0
package/src/__tests__/conversation-store.test.ts +30 -32
package/src/__tests__/credential-security-invariants.test.ts +4 -0
package/src/__tests__/date-context.test.ts +373 -0
package/src/__tests__/db-schedule-syntax-migration.test.ts +129 -0
package/src/__tests__/doordash-session.test.ts +9 -0
package/src/__tests__/fixtures/media-reuse-fixtures.ts +3 -3
package/src/__tests__/followup-tools.test.ts +303 -0
package/src/__tests__/handlers-twitter-config.test.ts +718 -0
package/src/__tests__/intent-routing.test.ts +64 -57
package/src/__tests__/ipc-roundtrip.benchmark.test.ts +237 -0
package/src/__tests__/ipc-snapshot.test.ts +96 -28
package/src/__tests__/llm-usage-store.test.ts +3 -8
package/src/__tests__/media-generate-image.test.ts +1 -1
package/src/__tests__/media-reuse-story.e2e.test.ts +7 -7
package/src/__tests__/memory-retrieval.benchmark.test.ts +430 -0
package/src/__tests__/parallel-tool.benchmark.test.ts +294 -0
package/src/__tests__/playbook-tools.test.ts +342 -0
package/src/__tests__/profile-compiler.test.ts +2 -1
package/src/__tests__/provider-streaming.benchmark.test.ts +773 -0
package/src/__tests__/recurrence-engine-rruleset.test.ts +78 -0
package/src/__tests__/recurrence-engine.test.ts +69 -0
package/src/__tests__/recurrence-types.test.ts +71 -0
package/src/__tests__/registry.test.ts +17 -10
package/src/__tests__/relay-server.test.ts +633 -0
package/src/__tests__/reminder-store.test.ts +6 -3
package/src/__tests__/reminder.test.ts +43 -77
package/src/__tests__/run-orchestrator-assistant-events.test.ts +222 -0
package/src/__tests__/run-orchestrator.test.ts +7 -7
package/src/__tests__/runtime-attachment-metadata.test.ts +19 -20
package/src/__tests__/runtime-runs-http.test.ts +5 -23
package/src/__tests__/runtime-runs.test.ts +11 -11
package/src/__tests__/schedule-store.test.ts +482 -0
package/src/__tests__/schedule-tools.test.ts +700 -0
package/src/__tests__/scheduler-recurrence.test.ts +329 -0
package/src/__tests__/server-history-render.test.ts +14 -13
package/src/__tests__/session-error.test.ts +28 -0
package/src/__tests__/session-init.benchmark.test.ts +462 -0
package/src/__tests__/session-queue.test.ts +89 -16
package/src/__tests__/session-runtime-assembly.test.ts +161 -0
package/src/__tests__/session-surfaces-task-progress.test.ts +104 -0
package/src/__tests__/signup-e2e.test.ts +2 -1
package/src/__tests__/skill-projection.benchmark.test.ts +328 -0
package/src/__tests__/skill-script-runner.test.ts +159 -0
package/src/__tests__/speaker-identification.test.ts +52 -0
package/src/__tests__/subagent-manager-notify.test.ts +42 -10
package/src/__tests__/subagent-tools.test.ts +141 -41
package/src/__tests__/task-compiler.test.ts +2 -1
package/src/__tests__/task-runner.test.ts +2 -1
package/src/__tests__/task-scheduler.test.ts +2 -1
package/src/__tests__/task-tools.test.ts +49 -56
package/src/__tests__/tool-audit-listener.test.ts +1 -0
package/src/__tests__/tool-domain-event-publisher.test.ts +2 -0
package/src/__tests__/tool-execution-pipeline.benchmark.test.ts +500 -0
package/src/__tests__/tool-executor.test.ts +13 -17
package/src/__tests__/turn-commit.test.ts +273 -2
package/src/__tests__/twilio-provider.test.ts +143 -0
package/src/__tests__/twilio-routes.test.ts +789 -0
package/src/__tests__/twitter-auth-handler.test.ts +581 -0
package/src/__tests__/view-image-tool.test.ts +217 -0
package/src/__tests__/workspace-git-service.test.ts +403 -0
package/src/__tests__/workspace-heartbeat-service.test.ts +141 -2
package/src/agent-heartbeat/agent-heartbeat-service.ts +155 -0
package/src/bundler/app-bundler.ts +35 -14
package/src/calls/call-bridge.ts +95 -0
package/src/calls/call-constants.ts +48 -0
package/src/calls/call-domain.ts +276 -0
package/src/calls/call-orchestrator.ts +390 -0
package/src/calls/call-recovery.ts +207 -0
package/src/calls/call-state-machine.ts +68 -0
package/src/calls/call-state.ts +64 -0
package/src/calls/call-store.ts +416 -0
package/src/calls/relay-server.ts +335 -0
package/src/calls/speaker-identification.ts +213 -0
package/src/calls/twilio-config.ts +34 -0
package/src/calls/twilio-provider.ts +173 -0
package/src/calls/twilio-routes.ts +250 -0
package/src/calls/types.ts +37 -0
package/src/calls/voice-provider.ts +14 -0
package/src/cli/config-commands.ts +334 -0
package/src/cli/core-commands.ts +776 -0
package/src/cli/doordash.ts +256 -25
package/src/cli/ipc-client.ts +82 -0
package/src/cli/map.ts +246 -0
package/src/cli/twitter.ts +575 -0
package/src/cli.ts +7 -5
package/src/commands/__tests__/cc-command-registry.test.ts +319 -0
package/src/commands/cc-command-registry.ts +209 -0
package/src/config/bundled-skills/contacts/SKILL.md +39 -0
package/src/config/bundled-skills/contacts/TOOLS.json +122 -0
package/src/config/bundled-skills/contacts/tools/contact-merge.ts +9 -0
package/src/config/bundled-skills/contacts/tools/contact-search.ts +9 -0
package/src/config/bundled-skills/contacts/tools/contact-upsert.ts +9 -0
package/src/config/bundled-skills/document/SKILL.md +18 -0
package/src/config/bundled-skills/document/TOOLS.json +53 -0
package/src/config/bundled-skills/document/tools/document-create.ts +9 -0
package/src/config/bundled-skills/document/tools/document-update.ts +9 -0
package/src/config/bundled-skills/doordash/SKILL.md +163 -0
package/src/config/bundled-skills/followups/SKILL.md +32 -0
package/src/config/bundled-skills/followups/TOOLS.json +100 -0
package/src/config/bundled-skills/followups/tools/followup-create.ts +9 -0
package/src/config/bundled-skills/followups/tools/followup-list.ts +9 -0
package/src/config/bundled-skills/followups/tools/followup-resolve.ts +9 -0
package/src/config/bundled-skills/image-studio/TOOLS.json +2 -2
package/src/config/bundled-skills/image-studio/tools/media-generate-image.ts +2 -24
package/src/config/bundled-skills/messaging/tools/messaging-analyze-style.ts +2 -1
package/src/config/bundled-skills/playbooks/SKILL.md +31 -0
package/src/config/bundled-skills/playbooks/TOOLS.json +126 -0
package/src/config/bundled-skills/playbooks/tools/playbook-create.ts +9 -0
package/src/config/bundled-skills/playbooks/tools/playbook-delete.ts +9 -0
package/src/config/bundled-skills/playbooks/tools/playbook-list.ts +9 -0
package/src/config/bundled-skills/playbooks/tools/playbook-update.ts +9 -0
package/src/config/bundled-skills/reminder/SKILL.md +20 -0
package/src/config/bundled-skills/reminder/TOOLS.json +67 -0
package/src/config/bundled-skills/reminder/tools/reminder-cancel.ts +9 -0
package/src/config/bundled-skills/reminder/tools/reminder-create.ts +9 -0
package/src/config/bundled-skills/reminder/tools/reminder-list.ts +9 -0
package/src/config/bundled-skills/schedule/SKILL.md +74 -0
package/src/config/bundled-skills/schedule/TOOLS.json +135 -0
package/src/config/bundled-skills/schedule/tools/schedule-create.ts +9 -0
package/src/config/bundled-skills/schedule/tools/schedule-delete.ts +9 -0
package/src/config/bundled-skills/schedule/tools/schedule-list.ts +9 -0
package/src/config/bundled-skills/schedule/tools/schedule-update.ts +9 -0
package/src/config/bundled-skills/subagent/SKILL.md +25 -0
package/src/config/bundled-skills/subagent/TOOLS.json +107 -0
package/src/config/bundled-skills/subagent/tools/subagent-abort.ts +9 -0
package/src/config/bundled-skills/subagent/tools/subagent-message.ts +9 -0
package/src/config/bundled-skills/subagent/tools/subagent-read.ts +9 -0
package/src/config/bundled-skills/subagent/tools/subagent-spawn.ts +9 -0
package/src/config/bundled-skills/subagent/tools/subagent-status.ts +9 -0
package/src/config/bundled-skills/tasks/SKILL.md +28 -0
package/src/config/bundled-skills/tasks/TOOLS.json +256 -0
package/src/config/bundled-skills/tasks/tools/task-delete.ts +9 -0
package/src/config/bundled-skills/tasks/tools/task-list-add.ts +9 -0
package/src/config/bundled-skills/tasks/tools/task-list-remove.ts +9 -0
package/src/config/bundled-skills/tasks/tools/task-list-show.ts +9 -0
package/src/config/bundled-skills/tasks/tools/task-list-update.ts +9 -0
package/src/config/bundled-skills/tasks/tools/task-list.ts +9 -0
package/src/config/bundled-skills/tasks/tools/task-run.ts +9 -0
package/src/config/bundled-skills/tasks/tools/task-save.ts +9 -0
package/src/config/bundled-skills/twitter/SKILL.md +134 -0
package/src/config/bundled-skills/watcher/SKILL.md +27 -0
package/src/config/bundled-skills/watcher/TOOLS.json +147 -0
package/src/config/bundled-skills/watcher/tools/watcher-create.ts +9 -0
package/src/config/bundled-skills/watcher/tools/watcher-delete.ts +9 -0
package/src/config/bundled-skills/watcher/tools/watcher-digest.ts +9 -0
package/src/config/bundled-skills/watcher/tools/watcher-list.ts +9 -0
package/src/config/bundled-skills/watcher/tools/watcher-update.ts +9 -0
package/src/config/defaults.ts +44 -0
package/src/config/loader.ts +4 -1
package/src/config/schema.ts +218 -1
package/src/config/system-prompt.ts +100 -6
package/src/config/templates/IDENTITY.md +7 -0
package/src/config/types.ts +5 -0
package/src/contacts/contact-store.ts +4 -4
package/src/daemon/assistant-attachments.ts +10 -0
package/src/daemon/classifier.ts +3 -1
package/src/daemon/computer-use-session.ts +3 -1
package/src/daemon/date-context.ts +136 -0
package/src/daemon/handlers/apps.ts +16 -1
package/src/daemon/handlers/browser.ts +54 -0
package/src/daemon/handlers/computer-use.ts +7 -1
package/src/daemon/handlers/config.ts +192 -4
package/src/daemon/handlers/diagnostics.ts +5 -1
package/src/daemon/handlers/documents.ts +18 -29
package/src/daemon/handlers/home-base.ts +5 -1
package/src/daemon/handlers/index.ts +40 -271
package/src/daemon/handlers/misc.ts +9 -1
package/src/daemon/handlers/publish.ts +6 -1
package/src/daemon/handlers/sessions.ts +65 -12
package/src/daemon/handlers/shared.ts +36 -1
package/src/daemon/handlers/signing.ts +37 -0
package/src/daemon/handlers/skills.ts +20 -6
package/src/daemon/handlers/subagents.ts +8 -3
package/src/daemon/handlers/twitter-auth.ts +169 -0
package/src/daemon/handlers/work-items.ts +495 -39
package/src/daemon/ipc-contract-inventory.json +40 -4
package/src/daemon/ipc-contract.ts +185 -37
package/src/daemon/ipc-protocol.ts +7 -2
package/src/daemon/lifecycle.ts +48 -5
package/src/daemon/main.ts +10 -4
package/src/daemon/ride-shotgun-handler.ts +74 -10
package/src/daemon/server.ts +144 -29
package/src/daemon/session-agent-loop.ts +887 -0
package/src/daemon/session-attachments.ts +28 -5
package/src/daemon/session-error.ts +24 -3
package/src/daemon/session-lifecycle.ts +147 -0
package/src/daemon/session-media-retry.ts +147 -0
package/src/daemon/session-messaging.ts +145 -0
package/src/daemon/session-notifiers.ts +164 -0
package/src/daemon/session-process.ts +2 -2
package/src/daemon/session-queue-manager.ts +1 -0
package/src/daemon/session-runtime-assembly.ts +52 -0
package/src/daemon/session-skill-tools.ts +124 -5
package/src/daemon/session-slash.ts +3 -0
package/src/daemon/session-surfaces.ts +77 -2
package/src/daemon/session-tool-setup.ts +222 -2
package/src/daemon/session-usage.ts +0 -2
package/src/daemon/session.ts +114 -1365
package/src/daemon/video-thumbnail.ts +60 -0
package/src/doordash/client.ts +121 -27
package/src/doordash/queries.ts +1 -2
package/src/export/formatter.ts +3 -1
package/src/followups/followup-store.ts +4 -2
package/src/followups/types.ts +6 -0
package/src/hooks/templates.ts +1 -1
package/src/index.ts +32 -1151
package/src/media/gemini-image-service.ts +1 -1
package/src/memory/attachments-store.ts +28 -83
package/src/memory/channel-delivery-store.ts +7 -21
package/src/memory/clarification-resolver.ts +6 -5
package/src/memory/contradiction-checker.ts +3 -2
package/src/memory/conversation-key-store.ts +10 -29
package/src/memory/conversation-store.ts +2 -1
package/src/memory/db.ts +362 -2
package/src/memory/entity-extractor.ts +6 -3
package/src/memory/items-extractor.ts +5 -4
package/src/memory/jobs-store.ts +3 -2
package/src/memory/llm-usage-store.ts +1 -2
package/src/memory/runs-store.ts +1 -2
package/src/memory/schema.ts +65 -2
package/src/messaging/style-analyzer.ts +3 -2
package/src/messaging/thread-summarizer.ts +8 -12
package/src/messaging/triage-engine.ts +4 -2
package/src/providers/openrouter/client.ts +20 -0
package/src/providers/registry.ts +8 -0
package/src/runtime/http-server.ts +277 -25
package/src/runtime/http-types.ts +0 -2
package/src/runtime/routes/attachment-routes.ts +5 -6
package/src/runtime/routes/call-routes.ts +140 -0
package/src/runtime/routes/channel-routes.ts +12 -19
package/src/runtime/routes/conversation-routes.ts +5 -9
package/src/runtime/routes/run-routes.ts +4 -8
package/src/runtime/run-orchestrator.ts +39 -6
package/src/schedule/recurrence-engine.ts +138 -0
package/src/schedule/recurrence-types.ts +67 -0
package/src/schedule/schedule-store.ts +102 -57
package/src/schedule/scheduler.ts +9 -6
package/src/security/oauth2.ts +29 -4
package/src/security/secret-allowlist.ts +46 -0
package/src/skills/clawhub.ts +1 -1
package/src/subagent/manager.ts +40 -8
package/src/swarm/backend-claude-code.ts +64 -9
package/src/swarm/worker-prompts.ts +2 -1
package/src/tasks/SPEC.md +34 -28
package/src/tasks/ephemeral-permissions.ts +16 -7
package/src/tasks/task-compiler.ts +5 -4
package/src/tasks/task-runner.ts +10 -5
package/src/tasks/task-scheduler.ts +1 -1
package/src/tasks/tool-sanitizer.ts +36 -0
package/src/tools/assets/search.ts +4 -4
package/src/tools/browser/api-map.ts +220 -0
package/src/tools/browser/auto-navigate.ts +270 -0
package/src/tools/browser/browser-execution.ts +2 -1
package/src/tools/browser/browser-manager.ts +2 -2
package/src/tools/browser/network-recorder.ts +5 -4
package/src/tools/browser/x-auto-navigate.ts +207 -0
package/src/tools/calls/call-end.ts +67 -0
package/src/tools/calls/call-start.ts +73 -0
package/src/tools/calls/call-status.ts +81 -0
package/src/tools/claude-code/claude-code.ts +77 -11
package/src/tools/contacts/contact-merge.ts +46 -78
package/src/tools/contacts/contact-search.ts +35 -79
package/src/tools/contacts/contact-upsert.ts +35 -108
package/src/tools/credentials/vault.ts +21 -5
package/src/tools/document/document-tool.ts +71 -144
package/src/tools/executor.ts +129 -10
package/src/tools/followups/followup_create.ts +46 -88
package/src/tools/followups/followup_list.ts +34 -74
package/src/tools/followups/followup_resolve.ts +31 -66
package/src/tools/host-terminal/cli-discover.ts +2 -1
package/src/tools/host-terminal/host-shell.ts +10 -0
package/src/tools/memory/handlers.ts +5 -4
package/src/tools/network/__tests__/web-search.test.ts +427 -0
package/src/tools/network/script-proxy/__tests__/logging.test.ts +248 -0
package/src/tools/network/script-proxy/__tests__/policy.test.ts +234 -0
package/src/tools/network/script-proxy/__tests__/router.test.ts +76 -0
package/src/tools/network/web-fetch.ts +18 -6
package/src/tools/playbooks/index.ts +4 -5
package/src/tools/playbooks/playbook-create.ts +3 -47
package/src/tools/playbooks/playbook-delete.ts +1 -25
package/src/tools/playbooks/playbook-list.ts +1 -28
package/src/tools/playbooks/playbook-update.ts +3 -51
package/src/tools/registry.ts +2 -4
package/src/tools/reminder/reminder.ts +5 -78
package/src/tools/schedule/create.ts +69 -74
package/src/tools/schedule/delete.ts +21 -47
package/src/tools/schedule/list.ts +55 -74
package/src/tools/schedule/update.ts +77 -84
package/src/tools/subagent/abort.ts +29 -58
package/src/tools/subagent/message.ts +30 -63
package/src/tools/subagent/read.ts +53 -84
package/src/tools/subagent/spawn.ts +43 -82
package/src/tools/subagent/status.ts +42 -71
package/src/tools/swarm/delegate.ts +2 -1
package/src/tools/tasks/index.ts +8 -6
package/src/tools/tasks/task-delete.ts +69 -56
package/src/tools/tasks/task-list.ts +31 -52
package/src/tools/tasks/task-run.ts +74 -102
package/src/tools/tasks/task-save.ts +33 -65
package/src/tools/tasks/work-item-enqueue.ts +192 -134
package/src/tools/tasks/work-item-list.ts +33 -78
package/src/tools/tasks/work-item-remove.ts +60 -0
package/src/tools/tasks/work-item-update.ts +114 -0
package/src/tools/terminal/backends/native.ts +3 -1
package/src/tools/tool-manifest.ts +20 -74
package/src/tools/types.ts +6 -0
package/src/tools/ui-surface/definitions.ts +6 -1
package/src/tools/watch/screen-watch.ts +3 -1
package/src/tools/watcher/create.ts +52 -98
package/src/tools/watcher/delete.ts +20 -46
package/src/tools/watcher/digest.ts +36 -70
package/src/tools/watcher/list.ts +49 -79
package/src/tools/watcher/update.ts +45 -91
package/src/twitter/client.ts +690 -0
package/src/twitter/session.ts +91 -0
package/src/usage/types.ts +0 -1
package/src/util/truncate.ts +6 -0
package/src/watcher/providers/slack.ts +2 -1
package/src/watcher/watcher-store.ts +3 -2
package/src/work-items/work-item-store.ts +236 -2
package/src/workspace/commit-message-enrichment-service.ts +284 -0
package/src/workspace/commit-message-provider.ts +95 -0
package/src/workspace/git-service.ts +272 -52
package/src/workspace/heartbeat-service.ts +70 -13
package/src/workspace/provider-commit-message-generator.ts +242 -0
package/src/workspace/turn-commit.ts +100 -51
package/src/tools/contacts/index.ts +0 -4
package/src/tools/document/index.ts +0 -5
package/src/tools/followups/index.ts +0 -3
package/src/tools/subagent/index.ts +0 -5
/package/src/__tests__/{memory-context-benchmark.test.ts → memory-context-benchmark.benchmark.test.ts} +0 -0

package/src/daemon/handlers/work-items.ts CHANGED Viewed

@@ -2,21 +2,30 @@ import * as net from 'node:net';
 import type {
   WorkItemsListRequest,
   WorkItemGetRequest,
-  WorkItemCreateRequest,
   WorkItemUpdateRequest,
   WorkItemCompleteRequest,
+  WorkItemDeleteRequest,
   WorkItemRunTaskRequest,
+  WorkItemOutputRequest,
+  WorkItemPreflightRequest,
+  WorkItemApprovePermissionsRequest,
+  WorkItemCancelRequest,
 } from '../ipc-protocol.js';
-import { log, type HandlerContext } from './shared.js';
+import { log, defineHandlers, type HandlerContext } from './shared.js';
+import { getSubagentManager } from '../../subagent/index.js';
 import {
-  createWorkItem,
+  deleteWorkItem,
   getWorkItem,
   listWorkItems,
   updateWorkItem,
   type WorkItemStatus,
 } from '../../work-items/work-item-store.js';
-import { getTask } from '../../tasks/task-store.js';
+import { getTask, getTaskRun } from '../../tasks/task-store.js';
 import { runTask } from '../../tasks/task-runner.js';
+import { getMessages } from '../../memory/conversation-store.js';
+import { classifyRisk, check } from '../../permissions/checker.js';
+import { truncate } from '../../util/truncate.js';
+import { sanitizeToolList, getRegisteredToolNames, getToolDescription } from '../../tasks/tool-sanitizer.js';
 export function handleWorkItemsList(
   msg: WorkItemsListRequest,
@@ -36,34 +45,20 @@ export function handleWorkItemGet(
   ctx.send(socket, { type: 'work_item_get_response', item });
 }
-export function handleWorkItemCreate(
-  msg: WorkItemCreateRequest,
-  socket: net.Socket,
-  ctx: HandlerContext,
-): void {
-  const task = getTask(msg.taskId);
-  if (!task) {
-    ctx.send(socket, { type: 'error', message: `Task not found: ${msg.taskId}` });
-    return;
-  }
-  const item = createWorkItem({
-    taskId: msg.taskId,
-    title: msg.title ?? task.title,
-    notes: msg.notes,
-    priorityTier: msg.priorityTier,
-    sortIndex: msg.sortIndex,
-  });
-  ctx.send(socket, { type: 'work_item_create_response', item });
-  // Notify all connected clients so open Task Queue views refresh immediately
-  broadcastWorkItemStatus(ctx, item.id);
-}
 export function handleWorkItemUpdate(
   msg: WorkItemUpdateRequest,
   socket: net.Socket,
   ctx: HandlerContext,
 ): void {
+  // Don't allow overwriting a cancelled status (e.g. from a late chat-completion observer)
+  if (msg.status !== undefined) {
+    const existing = getWorkItem(msg.id);
+    if (existing?.status === 'cancelled' && msg.status !== 'cancelled') {
+      ctx.send(socket, { type: 'work_item_update_response', item: existing });
+      return;
+    }
+  }
   const updates: Record<string, unknown> = {};
   if (msg.title !== undefined) updates.title = msg.title;
   if (msg.notes !== undefined) updates.notes = msg.notes;
@@ -78,6 +73,7 @@ export function handleWorkItemUpdate(
   // (e.g. priority/sort changes made by one client are reflected everywhere)
   if (item) {
     broadcastWorkItemStatus(ctx, item.id);
+    ctx.broadcast({ type: 'tasks_changed' });
   }
 }
@@ -86,6 +82,18 @@ export function handleWorkItemComplete(
   socket: net.Socket,
   ctx: HandlerContext,
 ): void {
+  // Only allow completion from the 'awaiting_review' state — this ensures
+  // items go through the full run lifecycle before being marked done.
+  const existing = getWorkItem(msg.id);
+  if (!existing) {
+    ctx.send(socket, { type: 'error', message: `Work item not found: ${msg.id}` });
+    return;
+  }
+  if (existing.status !== 'awaiting_review') {
+    ctx.send(socket, { type: 'error', message: `Cannot complete work item: status is '${existing.status}', expected 'awaiting_review'` });
+    return;
+  }
   const item = updateWorkItem(msg.id, { status: 'done' }) ?? null;
   ctx.send(socket, { type: 'work_item_update_response', item });
   if (item) {
@@ -102,9 +110,25 @@ export function handleWorkItemComplete(
         updatedAt: item.updatedAt,
       },
     });
+    ctx.broadcast({ type: 'tasks_changed' });
   }
 }
+export function handleWorkItemDelete(
+  msg: WorkItemDeleteRequest,
+  socket: net.Socket,
+  ctx: HandlerContext,
+): void {
+  const existing = getWorkItem(msg.id);
+  if (!existing) {
+    ctx.send(socket, { type: 'work_item_delete_response', id: msg.id, success: false });
+    return;
+  }
+  deleteWorkItem(msg.id);
+  ctx.send(socket, { type: 'work_item_delete_response', id: msg.id, success: true });
+  ctx.broadcast({ type: 'tasks_changed' });
+}
 function broadcastWorkItemStatus(ctx: HandlerContext, id: string): void {
   const item = getWorkItem(id);
   if (item) {
@@ -124,6 +148,212 @@ function broadcastWorkItemStatus(ctx: HandlerContext, id: string): void {
   }
 }
+/** Extract plain text from a message content string (handles JSON content block arrays). */
+function extractTextFromContent(content: string): string {
+  try {
+    const parsed = JSON.parse(content);
+    if (Array.isArray(parsed)) {
+      return parsed
+        .filter((b: { type: string }) => b.type === 'text')
+        .map((b: { text: string }) => b.text)
+        .join('\n');
+    }
+  } catch {
+    // Plain text content — use as-is
+  }
+  return content;
+}
+/** Extract tool_result blocks from a user message's content. */
+function extractToolResults(content: string): Array<{ tool_use_id: string; content: string; is_error?: boolean }> {
+  try {
+    const parsed = JSON.parse(content);
+    if (Array.isArray(parsed)) {
+      return parsed
+        .filter((b: { type: string }) => b.type === 'tool_result')
+        .map((b: { tool_use_id: string; content?: string | Array<{ type: string; text?: string }>; is_error?: boolean }) => {
+          let text = '';
+          if (typeof b.content === 'string') {
+            text = b.content;
+          } else if (Array.isArray(b.content)) {
+            text = b.content
+              .filter((c) => c.type === 'text' && c.text)
+              .map((c) => c.text!)
+              .join('\n');
+          }
+          return { tool_use_id: b.tool_use_id, content: text, is_error: b.is_error };
+        });
+    }
+  } catch {
+    // Not JSON — no tool_result blocks
+  }
+  return [];
+}
+/**
+ * Build highlights from tool outcomes in the conversation. Scans for
+ * tool_use (assistant) and tool_result (user) pairs, extracting concrete
+ * outcomes like errors, file paths, and URLs.
+ */
+function extractToolHighlights(
+  msgs: Array<{ role: string; content: string }>,
+  maxHighlights: number,
+): string[] {
+  const highlights: string[] = [];
+  // Build a map of tool_use_id -> tool name from assistant messages
+  const toolNameById = new Map<string, string>();
+  for (const m of msgs) {
+    if (m.role !== 'assistant') continue;
+    try {
+      const parsed = JSON.parse(m.content);
+      if (Array.isArray(parsed)) {
+        for (const block of parsed) {
+          if (block.type === 'tool_use' && block.id && block.name) {
+            toolNameById.set(block.id, block.name);
+          }
+        }
+      }
+    } catch { /* skip */ }
+  }
+  // Scan tool_result messages in reverse order (most recent first)
+  for (let i = msgs.length - 1; i >= 0 && highlights.length < maxHighlights; i--) {
+    const m = msgs[i];
+    if (m.role !== 'user') continue;
+    const results = extractToolResults(m.content);
+    for (const result of results) {
+      if (highlights.length >= maxHighlights) break;
+      const toolName = toolNameById.get(result.tool_use_id) ?? 'tool';
+      const resultText = result.content.trim();
+      if (result.is_error) {
+        // Always surface errors
+        const errorSnippet = truncate(resultText, 200, '...');
+        highlights.push(`- ${toolName}: Error — ${errorSnippet}`);
+      } else if (resultText) {
+        // Extract notable signal from successful results: file paths, URLs, or
+        // a short summary of what happened
+        const firstLine = resultText.split('\n')[0].trim();
+        if (firstLine.length > 0 && firstLine.length <= 200) {
+          highlights.push(`- ${toolName}: ${firstLine}`);
+        } else if (firstLine.length > 200) {
+          highlights.push(`- ${toolName}: ${truncate(firstLine, 200, '...')}`);
+        }
+      }
+    }
+  }
+  return highlights;
+}
+export function handleWorkItemOutput(
+  msg: WorkItemOutputRequest,
+  socket: net.Socket,
+  ctx: HandlerContext,
+): void {
+  try {
+    const workItem = getWorkItem(msg.id);
+    if (!workItem) {
+      ctx.send(socket, { type: 'work_item_output_response', id: msg.id, success: false, error: 'Work item not found' });
+      return;
+    }
+    // Use the task run's conversationId as the authoritative source. This
+    // ensures we read from the actual run's conversation, not stale references
+    // on the work item.
+    let conversationId: string | null = null;
+    let completedAt: number | null = null;
+    if (workItem.lastRunId) {
+      const run = getTaskRun(workItem.lastRunId);
+      if (run) {
+        conversationId = run.conversationId;
+        completedAt = run.finishedAt != null ? Math.floor(run.finishedAt / 1000) : null;
+      }
+    }
+    // Fall back to the work item's stored conversationId if the run lookup
+    // didn't yield one (e.g. run record was deleted but work item still has
+    // the reference).
+    if (!conversationId) {
+      conversationId = workItem.lastRunConversationId;
+    }
+    if (!conversationId) {
+      ctx.send(socket, { type: 'work_item_output_response', id: msg.id, success: false, error: 'This task has not been run yet. No output is available.' });
+      return;
+    }
+    let summary = '';
+    let highlights: string[] = [];
+    const msgs = getMessages(conversationId);
+    // Find the last assistant message with text content (not tool calls).
+    // Skip messages that are purely about task management rather than
+    // reporting what the run actually did.
+    for (let i = msgs.length - 1; i >= 0; i--) {
+      const m = msgs[i];
+      if (m.role !== 'assistant') continue;
+      const text = extractTextFromContent(m.content);
+      if (!text.trim()) continue;
+      summary = truncate(text, 2000, '');
+      // Extract bullet points from the assistant's prose
+      const lines = text.split('\n');
+      for (const line of lines) {
+        const trimmed = line.trim();
+        if ((trimmed.startsWith('-') || trimmed.startsWith('*')) && trimmed.length > 2) {
+          highlights.push(trimmed);
+          if (highlights.length >= 5) break;
+        }
+      }
+      break;
+    }
+    // If we didn't get enough highlights from the assistant prose, supplement
+    // with concrete tool outcomes from the conversation.
+    if (highlights.length < 5) {
+      const toolHighlights = extractToolHighlights(msgs, 5 - highlights.length);
+      highlights = [...highlights, ...toolHighlights];
+    }
+    // If there's no assistant summary at all, synthesize one from tool results
+    // so the user still sees what happened.
+    if (!summary && msgs.length > 0) {
+      const toolHighlights = extractToolHighlights(msgs, 10);
+      if (toolHighlights.length > 0) {
+        summary = 'Task completed. Tool outcomes:\n' + toolHighlights.join('\n');
+        // Use the tool highlights as the main highlights too
+        highlights = toolHighlights.slice(0, 5);
+      }
+    }
+    ctx.send(socket, {
+      type: 'work_item_output_response',
+      id: msg.id,
+      success: true,
+      output: {
+        title: workItem.title,
+        status: workItem.lastRunStatus ?? workItem.status,
+        runId: workItem.lastRunId,
+        conversationId,
+        completedAt,
+        summary,
+        highlights,
+      },
+    });
+  } catch (err) {
+    log.error({ err, workItemId: msg.id }, 'handleWorkItemOutput failed');
+    ctx.send(socket, { type: 'work_item_output_response', id: msg.id, success: false, error: 'Failed to load task output' });
+  }
+}
 export async function handleWorkItemRunTask(
   msg: WorkItemRunTaskRequest,
   socket: net.Socket,
@@ -131,10 +361,58 @@ export async function handleWorkItemRunTask(
 ): Promise<void> {
   const workItem = getWorkItem(msg.id);
   if (!workItem) {
-    ctx.send(socket, { type: 'work_item_run_task_response', id: msg.id, lastRunId: '', success: false, error: 'Work item not found' });
+    ctx.send(socket, { type: 'work_item_run_task_response', id: msg.id, lastRunId: '', success: false, error: 'Work item not found', errorCode: 'not_found' });
+    return;
+  }
+  if (workItem.status === 'running') {
+    ctx.send(socket, { type: 'work_item_run_task_response', id: msg.id, lastRunId: workItem.lastRunId ?? '', success: false, error: 'Work item is already running', errorCode: 'already_running' });
     return;
   }
+  const NON_RUNNABLE_STATUSES: readonly string[] = ['archived'];
+  if (NON_RUNNABLE_STATUSES.includes(workItem.status)) {
+    ctx.send(socket, { type: 'work_item_run_task_response', id: msg.id, lastRunId: workItem.lastRunId ?? '', success: false, error: `Work item has status '${workItem.status}' and cannot be run`, errorCode: 'invalid_status' });
+    return;
+  }
+  const task = getTask(workItem.taskId);
+  if (!task) {
+    ctx.send(socket, { type: 'work_item_run_task_response', id: msg.id, lastRunId: '', success: false, error: `Associated task not found: ${workItem.taskId}`, errorCode: 'no_task' });
+    return;
+  }
+  // Compute required tools using the same resolution logic as preflight:
+  // work-item snapshot first, then task template, then all registered tools.
+  let requiredTools: string[];
+  if (workItem.requiredTools !== null && workItem.requiredTools !== undefined) {
+    requiredTools = sanitizeToolList(JSON.parse(workItem.requiredTools));
+  } else {
+    requiredTools = task.requiredTools
+      ? sanitizeToolList(JSON.parse(task.requiredTools))
+      : getRegisteredToolNames();
+  }
+  // Permission checkpoint: if the task requires tools, verify all have been approved.
+  // Empty required tools means no approvals needed.
+  let approvedTools: string[] | undefined;
+  if (requiredTools.length > 0) {
+    approvedTools = workItem.approvedTools ? JSON.parse(workItem.approvedTools) : undefined;
+    const approvedSet = new Set<string>(approvedTools ?? []);
+    const missingApprovals = requiredTools.filter((t) => !approvedSet.has(t));
+    if (missingApprovals.length > 0) {
+      ctx.send(socket, {
+        type: 'work_item_run_task_response',
+        id: msg.id,
+        lastRunId: '',
+        success: false,
+        error: 'Required tool permissions have not been approved. Run preflight first.',
+        errorCode: 'permission_required',
+      });
+      return;
+    }
+  }
   // Set status to running
   updateWorkItem(msg.id, { status: 'running' });
@@ -143,34 +421,212 @@ export async function handleWorkItemRunTask(
   // Broadcast the running state
   broadcastWorkItemStatus(ctx, msg.id);
+  ctx.broadcast({ type: 'tasks_changed' });
-  // Execute task asynchronously — create a session and wire processMessage
+  // Execute task asynchronously — lazily create a session inside the callback
+  // using the conversationId provided by runTask, so the session references
+  // the conversation that was actually inserted into the database.
   try {
-    const session = await ctx.getOrCreateSession(crypto.randomUUID());
+    let session: Awaited<ReturnType<typeof ctx.getOrCreateSession>> | null = null;
     const result = await runTask(
-      { taskId: workItem.taskId, workingDir: process.cwd() },
-      async (_conversationId, message) => {
+      { taskId: workItem.taskId, workingDir: process.cwd(), approvedTools },
+      async (conversationId, message, taskRunId) => {
+        if (!session) {
+          // Store conversationId on the work item immediately so the cancel
+          // handler can locate the session while the task is still running.
+          updateWorkItem(msg.id, { lastRunConversationId: conversationId });
+          session = await ctx.getOrCreateSession(conversationId);
+          // Notify clients so they can create a visible chat thread for this task run
+          ctx.broadcast({
+            type: 'task_run_thread_created',
+            conversationId,
+            workItemId: msg.id,
+            title: workItem.title,
+          });
+          // Wire the taskRunId so the executor can retrieve ephemeral permission rules
+          (session as unknown as { taskRunId?: string }).taskRunId = taskRunId;
+          // Prevent interactive clients from rebinding to this session mid-run
+          (session as unknown as { headlessLock: boolean }).headlessLock = true;
+        }
         await session.processMessage(message, [], (event) => {
           ctx.broadcast(event);
         });
       },
     );
-    const finalStatus: WorkItemStatus = result.status === 'completed' ? 'awaiting_review' : 'failed';
-    updateWorkItem(msg.id, {
-      status: finalStatus,
-      lastRunId: result.taskRunId,
-      lastRunConversationId: result.conversationId,
-      lastRunStatus: result.status,
-    });
+    // Release the headless lock now that the task run is done
+    if (session) {
+      (session as unknown as { headlessLock: boolean }).headlessLock = false;
+    }
+    // Don't overwrite cancelled status — the cancel handler already set it
+    const current = getWorkItem(msg.id);
+    if (current?.status !== 'cancelled') {
+      const finalStatus: WorkItemStatus = result.status === 'completed' ? 'awaiting_review' : 'failed';
+      updateWorkItem(msg.id, {
+        status: finalStatus,
+        lastRunId: result.taskRunId,
+        lastRunConversationId: result.conversationId,
+        lastRunStatus: result.status,
+      });
+    }
     broadcastWorkItemStatus(ctx, msg.id);
+    ctx.broadcast({ type: 'tasks_changed' });
   } catch (err) {
+    // Release the headless lock on failure
+    if (session) {
+      (session as unknown as { headlessLock: boolean }).headlessLock = false;
+    }
     log.error({ err, workItemId: msg.id }, 'work_item_run_task failed');
     updateWorkItem(msg.id, {
       status: 'failed',
       lastRunStatus: 'failed',
     });
     broadcastWorkItemStatus(ctx, msg.id);
+    ctx.broadcast({ type: 'tasks_changed' });
+  }
+}
+export async function handleWorkItemPreflight(
+  msg: WorkItemPreflightRequest,
+  socket: net.Socket,
+  ctx: HandlerContext,
+): Promise<void> {
+  const workItem = getWorkItem(msg.id);
+  if (!workItem) {
+    ctx.send(socket, { type: 'work_item_preflight_response', id: msg.id, success: false, error: 'Work item not found' });
+    return;
+  }
+  // Compute required tools from the work-item snapshot first; only fall
+  // back to the task template (or all registered tools) when the
+  // snapshot is null.
+  let requiredTools: string[];
+  if (workItem.requiredTools !== null && workItem.requiredTools !== undefined) {
+    requiredTools = sanitizeToolList(JSON.parse(workItem.requiredTools));
+  } else {
+    const task = getTask(workItem.taskId);
+    if (!task) {
+      ctx.send(socket, { type: 'work_item_preflight_response', id: msg.id, success: false, error: `Associated task not found: ${workItem.taskId}` });
+      return;
+    }
+    requiredTools = task.requiredTools
+      ? sanitizeToolList(JSON.parse(task.requiredTools))
+      : getRegisteredToolNames();
+  }
+  // If the work item explicitly requires no tools, skip the dialog.
+  if (requiredTools.length === 0) {
+    ctx.send(socket, { type: 'work_item_preflight_response', id: msg.id, success: true, permissions: [] });
+    return;
+  }
+  // If some tools are already approved, only prompt for the missing ones.
+  // When all required tools are covered, skip the dialog entirely.
+  if (workItem.approvedTools) {
+    const approvedSet = new Set<string>(JSON.parse(workItem.approvedTools));
+    requiredTools = requiredTools.filter((t) => !approvedSet.has(t));
+    if (requiredTools.length === 0) {
+      ctx.send(socket, { type: 'work_item_preflight_response', id: msg.id, success: true, permissions: [] });
+      return;
+    }
+  }
+  const workingDir = process.cwd();
+  const permissions = await Promise.all(
+    requiredTools.map(async (tool) => {
+      const risk = await classifyRisk(tool, {}, workingDir);
+      const result = await check(tool, {}, workingDir);
+      return {
+        tool,
+        description: getToolDescription(tool),
+        riskLevel: risk.toLowerCase() as 'low' | 'medium' | 'high',
+        currentDecision: result.decision as 'allow' | 'deny' | 'prompt',
+      };
+    }),
+  );
+  ctx.send(socket, { type: 'work_item_preflight_response', id: msg.id, success: true, permissions });
+}
+export function handleWorkItemApprovePermissions(
+  msg: WorkItemApprovePermissionsRequest,
+  socket: net.Socket,
+  ctx: HandlerContext,
+): void {
+  const workItem = getWorkItem(msg.id);
+  if (!workItem) {
+    ctx.send(socket, { type: 'work_item_approve_permissions_response', id: msg.id, success: false, error: 'Work item not found' });
+    return;
+  }
+  // Merge newly approved tools with any previously approved ones so reruns
+  // that only need a subset of previously-approved tools don't require
+  // re-approval.
+  const existingApproved: string[] = workItem.approvedTools
+    ? JSON.parse(workItem.approvedTools)
+    : [];
+  const newApproved = sanitizeToolList(msg.approvedTools);
+  const merged = [...new Set([...existingApproved, ...newApproved])];
+  updateWorkItem(msg.id, {
+    approvedTools: JSON.stringify(sanitizeToolList(merged)),
+    approvalStatus: 'approved',
+  });
+  ctx.send(socket, { type: 'work_item_approve_permissions_response', id: msg.id, success: true });
+}
+export function handleWorkItemCancel(
+  msg: WorkItemCancelRequest,
+  socket: net.Socket,
+  ctx: HandlerContext,
+): void {
+  const workItem = getWorkItem(msg.id);
+  if (!workItem) {
+    ctx.send(socket, { type: 'work_item_cancel_response', id: msg.id, success: false, error: 'Work item not found' });
+    return;
+  }
+  if (workItem.status !== 'running') {
+    ctx.send(socket, { type: 'work_item_cancel_response', id: msg.id, success: false, error: `Work item is not running (status: ${workItem.status})` });
+    return;
   }
+  // Abort the session associated with this work item's current run
+  const conversationId = workItem.lastRunConversationId;
+  if (conversationId) {
+    const session = ctx.sessions.get(conversationId);
+    if (session) {
+      (session as unknown as { headlessLock: boolean }).headlessLock = false;
+      session.abort();
+      getSubagentManager().abortAllForParent(conversationId);
+    }
+  }
+  updateWorkItem(msg.id, {
+    status: 'cancelled',
+    lastRunStatus: 'cancelled',
+  });
+  ctx.send(socket, { type: 'work_item_cancel_response', id: msg.id, success: true });
+  broadcastWorkItemStatus(ctx, msg.id);
+  ctx.broadcast({ type: 'tasks_changed' });
 }
+export const workItemHandlers = defineHandlers({
+  work_items_list: handleWorkItemsList,
+  work_item_get: handleWorkItemGet,
+  work_item_update: handleWorkItemUpdate,
+  work_item_complete: handleWorkItemComplete,
+  work_item_delete: handleWorkItemDelete,
+  work_item_run_task: handleWorkItemRunTask,
+  work_item_output: handleWorkItemOutput,
+  work_item_preflight: handleWorkItemPreflight,
+  work_item_approve_permissions: handleWorkItemApprovePermissions,
+  work_item_cancel: handleWorkItemCancel,
+});