npm - @vellumai/assistant - Versions diffs - 0.4.49 → 0.4.51 - Mend

@vellumai/assistant 0.4.49 → 0.4.51

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (353) hide show

package/ARCHITECTURE.md +24 -33
package/README.md +3 -3
package/docs/architecture/integrations.md +2 -2
package/docs/architecture/keychain-broker.md +6 -6
package/docs/architecture/memory.md +180 -119
package/knip.json +32 -0
package/package.json +3 -2
package/src/__tests__/agent-loop.test.ts +3 -1
package/src/__tests__/anthropic-provider.test.ts +114 -23
package/src/__tests__/approval-cascade.test.ts +1 -15
package/src/__tests__/approval-routes-http.test.ts +2 -0
package/src/__tests__/assistant-feature-flag-guard.test.ts +0 -23
package/src/__tests__/btw-routes.test.ts +61 -5
package/src/__tests__/canonical-guardian-store.test.ts +95 -0
package/src/__tests__/checker.test.ts +13 -0
package/src/__tests__/config-schema.test.ts +1 -68
package/src/__tests__/config-watcher.test.ts +8 -0
package/src/__tests__/context-memory-e2e.test.ts +11 -100
package/src/__tests__/conversation-routes-guardian-reply.test.ts +8 -0
package/src/__tests__/conversation-routes-slash-commands.test.ts +1 -0
package/src/__tests__/credential-security-e2e.test.ts +1 -0
package/src/__tests__/credential-security-invariants.test.ts +8 -7
package/src/__tests__/credential-vault-unit.test.ts +23 -18
package/src/__tests__/credential-vault.test.ts +30 -18
package/src/__tests__/credentials-cli.test.ts +257 -82
package/src/__tests__/cu-unified-flow.test.ts +532 -0
package/src/__tests__/date-context.test.ts +93 -77
package/src/__tests__/deterministic-verification-control-plane.test.ts +64 -0
package/src/__tests__/guardian-routing-invariants.test.ts +93 -0
package/src/__tests__/history-repair.test.ts +245 -0
package/src/__tests__/host-cu-proxy.test.ts +165 -3
package/src/__tests__/http-user-message-parity.test.ts +1 -0
package/src/__tests__/inbound-invite-redemption.test.ts +36 -7
package/src/__tests__/integration-status.test.ts +31 -30
package/src/__tests__/invite-redemption-service.test.ts +166 -13
package/src/__tests__/invite-routes-http.test.ts +166 -5
package/src/__tests__/keychain-broker-client.test.ts +4 -4
package/src/__tests__/list-messages-attachments.test.ts +193 -0
package/src/__tests__/memory-context-benchmark.benchmark.test.ts +56 -18
package/src/__tests__/memory-lifecycle-e2e.test.ts +244 -387
package/src/__tests__/memory-recall-quality.test.ts +244 -407
package/src/__tests__/memory-regressions.experimental.test.ts +126 -101
package/src/__tests__/memory-regressions.test.ts +477 -2841
package/src/__tests__/memory-retrieval.benchmark.test.ts +33 -150
package/src/__tests__/memory-upsert-concurrency.test.ts +5 -244
package/src/__tests__/mime-builder.test.ts +28 -0
package/src/__tests__/native-web-search.test.ts +1 -0
package/src/__tests__/oauth-cli.test.ts +824 -31
package/src/__tests__/oauth-provider-profiles.test.ts +1 -1
package/src/__tests__/oauth-store.test.ts +363 -17
package/src/__tests__/qdrant-collection-migration.test.ts +53 -8
package/src/__tests__/registry.test.ts +0 -1
package/src/__tests__/relay-server.test.ts +55 -1
package/src/__tests__/schedule-tools.test.ts +32 -0
package/src/__tests__/script-proxy-certs.test.ts +1 -1
package/src/__tests__/secret-onetime-send.test.ts +1 -0
package/src/__tests__/secret-routes-managed-proxy.test.ts +183 -0
package/src/__tests__/secure-keys.test.ts +78 -18
package/src/__tests__/send-endpoint-busy.test.ts +3 -0
package/src/__tests__/server-history-render.test.ts +2 -2
package/src/__tests__/session-abort-tool-results.test.ts +1 -14
package/src/__tests__/session-agent-loop-overflow.test.ts +1583 -0
package/src/__tests__/session-agent-loop.test.ts +19 -15
package/src/__tests__/session-confirmation-signals.test.ts +1 -15
package/src/__tests__/session-error.test.ts +124 -2
package/src/__tests__/session-history-web-search.test.ts +918 -0
package/src/__tests__/session-pre-run-repair.test.ts +1 -14
package/src/__tests__/session-provider-retry-repair.test.ts +25 -28
package/src/__tests__/session-queue.test.ts +37 -27
package/src/__tests__/session-runtime-assembly.test.ts +54 -0
package/src/__tests__/session-slash-known.test.ts +1 -15
package/src/__tests__/session-slash-queue.test.ts +1 -15
package/src/__tests__/session-slash-unknown.test.ts +1 -15
package/src/__tests__/session-workspace-cache-state.test.ts +3 -33
package/src/__tests__/session-workspace-injection.test.ts +3 -37
package/src/__tests__/session-workspace-tool-tracking.test.ts +3 -37
package/src/__tests__/skills-install-extract.test.ts +93 -0
package/src/__tests__/skills.test.ts +2 -2
package/src/__tests__/skillssh-registry.test.ts +451 -0
package/src/__tests__/slack-channel-config.test.ts +10 -8
package/src/__tests__/trust-store.test.ts +15 -0
package/src/__tests__/twilio-config.test.ts +11 -10
package/src/__tests__/twilio-provider.test.ts +9 -4
package/src/__tests__/voice-invite-redemption.test.ts +85 -5
package/src/agent/ax-tree-compaction.test.ts +51 -0
package/src/agent/loop.ts +39 -12
package/src/approvals/AGENTS.md +1 -1
package/src/approvals/guardian-request-resolvers.ts +14 -2
package/src/bundler/compiler-tools.ts +66 -2
package/src/calls/call-domain.ts +134 -3
package/src/calls/call-store.ts +6 -0
package/src/calls/relay-server.ts +44 -6
package/src/calls/relay-setup-router.ts +17 -1
package/src/calls/twilio-config.ts +5 -4
package/src/calls/twilio-provider.ts +14 -9
package/src/calls/twilio-rest.ts +10 -7
package/src/calls/types.ts +3 -1
package/src/cli/commands/config.ts +14 -9
package/src/cli/commands/contacts.ts +3 -0
package/src/cli/commands/credentials.ts +170 -174
package/src/cli/commands/doctor.ts +11 -8
package/src/cli/commands/keys.ts +9 -9
package/src/cli/commands/mcp.ts +46 -59
package/src/cli/commands/memory.ts +16 -165
package/src/cli/commands/oauth/apps.ts +68 -10
package/src/cli/commands/oauth/connections.ts +475 -105
package/src/cli/commands/oauth/index.ts +3 -3
package/src/cli/commands/oauth/providers.ts +18 -4
package/src/cli/commands/sessions.ts +5 -2
package/src/cli/commands/skills.ts +173 -1
package/src/cli/http-client.ts +0 -20
package/src/cli/main-screen.tsx +2 -2
package/src/cli/program.ts +5 -6
package/src/cli.ts +20 -22
package/src/config/__tests__/feature-flag-registry-bundled.test.ts +39 -0
package/src/config/bundled-skills/computer-use/TOOLS.json +1 -1
package/src/config/bundled-skills/computer-use/tools/computer-use-observe.ts +12 -0
package/src/config/bundled-skills/contacts/SKILL.md +35 -11
package/src/config/bundled-skills/contacts/tools/google-contacts.ts +1 -1
package/src/config/bundled-skills/gmail/SKILL.md +1 -1
package/src/config/bundled-skills/gmail/TOOLS.json +52 -0
package/src/config/bundled-skills/gmail/tools/gmail-archive.ts +13 -3
package/src/config/bundled-skills/gmail/tools/gmail-attachments.ts +9 -2
package/src/config/bundled-skills/gmail/tools/gmail-draft.ts +5 -1
package/src/config/bundled-skills/gmail/tools/gmail-filters.ts +5 -1
package/src/config/bundled-skills/gmail/tools/gmail-follow-up.ts +5 -1
package/src/config/bundled-skills/gmail/tools/gmail-forward.ts +5 -1
package/src/config/bundled-skills/gmail/tools/gmail-label.ts +9 -2
package/src/config/bundled-skills/gmail/tools/gmail-outreach-scan.ts +5 -1
package/src/config/bundled-skills/gmail/tools/gmail-send-draft.ts +5 -1
package/src/config/bundled-skills/gmail/tools/gmail-sender-digest.ts +5 -1
package/src/config/bundled-skills/gmail/tools/gmail-trash.ts +5 -1
package/src/config/bundled-skills/gmail/tools/gmail-unsubscribe.ts +5 -1
package/src/config/bundled-skills/gmail/tools/gmail-vacation.ts +5 -1
package/src/config/bundled-skills/google-calendar/TOOLS.json +20 -0
package/src/config/bundled-skills/google-calendar/tools/calendar-check-availability.ts +2 -1
package/src/config/bundled-skills/google-calendar/tools/calendar-create-event.ts +2 -1
package/src/config/bundled-skills/google-calendar/tools/calendar-get-event.ts +2 -1
package/src/config/bundled-skills/google-calendar/tools/calendar-list-events.ts +2 -1
package/src/config/bundled-skills/google-calendar/tools/calendar-rsvp.ts +2 -1
package/src/config/bundled-skills/google-calendar/tools/shared.ts +8 -2
package/src/config/bundled-skills/messaging/SKILL.md +1 -1
package/src/config/bundled-skills/messaging/tools/messaging-analyze-style.ts +2 -2
package/src/config/bundled-skills/messaging/tools/messaging-archive-by-sender.ts +2 -2
package/src/config/bundled-skills/messaging/tools/messaging-auth-test.ts +2 -2
package/src/config/bundled-skills/messaging/tools/messaging-list-conversations.ts +2 -2
package/src/config/bundled-skills/messaging/tools/messaging-mark-read.ts +2 -2
package/src/config/bundled-skills/messaging/tools/messaging-read.ts +2 -2
package/src/config/bundled-skills/messaging/tools/messaging-search.ts +2 -2
package/src/config/bundled-skills/messaging/tools/messaging-send.ts +2 -2
package/src/config/bundled-skills/messaging/tools/messaging-sender-digest.ts +2 -2
package/src/config/bundled-skills/messaging/tools/shared.ts +7 -5
package/src/config/bundled-skills/slack/tools/shared.ts +1 -1
package/src/config/bundled-skills/slack/tools/slack-add-reaction.ts +1 -1
package/src/config/bundled-skills/slack/tools/slack-channel-details.ts +1 -1
package/src/config/bundled-skills/slack/tools/slack-delete-message.ts +1 -1
package/src/config/bundled-skills/slack/tools/slack-edit-message.ts +1 -1
package/src/config/bundled-skills/slack/tools/slack-leave-channel.ts +1 -1
package/src/config/bundled-skills/slack/tools/slack-scan-digest.ts +1 -1
package/src/config/bundled-tool-registry.ts +2 -5
package/src/config/loader.ts +6 -42
package/src/config/schema.ts +1 -12
package/src/config/schemas/memory-lifecycle.ts +0 -9
package/src/config/schemas/memory-processing.ts +0 -180
package/src/config/schemas/memory-retrieval.ts +32 -104
package/src/config/schemas/memory.ts +0 -10
package/src/config/types.ts +0 -4
package/src/contacts/contact-store.ts +39 -2
package/src/contacts/contacts-write.ts +9 -0
package/src/context/window-manager.ts +4 -1
package/src/daemon/config-watcher.ts +55 -2
package/src/daemon/daemon-control.ts +1 -1
package/src/daemon/date-context.ts +114 -31
package/src/daemon/handlers/config-ingress.ts +2 -2
package/src/daemon/handlers/config-slack-channel.ts +59 -39
package/src/daemon/handlers/config-telegram.ts +23 -14
package/src/daemon/handlers/session-history.ts +1 -358
package/src/daemon/handlers/sessions.ts +18 -13
package/src/daemon/handlers/shared.ts +3 -17
package/src/daemon/handlers/skills.ts +20 -1
package/src/daemon/history-repair.ts +72 -8
package/src/daemon/host-cu-proxy.ts +55 -26
package/src/daemon/lifecycle.ts +39 -4
package/src/daemon/mcp-reload-service.ts +2 -2
package/src/daemon/message-types/computer-use.ts +1 -12
package/src/daemon/message-types/memory.ts +4 -16
package/src/daemon/message-types/messages.ts +1 -0
package/src/daemon/message-types/sessions.ts +4 -42
package/src/daemon/server.ts +6 -1
package/src/daemon/session-agent-loop-handlers.ts +38 -0
package/src/daemon/session-agent-loop.ts +334 -48
package/src/daemon/session-error.ts +89 -6
package/src/daemon/session-history.ts +17 -7
package/src/daemon/session-media-retry.ts +6 -2
package/src/daemon/session-memory.ts +69 -149
package/src/daemon/session-process.ts +10 -1
package/src/daemon/session-runtime-assembly.ts +49 -19
package/src/daemon/session-slash.ts +3 -5
package/src/daemon/session-surfaces.ts +4 -1
package/src/daemon/session-tool-setup.ts +7 -1
package/src/daemon/session.ts +12 -2
package/src/email/providers/index.ts +2 -2
package/src/instrument.ts +61 -1
package/src/media/avatar-router.ts +1 -1
package/src/memory/admin.ts +2 -191
package/src/memory/canonical-guardian-store.ts +38 -2
package/src/memory/conversation-crud.ts +0 -33
package/src/memory/conversation-queries.ts +25 -83
package/src/memory/db-init.ts +32 -0
package/src/memory/embedding-backend.ts +84 -8
package/src/memory/embedding-types.ts +9 -1
package/src/memory/indexer.ts +7 -46
package/src/memory/invite-store.ts +19 -0
package/src/memory/items-extractor.ts +274 -76
package/src/memory/job-handlers/backfill.ts +2 -127
package/src/memory/job-handlers/cleanup.ts +2 -16
package/src/memory/job-handlers/extraction.ts +2 -138
package/src/memory/job-handlers/index-maintenance.ts +1 -6
package/src/memory/job-handlers/summarization.ts +3 -148
package/src/memory/job-utils.ts +21 -59
package/src/memory/jobs-store.ts +1 -159
package/src/memory/jobs-worker.ts +9 -52
package/src/memory/migrations/104-core-indexes.ts +3 -3
package/src/memory/migrations/149-oauth-tables.ts +2 -0
package/src/memory/migrations/150-oauth-apps-client-secret-path.ts +98 -0
package/src/memory/migrations/151-oauth-providers-ping-url.ts +11 -0
package/src/memory/migrations/152-memory-item-supersession.ts +44 -0
package/src/memory/migrations/153-drop-entity-tables.ts +15 -0
package/src/memory/migrations/154-drop-fts.ts +20 -0
package/src/memory/migrations/155-drop-conflicts.ts +7 -0
package/src/memory/migrations/156-call-session-invite-metadata.ts +24 -0
package/src/memory/migrations/157-invite-contact-id.ts +104 -0
package/src/memory/migrations/index.ts +8 -0
package/src/memory/migrations/registry.ts +6 -0
package/src/memory/qdrant-client.ts +148 -51
package/src/memory/raw-query.ts +1 -1
package/src/memory/retriever.test.ts +294 -273
package/src/memory/retriever.ts +421 -645
package/src/memory/schema/calls.ts +2 -0
package/src/memory/schema/contacts.ts +1 -0
package/src/memory/schema/memory-core.ts +3 -48
package/src/memory/schema/oauth.ts +2 -0
package/src/memory/search/formatting.ts +263 -176
package/src/memory/search/lexical.ts +1 -254
package/src/memory/search/ranking.ts +0 -455
package/src/memory/search/semantic.ts +100 -14
package/src/memory/search/staleness.ts +47 -0
package/src/memory/search/tier-classifier.ts +21 -0
package/src/memory/search/types.ts +15 -77
package/src/memory/task-memory-cleanup.ts +4 -6
package/src/messaging/provider.ts +1 -1
package/src/messaging/providers/gmail/adapter.ts +1 -1
package/src/messaging/providers/gmail/mime-builder.ts +17 -7
package/src/messaging/providers/telegram-bot/adapter.ts +17 -8
package/src/messaging/providers/whatsapp/adapter.ts +13 -9
package/src/messaging/registry.ts +9 -5
package/src/oauth/byo-connection.test.ts +40 -25
package/src/oauth/connect-orchestrator.ts +4 -10
package/src/oauth/connection-resolver.ts +20 -6
package/src/oauth/manual-token-connection.ts +5 -5
package/src/oauth/oauth-store.ts +183 -31
package/src/oauth/platform-connection.test.ts +1 -1
package/src/oauth/provider-behaviors.ts +503 -4
package/src/oauth/seed-providers.ts +214 -8
package/src/oauth/token-persistence.ts +31 -16
package/src/permissions/defaults.ts +1 -0
package/src/permissions/trust-store.ts +23 -1
package/src/playbooks/playbook-compiler.ts +1 -1
package/src/prompts/system-prompt.ts +18 -2
package/src/providers/anthropic/client.ts +56 -126
package/src/providers/types.ts +7 -1
package/src/runtime/AGENTS.md +9 -0
package/src/runtime/auth/route-policy.ts +6 -3
package/src/runtime/channel-readiness-service.ts +48 -40
package/src/runtime/guardian-reply-router.ts +24 -22
package/src/runtime/http-server.ts +2 -2
package/src/runtime/http-types.ts +2 -0
package/src/runtime/invite-redemption-service.ts +72 -12
package/src/runtime/invite-service.ts +43 -0
package/src/runtime/middleware/twilio-validation.ts +1 -1
package/src/runtime/pending-interactions.ts +2 -2
package/src/runtime/routes/brain-graph-routes.ts +10 -90
package/src/runtime/routes/btw-routes.ts +10 -5
package/src/runtime/routes/conversation-routes.ts +56 -11
package/src/runtime/routes/inbound-stages/acl-enforcement.ts +21 -12
package/src/runtime/routes/integrations/slack/channel.ts +2 -2
package/src/runtime/routes/integrations/telegram.ts +2 -2
package/src/runtime/routes/integrations/twilio.ts +17 -17
package/src/runtime/routes/invite-routes.ts +29 -4
package/src/runtime/routes/memory-item-routes.test.ts +754 -0
package/src/runtime/routes/memory-item-routes.ts +503 -0
package/src/runtime/routes/secret-routes.ts +17 -0
package/src/runtime/routes/session-management-routes.ts +3 -3
package/src/runtime/routes/settings-routes.ts +3 -3
package/src/runtime/routes/trust-rules-routes.ts +14 -0
package/src/runtime/routes/workspace-routes.ts +9 -4
package/src/runtime/routes/workspace-utils.ts +8 -2
package/src/schedule/integration-status.ts +26 -19
package/src/security/keychain-broker-client.ts +17 -4
package/src/security/oauth2.ts +6 -7
package/src/security/secure-keys.ts +44 -19
package/src/security/token-manager.ts +46 -39
package/src/services/vercel-deploy.ts +0 -24
package/src/signals/confirm.ts +78 -0
package/src/signals/mcp-reload.ts +18 -0
package/src/skills/catalog-install.ts +74 -18
package/src/skills/skillssh-registry.ts +503 -0
package/src/tools/assets/search.ts +5 -1
package/src/tools/computer-use/definitions.ts +0 -10
package/src/tools/computer-use/registry.ts +1 -1
package/src/tools/credentials/vault.ts +22 -7
package/src/tools/memory/definitions.ts +4 -13
package/src/tools/memory/handlers.test.ts +83 -103
package/src/tools/memory/handlers.ts +50 -85
package/src/tools/network/script-proxy/session-manager.ts +8 -8
package/src/tools/schedule/create.ts +10 -3
package/src/tools/schedule/update.ts +8 -1
package/src/tools/skills/load.ts +25 -2
package/src/watcher/provider-types.ts +1 -1
package/src/watcher/providers/github.ts +1 -1
package/src/watcher/providers/gmail.ts +3 -3
package/src/watcher/providers/google-calendar.ts +3 -3
package/src/watcher/providers/linear.ts +1 -1
package/src/__tests__/clarification-resolver.test.ts +0 -193
package/src/__tests__/conflict-intent-tokenization.test.ts +0 -160
package/src/__tests__/conflict-policy.test.ts +0 -269
package/src/__tests__/conflict-store.test.ts +0 -372
package/src/__tests__/contradiction-checker.test.ts +0 -361
package/src/__tests__/entity-extractor.test.ts +0 -211
package/src/__tests__/entity-search.test.ts +0 -1117
package/src/__tests__/profile-compiler.test.ts +0 -392
package/src/__tests__/session-conflict-gate.test.ts +0 -1228
package/src/__tests__/session-profile-injection.test.ts +0 -557
package/src/config/bundled-skills/knowledge-graph/SKILL.md +0 -25
package/src/config/bundled-skills/knowledge-graph/TOOLS.json +0 -66
package/src/config/bundled-skills/knowledge-graph/tools/graph-query.ts +0 -211
package/src/daemon/session-conflict-gate.ts +0 -167
package/src/daemon/session-dynamic-profile.ts +0 -77
package/src/memory/clarification-resolver.ts +0 -417
package/src/memory/conflict-intent.ts +0 -205
package/src/memory/conflict-policy.ts +0 -127
package/src/memory/conflict-store.ts +0 -410
package/src/memory/contradiction-checker.ts +0 -508
package/src/memory/entity-extractor.ts +0 -535
package/src/memory/format-recall.ts +0 -47
package/src/memory/fts-reconciler.ts +0 -165
package/src/memory/job-handlers/conflict.ts +0 -200
package/src/memory/profile-compiler.ts +0 -195
package/src/memory/recall-cache.ts +0 -117
package/src/memory/search/entity.ts +0 -535
package/src/memory/search/query-expansion.test.ts +0 -70
package/src/memory/search/query-expansion.ts +0 -118
package/src/runtime/routes/mcp-routes.ts +0 -20

package/src/daemon/session-agent-loop.ts CHANGED Viewed

@@ -13,6 +13,7 @@ import type {
   AgentEvent,
   AgentLoop,
   CheckpointDecision,
+  CheckpointInfo,
 } from "../agent/loop.js";
 import { createAssistantMessage } from "../agent/message-types.js";
 import type {
@@ -26,6 +27,10 @@ import { estimatePromptTokens } from "../context/token-estimator.js";
 import type { ContextWindowManager } from "../context/window-manager.js";
 import type { ToolProfiler } from "../events/tool-profiling-listener.js";
 import { getHookManager } from "../hooks/manager.js";
+import {
+  clearSentrySessionContext,
+  setSentrySessionContext,
+} from "../instrument.js";
 import { commitAppTurnChanges } from "../memory/app-git-service.js";
 import { getApp, listAppFiles } from "../memory/app-store.js";
 import {
@@ -68,7 +73,7 @@ import {
 } from "./context-overflow-reducer.js";
 import {
   buildTemporalContext,
-  extractUserTimeZoneFromDynamicProfile,
+  extractUserTimeZoneFromRecall,
 } from "./date-context.js";
 import { deepRepairHistory, repairHistory } from "./history-repair.js";
 import type {
@@ -88,8 +93,6 @@ import {
   formatAttachmentWarnings,
   resolveAssistantAttachments,
 } from "./session-attachments.js";
-import type { ConflictGate } from "./session-conflict-gate.js";
-import { stripDynamicProfileMessages } from "./session-dynamic-profile.js";
 import {
   buildSessionErrorMessage,
   classifySessionError,
@@ -122,6 +125,40 @@ import type { TraceEmitter } from "./trace-emitter.js";
 const log = getLogger("session-agent-loop");
+/**
+ * Parse the actual token count reported by the provider in a context-too-large
+ * error message. Providers typically include the prompt size, e.g.:
+ *   "prompt is too long: 242201 tokens > 200000 maximum"
+ *   "too many input tokens: 242201 > 200000"
+ *
+ * Returns the actual token count or null if it cannot be parsed.
+ */
+function parseActualTokensFromError(
+  errorMessage: string | null,
+): number | null {
+  if (!errorMessage) return null;
+  // Match patterns like "242201 tokens > 200000" or "242201 > 200000 maximum"
+  const match = errorMessage.match(
+    /(\d[\d,]*)\s*tokens?\s*[>≥]|:\s*(\d[\d,]*)\s*[>≥]/i,
+  );
+  if (match) {
+    const raw = (match[1] || match[2]).replace(/,/g, "");
+    const parsed = parseInt(raw, 10);
+    if (!isNaN(parsed) && parsed > 0) return parsed;
+  }
+  // Fallback: match "too many input tokens: N > M"
+  const fallback = errorMessage.match(/(\d[\d,]*)\s*[>≥]\s*\d/);
+  if (fallback) {
+    const raw = fallback[1].replace(/,/g, "");
+    const parsed = parseInt(raw, 10);
+    if (!isNaN(parsed) && parsed > 0) return parsed;
+  }
+  return null;
+}
 /** Title-cased friendly labels for tool names, used in confirmation chips. */
 const TOOL_FRIENDLY_LABEL: Record<string, string> = {
   bash: "Run Command",
@@ -165,7 +202,6 @@ export interface AgentLoopSessionContext {
   contextCompactedMessageCount: number;
   contextCompactedAt: number | null;
-  readonly conflictGate: ConflictGate;
   readonly memoryPolicy: { scopeId: string; includeDefaultFallback: boolean };
   currentActiveSurfaceId?: string;
@@ -231,6 +267,7 @@ export interface AgentLoopSessionContext {
       | "tool_result_received"
       | "confirmation_requested"
       | "confirmation_resolved"
+      | "context_compacting"
       | "message_complete"
       | "generation_cancelled"
       | "error_terminal",
@@ -350,6 +387,18 @@ export async function runAgentLoopImpl(
   ctx.profiler.startRequest();
   let turnStarted = false;
+  // Populate Sentry scope with session-specific tags so any exception
+  // captured during this turn (e.g. inside agent/loop.ts) can be
+  // filtered by conversation, assistant, or user in the dashboard.
+  setSentrySessionContext({
+    assistantId: ctx.assistantId ?? DAEMON_INTERNAL_ASSISTANT_ID,
+    conversationId: ctx.conversationId,
+    messageCount: ctx.messages.length,
+    userIdentifier:
+      ctx.trustContext?.guardianPrincipalId ??
+      ctx.trustContext?.requesterExternalUserId,
+  });
   try {
     // Auto-complete stale interactive surfaces from previous turns.
     // Only dismiss when the user sends a new message (not a surface action
@@ -432,10 +481,9 @@ export async function runAgentLoopImpl(
     if (compactCheck.needed) {
       ctx.emitActivityState(
         "thinking",
-        "thinking_delta",
+        "context_compacting",
         "assistant_turn",
         reqId,
-        "Compacting context",
       );
     }
     const compacted = await ctx.contextWindowManager.maybeCompact(
@@ -528,12 +576,9 @@ export async function runAgentLoopImpl(
         messages: ctx.messages,
         systemPrompt: ctx.systemPrompt,
         provider: ctx.provider,
-        conflictGate: ctx.conflictGate,
         scopeId: ctx.memoryPolicy.scopeId,
         includeDefaultFallback: ctx.memoryPolicy.includeDefaultFallback,
         trustClass: resolveTrustClass(ctx.trustContext),
-        isInteractive:
-          options?.isInteractive ?? (!ctx.hasNoClient && !ctx.headlessLock),
       },
       content,
       userMessageId,
@@ -541,7 +586,7 @@ export async function runAgentLoopImpl(
       onEvent,
     );
-    const { recall, dynamicProfile, recallInjectionStrategy } = memoryResult;
+    const { recall } = memoryResult;
     runMessages = memoryResult.runMessages;
     // Build active surface context
@@ -574,16 +619,16 @@ export async function runAgentLoopImpl(
     // Compute fresh temporal context each turn for date grounding.
     // Absolute "now" is always anchored to assistant host clock, while local
-    // date semantics prefer configured user timezone, then profile memory.
+    // date semantics prefer configured user timezone, then recalled memory.
     const hostTimeZone = Intl.DateTimeFormat().resolvedOptions().timeZone;
-    const userTimeZone = extractUserTimeZoneFromDynamicProfile(
-      dynamicProfile.text,
-    );
     const configuredUserTimeZone = getConfig().ui.userTimezone ?? null;
+    const recalledUserTimeZone = extractUserTimeZoneFromRecall(
+      recall.injectedText,
+    );
     const temporalContext = buildTemporalContext({
       hostTimeZone,
       configuredUserTimeZone,
-      userTimeZone,
+      userTimeZone: recalledUserTimeZone,
     });
     // Use the channel/interface context captured at the top of this function
@@ -656,7 +701,12 @@ export async function runAgentLoopImpl(
     const config = getConfig();
     const overflowRecovery = config.contextWindow.overflowRecovery;
     const providerMaxTokens = config.contextWindow.maxInputTokens;
-    const safetyMargin = overflowRecovery.safetyMarginRatio;
+    // Widen safety margin for large conversations where estimation error
+    // compounds across many messages with tool results.
+    const baseSafetyMargin = overflowRecovery.safetyMarginRatio;
+    const messageCount = ctx.messages.length;
+    const safetyMargin =
+      messageCount > 50 ? Math.max(baseSafetyMargin, 0.15) : baseSafetyMargin;
     const preflightBudget = Math.floor(providerMaxTokens * (1 - safetyMargin));
     let reducerState: ReducerState | undefined;
@@ -686,10 +736,9 @@ export async function runAgentLoopImpl(
         preflightAttempts++;
         ctx.emitActivityState(
           "thinking",
-          "thinking_delta",
+          "context_compacting",
           "assistant_turn",
           reqId,
-          "Compacting context",
         );
         const step = await reduceContextOverflow(
           ctx.messages,
@@ -790,7 +839,9 @@ export async function runAgentLoopImpl(
     const eventHandler = (event: AgentEvent) =>
       dispatchAgentEvent(state, deps, event);
-    const onCheckpoint = (): CheckpointDecision => {
+    let yieldedForBudget = false;
+    const onCheckpoint = (checkpoint: CheckpointInfo): CheckpointDecision => {
       const turnTools = state.currentTurnToolNames;
       state.currentTurnToolNames = [];
@@ -803,6 +854,27 @@ export async function runAgentLoopImpl(
           return "yield";
         }
       }
+      // Mid-loop token budget check: estimate current context size and
+      // yield if we're approaching the preflight budget. This lets the
+      // session-agent-loop run compaction before the provider rejects.
+      if (overflowRecovery.enabled) {
+        const midLoopThreshold = preflightBudget * 0.85;
+        const estimated = estimatePromptTokens(
+          checkpoint.history,
+          ctx.systemPrompt,
+          { providerName: ctx.provider.name },
+        );
+        if (estimated > midLoopThreshold) {
+          rlog.warn(
+            { phase: "mid-loop", estimated, threshold: midLoopThreshold },
+            "Token estimate approaching budget — yielding for compaction",
+          );
+          yieldedForBudget = true;
+          return "yield";
+        }
+      }
       return "continue";
     };
@@ -818,6 +890,109 @@ export async function runAgentLoopImpl(
       onCheckpoint,
     );
+    // ── Proactive mid-loop compaction ───────────────────────────────
+    // When the agent loop yielded because the token budget check in
+    // onCheckpoint detected approaching limits, run compaction on the
+    // accumulated history and re-enter the agent loop. This is distinct
+    // from the reactive convergence loop below that fires after a
+    // provider rejection — here we compact *before* hitting the limit.
+    let midLoopCompactAttempts = 0;
+    while (
+      yieldedForBudget &&
+      midLoopCompactAttempts < overflowRecovery.maxAttempts &&
+      !state.contextTooLargeDetected &&
+      !abortController.signal.aborted
+    ) {
+      midLoopCompactAttempts++;
+      yieldedForBudget = false;
+      rlog.info(
+        { phase: "mid-loop-compact" },
+        "Running compaction after checkpoint yield",
+      );
+      // Strip injected context from updated history before compacting,
+      // so we compact the "raw" persistent messages.
+      const rawHistory = stripInjectedContext(updatedHistory, {
+        stripRecall: (msgs) =>
+          stripMemoryRecallMessages(
+            msgs,
+            recall.injectedText,
+            "separate_context_message",
+          ),
+      });
+      ctx.messages = rawHistory;
+      ctx.emitActivityState(
+        "thinking",
+        "context_compacting",
+        "assistant_turn",
+        reqId,
+        "Compacting context",
+      );
+      const midLoopCompact = await ctx.contextWindowManager.maybeCompact(
+        ctx.messages,
+        abortController.signal,
+        {
+          lastCompactedAt: ctx.contextCompactedAt ?? undefined,
+          force: true,
+          targetInputTokensOverride: preflightBudget,
+        },
+      );
+      if (midLoopCompact.compacted) {
+        ctx.messages = midLoopCompact.messages;
+        ctx.contextCompactedMessageCount +=
+          midLoopCompact.compactedPersistedMessages;
+        ctx.contextCompactedAt = Date.now();
+        updateConversationContextWindow(
+          ctx.conversationId,
+          midLoopCompact.summaryText,
+          ctx.contextCompactedMessageCount,
+        );
+        onEvent({
+          type: "context_compacted",
+          previousEstimatedInputTokens:
+            midLoopCompact.previousEstimatedInputTokens,
+          estimatedInputTokens: midLoopCompact.estimatedInputTokens,
+          maxInputTokens: midLoopCompact.maxInputTokens,
+          thresholdTokens: midLoopCompact.thresholdTokens,
+          compactedMessages: midLoopCompact.compactedMessages,
+          summaryCalls: midLoopCompact.summaryCalls,
+          summaryInputTokens: midLoopCompact.summaryInputTokens,
+          summaryOutputTokens: midLoopCompact.summaryOutputTokens,
+          summaryModel: midLoopCompact.summaryModel,
+        });
+        emitUsage(
+          ctx,
+          midLoopCompact.summaryInputTokens,
+          midLoopCompact.summaryOutputTokens,
+          midLoopCompact.summaryModel,
+          onEvent,
+          "context_compactor",
+          reqId,
+          midLoopCompact.summaryCacheCreationInputTokens ?? 0,
+          midLoopCompact.summaryCacheReadInputTokens ?? 0,
+          collapseRawResponses(midLoopCompact.summaryRawResponses),
+        );
+      }
+      // Re-inject runtime context and re-enter the agent loop
+      runMessages = applyRuntimeInjections(ctx.messages, {
+        ...injectionOpts,
+        mode: currentInjectionMode,
+      });
+      preRepairMessages = runMessages;
+      preRunHistoryLength = runMessages.length;
+      updatedHistory = await ctx.agentLoop.run(
+        runMessages,
+        eventHandler,
+        abortController.signal,
+        reqId,
+        onCheckpoint,
+      );
+    }
     // One-shot ordering error retry
     if (
       state.orderingErrorDetected &&
@@ -855,14 +1030,58 @@ export async function runAgentLoopImpl(
     // reducer tiers (forced compaction, tool-result truncation, media
     // stubbing, injection downgrade) with optional approval gating for
     // interactive latest-turn compression.
-    if (
-      state.contextTooLargeDetected &&
-      updatedHistory.length === preRunHistoryLength
-    ) {
+    //
+    // When progress was made (agent added messages before hitting the
+    // limit), incorporate those new messages into ctx.messages so the
+    // convergence loop operates on the full (larger) history.
+    if (state.contextTooLargeDetected) {
+      if (updatedHistory.length > preRunHistoryLength) {
+        ctx.messages = stripInjectedContext(updatedHistory, {
+          stripRecall: (msgs) =>
+            stripMemoryRecallMessages(
+              msgs,
+              recall.injectedText,
+              "separate_context_message",
+            ),
+        });
+        preRepairMessages = updatedHistory;
+      }
       if (!reducerState) {
         reducerState = createInitialReducerState();
       }
+      // When the provider reveals the actual token count in its error
+      // message (e.g. "242201 tokens > 200000"), use it to correct the
+      // compaction target. The estimator may significantly underestimate
+      // (e.g. estimated 185k but actual was 242k), so using the
+      // uncorrected preflightBudget would still be too high.
+      const actualTokens = parseActualTokensFromError(
+        state.contextTooLargeErrorMessage,
+      );
+      const estimatedTokensAtOverflow = estimatePromptTokens(
+        ctx.messages,
+        ctx.systemPrompt,
+        { providerName: ctx.provider.name },
+      );
+      let correctedTarget = preflightBudget;
+      if (actualTokens && estimatedTokensAtOverflow > 0) {
+        const estimationErrorRatio = actualTokens / estimatedTokensAtOverflow;
+        if (estimationErrorRatio > 1.0) {
+          correctedTarget = Math.floor(preflightBudget / estimationErrorRatio);
+          rlog.warn(
+            {
+              phase: "convergence",
+              actualTokens,
+              estimatedTokens: estimatedTokensAtOverflow,
+              estimationErrorRatio: estimationErrorRatio.toFixed(2),
+              preflightBudget,
+              correctedTarget,
+            },
+            "Adjusting compaction target based on observed estimation error",
+          );
+        }
+      }
       let convergenceAttempts = 0;
       const maxAttempts = overflowRecovery.maxAttempts;
@@ -883,10 +1102,9 @@ export async function runAgentLoopImpl(
         ctx.emitActivityState(
           "thinking",
-          "thinking_delta",
+          "context_compacting",
           "assistant_turn",
           reqId,
-          "Compacting context",
         );
         const step = await reduceContextOverflow(
           ctx.messages,
@@ -894,7 +1112,7 @@ export async function runAgentLoopImpl(
             providerName: ctx.provider.name,
             systemPrompt: ctx.systemPrompt,
             contextWindow: config.contextWindow,
-            targetTokens: preflightBudget,
+            targetTokens: correctedTarget,
           },
           reducerState,
           (msgs, signal, opts) =>
@@ -906,6 +1124,12 @@ export async function runAgentLoopImpl(
         ctx.messages = step.messages;
         currentInjectionMode = step.state.injectionMode;
+        // If the reducer is now exhausted without compacting, break out
+        // so the overflow policy path can attempt emergency compaction.
+        if (reducerState.exhausted && !step.compactionResult?.compacted) {
+          break;
+        }
         if (step.compactionResult?.compacted) {
           ctx.contextCompactedMessageCount +=
             step.compactionResult.compactedPersistedMessages;
@@ -959,6 +1183,75 @@ export async function runAgentLoopImpl(
         );
       }
+      // When all reducer tiers are exhausted but the context is still too
+      // large, attempt one last emergency compaction before consulting the
+      // overflow policy. This covers the case where progress was made
+      // (messages grew) and the normal tiers couldn't compact enough.
+      if (state.contextTooLargeDetected && reducerState.exhausted) {
+        const emergencyCompact = await ctx.contextWindowManager.maybeCompact(
+          ctx.messages,
+          abortController.signal,
+          {
+            lastCompactedAt: ctx.contextCompactedAt ?? undefined,
+            force: true,
+            minKeepRecentUserTurns: 0,
+            targetInputTokensOverride: correctedTarget,
+          },
+        );
+        if (emergencyCompact.compacted) {
+          ctx.messages = emergencyCompact.messages;
+          ctx.contextCompactedMessageCount +=
+            emergencyCompact.compactedPersistedMessages;
+          ctx.contextCompactedAt = Date.now();
+          updateConversationContextWindow(
+            ctx.conversationId,
+            emergencyCompact.summaryText,
+            ctx.contextCompactedMessageCount,
+          );
+          onEvent({
+            type: "context_compacted",
+            previousEstimatedInputTokens:
+              emergencyCompact.previousEstimatedInputTokens,
+            estimatedInputTokens: emergencyCompact.estimatedInputTokens,
+            maxInputTokens: emergencyCompact.maxInputTokens,
+            thresholdTokens: emergencyCompact.thresholdTokens,
+            compactedMessages: emergencyCompact.compactedMessages,
+            summaryCalls: emergencyCompact.summaryCalls,
+            summaryInputTokens: emergencyCompact.summaryInputTokens,
+            summaryOutputTokens: emergencyCompact.summaryOutputTokens,
+            summaryModel: emergencyCompact.summaryModel,
+          });
+          emitUsage(
+            ctx,
+            emergencyCompact.summaryInputTokens,
+            emergencyCompact.summaryOutputTokens,
+            emergencyCompact.summaryModel,
+            onEvent,
+            "context_compactor",
+            reqId,
+            emergencyCompact.summaryCacheCreationInputTokens ?? 0,
+            emergencyCompact.summaryCacheReadInputTokens ?? 0,
+            collapseRawResponses(emergencyCompact.summaryRawResponses),
+          );
+          runMessages = applyRuntimeInjections(ctx.messages, {
+            ...injectionOpts,
+            mode: currentInjectionMode,
+          });
+          preRepairMessages = runMessages;
+          preRunHistoryLength = runMessages.length;
+          state.contextTooLargeDetected = false;
+          updatedHistory = await ctx.agentLoop.run(
+            runMessages,
+            eventHandler,
+            abortController.signal,
+            reqId,
+            onCheckpoint,
+          );
+        }
+      }
       // All reducer tiers exhausted but provider still rejects —
       // consult the overflow policy for latest-turn compression.
       if (state.contextTooLargeDetected) {
@@ -982,7 +1275,7 @@ export async function runAgentLoopImpl(
                   lastCompactedAt: ctx.contextCompactedAt ?? undefined,
                   force: true,
                   minKeepRecentUserTurns: 0,
-                  targetInputTokensOverride: preflightBudget,
+                  targetInputTokensOverride: correctedTarget,
                 },
               );
             if (emergencyCompact.compacted) {
@@ -1075,10 +1368,9 @@ export async function runAgentLoopImpl(
           // Non-interactive — auto-compress without asking
           ctx.emitActivityState(
             "thinking",
-            "thinking_delta",
+            "context_compacting",
             "assistant_turn",
             reqId,
-            "Compacting context",
           );
           const emergencyCompact = await ctx.contextWindowManager.maybeCompact(
             ctx.messages,
@@ -1087,7 +1379,7 @@ export async function runAgentLoopImpl(
               lastCompactedAt: ctx.contextCompactedAt ?? undefined,
               force: true,
               minKeepRecentUserTurns: 0,
-              targetInputTokensOverride: preflightBudget,
+              targetInputTokensOverride: correctedTarget,
             },
           );
           if (emergencyCompact.compacted) {
@@ -1154,19 +1446,6 @@ export async function runAgentLoopImpl(
         );
         onEvent(buildSessionErrorMessage(ctx.conversationId, classified));
       }
-    } else if (state.contextTooLargeDetected) {
-      // Progress was made (updatedHistory grew), so the retry path above was
-      // skipped. Surface the error so clients are not left with a silent failure.
-      rlog.warn(
-        { phase: "post_run" },
-        "Context too large after progress — surfacing error without retry",
-      );
-      const classified = classifySessionError(
-        new Error("context_length_exceeded"),
-        { phase: "agent_loop" },
-      );
-      onEvent(buildSessionErrorMessage(ctx.conversationId, classified));
-      state.providerErrorUserMessage = classified.userMessage;
     }
     if (state.deferredOrderingError) {
@@ -1280,10 +1559,8 @@ export async function runAgentLoopImpl(
         stripMemoryRecallMessages(
           msgs,
           recall.injectedText,
-          recallInjectionStrategy,
+          "separate_context_message",
         ),
-      stripDynamicProfile: (msgs) =>
-        stripDynamicProfileMessages(msgs, dynamicProfile.text),
     });
     emitUsage(
@@ -1451,12 +1728,17 @@ export async function runAgentLoopImpl(
       const message = err instanceof Error ? err.message : String(err);
       const errorClass = err instanceof Error ? err.constructor.name : "Error";
       rlog.error({ err }, "Session processing error");
+      const classified = classifySessionError(err, errorCtx);
       ctx.traceEmitter.emit("request_error", truncate(message, 200, ""), {
         requestId: reqId,
         status: "error",
-        attributes: { errorClass, message: truncate(message, 500, "") },
+        attributes: {
+          errorClass,
+          message: truncate(message, 500, ""),
+          errorCategory: classified.errorCategory,
+          errorCode: classified.code,
+        },
       });
-      const classified = classifySessionError(err, errorCtx);
       onEvent({ type: "error", message: classified.userMessage });
       onEvent(buildSessionErrorMessage(ctx.conversationId, classified));
       void getHookManager().trigger("on-error", {
@@ -1515,6 +1797,10 @@ export async function runAgentLoopImpl(
     }
     ctx.drainQueue(yieldedForHandoff ? "checkpoint_handoff" : "loop_complete");
+    // Clear session tags so they don't leak into unrelated error captures
+    // (e.g. unhandledRejection from a different async chain).
+    clearSentrySessionContext();
   }
 }