npm - @vellumai/assistant - Versions diffs - 0.4.46 → 0.4.49 - Mend

@vellumai/assistant 0.4.46 → 0.4.49

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (382) hide show

package/ARCHITECTURE.md +7 -7
package/README.md +2 -23
package/docs/architecture/integrations.md +45 -41
package/docs/architecture/keychain-broker.md +3 -3
package/docs/architecture/security.md +5 -5
package/docs/runbook-trusted-contacts.md +3 -8
package/hook-templates/debug-prompt-logger/hook.json +1 -1
package/hook-templates/debug-prompt-logger/run.sh +1 -3
package/package.json +1 -1
package/src/__tests__/actor-token-service.test.ts +0 -1
package/src/__tests__/anthropic-provider.test.ts +156 -0
package/src/__tests__/approval-cascade.test.ts +810 -0
package/src/__tests__/approval-primitive.test.ts +0 -1
package/src/__tests__/approval-routes-http.test.ts +2 -0
package/src/__tests__/assistant-attachments.test.ts +12 -34
package/src/__tests__/assistant-feature-flag-guardrails.test.ts +76 -0
package/src/__tests__/assistant-feature-flags-integration.test.ts +0 -1
package/src/__tests__/browser-fill-credential.test.ts +5 -2
package/src/__tests__/browser-skill-baseline-tool-payload.test.ts +2 -2
package/src/__tests__/bundled-skill-retrieval-guard.test.ts +2 -1
package/src/__tests__/channel-guardian.test.ts +0 -2
package/src/__tests__/channel-readiness-routes.test.ts +35 -25
package/src/__tests__/channel-readiness-service.test.ts +10 -9
package/src/__tests__/checker.test.ts +9 -29
package/src/__tests__/cli.test.ts +23 -0
package/src/__tests__/computer-use-skill-manifest-regression.test.ts +1 -1
package/src/__tests__/computer-use-tools.test.ts +2 -19
package/src/__tests__/config-watcher.test.ts +0 -1
package/src/__tests__/confirmation-request-guardian-bridge.test.ts +0 -1
package/src/__tests__/context-image-dimensions.test.ts +332 -0
package/src/__tests__/context-token-estimator.test.ts +196 -13
package/src/__tests__/conversation-attention-store.test.ts +0 -1
package/src/__tests__/conversation-attention-telegram.test.ts +0 -1
package/src/__tests__/conversation-routes-guardian-reply.test.ts +144 -0
package/src/__tests__/conversation-routes-slash-commands.test.ts +1 -0
package/src/__tests__/credential-broker-browser-fill.test.ts +23 -22
package/src/__tests__/credential-broker-server-use.test.ts +22 -21
package/src/__tests__/credential-broker.test.ts +2 -1
package/src/__tests__/credential-metadata-store.test.ts +239 -26
package/src/__tests__/credential-resolve.test.ts +5 -4
package/src/__tests__/credential-security-e2e.test.ts +8 -8
package/src/__tests__/credential-security-invariants.test.ts +111 -7
package/src/__tests__/credential-vault-unit.test.ts +287 -54
package/src/__tests__/credential-vault.test.ts +406 -12
package/src/__tests__/credentials-cli.test.ts +82 -6
package/src/__tests__/dynamic-skill-workflow-prompt.test.ts +0 -1
package/src/__tests__/ephemeral-permissions.test.ts +3 -3
package/src/__tests__/gateway-only-enforcement.test.ts +4 -2
package/src/__tests__/gateway-only-guard.test.ts +0 -1
package/src/__tests__/gemini-image-service.test.ts +75 -45
package/src/__tests__/gemini-provider.test.ts +9 -6
package/src/__tests__/guardian-action-conversation-turn.test.ts +1 -33
package/src/__tests__/guardian-action-copy-generator.test.ts +0 -20
package/src/__tests__/guardian-action-followup-executor.test.ts +1 -28
package/src/__tests__/guardian-action-followup-store.test.ts +1 -1
package/src/__tests__/guardian-action-grant-mint-consume.test.ts +0 -1
package/src/__tests__/guardian-decision-primitive-canonical.test.ts +0 -1
package/src/__tests__/guardian-grant-minting.test.ts +35 -0
package/src/__tests__/guardian-routing-invariants.test.ts +0 -1
package/src/__tests__/guardian-verification-voice-binding.test.ts +0 -1
package/src/__tests__/handlers-user-message-approval-consumption.test.ts +0 -39
package/src/__tests__/heartbeat-service.test.ts +0 -1
package/src/__tests__/host-cu-proxy.test.ts +629 -0
package/src/__tests__/host-shell-tool.test.ts +27 -15
package/src/__tests__/http-user-message-parity.test.ts +1 -0
package/src/__tests__/ingress-url-consistency.test.ts +14 -21
package/src/__tests__/integration-status.test.ts +38 -25
package/src/__tests__/intent-routing.test.ts +0 -1
package/src/__tests__/invite-routes-http.test.ts +10 -9
package/src/__tests__/keychain-broker-client.test.ts +11 -43
package/src/__tests__/managed-proxy-context.test.ts +5 -3
package/src/__tests__/media-generate-image.test.ts +63 -2
package/src/__tests__/media-reuse-story.e2e.test.ts +7 -3
package/src/__tests__/messaging-send-tool.test.ts +4 -6
package/src/__tests__/notification-routing-intent.test.ts +0 -1
package/src/__tests__/oauth-cli.test.ts +373 -14
package/src/__tests__/oauth-provider-profiles.test.ts +9 -9
package/src/__tests__/oauth-scope-policy.test.ts +4 -6
package/src/__tests__/oauth-store.test.ts +756 -0
package/src/__tests__/onboarding-starter-tasks.test.ts +0 -1
package/src/__tests__/provider-error-scenarios.test.ts +0 -1
package/src/__tests__/provider-fail-open-selection.test.ts +3 -1
package/src/__tests__/provider-managed-proxy-integration.test.ts +70 -6
package/src/__tests__/provider-streaming.benchmark.test.ts +0 -1
package/src/__tests__/public-ingress-urls.test.ts +15 -21
package/src/__tests__/recording-handler.test.ts +3 -4
package/src/__tests__/registry.test.ts +2 -2
package/src/__tests__/runtime-events-sse.test.ts +55 -7
package/src/__tests__/schedule-store.test.ts +0 -1
package/src/__tests__/scheduler-recurrence.test.ts +0 -1
package/src/__tests__/schema-transforms.test.ts +226 -0
package/src/__tests__/scoped-approval-grants.test.ts +0 -1
package/src/__tests__/scoped-grant-security-matrix.test.ts +0 -1
package/src/__tests__/script-proxy-injection-runtime.test.ts +23 -13
package/src/__tests__/script-proxy-policy-runtime.test.ts +1 -1
package/src/__tests__/script-proxy-session-manager.test.ts +1 -1
package/src/__tests__/secret-ingress-handler.test.ts +0 -1
package/src/__tests__/secret-onetime-send.test.ts +5 -3
package/src/__tests__/send-endpoint-busy.test.ts +21 -6
package/src/__tests__/sequence-store.test.ts +0 -1
package/src/__tests__/session-init.benchmark.test.ts +4 -5
package/src/__tests__/session-messaging-secret-redirect.test.ts +5 -4
package/src/__tests__/skill-include-graph.test.ts +66 -0
package/src/__tests__/skill-load-feature-flag.test.ts +0 -1
package/src/__tests__/skill-load-tool.test.ts +149 -1
package/src/__tests__/skill-projection-feature-flag.test.ts +0 -1
package/src/__tests__/skills-uninstall.test.ts +3 -3
package/src/__tests__/skills.test.ts +3 -12
package/src/__tests__/slack-channel-config.test.ts +76 -11
package/src/__tests__/slack-share-routes.test.ts +17 -14
package/src/__tests__/system-prompt.test.ts +0 -1
package/src/__tests__/telegram-bot-username-resolution.test.ts +3 -0
package/src/__tests__/telegram-invite-adapter.test.ts +18 -22
package/src/__tests__/terminal-tools.test.ts +4 -3
package/src/__tests__/test-support/computer-use-skill-harness.ts +3 -2
package/src/__tests__/tool-approval-handler.test.ts +0 -1
package/src/__tests__/tool-execution-pipeline.benchmark.test.ts +0 -1
package/src/__tests__/tool-executor-lifecycle-events.test.ts +0 -1
package/src/__tests__/tool-executor-shell-integration.test.ts +0 -1
package/src/__tests__/tool-executor.test.ts +0 -1
package/src/__tests__/tool-grant-request-escalation.test.ts +0 -1
package/src/__tests__/trust-store-pattern-matches.test.ts +29 -0
package/src/__tests__/trust-store.test.ts +1 -22
package/src/__tests__/trusted-contact-approval-notifier.test.ts +0 -1
package/src/__tests__/trusted-contact-inline-approval-integration.test.ts +0 -1
package/src/__tests__/twilio-config.test.ts +2 -1
package/src/__tests__/twilio-provider.test.ts +4 -2
package/src/__tests__/twilio-routes.test.ts +5 -20
package/src/__tests__/verification-control-plane-policy.test.ts +0 -1
package/src/__tests__/voice-scoped-grant-consumer.test.ts +0 -1
package/src/agent/ax-tree-compaction.test.ts +235 -0
package/src/agent/loop.ts +76 -130
package/src/calls/call-domain.ts +8 -10
package/src/calls/relay-server.ts +9 -13
package/src/calls/twilio-config.ts +4 -8
package/src/calls/twilio-provider.ts +2 -1
package/src/calls/twilio-rest.ts +2 -1
package/src/calls/twilio-routes.ts +1 -2
package/src/calls/voice-ingress-preflight.ts +1 -1
package/src/cli/commands/browser-relay.ts +46 -15
package/src/cli/commands/completions.ts +0 -3
package/src/cli/commands/credentials.ts +110 -23
package/src/cli/commands/oauth/apps.ts +255 -0
package/src/cli/commands/oauth/connections.ts +299 -0
package/src/cli/commands/oauth/index.ts +52 -0
package/src/cli/commands/oauth/providers.ts +242 -0
package/src/cli/commands/skills.ts +4 -338
package/src/cli/program.ts +1 -5
package/src/cli/reference.ts +1 -3
package/src/cli.ts +3 -2
package/src/config/assistant-feature-flags.ts +0 -3
package/src/config/bundled-skills/_shared/CLI_RETRIEVAL_PATTERN.md +1 -1
package/src/config/bundled-skills/claude-code/TOOLS.json +0 -4
package/src/config/bundled-skills/computer-use/SKILL.md +3 -6
package/src/config/bundled-skills/computer-use/TOOLS.json +22 -4
package/src/config/bundled-skills/contacts/tools/google-contacts.ts +29 -32
package/src/config/bundled-skills/gmail/SKILL.md +4 -4
package/src/config/bundled-skills/gmail/tools/gmail-archive.ts +54 -61
package/src/config/bundled-skills/gmail/tools/gmail-attachments.ts +25 -28
package/src/config/bundled-skills/gmail/tools/gmail-draft.ts +14 -17
package/src/config/bundled-skills/gmail/tools/gmail-filters.ts +39 -44
package/src/config/bundled-skills/gmail/tools/gmail-follow-up.ts +61 -58
package/src/config/bundled-skills/gmail/tools/gmail-forward.ts +50 -49
package/src/config/bundled-skills/gmail/tools/gmail-label.ts +11 -13
package/src/config/bundled-skills/gmail/tools/gmail-outreach-scan.ts +148 -146
package/src/config/bundled-skills/gmail/tools/gmail-send-draft.ts +4 -7
package/src/config/bundled-skills/gmail/tools/gmail-sender-digest.ts +175 -173
package/src/config/bundled-skills/gmail/tools/gmail-trash.ts +4 -7
package/src/config/bundled-skills/gmail/tools/gmail-unsubscribe.ts +71 -76
package/src/config/bundled-skills/gmail/tools/gmail-vacation.ts +32 -38
package/src/config/bundled-skills/google-calendar/SKILL.md +2 -2
package/src/config/bundled-skills/google-calendar/calendar-client.ts +90 -44
package/src/config/bundled-skills/google-calendar/tools/calendar-check-availability.ts +9 -10
package/src/config/bundled-skills/google-calendar/tools/calendar-create-event.ts +5 -6
package/src/config/bundled-skills/google-calendar/tools/calendar-get-event.ts +4 -5
package/src/config/bundled-skills/google-calendar/tools/calendar-list-events.ts +14 -15
package/src/config/bundled-skills/google-calendar/tools/calendar-rsvp.ts +37 -37
package/src/config/bundled-skills/google-calendar/tools/shared.ts +4 -9
package/src/config/bundled-skills/image-studio/tools/media-generate-image.ts +24 -3
package/src/config/bundled-skills/messaging/SKILL.md +6 -6
package/src/config/bundled-skills/messaging/tools/messaging-analyze-style.ts +62 -63
package/src/config/bundled-skills/messaging/tools/messaging-archive-by-sender.ts +15 -16
package/src/config/bundled-skills/messaging/tools/messaging-auth-test.ts +4 -5
package/src/config/bundled-skills/messaging/tools/messaging-list-conversations.ts +6 -7
package/src/config/bundled-skills/messaging/tools/messaging-mark-read.ts +4 -5
package/src/config/bundled-skills/messaging/tools/messaging-read.ts +14 -15
package/src/config/bundled-skills/messaging/tools/messaging-search.ts +4 -5
package/src/config/bundled-skills/messaging/tools/messaging-send.ts +128 -128
package/src/config/bundled-skills/messaging/tools/messaging-sender-digest.ts +33 -34
package/src/config/bundled-skills/messaging/tools/shared.ts +12 -15
package/src/config/bundled-skills/settings/SKILL.md +1 -1
package/src/config/bundled-skills/settings/TOOLS.json +2 -8
package/src/config/bundled-skills/settings/tools/voice-config-update.ts +5 -33
package/src/config/bundled-skills/slack/tools/shared.ts +4 -10
package/src/config/bundled-skills/slack/tools/slack-add-reaction.ts +4 -5
package/src/config/bundled-skills/slack/tools/slack-channel-details.ts +15 -16
package/src/config/bundled-skills/slack/tools/slack-delete-message.ts +4 -5
package/src/config/bundled-skills/slack/tools/slack-edit-message.ts +4 -5
package/src/config/bundled-skills/slack/tools/slack-leave-channel.ts +4 -5
package/src/config/bundled-skills/slack/tools/slack-scan-digest.ts +95 -92
package/src/config/env-registry.ts +14 -83
package/src/config/env.ts +11 -50
package/src/config/feature-flag-registry.json +16 -16
package/src/config/schema.ts +3 -1
package/src/config/skills.ts +21 -2
package/src/context/image-dimensions.ts +229 -0
package/src/context/token-estimator.ts +75 -12
package/src/context/window-manager.ts +49 -10
package/src/daemon/assistant-attachments.ts +1 -13
package/src/daemon/guardian-action-generators.ts +4 -5
package/src/daemon/handlers/config-ingress.ts +8 -33
package/src/daemon/handlers/config-slack-channel.ts +76 -56
package/src/daemon/handlers/config-telegram.ts +53 -24
package/src/daemon/handlers/sessions.ts +10 -24
package/src/daemon/handlers/shared.ts +0 -130
package/src/daemon/host-cu-proxy.ts +401 -0
package/src/daemon/lifecycle.ts +39 -63
package/src/daemon/message-protocol.ts +3 -0
package/src/daemon/message-types/computer-use.ts +2 -119
package/src/daemon/message-types/host-cu.ts +19 -0
package/src/daemon/message-types/integrations.ts +1 -0
package/src/daemon/message-types/messages.ts +3 -0
package/src/daemon/server.ts +14 -21
package/src/daemon/session-agent-loop-handlers.ts +2 -0
package/src/daemon/session-attachments.ts +1 -2
package/src/daemon/session-messaging.ts +3 -1
package/src/daemon/session-slash.ts +1 -1
package/src/daemon/session-surfaces.ts +40 -28
package/src/daemon/session-tool-setup.ts +20 -11
package/src/daemon/session.ts +139 -16
package/src/daemon/tool-side-effects.ts +2 -8
package/src/daemon/watch-handler.ts +2 -2
package/src/email/providers/index.ts +2 -1
package/src/events/tool-metrics-listener.ts +2 -2
package/src/hooks/manager.ts +1 -4
package/src/inbound/public-ingress-urls.ts +7 -7
package/src/instrument.ts +15 -1
package/src/logfire.ts +16 -5
package/src/media/app-icon-generator.ts +30 -4
package/src/media/avatar-router.ts +26 -3
package/src/media/gemini-image-service.ts +28 -2
package/src/memory/conversation-key-store.ts +21 -0
package/src/memory/db-init.ts +4 -0
package/src/memory/guardian-action-store.ts +1 -1
package/src/memory/migrations/149-oauth-tables.ts +60 -0
package/src/memory/migrations/index.ts +1 -0
package/src/memory/schema/guardian.ts +1 -1
package/src/memory/schema/index.ts +1 -0
package/src/memory/schema/oauth.ts +65 -0
package/src/messaging/provider.ts +19 -13
package/src/messaging/providers/gmail/adapter.ts +40 -23
package/src/messaging/providers/gmail/client.ts +283 -122
package/src/messaging/providers/gmail/people-client.ts +32 -24
package/src/messaging/providers/slack/adapter.ts +29 -19
package/src/messaging/providers/slack/client.ts +265 -78
package/src/messaging/providers/telegram-bot/adapter.ts +19 -18
package/src/messaging/providers/whatsapp/adapter.ts +17 -11
package/src/messaging/registry.ts +2 -31
package/src/notifications/copy-composer.ts +0 -5
package/src/notifications/signal.ts +4 -5
package/src/oauth/byo-connection.test.ts +537 -0
package/src/oauth/byo-connection.ts +128 -0
package/src/oauth/connect-orchestrator.ts +139 -56
package/src/oauth/connect-types.ts +17 -23
package/src/oauth/connection-resolver.ts +58 -0
package/src/oauth/connection.ts +38 -0
package/src/oauth/manual-token-connection.ts +104 -0
package/src/oauth/oauth-store.ts +496 -0
package/src/oauth/platform-connection.test.ts +192 -0
package/src/oauth/platform-connection.ts +111 -0
package/src/oauth/provider-behaviors.ts +124 -0
package/src/oauth/scope-policy.ts +9 -2
package/src/oauth/seed-providers.ts +161 -0
package/src/oauth/token-persistence.ts +74 -78
package/src/permissions/checker.ts +8 -4
package/src/permissions/defaults.ts +0 -1
package/src/permissions/prompter.ts +10 -1
package/src/permissions/trust-store.ts +13 -0
package/src/prompts/__tests__/build-cli-reference-section.test.ts +3 -1
package/src/prompts/system-prompt.ts +70 -45
package/src/providers/anthropic/client.ts +133 -24
package/src/providers/gemini/client.ts +15 -6
package/src/providers/managed-proxy/constants.ts +2 -2
package/src/providers/managed-proxy/context.ts +5 -1
package/src/providers/ratelimit.ts +17 -0
package/src/providers/registry.ts +2 -2
package/src/providers/retry.ts +1 -27
package/src/runtime/AGENTS.md +17 -0
package/src/runtime/auth/route-policy.ts +0 -3
package/src/runtime/channel-invite-transports/telegram.ts +2 -1
package/src/runtime/channel-readiness-service.ts +168 -195
package/src/runtime/channel-readiness-types.ts +4 -0
package/src/runtime/channel-reply-delivery.ts +0 -40
package/src/runtime/gateway-client.ts +0 -7
package/src/runtime/guardian-action-conversation-turn.ts +1 -3
package/src/runtime/guardian-action-followup-executor.ts +1 -1
package/src/runtime/guardian-action-message-composer.ts +3 -23
package/src/runtime/http-server.ts +17 -10
package/src/runtime/http-types.ts +2 -3
package/src/runtime/middleware/rate-limiter.ts +74 -20
package/src/runtime/middleware/twilio-validation.ts +1 -11
package/src/runtime/pending-interactions.ts +14 -12
package/src/runtime/routes/channel-delivery-routes.ts +0 -1
package/src/runtime/routes/channel-readiness-routes.ts +2 -0
package/src/runtime/routes/conversation-routes.ts +73 -19
package/src/runtime/routes/diagnostics-routes.ts +11 -9
package/src/runtime/routes/events-routes.ts +21 -11
package/src/runtime/routes/guardian-approval-interception.ts +20 -5
package/src/runtime/routes/host-cu-routes.ts +97 -0
package/src/runtime/routes/inbound-stages/background-dispatch.ts +12 -111
package/src/runtime/routes/integrations/slack/share.ts +6 -6
package/src/runtime/routes/integrations/twilio.ts +6 -5
package/src/runtime/routes/log-export-routes.ts +126 -8
package/src/runtime/routes/secret-routes.ts +3 -2
package/src/runtime/routes/settings-routes.ts +113 -48
package/src/runtime/routes/surface-action-routes.ts +1 -1
package/src/runtime/routes/watch-routes.ts +128 -0
package/src/schedule/integration-status.ts +10 -8
package/src/security/credential-key.ts +14 -0
package/src/security/keychain-broker-client.ts +5 -6
package/src/security/oauth2.ts +1 -1
package/src/security/token-manager.ts +145 -43
package/src/skills/catalog-install.ts +358 -0
package/src/skills/include-graph.ts +32 -0
package/src/telegram/bot-username.ts +2 -3
package/src/tools/apps/definitions.ts +0 -5
package/src/tools/assets/materialize.ts +0 -5
package/src/tools/assets/search.ts +0 -5
package/src/tools/browser/headless-browser.ts +1 -67
package/src/tools/browser/network-recorder.ts +1 -1
package/src/tools/browser/network-recording-types.ts +1 -1
package/src/tools/claude-code/claude-code.ts +0 -5
package/src/tools/computer-use/definitions.ts +46 -11
package/src/tools/computer-use/registry.ts +4 -5
package/src/tools/credentials/broker.ts +5 -4
package/src/tools/credentials/metadata-store.ts +22 -74
package/src/tools/credentials/resolve.ts +2 -1
package/src/tools/credentials/vault.ts +139 -151
package/src/tools/filesystem/edit.ts +1 -6
package/src/tools/filesystem/read.ts +0 -5
package/src/tools/filesystem/write.ts +1 -6
package/src/tools/host-filesystem/edit.ts +1 -6
package/src/tools/host-filesystem/read.ts +1 -6
package/src/tools/host-filesystem/write.ts +1 -6
package/src/tools/mcp/mcp-tool-factory.ts +18 -1
package/src/tools/memory/definitions.ts +0 -5
package/src/tools/network/web-fetch.ts +0 -5
package/src/tools/network/web-search.ts +0 -5
package/src/tools/registry.ts +2 -7
package/src/tools/schema-transforms.ts +99 -0
package/src/tools/skills/load.ts +62 -8
package/src/tools/swarm/delegate.ts +0 -5
package/src/tools/system/avatar-generator.ts +0 -5
package/src/tools/ui-surface/definitions.ts +0 -15
package/src/tools/watch/screen-watch.ts +0 -5
package/src/tools/watch/watch-state.ts +0 -12
package/src/util/logger.ts +7 -41
package/src/util/platform.ts +9 -28
package/src/version.ts +10 -0
package/src/watcher/providers/github.ts +51 -52
package/src/watcher/providers/gmail.ts +88 -80
package/src/watcher/providers/google-calendar.ts +94 -86
package/src/watcher/providers/linear.ts +87 -93
package/src/__tests__/computer-use-session-compaction.test.ts +0 -143
package/src/__tests__/computer-use-session-lifecycle.test.ts +0 -322
package/src/__tests__/computer-use-session-working-dir.test.ts +0 -166
package/src/__tests__/computer-use-skill-baseline.test.ts +0 -78
package/src/__tests__/computer-use-skill-endstate.test.ts +0 -105
package/src/__tests__/computer-use-skill-lifecycle-cleanup.test.ts +0 -249
package/src/__tests__/ride-shotgun-handler.test.ts +0 -452
package/src/cli/commands/dev.ts +0 -129
package/src/cli/commands/map.ts +0 -391
package/src/cli/commands/oauth.ts +0 -77
package/src/config/bundled-skills/computer-use/tools/computer-use-request-control.ts +0 -16
package/src/daemon/computer-use-session.ts +0 -1020
package/src/daemon/ride-shotgun-handler.ts +0 -567
package/src/oauth/provider-profiles.ts +0 -192
package/src/prompts/computer-use-prompt.ts +0 -98
package/src/runtime/routes/computer-use-routes.ts +0 -641
package/src/runtime/telegram-streaming-delivery.test.ts +0 -597
package/src/runtime/telegram-streaming-delivery.ts +0 -383
package/src/tools/computer-use/request-computer-control.ts +0 -61

package/src/__tests__/computer-use-session-lifecycle.test.ts DELETED Viewed

@@ -1,322 +0,0 @@
-import { describe, expect, mock, test } from "bun:test";
-// Mock config before importing modules that depend on it.
-// The permissions mode must be 'workspace' so computer-use tools
-// go through normal workspace trust evaluation instead of prompting.
-mock.module("../config/loader.js", () => ({
-  getConfig: () => ({
-    ui: {},
-    provider: "mock-provider",
-    permissions: { mode: "workspace" },
-    apiKeys: {},
-    sandbox: { enabled: false },
-    timeouts: { toolExecutionTimeoutSec: 30, permissionTimeoutSec: 5 },
-    skills: { load: { extraDirs: [] } },
-    secretDetection: { enabled: false },
-    contextWindow: {
-      enabled: true,
-      maxInputTokens: 180000,
-      targetBudgetRatio: 0.3,
-      compactThreshold: 0.8,
-      summaryBudgetRatio: 0.05,
-    },
-  }),
-  invalidateConfigCache: () => {},
-}));
-import { ComputerUseSession } from "../daemon/computer-use-session.js";
-import type {
-  CuObservation,
-  ServerMessage,
-} from "../daemon/message-protocol.js";
-import type { Provider, ProviderResponse } from "../providers/types.js";
-function createProvider(responses: ProviderResponse[]): {
-  provider: Provider;
-  getCalls: () => number;
-} {
-  let calls = 0;
-  const provider: Provider = {
-    name: "mock",
-    async sendMessage() {
-      const response = responses[calls] ?? responses[responses.length - 1];
-      calls++;
-      return response;
-    },
-  };
-  return { provider, getCalls: () => calls };
-}
-describe("ComputerUseSession lifecycle", () => {
-  test("stops provider loop immediately after terminal computer_use_done tool", async () => {
-    const { provider, getCalls } = createProvider([
-      {
-        content: [
-          {
-            type: "tool_use",
-            id: "tu-1",
-            name: "computer_use_done",
-            input: { summary: "Task finished" },
-          },
-        ],
-        model: "mock-model",
-        usage: { inputTokens: 10, outputTokens: 5 },
-        stopReason: "tool_use",
-      },
-      {
-        content: [{ type: "text", text: "This should never be requested" }],
-        model: "mock-model",
-        usage: { inputTokens: 10, outputTokens: 5 },
-        stopReason: "end_turn",
-      },
-    ]);
-    const sentMessages: ServerMessage[] = [];
-    let terminalCalls = 0;
-    const session = new ComputerUseSession(
-      "cu-test-1",
-      "test task",
-      1440,
-      900,
-      provider,
-      (msg) => {
-        sentMessages.push(msg);
-      },
-      "computer_use",
-      () => {
-        terminalCalls++;
-      },
-    );
-    const observation: CuObservation = {
-      type: "cu_observation",
-      sessionId: "cu-test-1",
-      axTree: 'Window "Test" [1]',
-    };
-    await session.handleObservation(observation);
-    // If computer_use_done does not abort the loop, we'd see an extra provider call.
-    expect(getCalls()).toBe(1);
-    expect(session.getState()).toBe("complete");
-    expect(terminalCalls).toBe(1);
-    const completes = sentMessages.filter(
-      (msg): msg is Extract<ServerMessage, { type: "cu_complete" }> =>
-        msg.type === "cu_complete",
-    );
-    expect(completes).toHaveLength(1);
-    expect(completes[0].summary).toBe("Task finished");
-  });
-  test("notifies terminal callback only once on repeated abort calls", () => {
-    const { provider } = createProvider([
-      {
-        content: [{ type: "text", text: "unused" }],
-        model: "mock-model",
-        usage: { inputTokens: 1, outputTokens: 1 },
-        stopReason: "end_turn",
-      },
-    ]);
-    let terminalCalls = 0;
-    const session = new ComputerUseSession(
-      "cu-test-2",
-      "test task",
-      1440,
-      900,
-      provider,
-      () => {},
-      "computer_use",
-      () => {
-        terminalCalls++;
-      },
-    );
-    session.abort();
-    session.abort();
-    expect(terminalCalls).toBe(1);
-    expect(session.getState()).toBe("error");
-  });
-  test("CU session passes exactly 10 computer_use_* tools to the agent loop", async () => {
-    let capturedTools: string[] = [];
-    const provider: Provider = {
-      name: "mock",
-      async sendMessage(_msgs, tools) {
-        capturedTools = (tools ?? []).map((t) => t.name);
-        return {
-          content: [
-            {
-              type: "tool_use",
-              id: "tu-capture",
-              name: "computer_use_done",
-              input: { summary: "Done" },
-            },
-          ],
-          model: "mock-model",
-          usage: { inputTokens: 10, outputTokens: 5 },
-          stopReason: "tool_use",
-        };
-      },
-    };
-    const session = new ComputerUseSession(
-      "cu-tool-capture",
-      "capture tools",
-      1440,
-      900,
-      provider,
-      () => {},
-      "computer_use",
-    );
-    await session.handleObservation({
-      type: "cu_observation",
-      sessionId: "cu-tool-capture",
-      axTree: 'Window "Test" [1]',
-    });
-    const cuTools = capturedTools.filter((n) => n.startsWith("computer_use_"));
-    expect(cuTools).toHaveLength(10);
-    // Assert exact set of expected CU tool names
-    const expectedCuTools = [
-      "computer_use_click",
-      "computer_use_type_text",
-      "computer_use_key",
-      "computer_use_scroll",
-      "computer_use_drag",
-      "computer_use_wait",
-      "computer_use_open_app",
-      "computer_use_run_applescript",
-      "computer_use_done",
-      "computer_use_respond",
-    ];
-    for (const name of expectedCuTools) {
-      expect(cuTools).toContain(name);
-    }
-  });
-  test("computer_use_respond is a terminal tool that completes the session", async () => {
-    const { provider } = createProvider([
-      {
-        content: [
-          {
-            type: "tool_use",
-            id: "tu-respond",
-            name: "computer_use_respond",
-            input: {
-              answer: "The meeting is at 3pm",
-              reasoning: "Found in calendar",
-            },
-          },
-        ],
-        model: "mock-model",
-        usage: { inputTokens: 10, outputTokens: 5 },
-        stopReason: "tool_use",
-      },
-    ]);
-    const sentMessages: ServerMessage[] = [];
-    const session = new ComputerUseSession(
-      "cu-respond-test",
-      "check my schedule",
-      1440,
-      900,
-      provider,
-      (msg) => {
-        sentMessages.push(msg);
-      },
-      "computer_use",
-    );
-    await session.handleObservation({
-      type: "cu_observation",
-      sessionId: "cu-respond-test",
-      axTree: 'Window "Calendar" [1]',
-    });
-    expect(session.getState()).toBe("complete");
-    const completes = sentMessages.filter(
-      (msg): msg is Extract<ServerMessage, { type: "cu_complete" }> =>
-        msg.type === "cu_complete",
-    );
-    expect(completes).toHaveLength(1);
-    expect(completes[0].summary).toBe("The meeting is at 3pm");
-    expect(completes[0].isResponse).toBe(true);
-  });
-  test("default construction preactivates computer-use skill and provides 10 CU tools", async () => {
-    let capturedTools: string[] = [];
-    const provider: Provider = {
-      name: "mock",
-      async sendMessage(_msgs, tools) {
-        capturedTools = (tools ?? []).map((t) => t.name);
-        return {
-          content: [
-            {
-              type: "tool_use",
-              id: "tu-default",
-              name: "computer_use_done",
-              input: { summary: "Done" },
-            },
-          ],
-          model: "mock-model",
-          usage: { inputTokens: 10, outputTokens: 5 },
-          stopReason: "tool_use",
-        };
-      },
-    };
-    // No preactivatedSkillIds passed — defaults to ['computer-use'] via skill projection
-    const session = new ComputerUseSession(
-      "cu-default-projection",
-      "test default projection",
-      1440,
-      900,
-      provider,
-      () => {},
-      "computer_use",
-      undefined,
-    );
-    await session.handleObservation({
-      type: "cu_observation",
-      sessionId: "cu-default-projection",
-      axTree: 'Window "Test" [1]',
-    });
-    const cuTools = capturedTools.filter((n) => n.startsWith("computer_use_"));
-    expect(cuTools).toHaveLength(10);
-  });
-  test("constructor accepts preactivatedSkillIds parameter", () => {
-    const { provider } = createProvider([
-      {
-        content: [{ type: "text", text: "unused" }],
-        model: "mock-model",
-        usage: { inputTokens: 1, outputTokens: 1 },
-        stopReason: "end_turn",
-      },
-    ]);
-    // Should not throw
-    const session = new ComputerUseSession(
-      "cu-preactivated",
-      "test preactivated",
-      1440,
-      900,
-      provider,
-      () => {},
-      "computer_use",
-      undefined,
-      ["computer-use"],
-    );
-    expect(session).toBeDefined();
-  });
-});

package/src/__tests__/computer-use-session-working-dir.test.ts DELETED Viewed

@@ -1,166 +0,0 @@
-import { afterEach, beforeEach, describe, expect, mock, test } from "bun:test";
-import type { CuObservation } from "../daemon/message-protocol.js";
-import type { Provider } from "../providers/types.js";
-let capturedWorkingDir: string | undefined;
-const noopLogger = new Proxy({} as Record<string, unknown>, {
-  get: (_target, prop) => (prop === "child" ? () => noopLogger : () => {}),
-});
-// eslint-disable-next-line @typescript-eslint/no-require-imports
-const realLogger = require("../util/logger.js");
-mock.module("../util/logger.js", () => ({
-  ...realLogger,
-  getLogger: () => noopLogger,
-  getCliLogger: () => noopLogger,
-  isDebug: () => false,
-  truncateForLog: (value: string, maxLen = 500) =>
-    value.length > maxLen ? value.slice(0, maxLen) + "..." : value,
-  initLogger: () => {},
-  pruneOldLogFiles: () => 0,
-}));
-// eslint-disable-next-line @typescript-eslint/no-require-imports
-const realPlatform = require("../util/platform.js");
-mock.module("../util/platform.js", () => ({
-  ...realPlatform,
-  getRootDir: () => "/tmp",
-  getDataDir: () => "/tmp/data",
-  getSandboxRootDir: () => "/tmp/sandbox",
-  getSandboxWorkingDir: () => "/tmp/workspace",
-  getInterfacesDir: () => "/tmp/interfaces",
-  getWorkspaceDir: () => "/tmp/workspace",
-  getWorkspaceConfigPath: () => "/tmp/workspace/config.json",
-  getWorkspaceSkillsDir: () => "/tmp/workspace/skills",
-  getWorkspaceHooksDir: () => "/tmp/workspace/hooks",
-  getWorkspacePromptPath: (file: string) => `/tmp/workspace/${file}`,
-  getPlatformName: () => "linux",
-  getClipboardCommand: () => null,
-  getPidPath: () => "/tmp/test.pid",
-  getDbPath: () => "/tmp/data/db/assistant.db",
-  getLogPath: () => "/tmp/test.log",
-  getHistoryPath: () => "/tmp/data/history",
-  getHooksDir: () => "/tmp/hooks",
-  readSessionToken: () => null,
-  ensureDataDir: () => {},
-  isMacOS: () => false,
-  isLinux: () => true,
-  isWindows: () => false,
-  normalizeAssistantId: (id: string) => id,
-  readLockfile: () => null,
-  writeLockfile: () => {},
-}));
-mock.module("../config/loader.js", () => ({
-  getConfig: () => ({
-    ui: {},
-    daemon: { standaloneRecording: false },
-    provider: "mock-provider",
-    model: "mock-model",
-    permissions: { mode: "workspace" },
-    apiKeys: {},
-    sandbox: { enabled: false, backend: "native" },
-    timeouts: { toolExecutionTimeoutSec: 30, permissionTimeoutSec: 5 },
-    skills: { load: { extraDirs: [] } },
-    secretDetection: {
-      enabled: false,
-      allowOneTimeSend: false,
-      customPatterns: [],
-      entropyThreshold: 3.5,
-    },
-    contextWindow: {
-      enabled: true,
-      maxInputTokens: 180000,
-      targetBudgetRatio: 0.30,
-      compactThreshold: 0.8,      summaryBudgetRatio: 0.05,
-    },
-    assistantFeatureFlagValues: {},
-  }),
-  loadConfig: () => ({}),
-  loadRawConfig: () => ({}),
-  saveConfig: () => {},
-  saveRawConfig: () => {},
-  invalidateConfigCache: () => {},
-  applyNestedDefaults: (config: unknown) => config,
-  getNestedValue: () => undefined,
-  setNestedValue: () => {},
-  syncConfigToLockfile: () => {},
-  API_KEY_PROVIDERS: [],
-}));
-const { ToolExecutor } = await import("../tools/executor.js");
-const { ComputerUseSession } =
-  await import("../daemon/computer-use-session.js");
-const originalExecute = ToolExecutor.prototype.execute;
-describe("ComputerUseSession working directory", () => {
-  beforeEach(() => {
-    capturedWorkingDir = undefined;
-    ToolExecutor.prototype.execute = async function (
-      _name: string,
-      _input: Record<string, unknown>,
-      context: { workingDir: string },
-    ) {
-      capturedWorkingDir = context.workingDir;
-      return { content: "ok", isError: false };
-    } as typeof ToolExecutor.prototype.execute;
-  });
-  afterEach(() => {
-    ToolExecutor.prototype.execute = originalExecute;
-  });
-  test("uses sandbox working directory for tool execution context", async () => {
-    let providerCalls = 0;
-    const provider: Provider = {
-      name: "mock-provider",
-      async sendMessage() {
-        const calls = providerCalls++;
-        if (calls === 0) {
-          return {
-            content: [
-              {
-                type: "tool_use",
-                id: "toolu_1",
-                name: "computer_use_click",
-                input: { element_id: 1 },
-              },
-            ],
-            model: "mock-model",
-            usage: { inputTokens: 1, outputTokens: 1 },
-            stopReason: "tool_use",
-          };
-        }
-        return {
-          content: [{ type: "text", text: "unused" }],
-          model: "mock-model",
-          usage: { inputTokens: 1, outputTokens: 1 },
-          stopReason: "end_turn",
-        };
-      },
-    };
-    const session = new ComputerUseSession(
-      "cu-sandbox-1",
-      "test task",
-      1440,
-      900,
-      provider,
-      () => {},
-    );
-    const observation: CuObservation = {
-      type: "cu_observation",
-      sessionId: "cu-sandbox-1",
-      axTree: 'Window "Test" [1]',
-    };
-    await session.handleObservation(observation);
-    expect(capturedWorkingDir).toBe("/tmp/workspace");
-  });
-});

package/src/__tests__/computer-use-skill-baseline.test.ts DELETED Viewed

@@ -1,78 +0,0 @@
-import { afterAll, describe, expect, test } from "bun:test";
-import { buildToolDefinitions } from "../daemon/session-tool-setup.js";
-import {
-  __resetRegistryForTesting,
-  getAllToolDefinitions,
-  getAllTools,
-  getTool,
-  initializeTools,
-} from "../tools/registry.js";
-import {
-  assertComputerUseToolsAbsent,
-  COMPUTER_USE_TOOL_NAMES,
-} from "./test-support/computer-use-skill-harness.js";
-afterAll(() => {
-  __resetRegistryForTesting();
-});
-describe("computer-use skill baseline: registry tool surfaces", () => {
-  test("no computer_use_* action tools are registered after initializeTools() (migrated to skill)", async () => {
-    await initializeTools();
-    for (const name of COMPUTER_USE_TOOL_NAMES) {
-      const tool = getTool(name);
-      expect(tool).toBeUndefined();
-    }
-  });
-  test("computer_use_request_control is registered in core after initializeTools()", async () => {
-    await initializeTools();
-    const tool = getTool("computer_use_request_control");
-    expect(tool).toBeDefined();
-  });
-  test("getAllToolDefinitions() excludes all computer_use_* tools (proxy exclusion)", async () => {
-    await initializeTools();
-    const defNames = getAllToolDefinitions().map((d) => d.name);
-    assertComputerUseToolsAbsent(defNames);
-  });
-  test("getAllToolDefinitions() excludes computer_use_request_control (proxy exclusion)", async () => {
-    await initializeTools();
-    const defNames = getAllToolDefinitions().map((d) => d.name);
-    expect(defNames).not.toContain("computer_use_request_control");
-  });
-  test("buildToolDefinitions() includes computer_use_request_control for text sessions", async () => {
-    await initializeTools();
-    const defNames = buildToolDefinitions().map((d) => d.name);
-    expect(defNames).toContain("computer_use_request_control");
-  });
-  test("buildToolDefinitions() excludes all computer_use_* action tools from text sessions", async () => {
-    await initializeTools();
-    const defNames = buildToolDefinitions().map((d) => d.name);
-    // The only computer_use_* tool in text sessions is the escalation tool
-    const cuActionTools = defNames.filter(
-      (n) =>
-        n.startsWith("computer_use_") && n !== "computer_use_request_control",
-    );
-    expect(cuActionTools).toHaveLength(0);
-  });
-  test("post-cutover count: 1 computer_use_* tool in core registry (escalation only)", async () => {
-    await initializeTools();
-    const allTools = getAllTools();
-    const cuTools = allTools.filter((t) => t.name.startsWith("computer_use_"));
-    expect(cuTools).toHaveLength(1);
-    expect(cuTools[0].name).toBe("computer_use_request_control");
-  });
-});

package/src/__tests__/computer-use-skill-endstate.test.ts DELETED Viewed

@@ -1,105 +0,0 @@
-import { join } from "node:path";
-import { beforeAll, describe, expect, test } from "bun:test";
-import { getBundledSkillsDir } from "../config/skills.js";
-import { buildToolDefinitions } from "../daemon/session-tool-setup.js";
-import { parseToolManifestFile } from "../skills/tool-manifest.js";
-import {
-  __resetRegistryForTesting,
-  getAllToolDefinitions,
-  getAllTools,
-  getTool,
-  initializeTools,
-} from "../tools/registry.js";
-import {
-  COMPUTER_USE_TOOL_COUNT,
-  COMPUTER_USE_TOOL_NAMES,
-} from "./test-support/computer-use-skill-harness.js";
-beforeAll(async () => {
-  __resetRegistryForTesting();
-  await initializeTools();
-});
-describe("computer-use skill end-state", () => {
-  // ── Core Registry ──────────────────────────────────────────────────
-  test("core registry contains 1 computer_use_* tool (escalation only)", () => {
-    const allTools = getAllTools();
-    const cuTools = allTools.filter((t) => t.name.startsWith("computer_use_"));
-    expect(cuTools).toHaveLength(1);
-    expect(cuTools[0].name).toBe("computer_use_request_control");
-  });
-  test("computer_use_request_control is resolvable from core registry", () => {
-    expect(getTool("computer_use_request_control")).toBeDefined();
-  });
-  test("no action tool from COMPUTER_USE_TOOL_NAMES is resolvable from core registry", () => {
-    for (const name of COMPUTER_USE_TOOL_NAMES) {
-      expect(getTool(name)).toBeUndefined();
-    }
-  });
-  // ── getAllToolDefinitions (excludes proxy & skill tools) ──────────
-  test("getAllToolDefinitions() excludes computer_use_* tools", () => {
-    const defs = getAllToolDefinitions();
-    const cuDefs = defs.filter((d) => d.name.startsWith("computer_use_"));
-    expect(cuDefs).toHaveLength(0);
-  });
-  test("getAllToolDefinitions() excludes computer_use_request_control (proxy exclusion)", () => {
-    const defs = getAllToolDefinitions();
-    const found = defs.find((d) => d.name === "computer_use_request_control");
-    expect(found).toBeUndefined();
-  });
-  // ── buildToolDefinitions (text session tool set) ─────────────────
-  test("buildToolDefinitions() includes computer_use_request_control", () => {
-    const defs = buildToolDefinitions();
-    const found = defs.find((d) => d.name === "computer_use_request_control");
-    expect(found).toBeDefined();
-  });
-  test("buildToolDefinitions() excludes computer_use_* action tools", () => {
-    const defs = buildToolDefinitions();
-    const cuDefs = defs.filter(
-      (d) =>
-        d.name.startsWith("computer_use_") &&
-        d.name !== "computer_use_request_control",
-    );
-    expect(cuDefs).toHaveLength(0);
-  });
-  // ── Bundled Skill Catalog ────────────────────────────────────────
-  test(
-    "computer-use skill has exactly " +
-      COMPUTER_USE_TOOL_COUNT +
-      " tools in TOOLS.json",
-    () => {
-      const manifestPath = join(
-        getBundledSkillsDir(),
-        "computer-use",
-        "TOOLS.json",
-      );
-      const manifest = parseToolManifestFile(manifestPath);
-      expect(manifest.tools).toHaveLength(COMPUTER_USE_TOOL_COUNT);
-    },
-  );
-  test("bundled skill tool names match expected computer_use_* names", () => {
-    const manifestPath = join(
-      getBundledSkillsDir(),
-      "computer-use",
-      "TOOLS.json",
-    );
-    const manifest = parseToolManifestFile(manifestPath);
-    const toolNames = new Set(manifest.tools.map((t) => t.name));
-    for (const name of COMPUTER_USE_TOOL_NAMES) {
-      expect(toolNames.has(name)).toBe(true);
-    }
-  });
-});