npm - ruflo - Versions diffs - 3.10.36 → 3.10.37 - Mend

ruflo 3.10.36 → 3.10.37

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (498) hide show

package/README.md +416 -416
package/bin/ruflo.js +77 -77
package/package.json +113 -113
package/src/chat-ui/Dockerfile +25 -25
package/src/chat-ui/patch-mcp-url-safety.sh +28 -28
package/src/config/config.example.json +76 -76
package/src/mcp-bridge/Dockerfile +45 -45
package/src/mcp-bridge/index.js +1692 -1692
package/src/mcp-bridge/mcp-stdio-kernel.js +159 -159
package/src/mcp-bridge/package.json +17 -17
package/src/mcp-bridge/test-harness.js +470 -470
package/src/nginx/Dockerfile +10 -10
package/src/nginx/nginx.conf +67 -67
package/src/nginx/static/favicon-dark.svg +4 -4
package/src/nginx/static/favicon.svg +4 -4
package/src/nginx/static/icon.svg +5 -5
package/src/nginx/static/logo.svg +9 -9
package/src/nginx/static/manifest.json +22 -22
package/src/nginx/static/welcome.js +184 -184
package/src/ruvocal/.claude/skills/add-model-descriptions/SKILL.md +73 -73
package/src/ruvocal/.devcontainer/Dockerfile +9 -9
package/src/ruvocal/.devcontainer/devcontainer.json +36 -36
package/src/ruvocal/.dockerignore +16 -16
package/src/ruvocal/.eslintignore +13 -13
package/src/ruvocal/.eslintrc.cjs +45 -45
package/src/ruvocal/.gcloudignore +18 -18
package/src/ruvocal/.github/ISSUE_TEMPLATE/bug-report--chat-ui-.md +43 -43
package/src/ruvocal/.github/ISSUE_TEMPLATE/config-support.md +9 -9
package/src/ruvocal/.github/ISSUE_TEMPLATE/feature-request--chat-ui-.md +17 -17
package/src/ruvocal/.github/ISSUE_TEMPLATE/huggingchat.md +11 -11
package/src/ruvocal/.github/release.yml +16 -16
package/src/ruvocal/.github/workflows/build-docs.yml +18 -18
package/src/ruvocal/.github/workflows/build-image.yml +142 -142
package/src/ruvocal/.github/workflows/build-pr-docs.yml +20 -20
package/src/ruvocal/.github/workflows/deploy-dev.yml +63 -63
package/src/ruvocal/.github/workflows/deploy-prod.yml +78 -78
package/src/ruvocal/.github/workflows/lint-and-test.yml +84 -84
package/src/ruvocal/.github/workflows/slugify.yaml +72 -72
package/src/ruvocal/.github/workflows/trufflehog.yml +17 -17
package/src/ruvocal/.github/workflows/upload-pr-documentation.yml +16 -16
package/src/ruvocal/.husky/lint-stage-config.js +4 -4
package/src/ruvocal/.husky/pre-commit +2 -2
package/src/ruvocal/.prettierignore +14 -14
package/src/ruvocal/.prettierrc +7 -7
package/src/ruvocal/CLAUDE.md +126 -126
package/src/ruvocal/Dockerfile +96 -96
package/src/ruvocal/LICENSE +202 -202
package/src/ruvocal/PRIVACY.md +41 -41
package/src/ruvocal/README.md +164 -164
package/src/ruvocal/chart/Chart.yaml +5 -5
package/src/ruvocal/chart/env/dev.yaml +260 -260
package/src/ruvocal/chart/env/prod.yaml +273 -273
package/src/ruvocal/chart/templates/_helpers.tpl +22 -22
package/src/ruvocal/chart/templates/config.yaml +10 -10
package/src/ruvocal/chart/templates/deployment.yaml +81 -81
package/src/ruvocal/chart/templates/hpa.yaml +45 -45
package/src/ruvocal/chart/templates/infisical.yaml +24 -24
package/src/ruvocal/chart/templates/ingress-internal.yaml +32 -32
package/src/ruvocal/chart/templates/ingress.yaml +32 -32
package/src/ruvocal/chart/templates/network-policy.yaml +36 -36
package/src/ruvocal/chart/templates/service-account.yaml +13 -13
package/src/ruvocal/chart/templates/service-monitor.yaml +17 -17
package/src/ruvocal/chart/templates/service.yaml +21 -21
package/src/ruvocal/chart/values.yaml +73 -73
package/src/ruvocal/cloudbuild.yaml +68 -68
package/src/ruvocal/config/branding.env.example +19 -19
package/src/ruvocal/docker-compose.yml +21 -21
package/src/ruvocal/docs/adr/ADR-029-HUGGINGFACE-CHAT-UI-CLOUD-RUN.md +1236 -1236
package/src/ruvocal/docs/adr/ADR-033-RUVECTOR-RUFLO-MCP-INTEGRATION.md +111 -111
package/src/ruvocal/docs/adr/ADR-034-OPTIONAL-MCP-BACKENDS.md +117 -117
package/src/ruvocal/docs/adr/ADR-035-MCP-TOOL-GROUPS.md +186 -186
package/src/ruvocal/docs/adr/ADR-037-AUTOPILOT-CHAT-MODE.md +1500 -1500
package/src/ruvocal/docs/adr/ADR-038-RUVOCAL-FORK.md +286 -286
package/src/ruvocal/docs/source/_toctree.yml +30 -30
package/src/ruvocal/docs/source/configuration/common-issues.md +38 -38
package/src/ruvocal/docs/source/configuration/llm-router.md +105 -105
package/src/ruvocal/docs/source/configuration/mcp-tools.md +84 -84
package/src/ruvocal/docs/source/configuration/metrics.md +9 -9
package/src/ruvocal/docs/source/configuration/open-id.md +57 -57
package/src/ruvocal/docs/source/configuration/overview.md +89 -89
package/src/ruvocal/docs/source/configuration/theming.md +20 -20
package/src/ruvocal/docs/source/developing/architecture.md +48 -48
package/src/ruvocal/docs/source/index.md +53 -53
package/src/ruvocal/docs/source/installation/docker.md +43 -43
package/src/ruvocal/docs/source/installation/helm.md +43 -43
package/src/ruvocal/docs/source/installation/local.md +62 -62
package/src/ruvocal/entrypoint.sh +18 -18
package/src/ruvocal/mcp-bridge/Dockerfile +45 -45
package/src/ruvocal/mcp-bridge/cloudbuild.yaml +49 -49
package/src/ruvocal/mcp-bridge/index.js +1902 -1902
package/src/ruvocal/mcp-bridge/mcp-stdio-kernel.js +159 -159
package/src/ruvocal/mcp-bridge/package-lock.json +762 -762
package/src/ruvocal/mcp-bridge/package.json +17 -17
package/src/ruvocal/mcp-bridge/test-harness.js +470 -470
package/src/ruvocal/package-lock.json +11741 -11741
package/src/ruvocal/package.json +121 -121
package/src/ruvocal/postcss.config.js +6 -6
package/src/ruvocal/rvf.manifest.json +204 -204
package/src/ruvocal/scripts/config.ts +64 -64
package/src/ruvocal/scripts/generate-welcome.mjs +181 -181
package/src/ruvocal/scripts/populate.ts +288 -288
package/src/ruvocal/scripts/samples.txt +194 -194
package/src/ruvocal/scripts/setups/vitest-setup-server.ts +44 -44
package/src/ruvocal/scripts/updateLocalEnv.ts +48 -48
package/src/ruvocal/src/ambient.d.ts +7 -7
package/src/ruvocal/src/app.d.ts +29 -29
package/src/ruvocal/src/app.html +53 -53
package/src/ruvocal/src/hooks.server.ts +32 -32
package/src/ruvocal/src/hooks.ts +6 -6
package/src/ruvocal/src/lib/APIClient.ts +148 -148
package/src/ruvocal/src/lib/actions/clickOutside.ts +18 -18
package/src/ruvocal/src/lib/actions/snapScrollToBottom.ts +346 -346
package/src/ruvocal/src/lib/buildPrompt.ts +33 -33
package/src/ruvocal/src/lib/components/AnnouncementBanner.svelte +20 -20
package/src/ruvocal/src/lib/components/BackgroundGenerationPoller.svelte +168 -168
package/src/ruvocal/src/lib/components/CodeBlock.svelte +73 -73
package/src/ruvocal/src/lib/components/CopyToClipBoardBtn.svelte +92 -92
package/src/ruvocal/src/lib/components/DeleteConversationModal.svelte +75 -75
package/src/ruvocal/src/lib/components/EditConversationModal.svelte +100 -100
package/src/ruvocal/src/lib/components/ExpandNavigation.svelte +22 -22
package/src/ruvocal/src/lib/components/FoundationBackground.svelte +242 -242
package/src/ruvocal/src/lib/components/HoverTooltip.svelte +44 -44
package/src/ruvocal/src/lib/components/HtmlPreviewModal.svelte +143 -143
package/src/ruvocal/src/lib/components/InfiniteScroll.svelte +50 -50
package/src/ruvocal/src/lib/components/MobileNav.svelte +300 -300
package/src/ruvocal/src/lib/components/Modal.svelte +115 -115
package/src/ruvocal/src/lib/components/ModelCardMetadata.svelte +71 -71
package/src/ruvocal/src/lib/components/NavConversationItem.svelte +151 -151
package/src/ruvocal/src/lib/components/NavMenu.svelte +313 -313
package/src/ruvocal/src/lib/components/Pagination.svelte +97 -97
package/src/ruvocal/src/lib/components/PaginationArrow.svelte +27 -27
package/src/ruvocal/src/lib/components/Portal.svelte +24 -24
package/src/ruvocal/src/lib/components/RetryBtn.svelte +18 -18
package/src/ruvocal/src/lib/components/RuFloUniverse.svelte +185 -185
package/src/ruvocal/src/lib/components/RufloHelpModal.svelte +411 -411
package/src/ruvocal/src/lib/components/ScrollToBottomBtn.svelte +47 -47
package/src/ruvocal/src/lib/components/ScrollToPreviousBtn.svelte +77 -77
package/src/ruvocal/src/lib/components/ShareConversationModal.svelte +182 -182
package/src/ruvocal/src/lib/components/StopGeneratingBtn.svelte +69 -69
package/src/ruvocal/src/lib/components/SubscribeModal.svelte +87 -87
package/src/ruvocal/src/lib/components/Switch.svelte +36 -36
package/src/ruvocal/src/lib/components/SystemPromptModal.svelte +44 -44
package/src/ruvocal/src/lib/components/Toast.svelte +27 -27
package/src/ruvocal/src/lib/components/Tooltip.svelte +30 -30
package/src/ruvocal/src/lib/components/WelcomeModal.svelte +46 -46
package/src/ruvocal/src/lib/components/chat/Alternatives.svelte +77 -77
package/src/ruvocal/src/lib/components/chat/BlockWrapper.svelte +72 -72
package/src/ruvocal/src/lib/components/chat/ChatInput.svelte +490 -490
package/src/ruvocal/src/lib/components/chat/ChatIntroduction.svelte +123 -123
package/src/ruvocal/src/lib/components/chat/ChatMessage.svelte +548 -548
package/src/ruvocal/src/lib/components/chat/ChatWindow.svelte +1057 -1057
package/src/ruvocal/src/lib/components/chat/FileDropzone.svelte +92 -92
package/src/ruvocal/src/lib/components/chat/ImageLightbox.svelte +66 -66
package/src/ruvocal/src/lib/components/chat/MarkdownBlock.svelte +23 -23
package/src/ruvocal/src/lib/components/chat/MarkdownRenderer.svelte +69 -69
package/src/ruvocal/src/lib/components/chat/MarkdownRenderer.svelte.test.ts +58 -58
package/src/ruvocal/src/lib/components/chat/MessageAvatar.svelte +103 -103
package/src/ruvocal/src/lib/components/chat/ModelSwitch.svelte +64 -64
package/src/ruvocal/src/lib/components/chat/OpenReasoningResults.svelte +81 -81
package/src/ruvocal/src/lib/components/chat/TaskGroup.svelte +88 -88
package/src/ruvocal/src/lib/components/chat/ToolUpdate.svelte +273 -273
package/src/ruvocal/src/lib/components/chat/UploadedFile.svelte +253 -253
package/src/ruvocal/src/lib/components/chat/UrlFetchModal.svelte +203 -203
package/src/ruvocal/src/lib/components/chat/VoiceRecorder.svelte +214 -214
package/src/ruvocal/src/lib/components/icons/IconBurger.svelte +20 -20
package/src/ruvocal/src/lib/components/icons/IconCheap.svelte +20 -20
package/src/ruvocal/src/lib/components/icons/IconChevron.svelte +24 -24
package/src/ruvocal/src/lib/components/icons/IconDazzled.svelte +40 -40
package/src/ruvocal/src/lib/components/icons/IconFast.svelte +20 -20
package/src/ruvocal/src/lib/components/icons/IconLoading.svelte +22 -22
package/src/ruvocal/src/lib/components/icons/IconMCP.svelte +28 -28
package/src/ruvocal/src/lib/components/icons/IconMoon.svelte +21 -21
package/src/ruvocal/src/lib/components/icons/IconNew.svelte +20 -20
package/src/ruvocal/src/lib/components/icons/IconOmni.svelte +90 -90
package/src/ruvocal/src/lib/components/icons/IconPaperclip.svelte +24 -24
package/src/ruvocal/src/lib/components/icons/IconPro.svelte +37 -37
package/src/ruvocal/src/lib/components/icons/IconShare.svelte +21 -21
package/src/ruvocal/src/lib/components/icons/IconSun.svelte +93 -93
package/src/ruvocal/src/lib/components/icons/Logo.svelte +68 -68
package/src/ruvocal/src/lib/components/icons/LogoHuggingFaceBorderless.svelte +54 -54
package/src/ruvocal/src/lib/components/mcp/AddServerForm.svelte +250 -250
package/src/ruvocal/src/lib/components/mcp/MCPServerManager.svelte +185 -185
package/src/ruvocal/src/lib/components/mcp/ServerCard.svelte +203 -203
package/src/ruvocal/src/lib/components/players/AudioPlayer.svelte +82 -82
package/src/ruvocal/src/lib/components/voice/AudioWaveform.svelte +96 -96
package/src/ruvocal/src/lib/components/wasm/GalleryPanel.svelte +357 -357
package/src/ruvocal/src/lib/constants/mcpExamples.ts +114 -114
package/src/ruvocal/src/lib/constants/mime.ts +11 -11
package/src/ruvocal/src/lib/constants/pagination.ts +1 -1
package/src/ruvocal/src/lib/constants/publicSepToken.ts +1 -1
package/src/ruvocal/src/lib/constants/routerExamples.ts +133 -133
package/src/ruvocal/src/lib/constants/rvagentPresets.ts +206 -206
package/src/ruvocal/src/lib/createShareLink.ts +27 -27
package/src/ruvocal/src/lib/jobs/refresh-conversation-stats.ts +297 -297
package/src/ruvocal/src/lib/migrations/lock.ts +56 -56
package/src/ruvocal/src/lib/migrations/migrations.spec.ts +74 -74
package/src/ruvocal/src/lib/migrations/migrations.ts +109 -109
package/src/ruvocal/src/lib/migrations/routines/01-update-search-assistants.ts +50 -50
package/src/ruvocal/src/lib/migrations/routines/02-update-assistants-models.ts +48 -48
package/src/ruvocal/src/lib/migrations/routines/04-update-message-updates.ts +151 -151
package/src/ruvocal/src/lib/migrations/routines/05-update-message-files.ts +56 -56
package/src/ruvocal/src/lib/migrations/routines/06-trim-message-updates.ts +56 -56
package/src/ruvocal/src/lib/migrations/routines/08-update-featured-to-review.ts +32 -32
package/src/ruvocal/src/lib/migrations/routines/09-delete-empty-conversations.spec.ts +214 -214
package/src/ruvocal/src/lib/migrations/routines/09-delete-empty-conversations.ts +88 -88
package/src/ruvocal/src/lib/migrations/routines/10-update-reports-assistantid.ts +29 -29
package/src/ruvocal/src/lib/migrations/routines/index.ts +15 -15
package/src/ruvocal/src/lib/server/__tests__/conversation-stop-generating.spec.ts +103 -103
package/src/ruvocal/src/lib/server/abortRegistry.ts +57 -57
package/src/ruvocal/src/lib/server/abortedGenerations.ts +43 -43
package/src/ruvocal/src/lib/server/adminToken.ts +62 -62
package/src/ruvocal/src/lib/server/api/__tests__/conversations-id.spec.ts +296 -296
package/src/ruvocal/src/lib/server/api/__tests__/conversations-message.spec.ts +216 -216
package/src/ruvocal/src/lib/server/api/__tests__/conversations.spec.ts +235 -235
package/src/ruvocal/src/lib/server/api/__tests__/misc.spec.ts +72 -72
package/src/ruvocal/src/lib/server/api/__tests__/testHelpers.ts +86 -86
package/src/ruvocal/src/lib/server/api/__tests__/user-reports.spec.ts +78 -78
package/src/ruvocal/src/lib/server/api/__tests__/user.spec.ts +239 -239
package/src/ruvocal/src/lib/server/api/types.ts +37 -37
package/src/ruvocal/src/lib/server/api/utils/requireAuth.ts +22 -22
package/src/ruvocal/src/lib/server/api/utils/resolveConversation.ts +69 -69
package/src/ruvocal/src/lib/server/api/utils/resolveModel.ts +27 -27
package/src/ruvocal/src/lib/server/api/utils/superjsonResponse.ts +15 -15
package/src/ruvocal/src/lib/server/apiToken.ts +11 -11
package/src/ruvocal/src/lib/server/auth.ts +554 -554
package/src/ruvocal/src/lib/server/config.ts +187 -187
package/src/ruvocal/src/lib/server/conversation.ts +83 -83
package/src/ruvocal/src/lib/server/database/__tests__/rvf.spec.ts +709 -709
package/src/ruvocal/src/lib/server/database/postgres.ts +700 -700
package/src/ruvocal/src/lib/server/database/rvf.ts +1078 -1078
package/src/ruvocal/src/lib/server/database.ts +145 -145
package/src/ruvocal/src/lib/server/endpoints/document.ts +68 -68
package/src/ruvocal/src/lib/server/endpoints/endpoints.ts +43 -43
package/src/ruvocal/src/lib/server/endpoints/images.ts +211 -211
package/src/ruvocal/src/lib/server/endpoints/openai/endpointOai.ts +266 -266
package/src/ruvocal/src/lib/server/endpoints/openai/openAIChatToTextGenerationStream.ts +212 -212
package/src/ruvocal/src/lib/server/endpoints/openai/openAICompletionToTextGenerationStream.ts +32 -32
package/src/ruvocal/src/lib/server/endpoints/preprocessMessages.ts +61 -61
package/src/ruvocal/src/lib/server/exitHandler.ts +59 -59
package/src/ruvocal/src/lib/server/files/downloadFile.ts +34 -34
package/src/ruvocal/src/lib/server/files/uploadFile.ts +29 -29
package/src/ruvocal/src/lib/server/findRepoRoot.ts +13 -13
package/src/ruvocal/src/lib/server/generateFromDefaultEndpoint.ts +46 -46
package/src/ruvocal/src/lib/server/hooks/error.ts +37 -37
package/src/ruvocal/src/lib/server/hooks/fetch.ts +22 -22
package/src/ruvocal/src/lib/server/hooks/handle.ts +250 -250
package/src/ruvocal/src/lib/server/hooks/init.ts +51 -51
package/src/ruvocal/src/lib/server/isURLLocal.spec.ts +31 -31
package/src/ruvocal/src/lib/server/isURLLocal.ts +74 -74
package/src/ruvocal/src/lib/server/logger.ts +42 -42
package/src/ruvocal/src/lib/server/mcp/clientPool.spec.ts +175 -175
package/src/ruvocal/src/lib/server/mcp/hf.ts +32 -32
package/src/ruvocal/src/lib/server/mcp/httpClient.ts +122 -122
package/src/ruvocal/src/lib/server/mcp/registry.ts +76 -76
package/src/ruvocal/src/lib/server/mcp/tools.ts +196 -196
package/src/ruvocal/src/lib/server/metrics.ts +255 -255
package/src/ruvocal/src/lib/server/models.ts +518 -518
package/src/ruvocal/src/lib/server/requestContext.ts +55 -55
package/src/ruvocal/src/lib/server/router/arch.ts +230 -230
package/src/ruvocal/src/lib/server/router/endpoint.ts +316 -316
package/src/ruvocal/src/lib/server/router/multimodal.ts +28 -28
package/src/ruvocal/src/lib/server/router/policy.ts +49 -49
package/src/ruvocal/src/lib/server/router/toolsRoute.ts +51 -51
package/src/ruvocal/src/lib/server/router/types.ts +21 -21
package/src/ruvocal/src/lib/server/sendSlack.ts +23 -23
package/src/ruvocal/src/lib/server/textGeneration/generate.ts +258 -258
package/src/ruvocal/src/lib/server/textGeneration/index.ts +96 -96
package/src/ruvocal/src/lib/server/textGeneration/mcp/fileRefs.ts +155 -155
package/src/ruvocal/src/lib/server/textGeneration/mcp/routerResolution.ts +108 -108
package/src/ruvocal/src/lib/server/textGeneration/mcp/runMcpFlow.ts +831 -831
package/src/ruvocal/src/lib/server/textGeneration/mcp/toolInvocation.ts +349 -349
package/src/ruvocal/src/lib/server/textGeneration/mcp/wasmTools.test.ts +633 -633
package/src/ruvocal/src/lib/server/textGeneration/reasoning.ts +23 -23
package/src/ruvocal/src/lib/server/textGeneration/title.ts +83 -83
package/src/ruvocal/src/lib/server/textGeneration/types.ts +28 -28
package/src/ruvocal/src/lib/server/textGeneration/utils/prepareFiles.ts +88 -88
package/src/ruvocal/src/lib/server/textGeneration/utils/routing.ts +21 -21
package/src/ruvocal/src/lib/server/textGeneration/utils/toolPrompt.ts +49 -49
package/src/ruvocal/src/lib/server/urlSafety.ts +77 -77
package/src/ruvocal/src/lib/server/usageLimits.ts +30 -30
package/src/ruvocal/src/lib/stores/autopilotStore.svelte.ts +175 -175
package/src/ruvocal/src/lib/stores/backgroundGenerations.svelte.ts +32 -32
package/src/ruvocal/src/lib/stores/backgroundGenerations.ts +1 -1
package/src/ruvocal/src/lib/stores/errors.ts +9 -9
package/src/ruvocal/src/lib/stores/isAborted.ts +3 -3
package/src/ruvocal/src/lib/stores/isPro.ts +4 -4
package/src/ruvocal/src/lib/stores/loading.ts +3 -3
package/src/ruvocal/src/lib/stores/mcpServers.ts +534 -534
package/src/ruvocal/src/lib/stores/pendingChatInput.ts +3 -3
package/src/ruvocal/src/lib/stores/pendingMessage.ts +9 -9
package/src/ruvocal/src/lib/stores/settings.ts +182 -182
package/src/ruvocal/src/lib/stores/shareModal.ts +13 -13
package/src/ruvocal/src/lib/stores/titleUpdate.ts +8 -8
package/src/ruvocal/src/lib/stores/wasmMcp.ts +472 -472
package/src/ruvocal/src/lib/switchTheme.ts +124 -124
package/src/ruvocal/src/lib/types/AbortedGeneration.ts +8 -8
package/src/ruvocal/src/lib/types/Assistant.ts +31 -31
package/src/ruvocal/src/lib/types/AssistantStats.ts +11 -11
package/src/ruvocal/src/lib/types/ConfigKey.ts +4 -4
package/src/ruvocal/src/lib/types/ConvSidebar.ts +9 -9
package/src/ruvocal/src/lib/types/Conversation.ts +27 -27
package/src/ruvocal/src/lib/types/ConversationStats.ts +13 -13
package/src/ruvocal/src/lib/types/Message.ts +41 -41
package/src/ruvocal/src/lib/types/MessageEvent.ts +10 -10
package/src/ruvocal/src/lib/types/MessageUpdate.ts +139 -139
package/src/ruvocal/src/lib/types/MigrationResult.ts +7 -7
package/src/ruvocal/src/lib/types/Model.ts +23 -23
package/src/ruvocal/src/lib/types/Report.ts +12 -12
package/src/ruvocal/src/lib/types/Review.ts +6 -6
package/src/ruvocal/src/lib/types/Semaphore.ts +19 -19
package/src/ruvocal/src/lib/types/Session.ts +22 -22
package/src/ruvocal/src/lib/types/Settings.ts +93 -93
package/src/ruvocal/src/lib/types/SharedConversation.ts +9 -9
package/src/ruvocal/src/lib/types/Template.ts +6 -6
package/src/ruvocal/src/lib/types/Timestamps.ts +4 -4
package/src/ruvocal/src/lib/types/TokenCache.ts +6 -6
package/src/ruvocal/src/lib/types/Tool.ts +77 -77
package/src/ruvocal/src/lib/types/UrlDependency.ts +5 -5
package/src/ruvocal/src/lib/types/User.ts +14 -14
package/src/ruvocal/src/lib/utils/PublicConfig.svelte.ts +75 -75
package/src/ruvocal/src/lib/utils/auth.ts +17 -17
package/src/ruvocal/src/lib/utils/chunk.ts +33 -33
package/src/ruvocal/src/lib/utils/cookiesAreEnabled.ts +13 -13
package/src/ruvocal/src/lib/utils/debounce.ts +17 -17
package/src/ruvocal/src/lib/utils/deepestChild.ts +6 -6
package/src/ruvocal/src/lib/utils/favicon.ts +21 -21
package/src/ruvocal/src/lib/utils/fetchJSON.ts +23 -23
package/src/ruvocal/src/lib/utils/file2base64.ts +14 -14
package/src/ruvocal/src/lib/utils/formatUserCount.ts +37 -37
package/src/ruvocal/src/lib/utils/generationState.spec.ts +75 -75
package/src/ruvocal/src/lib/utils/generationState.ts +26 -26
package/src/ruvocal/src/lib/utils/getHref.ts +41 -41
package/src/ruvocal/src/lib/utils/getReturnFromGenerator.ts +7 -7
package/src/ruvocal/src/lib/utils/haptics.ts +64 -64
package/src/ruvocal/src/lib/utils/hashConv.ts +12 -12
package/src/ruvocal/src/lib/utils/hf.ts +17 -17
package/src/ruvocal/src/lib/utils/isDesktop.ts +7 -7
package/src/ruvocal/src/lib/utils/isUrl.ts +8 -8
package/src/ruvocal/src/lib/utils/isVirtualKeyboard.ts +16 -16
package/src/ruvocal/src/lib/utils/loadAttachmentsFromUrls.ts +115 -115
package/src/ruvocal/src/lib/utils/marked.spec.ts +96 -96
package/src/ruvocal/src/lib/utils/marked.ts +531 -531
package/src/ruvocal/src/lib/utils/mcpValidation.ts +147 -147
package/src/ruvocal/src/lib/utils/mergeAsyncGenerators.ts +38 -38
package/src/ruvocal/src/lib/utils/messageUpdates.spec.ts +262 -262
package/src/ruvocal/src/lib/utils/messageUpdates.ts +324 -324
package/src/ruvocal/src/lib/utils/mime.ts +56 -56
package/src/ruvocal/src/lib/utils/models.ts +14 -14
package/src/ruvocal/src/lib/utils/parseBlocks.ts +120 -120
package/src/ruvocal/src/lib/utils/parseIncompleteMarkdown.ts +644 -644
package/src/ruvocal/src/lib/utils/parseStringToList.ts +10 -10
package/src/ruvocal/src/lib/utils/randomUuid.ts +14 -14
package/src/ruvocal/src/lib/utils/searchTokens.ts +33 -33
package/src/ruvocal/src/lib/utils/sha256.ts +7 -7
package/src/ruvocal/src/lib/utils/stringifyError.ts +12 -12
package/src/ruvocal/src/lib/utils/sum.ts +3 -3
package/src/ruvocal/src/lib/utils/template.spec.ts +59 -59
package/src/ruvocal/src/lib/utils/template.ts +53 -53
package/src/ruvocal/src/lib/utils/timeout.ts +9 -9
package/src/ruvocal/src/lib/utils/toolProgress.spec.ts +46 -46
package/src/ruvocal/src/lib/utils/toolProgress.ts +11 -11
package/src/ruvocal/src/lib/utils/tree/addChildren.spec.ts +102 -102
package/src/ruvocal/src/lib/utils/tree/addChildren.ts +48 -48
package/src/ruvocal/src/lib/utils/tree/addSibling.spec.ts +81 -81
package/src/ruvocal/src/lib/utils/tree/addSibling.ts +41 -41
package/src/ruvocal/src/lib/utils/tree/buildSubtree.spec.ts +110 -110
package/src/ruvocal/src/lib/utils/tree/buildSubtree.ts +24 -24
package/src/ruvocal/src/lib/utils/tree/convertLegacyConversation.spec.ts +31 -31
package/src/ruvocal/src/lib/utils/tree/convertLegacyConversation.ts +36 -36
package/src/ruvocal/src/lib/utils/tree/isMessageId.spec.ts +15 -15
package/src/ruvocal/src/lib/utils/tree/isMessageId.ts +5 -5
package/src/ruvocal/src/lib/utils/tree/tree.d.ts +14 -14
package/src/ruvocal/src/lib/utils/tree/treeHelpers.spec.ts +167 -167
package/src/ruvocal/src/lib/utils/updates.ts +39 -39
package/src/ruvocal/src/lib/utils/urlParams.ts +13 -13
package/src/ruvocal/src/lib/wasm/idb.ts +438 -438
package/src/ruvocal/src/lib/wasm/index.ts +1213 -1213
package/src/ruvocal/src/lib/wasm/tests/wasm-capabilities.test.ts +565 -565
package/src/ruvocal/src/lib/wasm/wasm.worker.ts +332 -332
package/src/ruvocal/src/lib/wasm/workerClient.ts +166 -166
package/src/ruvocal/src/lib/workers/autopilotWorker.ts +221 -221
package/src/ruvocal/src/lib/workers/detailFetchWorker.ts +100 -100
package/src/ruvocal/src/lib/workers/markdownWorker.ts +61 -61
package/src/ruvocal/src/routes/+error.svelte +20 -20
package/src/ruvocal/src/routes/+layout.svelte +324 -324
package/src/ruvocal/src/routes/+layout.ts +91 -91
package/src/ruvocal/src/routes/+page.svelte +168 -168
package/src/ruvocal/src/routes/.well-known/oauth-cimd/+server.ts +37 -37
package/src/ruvocal/src/routes/__debug/openai/+server.ts +21 -21
package/src/ruvocal/src/routes/admin/export/+server.ts +159 -159
package/src/ruvocal/src/routes/admin/stats/compute/+server.ts +16 -16
package/src/ruvocal/src/routes/api/conversation/[id]/+server.ts +40 -40
package/src/ruvocal/src/routes/api/conversation/[id]/message/[messageId]/+server.ts +42 -42
package/src/ruvocal/src/routes/api/conversations/+server.ts +48 -48
package/src/ruvocal/src/routes/api/fetch-url/+server.ts +147 -147
package/src/ruvocal/src/routes/api/mcp/health/+server.ts +292 -292
package/src/ruvocal/src/routes/api/mcp/servers/+server.ts +32 -32
package/src/ruvocal/src/routes/api/models/+server.ts +25 -25
package/src/ruvocal/src/routes/api/transcribe/+server.ts +104 -104
package/src/ruvocal/src/routes/api/user/+server.ts +15 -15
package/src/ruvocal/src/routes/api/user/validate-token/+server.ts +20 -20
package/src/ruvocal/src/routes/api/v2/conversations/+server.ts +48 -48
package/src/ruvocal/src/routes/api/v2/conversations/[id]/+server.ts +94 -94
package/src/ruvocal/src/routes/api/v2/conversations/[id]/message/[messageId]/+server.ts +43 -43
package/src/ruvocal/src/routes/api/v2/conversations/import-share/+server.ts +23 -23
package/src/ruvocal/src/routes/api/v2/debug/config/+server.ts +16 -16
package/src/ruvocal/src/routes/api/v2/debug/refresh/+server.ts +30 -30
package/src/ruvocal/src/routes/api/v2/export/+server.ts +196 -196
package/src/ruvocal/src/routes/api/v2/feature-flags/+server.ts +14 -14
package/src/ruvocal/src/routes/api/v2/models/+server.ts +38 -38
package/src/ruvocal/src/routes/api/v2/models/[namespace]/+server.ts +8 -8
package/src/ruvocal/src/routes/api/v2/models/[namespace]/[model]/+server.ts +8 -8
package/src/ruvocal/src/routes/api/v2/models/[namespace]/[model]/subscribe/+server.ts +28 -28
package/src/ruvocal/src/routes/api/v2/models/[namespace]/subscribe/+server.ts +28 -28
package/src/ruvocal/src/routes/api/v2/models/old/+server.ts +7 -7
package/src/ruvocal/src/routes/api/v2/models/refresh/+server.ts +33 -33
package/src/ruvocal/src/routes/api/v2/public-config/+server.ts +7 -7
package/src/ruvocal/src/routes/api/v2/user/+server.ts +17 -17
package/src/ruvocal/src/routes/api/v2/user/billing-orgs/+server.ts +73 -73
package/src/ruvocal/src/routes/api/v2/user/reports/+server.ts +17 -17
package/src/ruvocal/src/routes/api/v2/user/settings/+server.ts +110 -110
package/src/ruvocal/src/routes/conversation/+server.ts +115 -115
package/src/ruvocal/src/routes/conversation/[id]/+page.svelte +586 -586
package/src/ruvocal/src/routes/conversation/[id]/+page.ts +60 -60
package/src/ruvocal/src/routes/conversation/[id]/+server.ts +740 -740
package/src/ruvocal/src/routes/conversation/[id]/message/[messageId]/prompt/+server.ts +66 -66
package/src/ruvocal/src/routes/conversation/[id]/share/+server.ts +69 -69
package/src/ruvocal/src/routes/conversation/[id]/stop-generating/+server.ts +35 -35
package/src/ruvocal/src/routes/healthcheck/+server.ts +3 -3
package/src/ruvocal/src/routes/login/+server.ts +5 -5
package/src/ruvocal/src/routes/login/callback/+server.ts +103 -103
package/src/ruvocal/src/routes/login/callback/updateUser.spec.ts +157 -157
package/src/ruvocal/src/routes/login/callback/updateUser.ts +215 -215
package/src/ruvocal/src/routes/logout/+server.ts +18 -18
package/src/ruvocal/src/routes/metrics/+server.ts +18 -18
package/src/ruvocal/src/routes/models/+page.svelte +233 -233
package/src/ruvocal/src/routes/models/[...model]/+page.svelte +161 -161
package/src/ruvocal/src/routes/models/[...model]/+page.ts +14 -14
package/src/ruvocal/src/routes/models/[...model]/thumbnail.png/+server.ts +64 -64
package/src/ruvocal/src/routes/models/[...model]/thumbnail.png/ModelThumbnail.svelte +28 -28
package/src/ruvocal/src/routes/privacy/+page.svelte +11 -11
package/src/ruvocal/src/routes/r/[id]/+page.ts +34 -34
package/src/ruvocal/src/routes/settings/(nav)/+layout.svelte +282 -282
package/src/ruvocal/src/routes/settings/(nav)/+layout.ts +1 -1
package/src/ruvocal/src/routes/settings/(nav)/+server.ts +59 -59
package/src/ruvocal/src/routes/settings/(nav)/[...model]/+page.svelte +464 -464
package/src/ruvocal/src/routes/settings/(nav)/[...model]/+page.ts +14 -14
package/src/ruvocal/src/routes/settings/(nav)/application/+page.svelte +362 -362
package/src/ruvocal/src/routes/settings/+layout.svelte +40 -40
package/src/ruvocal/src/styles/highlight-js.css +195 -195
package/src/ruvocal/src/styles/main.css +144 -144
package/src/ruvocal/static/chatui/favicon-dark.svg +3 -3
package/src/ruvocal/static/chatui/favicon-dev.svg +3 -3
package/src/ruvocal/static/chatui/favicon.svg +3 -3
package/src/ruvocal/static/chatui/icon.svg +3 -3
package/src/ruvocal/static/chatui/logo.svg +7 -7
package/src/ruvocal/static/chatui/manifest.json +54 -54
package/src/ruvocal/static/chatui/welcome.js +184 -184
package/src/ruvocal/static/huggingchat/favicon-dark.svg +4 -4
package/src/ruvocal/static/huggingchat/favicon-dev.svg +4 -4
package/src/ruvocal/static/huggingchat/favicon.svg +4 -4
package/src/ruvocal/static/huggingchat/fulltext-logo.svg +1 -1
package/src/ruvocal/static/huggingchat/icon.svg +4 -4
package/src/ruvocal/static/huggingchat/logo.svg +4 -4
package/src/ruvocal/static/huggingchat/manifest.json +54 -54
package/src/ruvocal/static/huggingchat/routes.chat.json +226 -226
package/src/ruvocal/static/robots.txt +10 -10
package/src/ruvocal/static/wasm/rvagent_wasm.js +1539 -1539
package/src/ruvocal/stub/@reflink/reflink/package.json +5 -5
package/src/ruvocal/svelte.config.js +53 -53
package/src/ruvocal/tailwind.config.cjs +30 -30
package/src/ruvocal/tsconfig.json +19 -19
package/src/ruvocal/vite.config.ts +87 -87
package/src/scripts/deploy.sh +116 -116
package/src/scripts/generate-config.js +245 -245
package/src/scripts/generate-welcome.js +187 -187
package/src/scripts/package-rvf.sh +116 -116
package/src/ruvocal/.claude-flow/daemon-state.json +0 -135
package/src/ruvocal/.claude-flow/data/pending-insights.jsonl +0 -0
package/src/ruvocal/.claude-flow/data/ranked-context.json +0 -5
package/src/ruvocal/.claude-flow/logs/daemon.log +0 -31
package/src/ruvocal/.claude-flow/logs/headless/audit_1777949411822_juxau0_prompt.log +0 -989
package/src/ruvocal/.claude-flow/logs/headless/audit_1777949411822_juxau0_result.log +0 -67
package/src/ruvocal/.claude-flow/logs/headless/audit_1777950042278_jvj5xq_prompt.log +0 -989
package/src/ruvocal/.claude-flow/logs/headless/audit_1777950042278_jvj5xq_result.log +0 -93
package/src/ruvocal/.claude-flow/logs/headless/optimize_1777949531823_yt5yc2_prompt.log +0 -1498
package/src/ruvocal/.claude-flow/logs/headless/optimize_1777949531823_yt5yc2_result.log +0 -93
package/src/ruvocal/.claude-flow/logs/headless/testgaps_1777949771821_elw1j4_prompt.log +0 -1498
package/src/ruvocal/.claude-flow/logs/headless/testgaps_1777949771821_elw1j4_result.log +0 -100
package/src/ruvocal/.claude-flow/metrics/codebase-map.json +0 -11
package/src/ruvocal/.claude-flow/metrics/consolidation.json +0 -6
package/src/ruvocal/.claude-flow/neural/stats.json +0 -6
package/src/ruvocal/.claude-flow/sessions/current.json +0 -13
package/src/ruvocal/.swarm/attestation.db +0 -0
package/src/ruvocal/.swarm/hnsw.index +0 -0
package/src/ruvocal/.swarm/hnsw.metadata.json +0 -1
package/src/ruvocal/.swarm/memory.db +0 -0
package/src/ruvocal/.swarm/schema.sql +0 -305

package/src/ruvocal/src/lib/server/textGeneration/mcp/runMcpFlow.ts CHANGED Viewed

@@ -1,831 +1,831 @@
-import { config } from "$lib/server/config";
-import { MessageUpdateType, type MessageUpdate } from "$lib/types/MessageUpdate";
-import { getMcpServers } from "$lib/server/mcp/registry";
-import { isValidUrl } from "$lib/server/urlSafety";
-import { resetMcpToolsCache } from "$lib/server/mcp/tools";
-import { getOpenAiToolsForMcp } from "$lib/server/mcp/tools";
-import type {
-	ChatCompletionChunk,
-	ChatCompletionCreateParamsStreaming,
-	ChatCompletionMessageParam,
-	ChatCompletionMessageToolCall,
-} from "openai/resources/chat/completions";
-import type { Stream } from "openai/streaming";
-import { buildToolPreprompt } from "../utils/toolPrompt";
-import type { EndpointMessage } from "../../endpoints/endpoints";
-import { resolveRouterTarget } from "./routerResolution";
-import { executeToolCalls, type NormalizedToolCall } from "./toolInvocation";
-import { drainPool } from "$lib/server/mcp/clientPool";
-import type { TextGenerationContext } from "../types";
-import {
-	hasAuthHeader,
-	isStrictHfMcpLogin,
-	hasNonEmptyToken,
-	isExaMcpServer,
-} from "$lib/server/mcp/hf";
-import { buildImageRefResolver } from "./fileRefs";
-import { prepareMessagesWithFiles } from "$lib/server/textGeneration/utils/prepareFiles";
-import { makeImageProcessor } from "$lib/server/endpoints/images";
-import { logger } from "$lib/server/logger";
-import { AbortedGenerations } from "$lib/server/abortedGenerations";
-export type RunMcpFlowContext = Pick<
-	TextGenerationContext,
-	"model" | "conv" | "assistant" | "forceMultimodal" | "forceTools" | "provider" | "locals"
-> & { messages: EndpointMessage[] };
-// Return type: "completed" = MCP ran successfully, "not_applicable" = MCP didn't run, "aborted" = user aborted
-export type McpFlowResult = "completed" | "not_applicable" | "aborted";
-export async function* runMcpFlow({
-	model,
-	conv,
-	messages,
-	assistant,
-	forceMultimodal,
-	forceTools,
-	provider,
-	locals,
-	preprompt,
-	abortSignal,
-	abortController,
-	promptedAt,
-	autopilot,
-	autopilotMaxSteps,
-}: RunMcpFlowContext & {
-	preprompt?: string;
-	abortSignal?: AbortSignal;
-	abortController?: AbortController;
-	promptedAt?: Date;
-	autopilot?: boolean;
-	autopilotMaxSteps?: number;
-}): AsyncGenerator<MessageUpdate, McpFlowResult, undefined> {
-	// Helper to check if generation should be aborted via DB polling
-	// Also triggers the abort controller to cancel active streams/requests
-	const checkAborted = (): boolean => {
-		if (abortSignal?.aborted) return true;
-		const abortTime = AbortedGenerations.getInstance().getAbortTime(conv._id.toString());
-		if (abortTime && promptedAt && abortTime > promptedAt) {
-			// Trigger the abort controller to cancel active streams
-			if (abortController && !abortController.signal.aborted) {
-				abortController.abort();
-			}
-			return true;
-		}
-		return false;
-	};
-	// Start from env-configured servers
-	let servers = getMcpServers();
-	try {
-		logger.debug(
-			{ baseServers: servers.map((s) => ({ name: s.name, url: s.url })), count: servers.length },
-			"[mcp] base servers loaded"
-		);
-	} catch {}
-	// Merge in request-provided custom servers (if any)
-	try {
-		const reqMcp = (
-			locals as unknown as {
-				mcp?: {
-					selectedServers?: Array<{ name: string; url: string; headers?: Record<string, string> }>;
-					selectedServerNames?: string[];
-				};
-			}
-		)?.mcp;
-		const custom = Array.isArray(reqMcp?.selectedServers) ? reqMcp?.selectedServers : [];
-		if (custom.length > 0) {
-			// Invalidate cached tool list when the set of servers changes at request-time
-			resetMcpToolsCache();
-			// Deduplicate by server name (request takes precedence)
-			const byName = new Map<
-				string,
-				{ name: string; url: string; headers?: Record<string, string> }
-			>();
-			for (const s of servers) byName.set(s.name, s);
-			for (const s of custom) byName.set(s.name, s);
-			servers = [...byName.values()];
-			try {
-				logger.debug(
-					{
-						customProvidedCount: custom.length,
-						mergedServers: servers.map((s) => ({
-							name: s.name,
-							url: s.url,
-							hasAuth: !!s.headers?.Authorization,
-						})),
-					},
-					"[mcp] merged request-provided servers"
-				);
-			} catch {}
-		}
-		// If the client specified a selection by name, filter to those
-		const names = Array.isArray(reqMcp?.selectedServerNames)
-			? reqMcp?.selectedServerNames
-			: undefined;
-		if (Array.isArray(names)) {
-			const before = servers.map((s) => s.name);
-			servers = servers.filter((s) => names.includes(s.name));
-			try {
-				logger.debug(
-					{ selectedNames: names, before, after: servers.map((s) => s.name) },
-					"[mcp] applied name selection"
-				);
-			} catch {}
-		}
-	} catch {
-		// ignore selection merge errors and proceed with env servers
-	}
-	// If selection/merge yielded no servers, bail early with clearer log
-	if (servers.length === 0) {
-		logger.warn({}, "[mcp] no MCP servers selected after merge/name filter");
-		return "not_applicable";
-	}
-	// Enforce server-side safety (public HTTPS only, no private ranges)
-	{
-		const before = servers.slice();
-		servers = servers.filter((s) => {
-			try {
-				return isValidUrl(s.url);
-			} catch {
-				return false;
-			}
-		});
-		try {
-			const rejected = before.filter((b) => !servers.includes(b));
-			if (rejected.length > 0) {
-				logger.warn(
-					{ rejected: rejected.map((r) => ({ name: r.name, url: r.url })) },
-					"[mcp] rejected servers by URL safety"
-				);
-			}
-		} catch {}
-	}
-	if (servers.length === 0) {
-		logger.warn({}, "[mcp] all selected MCP servers rejected by URL safety guard");
-		return "not_applicable";
-	}
-	// Optionally attach the logged-in user's HF token to the official HF MCP server only.
-	// Never override an explicit Authorization header, and require token to look like an HF token.
-	try {
-		const shouldForward = config.MCP_FORWARD_HF_USER_TOKEN === "true";
-		const userToken =
-			(locals as unknown as { hfAccessToken?: string } | undefined)?.hfAccessToken ??
-			(locals as unknown as { token?: string } | undefined)?.token;
-		if (shouldForward && hasNonEmptyToken(userToken)) {
-			const overlayApplied: string[] = [];
-			servers = servers.map((s) => {
-				try {
-					if (isStrictHfMcpLogin(s.url) && !hasAuthHeader(s.headers)) {
-						overlayApplied.push(s.name);
-						return {
-							...s,
-							headers: { ...(s.headers ?? {}), Authorization: `Bearer ${userToken}` },
-						};
-					}
-				} catch {
-					// ignore URL parse errors and leave server unchanged
-				}
-				return s;
-			});
-			if (overlayApplied.length > 0) {
-				try {
-					logger.debug({ overlayApplied }, "[mcp] forwarded HF token to servers");
-				} catch {}
-			}
-		}
-	} catch {
-		// best-effort overlay; continue if anything goes wrong
-	}
-	// Inject Exa API key for mcp.exa.ai servers via URL param (mcp.exa.ai doesn't support headers)
-	try {
-		const exaApiKey = config.EXA_API_KEY;
-		if (hasNonEmptyToken(exaApiKey)) {
-			const overlayApplied: string[] = [];
-			servers = servers.map((s) => {
-				try {
-					if (isExaMcpServer(s.url)) {
-						const url = new URL(s.url);
-						if (!url.searchParams.has("exaApiKey")) {
-							url.searchParams.set("exaApiKey", exaApiKey);
-							overlayApplied.push(s.name);
-							return { ...s, url: url.toString() };
-						}
-					}
-				} catch {}
-				return s;
-			});
-			if (overlayApplied.length > 0) {
-				logger.debug({ overlayApplied }, "[mcp] injected Exa API key to servers");
-			}
-		}
-	} catch {
-		// best-effort injection; continue if anything goes wrong
-	}
-	logger.debug(
-		{ count: servers.length, servers: servers.map((s) => s.name) },
-		"[mcp] servers configured"
-	);
-	if (servers.length === 0) {
-		return "not_applicable";
-	}
-	// Gate MCP flow based on model tool support (aggregated) with user override
-	try {
-		const supportsTools = Boolean((model as unknown as { supportsTools?: boolean }).supportsTools);
-		const toolsEnabled = Boolean(forceTools) || supportsTools;
-		logger.debug(
-			{
-				model: model.id ?? model.name,
-				supportsTools,
-				forceTools: Boolean(forceTools),
-				toolsEnabled,
-			},
-			"[mcp] tools gate evaluation"
-		);
-		if (!toolsEnabled) {
-			logger.info(
-				{ model: model.id ?? model.name },
-				"[mcp] tools disabled for model; skipping MCP flow"
-			);
-			return "not_applicable";
-		}
-	} catch {
-		// If anything goes wrong reading the flag, proceed (previous behavior)
-	}
-	const resolveFileRef = buildImageRefResolver(messages);
-	const imageProcessor = makeImageProcessor({
-		supportedMimeTypes: ["image/png", "image/jpeg"],
-		preferredMimeType: "image/jpeg",
-		maxSizeInMB: 1,
-		maxWidth: 1024,
-		maxHeight: 1024,
-	});
-	const hasImageInput = messages.some((msg) =>
-		(msg.files ?? []).some(
-			(file) => typeof file?.mime === "string" && file.mime.startsWith("image/")
-		)
-	);
-	const { runMcp, targetModel, candidateModelId, resolvedRoute } = await resolveRouterTarget({
-		model,
-		messages,
-		conversationId: conv._id.toString(),
-		hasImageInput,
-		locals,
-	});
-	if (!runMcp) {
-		logger.info(
-			{ model: targetModel.id ?? targetModel.name, resolvedRoute },
-			"[mcp] runMcp=false (routing chose non-tools candidate)"
-		);
-		return "not_applicable";
-	}
-	try {
-		const { tools: oaTools, mapping } = await getOpenAiToolsForMcp(servers, {
-			signal: abortSignal,
-		});
-		try {
-			logger.info(
-				{ toolCount: oaTools.length, toolNames: oaTools.map((t) => t.function.name) },
-				"[mcp] openai tool defs built"
-			);
-		} catch {}
-		if (oaTools.length === 0) {
-			logger.warn({}, "[mcp] zero tools available after listing; skipping MCP flow");
-			return "not_applicable";
-		}
-		const { OpenAI } = await import("openai");
-		// Capture provider header (x-inference-provider) from the upstream OpenAI-compatible server.
-		let providerHeader: string | undefined;
-		const captureProviderFetch = async (
-			input: RequestInfo | URL,
-			init?: RequestInit
-		): Promise<Response> => {
-			const res = await fetch(input, init);
-			const p = res.headers.get("x-inference-provider");
-			if (p && !providerHeader) providerHeader = p;
-			return res;
-		};
-		const openai = new OpenAI({
-			apiKey: config.OPENAI_API_KEY || config.HF_TOKEN || "sk-",
-			baseURL: config.OPENAI_BASE_URL,
-			fetch: captureProviderFetch,
-			defaultHeaders: {
-				// Bill to organization if configured (HuggingChat only)
-				...(config.isHuggingChat && locals?.billingOrganization
-					? { "X-HF-Bill-To": locals.billingOrganization }
-					: {}),
-			},
-		});
-		const mmEnabled = (forceMultimodal ?? false) || targetModel.multimodal;
-		logger.info(
-			{
-				targetModel: targetModel.id ?? targetModel.name,
-				mmEnabled,
-				route: resolvedRoute,
-				candidateModelId,
-				toolCount: oaTools.length,
-				hasUserToken: Boolean((locals as unknown as { token?: string })?.token),
-			},
-			"[mcp] starting completion with tools"
-		);
-		let messagesOpenAI: ChatCompletionMessageParam[] = await prepareMessagesWithFiles(
-			messages,
-			imageProcessor,
-			mmEnabled
-		);
-		const toolPreprompt = buildToolPreprompt(oaTools, autopilot);
-		const prepromptPieces: string[] = [];
-		if (toolPreprompt.trim().length > 0) {
-			prepromptPieces.push(toolPreprompt);
-		}
-		if (typeof preprompt === "string" && preprompt.trim().length > 0) {
-			prepromptPieces.push(preprompt);
-		}
-		const mergedPreprompt = prepromptPieces.join("\n\n");
-		const hasSystemMessage = messagesOpenAI.length > 0 && messagesOpenAI[0]?.role === "system";
-		if (hasSystemMessage) {
-			if (mergedPreprompt.length > 0) {
-				const existing = messagesOpenAI[0].content ?? "";
-				const existingText = typeof existing === "string" ? existing : "";
-				messagesOpenAI[0].content = mergedPreprompt + (existingText ? "\n\n" + existingText : "");
-			}
-		} else if (mergedPreprompt.length > 0) {
-			messagesOpenAI = [{ role: "system", content: mergedPreprompt }, ...messagesOpenAI];
-		}
-		// Work around servers that reject `system` role
-		if (
-			typeof config.OPENAI_BASE_URL === "string" &&
-			config.OPENAI_BASE_URL.length > 0 &&
-			(config.OPENAI_BASE_URL.includes("hf.space") ||
-				config.OPENAI_BASE_URL.includes("gradio.app")) &&
-			messagesOpenAI[0]?.role === "system"
-		) {
-			messagesOpenAI[0] = { ...messagesOpenAI[0], role: "user" };
-		}
-		const parameters = { ...targetModel.parameters, ...assistant?.generateSettings } as Record<
-			string,
-			unknown
-		>;
-		const maxTokens =
-			(parameters?.max_tokens as number | undefined) ??
-			(parameters?.max_new_tokens as number | undefined) ??
-			(parameters?.max_completion_tokens as number | undefined);
-		const stopSequences =
-			typeof parameters?.stop === "string"
-				? parameters.stop
-				: Array.isArray(parameters?.stop)
-					? (parameters.stop as string[])
-					: undefined;
-		// Build model ID with optional provider suffix (e.g., "model:fastest" or "model:together")
-		const baseModelId = targetModel.id ?? targetModel.name;
-		const modelIdWithProvider =
-			provider && provider !== "auto" ? `${baseModelId}:${provider}` : baseModelId;
-		const completionBase: Omit<ChatCompletionCreateParamsStreaming, "messages"> = {
-			model: modelIdWithProvider,
-			stream: true,
-			temperature: typeof parameters?.temperature === "number" ? parameters.temperature : undefined,
-			top_p: typeof parameters?.top_p === "number" ? parameters.top_p : undefined,
-			frequency_penalty:
-				typeof parameters?.frequency_penalty === "number"
-					? parameters.frequency_penalty
-					: typeof parameters?.repetition_penalty === "number"
-						? parameters.repetition_penalty
-						: undefined,
-			presence_penalty:
-				typeof parameters?.presence_penalty === "number" ? parameters.presence_penalty : undefined,
-			stop: stopSequences,
-			max_tokens: typeof maxTokens === "number" ? maxTokens : undefined,
-			tools: oaTools,
-			tool_choice: "auto",
-		};
-		const toPrimitive = (value: unknown) => {
-			if (typeof value === "string" || typeof value === "number" || typeof value === "boolean") {
-				return value;
-			}
-			return undefined;
-		};
-		const parseArgs = (raw: unknown): Record<string, unknown> => {
-			if (typeof raw !== "string" || raw.trim().length === 0) return {};
-			try {
-				return JSON.parse(raw);
-			} catch {
-				return {};
-			}
-		};
-		const processToolOutput = (
-			text: string
-		): {
-			annotated: string;
-			sources: { index: number; link: string }[];
-		} => ({ annotated: text, sources: [] });
-		let lastAssistantContent = "";
-		let streamedContent = false;
-		// Track whether we're inside a <think> block when the upstream streams
-		// provider-specific reasoning tokens (e.g. `reasoning` or `reasoning_content`).
-		let thinkOpen = false;
-		if (resolvedRoute && candidateModelId) {
-			yield {
-				type: MessageUpdateType.RouterMetadata,
-				route: resolvedRoute,
-				model: candidateModelId,
-			};
-			logger.debug(
-				{ route: resolvedRoute, model: candidateModelId },
-				"[mcp] router metadata emitted"
-			);
-		}
-		// Autopilot loop cap is user-configurable (Settings.autopilotMaxSteps);
-		// fall back to 30 for back-compat when the client doesn't send a value.
-		// Non-autopilot mode keeps a tight 10-loop safety net regardless of caller input.
-		const autopilotCap =
-			typeof autopilotMaxSteps === "number" && autopilotMaxSteps > 0
-				? Math.min(autopilotMaxSteps, 100)
-				: 30;
-		const maxLoops = autopilot ? autopilotCap : 10;
-		for (let loop = 0; loop < maxLoops; loop += 1) {
-			// Check for abort at the start of each loop iteration
-			if (checkAborted()) {
-				logger.info({ loop }, "[mcp] aborting at start of loop iteration");
-				return "aborted";
-			}
-			lastAssistantContent = "";
-			streamedContent = false;
-			const completionRequest: ChatCompletionCreateParamsStreaming = {
-				...completionBase,
-				messages: messagesOpenAI,
-			};
-			const completionStream: Stream<ChatCompletionChunk> = await openai.chat.completions.create(
-				completionRequest,
-				{
-					signal: abortSignal,
-					headers: {
-						"ChatUI-Conversation-ID": conv._id.toString(),
-						"X-use-cache": "false",
-						...(locals?.token ? { Authorization: `Bearer ${locals.token}` } : {}),
-					},
-				}
-			);
-			// If provider header was exposed, notify UI so it can render "via {provider}".
-			if (providerHeader) {
-				yield {
-					type: MessageUpdateType.RouterMetadata,
-					route: "",
-					model: "",
-					provider: providerHeader as unknown as import("@huggingface/inference").InferenceProvider,
-				};
-				logger.debug({ provider: providerHeader }, "[mcp] provider metadata emitted");
-			}
-			const toolCallState: Record<number, { id?: string; name?: string; arguments: string }> = {};
-			let firstToolDeltaLogged = false;
-			let sawToolCall = false;
-			let tokenCount = 0;
-			for await (const chunk of completionStream) {
-				const choice = chunk.choices?.[0];
-				const delta = choice?.delta;
-				if (!delta) continue;
-				const chunkToolCalls = delta.tool_calls ?? [];
-				if (chunkToolCalls.length > 0) {
-					sawToolCall = true;
-					for (const call of chunkToolCalls) {
-						const toolCall = call as unknown as {
-							index?: number;
-							id?: string;
-							function?: { name?: string; arguments?: string };
-						};
-						const index = toolCall.index ?? 0;
-						const current = toolCallState[index] ?? { arguments: "" };
-						if (toolCall.id) current.id = toolCall.id;
-						if (toolCall.function?.name) current.name = toolCall.function.name;
-						if (toolCall.function?.arguments) current.arguments += toolCall.function.arguments;
-						toolCallState[index] = current;
-					}
-					if (!firstToolDeltaLogged) {
-						try {
-							const first =
-								toolCallState[
-									Object.keys(toolCallState)
-										.map((k) => Number(k))
-										.sort((a, b) => a - b)[0] ?? 0
-								];
-							logger.info(
-								{ firstCallName: first?.name, hasId: Boolean(first?.id) },
-								"[mcp] observed streamed tool_call delta"
-							);
-							firstToolDeltaLogged = true;
-						} catch {}
-					}
-				}
-				const deltaContent = (() => {
-					if (typeof delta.content === "string") return delta.content;
-					const maybeParts = delta.content as unknown;
-					if (Array.isArray(maybeParts)) {
-						return maybeParts
-							.map((part) =>
-								typeof part === "object" &&
-								part !== null &&
-								"text" in part &&
-								typeof (part as Record<string, unknown>).text === "string"
-									? String((part as Record<string, unknown>).text)
-									: ""
-							)
-							.join("");
-					}
-					return "";
-				})();
-				// Provider-dependent reasoning fields (e.g., `reasoning` or `reasoning_content`).
-				const deltaReasoning: string =
-					typeof (delta as unknown as Record<string, unknown>)?.reasoning === "string"
-						? ((delta as unknown as { reasoning?: string }).reasoning as string)
-						: typeof (delta as unknown as Record<string, unknown>)?.reasoning_content === "string"
-							? ((delta as unknown as { reasoning_content?: string }).reasoning_content as string)
-							: "";
-				// Merge reasoning + content into a single combined token stream, mirroring
-				// the OpenAI adapter so the UI can auto-detect <think> blocks.
-				let combined = "";
-				if (deltaReasoning.trim().length > 0) {
-					if (!thinkOpen) {
-						combined += "<think>" + deltaReasoning;
-						thinkOpen = true;
-					} else {
-						combined += deltaReasoning;
-					}
-				}
-				if (deltaContent && deltaContent.length > 0) {
-					if (thinkOpen) {
-						combined += "</think>" + deltaContent;
-						thinkOpen = false;
-					} else {
-						combined += deltaContent;
-					}
-				}
-				if (combined.length > 0) {
-					lastAssistantContent += combined;
-					if (!sawToolCall) {
-						streamedContent = true;
-						yield { type: MessageUpdateType.Stream, token: combined };
-						tokenCount += combined.length;
-					}
-				}
-				// Periodic abort check during streaming
-				if (checkAborted()) {
-					logger.info({ loop, tokenCount }, "[mcp] aborting during stream");
-					return "aborted";
-				}
-			}
-			logger.info(
-				{ sawToolCalls: Object.keys(toolCallState).length > 0, tokens: tokenCount, loop },
-				"[mcp] completion stream closed"
-			);
-			// Check abort after stream completes
-			if (checkAborted()) {
-				logger.info({ loop }, "[mcp] aborting after stream completed");
-				return "aborted";
-			}
-			// Auto-close any unclosed <think> block so reasoning from this loop
-			// doesn't swallow content from subsequent iterations.  The client-side
-			// regex matches `<think>` to end-of-string, so an unclosed block would
-			// hide everything that follows.
-			if (thinkOpen) {
-				if (streamedContent) {
-					yield { type: MessageUpdateType.Stream, token: "</think>" };
-				}
-				lastAssistantContent += "</think>";
-				thinkOpen = false;
-			}
-			if (Object.keys(toolCallState).length > 0) {
-				// If any streamed call is missing id, perform a quick non-stream retry to recover full tool_calls with ids
-				const missingId = Object.values(toolCallState).some((c) => c?.name && !c?.id);
-				let calls: NormalizedToolCall[];
-				if (missingId) {
-					logger.debug(
-						{ loop },
-						"[mcp] missing tool_call id in stream; retrying non-stream to recover ids"
-					);
-					const nonStream = await openai.chat.completions.create(
-						{ ...completionBase, messages: messagesOpenAI, stream: false },
-						{
-							signal: abortSignal,
-							headers: {
-								"ChatUI-Conversation-ID": conv._id.toString(),
-								"X-use-cache": "false",
-								...(locals?.token ? { Authorization: `Bearer ${locals.token}` } : {}),
-							},
-						}
-					);
-					const tc = nonStream.choices?.[0]?.message?.tool_calls ?? [];
-					calls = tc.map((t) => ({
-						id: t.id,
-						name: t.function?.name ?? "",
-						arguments: t.function?.arguments ?? "",
-					}));
-				} else {
-					calls = Object.values(toolCallState)
-						.map((c) => (c?.id && c?.name ? c : undefined))
-						.filter(Boolean)
-						.map((c) => ({
-							id: c?.id ?? "",
-							name: c?.name ?? "",
-							arguments: c?.arguments ?? "",
-						})) as NormalizedToolCall[];
-				}
-				// Include the assistant message with tool_calls so the next round
-				// sees both the calls and their outputs, matching MCP branch behavior.
-				const toolCalls: ChatCompletionMessageToolCall[] = calls.map((call) => ({
-					id: call.id,
-					type: "function",
-					function: { name: call.name, arguments: call.arguments },
-				}));
-				// Avoid sending <think> content back to the model alongside tool_calls
-				// to prevent confusing follow-up reasoning. Strip any think blocks.
-				const assistantContentForToolMsg = lastAssistantContent.replace(
-					/<think>[\s\S]*?(?:<\/think>|$)/g,
-					""
-				);
-				const assistantToolMessage: ChatCompletionMessageParam = {
-					role: "assistant",
-					content: assistantContentForToolMsg,
-					tool_calls: toolCalls,
-				};
-				const exec = executeToolCalls({
-					calls,
-					mapping,
-					servers,
-					parseArgs,
-					resolveFileRef,
-					toPrimitive,
-					processToolOutput,
-					abortSignal,
-				});
-				let toolMsgCount = 0;
-				let toolRunCount = 0;
-				for await (const event of exec) {
-					if (event.type === "update") {
-						yield event.update;
-					} else {
-						messagesOpenAI = [
-							...messagesOpenAI,
-							assistantToolMessage,
-							...(event.summary.toolMessages ?? []),
-						];
-						toolMsgCount = event.summary.toolMessages?.length ?? 0;
-						toolRunCount = event.summary.toolRuns?.length ?? 0;
-						logger.info(
-							{ toolMsgCount, toolRunCount },
-							"[mcp] tools executed; continuing loop for follow-up completion"
-						);
-					}
-					// Check abort during tool execution
-					if (checkAborted()) {
-						logger.info({ loop, toolMsgCount }, "[mcp] aborting during tool execution");
-						return "aborted";
-					}
-				}
-				// Check abort after all tools complete before continuing loop
-				if (checkAborted()) {
-					logger.info({ loop }, "[mcp] aborting after tool execution");
-					return "aborted";
-				}
-				// Emit autopilot step event so the UI can show progress
-				if (autopilot) {
-					yield {
-						type: MessageUpdateType.AutopilotStep,
-						step: loop + 1,
-						maxSteps: maxLoops,
-						toolCount: toolRunCount,
-					};
-				}
-				// Continue loop: next iteration will use tool messages to get the final content
-				continue;
-			}
-			// No tool calls in this iteration
-			// If a <think> block is still open, close it for the final output
-			if (thinkOpen) {
-				lastAssistantContent += "</think>";
-				thinkOpen = false;
-			}
-			// Autopilot auto-continue: if the model stopped to ask a question or
-			// explain what it plans to do instead of calling tools, re-prompt it
-			// to continue executing autonomously.
-			if (autopilot && loop < maxLoops - 1) {
-				const trimmed = lastAssistantContent.replace(/<think>[\s\S]*?(?:<\/think>|$)/g, "").trim();
-				const looksLikeQuestion =
-					trimmed.endsWith("?") ||
-					/\b(shall I|should I|would you like|do you want|let me know|can I)\b/i.test(trimmed);
-				const looksLikePartial =
-					/\b(first|next|then|now I'll|I will|let me|I'm going to|here's my plan)\b/i.test(trimmed);
-				if (looksLikeQuestion || looksLikePartial) {
-					// Stream the partial content so user sees what the model said
-					if (!streamedContent && trimmed.length > 0) {
-						yield { type: MessageUpdateType.Stream, token: lastAssistantContent };
-					}
-					// Add the assistant's response and a continuation prompt
-					messagesOpenAI = [
-						...messagesOpenAI,
-						{ role: "assistant", content: lastAssistantContent },
-						{
-							role: "user",
-							content:
-								"Continue executing autonomously. Do not ask questions — make reasonable assumptions and use tools to complete the task. Proceed now.",
-						},
-					];
-					logger.info(
-						{ loop, looksLikeQuestion, looksLikePartial },
-						"[mcp] autopilot auto-continue: re-prompting model to keep going"
-					);
-					// Emit autopilot step
-					yield {
-						type: MessageUpdateType.AutopilotStep,
-						step: loop + 1,
-						maxSteps: maxLoops,
-						toolCount: 0,
-					};
-					continue;
-				}
-			}
-			if (!streamedContent && lastAssistantContent.trim().length > 0) {
-				yield { type: MessageUpdateType.Stream, token: lastAssistantContent };
-			}
-			yield {
-				type: MessageUpdateType.FinalAnswer,
-				text: lastAssistantContent,
-				interrupted: false,
-			};
-			logger.info(
-				{ length: lastAssistantContent.length, loop },
-				"[mcp] final answer emitted (no tool_calls)"
-			);
-			return "completed";
-		}
-		logger.warn({}, "[mcp] exceeded tool-followup loops; falling back");
-	} catch (err) {
-		const msg = String(err ?? "");
-		const isAbort =
-			(abortSignal && abortSignal.aborted) ||
-			msg.includes("AbortError") ||
-			msg.includes("APIUserAbortError") ||
-			msg.includes("Request was aborted");
-		if (isAbort) {
-			// Expected on user stop; keep logs quiet and do not treat as error
-			logger.debug({}, "[mcp] aborted by user");
-			return "aborted";
-		}
-		logger.warn({ err: msg }, "[mcp] flow failed, falling back to default endpoint");
-	} finally {
-		// ensure MCP clients are closed after the turn
-		await drainPool();
-	}
-	return "not_applicable";
-}
+import { config } from "$lib/server/config";
+import { MessageUpdateType, type MessageUpdate } from "$lib/types/MessageUpdate";
+import { getMcpServers } from "$lib/server/mcp/registry";
+import { isValidUrl } from "$lib/server/urlSafety";
+import { resetMcpToolsCache } from "$lib/server/mcp/tools";
+import { getOpenAiToolsForMcp } from "$lib/server/mcp/tools";
+import type {
+	ChatCompletionChunk,
+	ChatCompletionCreateParamsStreaming,
+	ChatCompletionMessageParam,
+	ChatCompletionMessageToolCall,
+} from "openai/resources/chat/completions";
+import type { Stream } from "openai/streaming";
+import { buildToolPreprompt } from "../utils/toolPrompt";
+import type { EndpointMessage } from "../../endpoints/endpoints";
+import { resolveRouterTarget } from "./routerResolution";
+import { executeToolCalls, type NormalizedToolCall } from "./toolInvocation";
+import { drainPool } from "$lib/server/mcp/clientPool";
+import type { TextGenerationContext } from "../types";
+import {
+	hasAuthHeader,
+	isStrictHfMcpLogin,
+	hasNonEmptyToken,
+	isExaMcpServer,
+} from "$lib/server/mcp/hf";
+import { buildImageRefResolver } from "./fileRefs";
+import { prepareMessagesWithFiles } from "$lib/server/textGeneration/utils/prepareFiles";
+import { makeImageProcessor } from "$lib/server/endpoints/images";
+import { logger } from "$lib/server/logger";
+import { AbortedGenerations } from "$lib/server/abortedGenerations";
+export type RunMcpFlowContext = Pick<
+	TextGenerationContext,
+	"model" | "conv" | "assistant" | "forceMultimodal" | "forceTools" | "provider" | "locals"
+> & { messages: EndpointMessage[] };
+// Return type: "completed" = MCP ran successfully, "not_applicable" = MCP didn't run, "aborted" = user aborted
+export type McpFlowResult = "completed" | "not_applicable" | "aborted";
+export async function* runMcpFlow({
+	model,
+	conv,
+	messages,
+	assistant,
+	forceMultimodal,
+	forceTools,
+	provider,
+	locals,
+	preprompt,
+	abortSignal,
+	abortController,
+	promptedAt,
+	autopilot,
+	autopilotMaxSteps,
+}: RunMcpFlowContext & {
+	preprompt?: string;
+	abortSignal?: AbortSignal;
+	abortController?: AbortController;
+	promptedAt?: Date;
+	autopilot?: boolean;
+	autopilotMaxSteps?: number;
+}): AsyncGenerator<MessageUpdate, McpFlowResult, undefined> {
+	// Helper to check if generation should be aborted via DB polling
+	// Also triggers the abort controller to cancel active streams/requests
+	const checkAborted = (): boolean => {
+		if (abortSignal?.aborted) return true;
+		const abortTime = AbortedGenerations.getInstance().getAbortTime(conv._id.toString());
+		if (abortTime && promptedAt && abortTime > promptedAt) {
+			// Trigger the abort controller to cancel active streams
+			if (abortController && !abortController.signal.aborted) {
+				abortController.abort();
+			}
+			return true;
+		}
+		return false;
+	};
+	// Start from env-configured servers
+	let servers = getMcpServers();
+	try {
+		logger.debug(
+			{ baseServers: servers.map((s) => ({ name: s.name, url: s.url })), count: servers.length },
+			"[mcp] base servers loaded"
+		);
+	} catch {}
+	// Merge in request-provided custom servers (if any)
+	try {
+		const reqMcp = (
+			locals as unknown as {
+				mcp?: {
+					selectedServers?: Array<{ name: string; url: string; headers?: Record<string, string> }>;
+					selectedServerNames?: string[];
+				};
+			}
+		)?.mcp;
+		const custom = Array.isArray(reqMcp?.selectedServers) ? reqMcp?.selectedServers : [];
+		if (custom.length > 0) {
+			// Invalidate cached tool list when the set of servers changes at request-time
+			resetMcpToolsCache();
+			// Deduplicate by server name (request takes precedence)
+			const byName = new Map<
+				string,
+				{ name: string; url: string; headers?: Record<string, string> }
+			>();
+			for (const s of servers) byName.set(s.name, s);
+			for (const s of custom) byName.set(s.name, s);
+			servers = [...byName.values()];
+			try {
+				logger.debug(
+					{
+						customProvidedCount: custom.length,
+						mergedServers: servers.map((s) => ({
+							name: s.name,
+							url: s.url,
+							hasAuth: !!s.headers?.Authorization,
+						})),
+					},
+					"[mcp] merged request-provided servers"
+				);
+			} catch {}
+		}
+		// If the client specified a selection by name, filter to those
+		const names = Array.isArray(reqMcp?.selectedServerNames)
+			? reqMcp?.selectedServerNames
+			: undefined;
+		if (Array.isArray(names)) {
+			const before = servers.map((s) => s.name);
+			servers = servers.filter((s) => names.includes(s.name));
+			try {
+				logger.debug(
+					{ selectedNames: names, before, after: servers.map((s) => s.name) },
+					"[mcp] applied name selection"
+				);
+			} catch {}
+		}
+	} catch {
+		// ignore selection merge errors and proceed with env servers
+	}
+	// If selection/merge yielded no servers, bail early with clearer log
+	if (servers.length === 0) {
+		logger.warn({}, "[mcp] no MCP servers selected after merge/name filter");
+		return "not_applicable";
+	}
+	// Enforce server-side safety (public HTTPS only, no private ranges)
+	{
+		const before = servers.slice();
+		servers = servers.filter((s) => {
+			try {
+				return isValidUrl(s.url);
+			} catch {
+				return false;
+			}
+		});
+		try {
+			const rejected = before.filter((b) => !servers.includes(b));
+			if (rejected.length > 0) {
+				logger.warn(
+					{ rejected: rejected.map((r) => ({ name: r.name, url: r.url })) },
+					"[mcp] rejected servers by URL safety"
+				);
+			}
+		} catch {}
+	}
+	if (servers.length === 0) {
+		logger.warn({}, "[mcp] all selected MCP servers rejected by URL safety guard");
+		return "not_applicable";
+	}
+	// Optionally attach the logged-in user's HF token to the official HF MCP server only.
+	// Never override an explicit Authorization header, and require token to look like an HF token.
+	try {
+		const shouldForward = config.MCP_FORWARD_HF_USER_TOKEN === "true";
+		const userToken =
+			(locals as unknown as { hfAccessToken?: string } | undefined)?.hfAccessToken ??
+			(locals as unknown as { token?: string } | undefined)?.token;
+		if (shouldForward && hasNonEmptyToken(userToken)) {
+			const overlayApplied: string[] = [];
+			servers = servers.map((s) => {
+				try {
+					if (isStrictHfMcpLogin(s.url) && !hasAuthHeader(s.headers)) {
+						overlayApplied.push(s.name);
+						return {
+							...s,
+							headers: { ...(s.headers ?? {}), Authorization: `Bearer ${userToken}` },
+						};
+					}
+				} catch {
+					// ignore URL parse errors and leave server unchanged
+				}
+				return s;
+			});
+			if (overlayApplied.length > 0) {
+				try {
+					logger.debug({ overlayApplied }, "[mcp] forwarded HF token to servers");
+				} catch {}
+			}
+		}
+	} catch {
+		// best-effort overlay; continue if anything goes wrong
+	}
+	// Inject Exa API key for mcp.exa.ai servers via URL param (mcp.exa.ai doesn't support headers)
+	try {
+		const exaApiKey = config.EXA_API_KEY;
+		if (hasNonEmptyToken(exaApiKey)) {
+			const overlayApplied: string[] = [];
+			servers = servers.map((s) => {
+				try {
+					if (isExaMcpServer(s.url)) {
+						const url = new URL(s.url);
+						if (!url.searchParams.has("exaApiKey")) {
+							url.searchParams.set("exaApiKey", exaApiKey);
+							overlayApplied.push(s.name);
+							return { ...s, url: url.toString() };
+						}
+					}
+				} catch {}
+				return s;
+			});
+			if (overlayApplied.length > 0) {
+				logger.debug({ overlayApplied }, "[mcp] injected Exa API key to servers");
+			}
+		}
+	} catch {
+		// best-effort injection; continue if anything goes wrong
+	}
+	logger.debug(
+		{ count: servers.length, servers: servers.map((s) => s.name) },
+		"[mcp] servers configured"
+	);
+	if (servers.length === 0) {
+		return "not_applicable";
+	}
+	// Gate MCP flow based on model tool support (aggregated) with user override
+	try {
+		const supportsTools = Boolean((model as unknown as { supportsTools?: boolean }).supportsTools);
+		const toolsEnabled = Boolean(forceTools) || supportsTools;
+		logger.debug(
+			{
+				model: model.id ?? model.name,
+				supportsTools,
+				forceTools: Boolean(forceTools),
+				toolsEnabled,
+			},
+			"[mcp] tools gate evaluation"
+		);
+		if (!toolsEnabled) {
+			logger.info(
+				{ model: model.id ?? model.name },
+				"[mcp] tools disabled for model; skipping MCP flow"
+			);
+			return "not_applicable";
+		}
+	} catch {
+		// If anything goes wrong reading the flag, proceed (previous behavior)
+	}
+	const resolveFileRef = buildImageRefResolver(messages);
+	const imageProcessor = makeImageProcessor({
+		supportedMimeTypes: ["image/png", "image/jpeg"],
+		preferredMimeType: "image/jpeg",
+		maxSizeInMB: 1,
+		maxWidth: 1024,
+		maxHeight: 1024,
+	});
+	const hasImageInput = messages.some((msg) =>
+		(msg.files ?? []).some(
+			(file) => typeof file?.mime === "string" && file.mime.startsWith("image/")
+		)
+	);
+	const { runMcp, targetModel, candidateModelId, resolvedRoute } = await resolveRouterTarget({
+		model,
+		messages,
+		conversationId: conv._id.toString(),
+		hasImageInput,
+		locals,
+	});
+	if (!runMcp) {
+		logger.info(
+			{ model: targetModel.id ?? targetModel.name, resolvedRoute },
+			"[mcp] runMcp=false (routing chose non-tools candidate)"
+		);
+		return "not_applicable";
+	}
+	try {
+		const { tools: oaTools, mapping } = await getOpenAiToolsForMcp(servers, {
+			signal: abortSignal,
+		});
+		try {
+			logger.info(
+				{ toolCount: oaTools.length, toolNames: oaTools.map((t) => t.function.name) },
+				"[mcp] openai tool defs built"
+			);
+		} catch {}
+		if (oaTools.length === 0) {
+			logger.warn({}, "[mcp] zero tools available after listing; skipping MCP flow");
+			return "not_applicable";
+		}
+		const { OpenAI } = await import("openai");
+		// Capture provider header (x-inference-provider) from the upstream OpenAI-compatible server.
+		let providerHeader: string | undefined;
+		const captureProviderFetch = async (
+			input: RequestInfo | URL,
+			init?: RequestInit
+		): Promise<Response> => {
+			const res = await fetch(input, init);
+			const p = res.headers.get("x-inference-provider");
+			if (p && !providerHeader) providerHeader = p;
+			return res;
+		};
+		const openai = new OpenAI({
+			apiKey: config.OPENAI_API_KEY || config.HF_TOKEN || "sk-",
+			baseURL: config.OPENAI_BASE_URL,
+			fetch: captureProviderFetch,
+			defaultHeaders: {
+				// Bill to organization if configured (HuggingChat only)
+				...(config.isHuggingChat && locals?.billingOrganization
+					? { "X-HF-Bill-To": locals.billingOrganization }
+					: {}),
+			},
+		});
+		const mmEnabled = (forceMultimodal ?? false) || targetModel.multimodal;
+		logger.info(
+			{
+				targetModel: targetModel.id ?? targetModel.name,
+				mmEnabled,
+				route: resolvedRoute,
+				candidateModelId,
+				toolCount: oaTools.length,
+				hasUserToken: Boolean((locals as unknown as { token?: string })?.token),
+			},
+			"[mcp] starting completion with tools"
+		);
+		let messagesOpenAI: ChatCompletionMessageParam[] = await prepareMessagesWithFiles(
+			messages,
+			imageProcessor,
+			mmEnabled
+		);
+		const toolPreprompt = buildToolPreprompt(oaTools, autopilot);
+		const prepromptPieces: string[] = [];
+		if (toolPreprompt.trim().length > 0) {
+			prepromptPieces.push(toolPreprompt);
+		}
+		if (typeof preprompt === "string" && preprompt.trim().length > 0) {
+			prepromptPieces.push(preprompt);
+		}
+		const mergedPreprompt = prepromptPieces.join("\n\n");
+		const hasSystemMessage = messagesOpenAI.length > 0 && messagesOpenAI[0]?.role === "system";
+		if (hasSystemMessage) {
+			if (mergedPreprompt.length > 0) {
+				const existing = messagesOpenAI[0].content ?? "";
+				const existingText = typeof existing === "string" ? existing : "";
+				messagesOpenAI[0].content = mergedPreprompt + (existingText ? "\n\n" + existingText : "");
+			}
+		} else if (mergedPreprompt.length > 0) {
+			messagesOpenAI = [{ role: "system", content: mergedPreprompt }, ...messagesOpenAI];
+		}
+		// Work around servers that reject `system` role
+		if (
+			typeof config.OPENAI_BASE_URL === "string" &&
+			config.OPENAI_BASE_URL.length > 0 &&
+			(config.OPENAI_BASE_URL.includes("hf.space") ||
+				config.OPENAI_BASE_URL.includes("gradio.app")) &&
+			messagesOpenAI[0]?.role === "system"
+		) {
+			messagesOpenAI[0] = { ...messagesOpenAI[0], role: "user" };
+		}
+		const parameters = { ...targetModel.parameters, ...assistant?.generateSettings } as Record<
+			string,
+			unknown
+		>;
+		const maxTokens =
+			(parameters?.max_tokens as number | undefined) ??
+			(parameters?.max_new_tokens as number | undefined) ??
+			(parameters?.max_completion_tokens as number | undefined);
+		const stopSequences =
+			typeof parameters?.stop === "string"
+				? parameters.stop
+				: Array.isArray(parameters?.stop)
+					? (parameters.stop as string[])
+					: undefined;
+		// Build model ID with optional provider suffix (e.g., "model:fastest" or "model:together")
+		const baseModelId = targetModel.id ?? targetModel.name;
+		const modelIdWithProvider =
+			provider && provider !== "auto" ? `${baseModelId}:${provider}` : baseModelId;
+		const completionBase: Omit<ChatCompletionCreateParamsStreaming, "messages"> = {
+			model: modelIdWithProvider,
+			stream: true,
+			temperature: typeof parameters?.temperature === "number" ? parameters.temperature : undefined,
+			top_p: typeof parameters?.top_p === "number" ? parameters.top_p : undefined,
+			frequency_penalty:
+				typeof parameters?.frequency_penalty === "number"
+					? parameters.frequency_penalty
+					: typeof parameters?.repetition_penalty === "number"
+						? parameters.repetition_penalty
+						: undefined,
+			presence_penalty:
+				typeof parameters?.presence_penalty === "number" ? parameters.presence_penalty : undefined,
+			stop: stopSequences,
+			max_tokens: typeof maxTokens === "number" ? maxTokens : undefined,
+			tools: oaTools,
+			tool_choice: "auto",
+		};
+		const toPrimitive = (value: unknown) => {
+			if (typeof value === "string" || typeof value === "number" || typeof value === "boolean") {
+				return value;
+			}
+			return undefined;
+		};
+		const parseArgs = (raw: unknown): Record<string, unknown> => {
+			if (typeof raw !== "string" || raw.trim().length === 0) return {};
+			try {
+				return JSON.parse(raw);
+			} catch {
+				return {};
+			}
+		};
+		const processToolOutput = (
+			text: string
+		): {
+			annotated: string;
+			sources: { index: number; link: string }[];
+		} => ({ annotated: text, sources: [] });
+		let lastAssistantContent = "";
+		let streamedContent = false;
+		// Track whether we're inside a <think> block when the upstream streams
+		// provider-specific reasoning tokens (e.g. `reasoning` or `reasoning_content`).
+		let thinkOpen = false;
+		if (resolvedRoute && candidateModelId) {
+			yield {
+				type: MessageUpdateType.RouterMetadata,
+				route: resolvedRoute,
+				model: candidateModelId,
+			};
+			logger.debug(
+				{ route: resolvedRoute, model: candidateModelId },
+				"[mcp] router metadata emitted"
+			);
+		}
+		// Autopilot loop cap is user-configurable (Settings.autopilotMaxSteps);
+		// fall back to 30 for back-compat when the client doesn't send a value.
+		// Non-autopilot mode keeps a tight 10-loop safety net regardless of caller input.
+		const autopilotCap =
+			typeof autopilotMaxSteps === "number" && autopilotMaxSteps > 0
+				? Math.min(autopilotMaxSteps, 100)
+				: 30;
+		const maxLoops = autopilot ? autopilotCap : 10;
+		for (let loop = 0; loop < maxLoops; loop += 1) {
+			// Check for abort at the start of each loop iteration
+			if (checkAborted()) {
+				logger.info({ loop }, "[mcp] aborting at start of loop iteration");
+				return "aborted";
+			}
+			lastAssistantContent = "";
+			streamedContent = false;
+			const completionRequest: ChatCompletionCreateParamsStreaming = {
+				...completionBase,
+				messages: messagesOpenAI,
+			};
+			const completionStream: Stream<ChatCompletionChunk> = await openai.chat.completions.create(
+				completionRequest,
+				{
+					signal: abortSignal,
+					headers: {
+						"ChatUI-Conversation-ID": conv._id.toString(),
+						"X-use-cache": "false",
+						...(locals?.token ? { Authorization: `Bearer ${locals.token}` } : {}),
+					},
+				}
+			);
+			// If provider header was exposed, notify UI so it can render "via {provider}".
+			if (providerHeader) {
+				yield {
+					type: MessageUpdateType.RouterMetadata,
+					route: "",
+					model: "",
+					provider: providerHeader as unknown as import("@huggingface/inference").InferenceProvider,
+				};
+				logger.debug({ provider: providerHeader }, "[mcp] provider metadata emitted");
+			}
+			const toolCallState: Record<number, { id?: string; name?: string; arguments: string }> = {};
+			let firstToolDeltaLogged = false;
+			let sawToolCall = false;
+			let tokenCount = 0;
+			for await (const chunk of completionStream) {
+				const choice = chunk.choices?.[0];
+				const delta = choice?.delta;
+				if (!delta) continue;
+				const chunkToolCalls = delta.tool_calls ?? [];
+				if (chunkToolCalls.length > 0) {
+					sawToolCall = true;
+					for (const call of chunkToolCalls) {
+						const toolCall = call as unknown as {
+							index?: number;
+							id?: string;
+							function?: { name?: string; arguments?: string };
+						};
+						const index = toolCall.index ?? 0;
+						const current = toolCallState[index] ?? { arguments: "" };
+						if (toolCall.id) current.id = toolCall.id;
+						if (toolCall.function?.name) current.name = toolCall.function.name;
+						if (toolCall.function?.arguments) current.arguments += toolCall.function.arguments;
+						toolCallState[index] = current;
+					}
+					if (!firstToolDeltaLogged) {
+						try {
+							const first =
+								toolCallState[
+									Object.keys(toolCallState)
+										.map((k) => Number(k))
+										.sort((a, b) => a - b)[0] ?? 0
+								];
+							logger.info(
+								{ firstCallName: first?.name, hasId: Boolean(first?.id) },
+								"[mcp] observed streamed tool_call delta"
+							);
+							firstToolDeltaLogged = true;
+						} catch {}
+					}
+				}
+				const deltaContent = (() => {
+					if (typeof delta.content === "string") return delta.content;
+					const maybeParts = delta.content as unknown;
+					if (Array.isArray(maybeParts)) {
+						return maybeParts
+							.map((part) =>
+								typeof part === "object" &&
+								part !== null &&
+								"text" in part &&
+								typeof (part as Record<string, unknown>).text === "string"
+									? String((part as Record<string, unknown>).text)
+									: ""
+							)
+							.join("");
+					}
+					return "";
+				})();
+				// Provider-dependent reasoning fields (e.g., `reasoning` or `reasoning_content`).
+				const deltaReasoning: string =
+					typeof (delta as unknown as Record<string, unknown>)?.reasoning === "string"
+						? ((delta as unknown as { reasoning?: string }).reasoning as string)
+						: typeof (delta as unknown as Record<string, unknown>)?.reasoning_content === "string"
+							? ((delta as unknown as { reasoning_content?: string }).reasoning_content as string)
+							: "";
+				// Merge reasoning + content into a single combined token stream, mirroring
+				// the OpenAI adapter so the UI can auto-detect <think> blocks.
+				let combined = "";
+				if (deltaReasoning.trim().length > 0) {
+					if (!thinkOpen) {
+						combined += "<think>" + deltaReasoning;
+						thinkOpen = true;
+					} else {
+						combined += deltaReasoning;
+					}
+				}
+				if (deltaContent && deltaContent.length > 0) {
+					if (thinkOpen) {
+						combined += "</think>" + deltaContent;
+						thinkOpen = false;
+					} else {
+						combined += deltaContent;
+					}
+				}
+				if (combined.length > 0) {
+					lastAssistantContent += combined;
+					if (!sawToolCall) {
+						streamedContent = true;
+						yield { type: MessageUpdateType.Stream, token: combined };
+						tokenCount += combined.length;
+					}
+				}
+				// Periodic abort check during streaming
+				if (checkAborted()) {
+					logger.info({ loop, tokenCount }, "[mcp] aborting during stream");
+					return "aborted";
+				}
+			}
+			logger.info(
+				{ sawToolCalls: Object.keys(toolCallState).length > 0, tokens: tokenCount, loop },
+				"[mcp] completion stream closed"
+			);
+			// Check abort after stream completes
+			if (checkAborted()) {
+				logger.info({ loop }, "[mcp] aborting after stream completed");
+				return "aborted";
+			}
+			// Auto-close any unclosed <think> block so reasoning from this loop
+			// doesn't swallow content from subsequent iterations.  The client-side
+			// regex matches `<think>` to end-of-string, so an unclosed block would
+			// hide everything that follows.
+			if (thinkOpen) {
+				if (streamedContent) {
+					yield { type: MessageUpdateType.Stream, token: "</think>" };
+				}
+				lastAssistantContent += "</think>";
+				thinkOpen = false;
+			}
+			if (Object.keys(toolCallState).length > 0) {
+				// If any streamed call is missing id, perform a quick non-stream retry to recover full tool_calls with ids
+				const missingId = Object.values(toolCallState).some((c) => c?.name && !c?.id);
+				let calls: NormalizedToolCall[];
+				if (missingId) {
+					logger.debug(
+						{ loop },
+						"[mcp] missing tool_call id in stream; retrying non-stream to recover ids"
+					);
+					const nonStream = await openai.chat.completions.create(
+						{ ...completionBase, messages: messagesOpenAI, stream: false },
+						{
+							signal: abortSignal,
+							headers: {
+								"ChatUI-Conversation-ID": conv._id.toString(),
+								"X-use-cache": "false",
+								...(locals?.token ? { Authorization: `Bearer ${locals.token}` } : {}),
+							},
+						}
+					);
+					const tc = nonStream.choices?.[0]?.message?.tool_calls ?? [];
+					calls = tc.map((t) => ({
+						id: t.id,
+						name: t.function?.name ?? "",
+						arguments: t.function?.arguments ?? "",
+					}));
+				} else {
+					calls = Object.values(toolCallState)
+						.map((c) => (c?.id && c?.name ? c : undefined))
+						.filter(Boolean)
+						.map((c) => ({
+							id: c?.id ?? "",
+							name: c?.name ?? "",
+							arguments: c?.arguments ?? "",
+						})) as NormalizedToolCall[];
+				}
+				// Include the assistant message with tool_calls so the next round
+				// sees both the calls and their outputs, matching MCP branch behavior.
+				const toolCalls: ChatCompletionMessageToolCall[] = calls.map((call) => ({
+					id: call.id,
+					type: "function",
+					function: { name: call.name, arguments: call.arguments },
+				}));
+				// Avoid sending <think> content back to the model alongside tool_calls
+				// to prevent confusing follow-up reasoning. Strip any think blocks.
+				const assistantContentForToolMsg = lastAssistantContent.replace(
+					/<think>[\s\S]*?(?:<\/think>|$)/g,
+					""
+				);
+				const assistantToolMessage: ChatCompletionMessageParam = {
+					role: "assistant",
+					content: assistantContentForToolMsg,
+					tool_calls: toolCalls,
+				};
+				const exec = executeToolCalls({
+					calls,
+					mapping,
+					servers,
+					parseArgs,
+					resolveFileRef,
+					toPrimitive,
+					processToolOutput,
+					abortSignal,
+				});
+				let toolMsgCount = 0;
+				let toolRunCount = 0;
+				for await (const event of exec) {
+					if (event.type === "update") {
+						yield event.update;
+					} else {
+						messagesOpenAI = [
+							...messagesOpenAI,
+							assistantToolMessage,
+							...(event.summary.toolMessages ?? []),
+						];
+						toolMsgCount = event.summary.toolMessages?.length ?? 0;
+						toolRunCount = event.summary.toolRuns?.length ?? 0;
+						logger.info(
+							{ toolMsgCount, toolRunCount },
+							"[mcp] tools executed; continuing loop for follow-up completion"
+						);
+					}
+					// Check abort during tool execution
+					if (checkAborted()) {
+						logger.info({ loop, toolMsgCount }, "[mcp] aborting during tool execution");
+						return "aborted";
+					}
+				}
+				// Check abort after all tools complete before continuing loop
+				if (checkAborted()) {
+					logger.info({ loop }, "[mcp] aborting after tool execution");
+					return "aborted";
+				}
+				// Emit autopilot step event so the UI can show progress
+				if (autopilot) {
+					yield {
+						type: MessageUpdateType.AutopilotStep,
+						step: loop + 1,
+						maxSteps: maxLoops,
+						toolCount: toolRunCount,
+					};
+				}
+				// Continue loop: next iteration will use tool messages to get the final content
+				continue;
+			}
+			// No tool calls in this iteration
+			// If a <think> block is still open, close it for the final output
+			if (thinkOpen) {
+				lastAssistantContent += "</think>";
+				thinkOpen = false;
+			}
+			// Autopilot auto-continue: if the model stopped to ask a question or
+			// explain what it plans to do instead of calling tools, re-prompt it
+			// to continue executing autonomously.
+			if (autopilot && loop < maxLoops - 1) {
+				const trimmed = lastAssistantContent.replace(/<think>[\s\S]*?(?:<\/think>|$)/g, "").trim();
+				const looksLikeQuestion =
+					trimmed.endsWith("?") ||
+					/\b(shall I|should I|would you like|do you want|let me know|can I)\b/i.test(trimmed);
+				const looksLikePartial =
+					/\b(first|next|then|now I'll|I will|let me|I'm going to|here's my plan)\b/i.test(trimmed);
+				if (looksLikeQuestion || looksLikePartial) {
+					// Stream the partial content so user sees what the model said
+					if (!streamedContent && trimmed.length > 0) {
+						yield { type: MessageUpdateType.Stream, token: lastAssistantContent };
+					}
+					// Add the assistant's response and a continuation prompt
+					messagesOpenAI = [
+						...messagesOpenAI,
+						{ role: "assistant", content: lastAssistantContent },
+						{
+							role: "user",
+							content:
+								"Continue executing autonomously. Do not ask questions — make reasonable assumptions and use tools to complete the task. Proceed now.",
+						},
+					];
+					logger.info(
+						{ loop, looksLikeQuestion, looksLikePartial },
+						"[mcp] autopilot auto-continue: re-prompting model to keep going"
+					);
+					// Emit autopilot step
+					yield {
+						type: MessageUpdateType.AutopilotStep,
+						step: loop + 1,
+						maxSteps: maxLoops,
+						toolCount: 0,
+					};
+					continue;
+				}
+			}
+			if (!streamedContent && lastAssistantContent.trim().length > 0) {
+				yield { type: MessageUpdateType.Stream, token: lastAssistantContent };
+			}
+			yield {
+				type: MessageUpdateType.FinalAnswer,
+				text: lastAssistantContent,
+				interrupted: false,
+			};
+			logger.info(
+				{ length: lastAssistantContent.length, loop },
+				"[mcp] final answer emitted (no tool_calls)"
+			);
+			return "completed";
+		}
+		logger.warn({}, "[mcp] exceeded tool-followup loops; falling back");
+	} catch (err) {
+		const msg = String(err ?? "");
+		const isAbort =
+			(abortSignal && abortSignal.aborted) ||
+			msg.includes("AbortError") ||
+			msg.includes("APIUserAbortError") ||
+			msg.includes("Request was aborted");
+		if (isAbort) {
+			// Expected on user stop; keep logs quiet and do not treat as error
+			logger.debug({}, "[mcp] aborted by user");
+			return "aborted";
+		}
+		logger.warn({ err: msg }, "[mcp] flow failed, falling back to default endpoint");
+	} finally {
+		// ensure MCP clients are closed after the turn
+		await drainPool();
+	}
+	return "not_applicable";
+}