npm - @nick3/copilot-api - Versions diffs - 1.2.2 → 1.2.7 - Mend

@nick3/copilot-api 1.2.2 → 1.2.7

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (10) hide show

package/README.md +68 -5
package/dist/{accounts-manager-DellX80M.js → accounts-manager-iJwqQUkM.js} +221 -13
package/dist/accounts-manager-iJwqQUkM.js.map +1 -0
package/dist/main.js +15 -9
package/dist/main.js.map +1 -1
package/dist/{server-dAi_n8ee.js → server-BgJ8vqcw.js} +410 -80
package/dist/server-BgJ8vqcw.js.map +1 -0
package/package.json +1 -1
package/dist/accounts-manager-DellX80M.js.map +0 -1
package/dist/server-dAi_n8ee.js.map +0 -1

package/dist/{server-dAi_n8ee.js → server-BgJ8vqcw.js} RENAMED Viewed

@@ -1,4 +1,4 @@
-import { HTTPError, PATHS, accountFromState, accountsManager, copilotBaseUrl, copilotHeaders, forwardError, getAliasTargetSet, getConfig, getCopilotUsage, getExtraPromptForModel, getModelAliases, getModelAliasesInfo, getModelRefreshIntervalMs, getReasoningEffortForModel, getSmallModel, isForceAgentEnabled, isFreeModelLoadBalancingEnabled, isMessageStartInputTokensFallbackEnabled, isNullish, listAccountsFromRegistry, mergeConfigWithDefaults, shouldCompactUseSmallModel, sleep, state } from "./accounts-manager-DellX80M.js";
+import { HTTPError, PATHS, accountFromState, accountsManager, copilotBaseUrl, copilotHeaders, forwardError, generateRequestIdFromPayload, getAliasTargetSet, getConfig, getCopilotUsage, getExtraPromptForModel, getModelAliases, getModelAliasesInfo, getModelRefreshIntervalMs, getProviderConfig, getReasoningEffortForModel, getRootSessionId, getSmallModel, getUUID, isForceAgentEnabled, isFreeModelLoadBalancingEnabled, isMessageStartInputTokensFallbackEnabled, isNullish, isResponsesApiContextManagementModel, listAccountsFromRegistry, mergeConfigWithDefaults, prepareInteractionHeaders, shouldCompactUseSmallModel, sleep, state } from "./accounts-manager-iJwqQUkM.js";
 import consola from "consola";
 import fs, { readFile } from "node:fs/promises";
 import * as path$1 from "node:path";
@@ -2227,13 +2227,14 @@ const getTokenCount = async (payload, model) => {
 //#endregion
 //#region src/services/copilot/create-responses.ts
-const createResponses = async (payload, { vision, initiator, upstreamRequestId }, account) => {
+const createResponses = async (payload, { vision, initiator, upstreamRequestId, subagentMarker, sessionId }, account) => {
 	const ctx = account ?? accountFromState();
 	if (!ctx.copilotToken) throw new Error("Copilot token not found");
 	const headers = {
 		...copilotHeaders(ctx, vision, upstreamRequestId),
-		"X-Initiator": initiator
+		"x-initiator": initiator
 	};
+	prepareInteractionHeaders(sessionId, Boolean(subagentMarker), headers);
 	payload.service_tier = null;
 	const response = await fetch(`${copilotBaseUrl(ctx)}/responses`, {
 		method: "POST",
@@ -2251,6 +2252,8 @@ const createResponses = async (payload, { vision, initiator, upstreamRequestId }
 //#endregion
 //#region src/routes/messages/responses-translation.ts
 const MESSAGE_TYPE = "message";
+const COMPACTION_SIGNATURE_PREFIX = "cm1#";
+const COMPACTION_SIGNATURE_SEPARATOR = "@";
 const THINKING_TEXT$1 = "Thinking...";
 const translateAnthropicMessagesToResponsesPayload = (payload, modelOverride) => {
 	const model = modelOverride ?? payload.model;
@@ -2282,6 +2285,23 @@ const translateAnthropicMessagesToResponsesPayload = (payload, modelOverride) =>
 		include: ["reasoning.encrypted_content"]
 	};
 };
+const encodeCompactionCarrierSignature = (compaction) => {
+	return `${COMPACTION_SIGNATURE_PREFIX}${compaction.encrypted_content}${COMPACTION_SIGNATURE_SEPARATOR}${compaction.id}`;
+};
+const decodeCompactionCarrierSignature = (signature) => {
+	if (signature.startsWith(COMPACTION_SIGNATURE_PREFIX)) {
+		const raw = signature.slice(4);
+		const separatorIndex = raw.indexOf(COMPACTION_SIGNATURE_SEPARATOR);
+		if (separatorIndex <= 0 || separatorIndex === raw.length - 1) return;
+		const encrypted_content = raw.slice(0, separatorIndex);
+		const id = raw.slice(separatorIndex + 1);
+		if (!encrypted_content) return;
+		return {
+			id,
+			encrypted_content
+		};
+	}
+};
 const translateMessage = (message, model, applyPhase) => {
 	if (message.role === "user") return translateUserMessage(message);
 	return translateAssistantMessage(message, model, applyPhase);
@@ -2318,13 +2338,24 @@ const translateAssistantMessage = (message, model, applyPhase) => {
 			items.push(createFunctionToolCall(block));
 			continue;
 		}
-		if (block.type === "thinking" && block.signature && block.signature.includes("@")) {
-			flushPendingContent(pendingContent, items, {
-				role: "assistant",
-				phase: assistantPhase
-			});
-			items.push(createReasoningContent(block));
-			continue;
+		if (block.type === "thinking" && block.signature) {
+			const compactionContent = createCompactionContent(block);
+			if (compactionContent) {
+				flushPendingContent(pendingContent, items, {
+					role: "assistant",
+					phase: assistantPhase
+				});
+				items.push(compactionContent);
+				continue;
+			}
+			if (block.signature.includes("@")) {
+				flushPendingContent(pendingContent, items, {
+					role: "assistant",
+					phase: assistantPhase
+				});
+				items.push(createReasoningContent(block));
+				continue;
+			}
 		}
 		const converted = translateAssistantContentBlock(block);
 		if (converted) pendingContent.push(converted);
@@ -2384,9 +2415,7 @@ const createImageContent = (block) => ({
 	detail: "auto"
 });
 const createReasoningContent = (block) => {
-	const array = block.signature.split("@");
-	const signature = array[0];
-	const id = array[1];
+	const { encryptedContent, id } = parseReasoningSignature(block.signature);
 	const thinking = block.thinking === THINKING_TEXT$1 ? "" : block.thinking;
 	return {
 		id,
@@ -2395,7 +2424,27 @@ const createReasoningContent = (block) => {
 			type: "summary_text",
 			text: thinking
 		}] : [],
-		encrypted_content: signature
+		encrypted_content: encryptedContent
+	};
+};
+const createCompactionContent = (block) => {
+	const compaction = decodeCompactionCarrierSignature(block.signature);
+	if (!compaction) return;
+	return {
+		id: compaction.id,
+		type: "compaction",
+		encrypted_content: compaction.encrypted_content
+	};
+};
+const parseReasoningSignature = (signature) => {
+	const splitIndex = signature.lastIndexOf("@");
+	if (splitIndex <= 0 || splitIndex === signature.length - 1) return {
+		encryptedContent: signature,
+		id: ""
+	};
+	return {
+		encryptedContent: signature.slice(0, splitIndex),
+		id: signature.slice(splitIndex + 1)
 	};
 };
 const createFunctionToolCall = (block) => ({
@@ -2486,6 +2535,11 @@ const mapOutputToAnthropicContent = (output) => {
 			});
 			break;
 		}
+		case "compaction": {
+			const compactionBlock = createCompactionThinkingBlock(item);
+			if (compactionBlock) contentBlocks.push(compactionBlock);
+			break;
+		}
 		default: {
 			const combinedText = combineMessageTextContent(item.content);
 			if (combinedText.length > 0) contentBlocks.push({
@@ -2543,6 +2597,17 @@ const createToolUseContentBlock = (call) => {
 		input
 	};
 };
+const createCompactionThinkingBlock = (item) => {
+	if (!item.id || !item.encrypted_content) return null;
+	return {
+		type: "thinking",
+		thinking: THINKING_TEXT$1,
+		signature: encodeCompactionCarrierSignature({
+			id: item.id,
+			encrypted_content: item.encrypted_content
+		})
+	};
+};
 const parseFunctionCallArguments = (rawArguments) => {
 	if (typeof rawArguments !== "string" || rawArguments.trim().length === 0) return {};
 	try {
@@ -2647,8 +2712,9 @@ const createChatCompletions = async (payload, account, options) => {
 	const initiator = options?.initiator ?? getChatInitiator(payload.messages);
 	const headers = {
 		...copilotHeaders(ctx, enableVision, options?.upstreamRequestId),
-		"X-Initiator": initiator
+		"x-initiator": options?.subagentMarker ? "agent" : initiator
 	};
+	prepareInteractionHeaders(options?.sessionId, Boolean(options?.subagentMarker), headers);
 	const upstreamPayload = applyDefaultReasoningEffort(payload);
 	const response = await fetch(`${copilotBaseUrl(ctx)}/chat/completions`, {
 		method: "POST",
@@ -2665,7 +2731,7 @@ const createChatCompletions = async (payload, account, options) => {
 //#endregion
 //#region src/routes/chat-completions/handler.ts
-const logger$3 = createHandlerLogger("chat-completions-handler");
+const logger$6 = createHandlerLogger("chat-completions-handler");
 const CHAT_COMPLETIONS_ENDPOINT$1 = "/chat/completions";
 async function handleCompletion$1(c) {
 	await checkRateLimit(state);
@@ -2695,7 +2761,7 @@ async function handleCompletion$1(c) {
 			reason: "MODEL_NOT_SUPPORTED"
 		});
 	}
-	logger$3.debug("Request payload:", JSON.stringify(payload).slice(-400));
+	logger$6.debug("Request payload:", JSON.stringify(payload).slice(-400));
 	const selection = await accountsManager.selectAccountForRequest([{
 		modelId: clientModel,
 		endpoint: CHAT_COMPLETIONS_ENDPOINT$1
@@ -2726,7 +2792,10 @@ async function handleCompletion$1(c) {
 	if (state.manualApprove) await awaitApproval();
 	const payloadWithMaxTokens = applyDefaultMaxTokens(upstreamPayload, selectedModel);
 	const accountCtx = toAccountContext(account);
-	request.upstreamRequestId = randomUUID();
+	const upstreamRequestId = generateRequestIdFromPayload(payloadWithMaxTokens);
+	const upstreamSessionId = getUUID(upstreamRequestId);
+	request.upstreamRequestId = upstreamRequestId;
+	request.upstreamSessionId = upstreamSessionId;
 	if (streamRequested) return handleStreamingRequest({
 		c,
 		store,
@@ -2811,9 +2880,9 @@ function selectionFailureResponse$2(c, params) {
 async function logTokenCountForRequest(params) {
 	try {
 		const tokenCount = await getTokenCount(params.payload, params.selectedModel);
-		logger$3.info("Current token count:", tokenCount);
+		logger$6.info("Current token count:", tokenCount);
 	} catch (error) {
-		logger$3.warn("Failed to calculate token count:", error);
+		logger$6.warn("Failed to calculate token count:", error);
 	}
 }
 function applyDefaultMaxTokens(payload, selectedModel) {
@@ -2822,14 +2891,17 @@ function applyDefaultMaxTokens(payload, selectedModel) {
 		...payload,
 		max_tokens: selectedModel.capabilities.limits.max_output_tokens
 	};
-	logger$3.debug("Set max_tokens to:", JSON.stringify(updated.max_tokens));
+	logger$6.debug("Set max_tokens to:", JSON.stringify(updated.max_tokens));
 	return updated;
 }
 async function handleStreamingRequest(params) {
 	const { c, store, request, payload, selection, accountCtx, clientModel, premiumRemainingBefore, premiumUnlimitedBefore } = params;
 	let response;
 	try {
-		response = await createChatCompletions(payload, accountCtx, { upstreamRequestId: request.upstreamRequestId });
+		response = await createChatCompletions(payload, accountCtx, {
+			upstreamRequestId: request.upstreamRequestId,
+			sessionId: request.upstreamSessionId
+		});
 	} catch (error) {
 		return handleUpstreamCreateError$1({
 			store,
@@ -2851,7 +2923,7 @@ async function handleStreamingRequest(params) {
 		premiumUnlimitedBefore,
 		response
 	});
-	logger$3.debug("Streaming response");
+	logger$6.debug("Streaming response");
 	return streamSSE(c, (stream) => streamChatCompletionsAndLog$1({
 		stream,
 		response,
@@ -2904,7 +2976,7 @@ async function handleNonStreamingUpstreamResponse(params) {
 	let errorMessage;
 	const finishedAtMs = Date.now();
 	try {
-		logger$3.debug("Non-streaming response:", JSON.stringify(response));
+		logger$6.debug("Non-streaming response:", JSON.stringify(response));
 		return c.json(response);
 	} catch (error) {
 		const details = extractErrorDetails(error);
@@ -2954,7 +3026,7 @@ async function streamChatCompletionsAndLog$1(params) {
 			if (ttfbMs === void 0) ttfbMs = Date.now() - request.startedAtMs;
 			const usage = await extractUsageFromChunk(chunk);
 			if (usage) lastUsage = usage;
-			logger$3.debug("Streaming chunk:", JSON.stringify(chunk));
+			logger$6.debug("Streaming chunk:", JSON.stringify(chunk));
 			await stream.writeSSE(chunk);
 		}
 	} catch (error) {
@@ -2962,7 +3034,7 @@ async function streamChatCompletionsAndLog$1(params) {
 		errorName = details.errorName;
 		errorStatus = details.errorStatus;
 		errorMessage = details.errorMessage;
-		logger$3.warn("Streaming error:", error);
+		logger$6.warn("Streaming error:", error);
 	} finally {
 		const finishedAtMs = Date.now();
 		await accountsManager.finalizeQuota(account, reservation);
@@ -3013,16 +3085,19 @@ async function handleNonStreamingRequest(params) {
 	let errorMessage;
 	let finishedAtMs;
 	try {
-		const response = await createChatCompletions(payload, accountCtx, { upstreamRequestId: request.upstreamRequestId });
+		const response = await createChatCompletions(payload, accountCtx, {
+			upstreamRequestId: request.upstreamRequestId,
+			sessionId: request.upstreamSessionId
+		});
 		finishedAtMs = Date.now();
 		if (!isNonStreaming$1(response)) {
-			logger$3.debug("Unexpected streaming response");
+			logger$6.debug("Unexpected streaming response");
 			return streamSSE(c, async (stream) => {
 				for await (const chunk of response) await stream.writeSSE(chunk);
 			});
 		}
 		usage = normalizeChatCompletionsUsage(response.usage);
-		logger$3.debug("Non-streaming response:", JSON.stringify(response));
+		logger$6.debug("Non-streaming response:", JSON.stringify(response));
 		return c.json(response);
 	} catch (error) {
 		finishedAtMs = Date.now();
@@ -3294,11 +3369,11 @@ const mergeToolResultForClaude = (anthropicPayload) => {
 		msg.content = mergeToolResult(toolResults, textBlocks);
 	}
 };
-const estimateInputTokens = async (payload, selectedModel, logger$4) => {
+const estimateInputTokens = async (payload, selectedModel, logger$7) => {
 	try {
 		return (await getTokenCount(payload, selectedModel)).input;
 	} catch (error) {
-		logger$4.warn("Failed to estimate input tokens for message_start", error);
+		logger$7.warn("Failed to estimate input tokens for message_start", error);
 		return;
 	}
 };
@@ -3716,8 +3791,34 @@ const handleOutputItemAdded$1 = (rawEvent, state$1) => {
 const handleOutputItemDone$1 = (rawEvent, state$1) => {
 	const events$1 = new Array();
 	const item = rawEvent.item;
-	if (item.type !== "reasoning") return events$1;
+	const itemType = item.type;
 	const outputIndex = rawEvent.output_index;
+	if (itemType === "compaction") {
+		if (!item.id || !item.encrypted_content) return events$1;
+		const blockIndex$1 = openThinkingBlockIfNeeded(state$1, outputIndex, events$1);
+		if (!state$1.blockHasDelta.has(blockIndex$1)) events$1.push({
+			type: "content_block_delta",
+			index: blockIndex$1,
+			delta: {
+				type: "thinking_delta",
+				thinking: THINKING_TEXT$1
+			}
+		});
+		events$1.push({
+			type: "content_block_delta",
+			index: blockIndex$1,
+			delta: {
+				type: "signature_delta",
+				signature: encodeCompactionCarrierSignature({
+					id: item.id,
+					encrypted_content: item.encrypted_content
+				})
+			}
+		});
+		state$1.blockHasDelta.add(blockIndex$1);
+		return events$1;
+	}
+	if (itemType !== "reasoning") return events$1;
 	const blockIndex = openThinkingBlockIfNeeded(state$1, outputIndex, events$1);
 	const signature = (item.encrypted_content ?? "") + "@" + item.id;
 	if (signature) {
@@ -4065,6 +4166,31 @@ const isAgentRole = (item) => {
 const hasVisionInput = (payload) => {
 	return getPayloadItems(payload).some((item) => containsVisionContent(item));
 };
+const resolveResponsesCompactThreshold = (maxPromptTokens) => {
+	if (typeof maxPromptTokens === "number" && maxPromptTokens > 0) return Math.floor(maxPromptTokens * .9);
+	return 5e4;
+};
+const createCompactionContextManagement = (compactThreshold) => [{
+	type: "compaction",
+	compact_threshold: compactThreshold
+}];
+const applyResponsesApiContextManagement = (payload, maxPromptTokens) => {
+	if (payload.context_management !== void 0) return;
+	if (!isResponsesApiContextManagementModel(payload.model)) return;
+	payload.context_management = createCompactionContextManagement(resolveResponsesCompactThreshold(maxPromptTokens));
+};
+const compactInputByLatestCompaction = (payload) => {
+	if (!Array.isArray(payload.input) || payload.input.length === 0) return;
+	const latestCompactionMessageIndex = getLatestCompactionMessageIndex(payload.input);
+	if (latestCompactionMessageIndex === void 0) return;
+	payload.input = payload.input.slice(latestCompactionMessageIndex);
+};
+const getLatestCompactionMessageIndex = (input) => {
+	for (let index = input.length - 1; index >= 0; index -= 1) if (isCompactionInputItem(input[index])) return index;
+};
+const isCompactionInputItem = (value) => {
+	return "type" in value && typeof value.type === "string" && value.type === "compaction";
+};
 const getPayloadItems = (payload) => {
 	const result = [];
 	const { input } = payload;
@@ -4113,8 +4239,9 @@ const createMessages = async (payload, account, options) => {
 	const initiator = options?.initiator ?? getMessagesInitiator(payload);
 	const headers = {
 		...copilotHeaders(ctx, enableVision, options?.upstreamRequestId),
-		"X-Initiator": initiator
+		"x-initiator": options?.subagentMarker ? "agent" : initiator
 	};
+	prepareInteractionHeaders(options?.sessionId, Boolean(options?.subagentMarker), headers);
 	const anthropicBeta = buildAnthropicBetaHeader(options?.anthropicBetaHeader, payload.thinking);
 	if (anthropicBeta) headers["anthropic-beta"] = anthropicBeta;
 	const response = await fetch(`${copilotBaseUrl(ctx)}/v1/messages`, {
@@ -4434,7 +4561,7 @@ const parseSubagentMarkerFromSystemReminder = (text) => {
 //#endregion
 //#region src/routes/messages/handler.ts
-const logger$2 = createHandlerLogger("messages-handler");
+const logger$5 = createHandlerLogger("messages-handler");
 const CHAT_COMPLETIONS_ENDPOINT = "/chat/completions";
 const RESPONSES_ENDPOINT$1 = "/responses";
 const MESSAGES_ENDPOINT = "/v1/messages";
@@ -4449,17 +4576,21 @@ async function handleCompletion(c) {
 	const { ip: clientIp, source: clientIpSource } = getClientIpInfo(c);
 	const userAgent = c.req.header("user-agent") ?? void 0;
 	const anthropicPayload = await c.req.json();
-	logger$2.debug("Anthropic request payload:", JSON.stringify(anthropicPayload));
+	logger$5.debug("Anthropic request payload:", JSON.stringify(anthropicPayload));
 	const subagentMarker = parseSubagentMarkerFromFirstUser(anthropicPayload);
 	const initiatorOverride = subagentMarker ? "agent" : void 0;
-	if (subagentMarker) logger$2.debug("Detected Subagent marker:", JSON.stringify(subagentMarker));
+	if (subagentMarker) logger$5.debug("Detected Subagent marker:", JSON.stringify(subagentMarker));
+	const sessionId = getRootSessionId(anthropicPayload, c);
+	logger$5.debug("Extracted session ID:", sessionId);
 	const anthropicBeta = c.req.header("anthropic-beta");
 	const isCompact = isCompactRequest(anthropicPayload);
 	if (anthropicBeta && isWarmupProbeRequest(anthropicPayload)) anthropicPayload.model = getSmallModel();
 	if (isCompact) {
-		logger$2.debug("Is compact request:", isCompact);
+		logger$5.debug("Is compact request:", isCompact);
 		if (shouldCompactUseSmallModel()) anthropicPayload.model = getSmallModel();
 	} else mergeToolResultForClaude(anthropicPayload);
+	const upstreamRequestId = generateRequestIdFromPayload(anthropicPayload, sessionId);
+	logger$5.debug("Generated request ID:", upstreamRequestId);
 	const clientModel = anthropicPayload.model;
 	const streamRequested = Boolean(anthropicPayload.stream);
 	const rawUserId = anthropicPayload.metadata?.user_id;
@@ -4543,6 +4674,7 @@ async function handleCompletion(c) {
 		upstreamEndpoint: endpoint,
 		upstreamModel: selectedModel.id,
 		costUnits,
+		upstreamRequestId,
 		premiumRemainingBefore,
 		premiumUnlimitedBefore
 	};
@@ -4551,6 +4683,8 @@ async function handleCompletion(c) {
 		anthropicPayload,
 		anthropicBetaHeader: anthropicBeta ?? void 0,
 		initiatorOverride,
+		subagentMarker,
+		sessionId,
 		instr,
 		selectedModel
 	});
@@ -4559,6 +4693,8 @@ async function handleCompletion(c) {
 		anthropicPayload,
 		openAIPayload,
 		initiatorOverride,
+		subagentMarker,
+		sessionId,
 		selectedModel,
 		instr
 	});
@@ -4566,23 +4702,25 @@ async function handleCompletion(c) {
 		c,
 		openAIPayload,
 		initiatorOverride,
+		subagentMarker,
+		sessionId,
 		selectedModel,
 		instr
 	});
 }
 const handleWithChatCompletions = async (params) => {
-	const { c, openAIPayload, initiatorOverride, selectedModel, instr } = params;
-	logger$2.debug("Translated OpenAI request payload:", JSON.stringify(openAIPayload));
+	const { c, openAIPayload, initiatorOverride, subagentMarker, sessionId, selectedModel, instr } = params;
+	logger$5.debug("Translated OpenAI request payload:", JSON.stringify(openAIPayload));
 	const ctx = toAccountContext(instr.account);
 	const initiator = initiatorOverride ?? getChatInitiator(openAIPayload.messages);
-	const upstreamRequestId = randomUUID();
 	instr.initiator = initiator;
-	instr.upstreamRequestId = upstreamRequestId;
 	let response;
 	try {
 		response = await createChatCompletions(openAIPayload, ctx, {
-			upstreamRequestId,
-			initiator
+			upstreamRequestId: instr.upstreamRequestId,
+			initiator,
+			subagentMarker,
+			sessionId
 		});
 	} catch (error) {
 		return await handleChatCompletionsCreateError({
@@ -4596,9 +4734,9 @@ const handleWithChatCompletions = async (params) => {
 		response,
 		instr
 	});
-	logger$2.debug("Streaming response from Copilot");
+	logger$5.debug("Streaming response from Copilot");
 	const fallbackEnabled = isMessageStartInputTokensFallbackEnabled();
-	const estimatedInputTokens = fallbackEnabled ? await estimateInputTokens(openAIPayload, selectedModel, logger$2) : void 0;
+	const estimatedInputTokens = fallbackEnabled ? await estimateInputTokens(openAIPayload, selectedModel, logger$5) : void 0;
 	const historicalUsage = fallbackEnabled && instr.promptCacheKey && instr.safetyIdentifier ? instr.store.getLastCompletedUsageBySession({
 		promptCacheKey: instr.promptCacheKey,
 		safetyIdentifier: instr.safetyIdentifier,
@@ -4613,21 +4751,23 @@ const handleWithChatCompletions = async (params) => {
 	}));
 };
 const handleWithResponsesApi = async (params) => {
-	const { c, anthropicPayload, openAIPayload, initiatorOverride, selectedModel, instr } = params;
+	const { c, anthropicPayload, openAIPayload, initiatorOverride, subagentMarker, sessionId, selectedModel, instr } = params;
 	const responsesPayload = translateAnthropicMessagesToResponsesPayload(anthropicPayload, selectedModel.id);
-	logger$2.debug("Translated Responses payload:", JSON.stringify(responsesPayload));
+	applyResponsesApiContextManagement(responsesPayload, selectedModel.capabilities.limits.max_prompt_tokens);
+	compactInputByLatestCompaction(responsesPayload);
+	logger$5.debug("Translated Responses payload:", JSON.stringify(responsesPayload));
 	const { vision, initiator } = getResponsesRequestOptions(responsesPayload);
 	const resolvedInitiator = initiatorOverride ?? initiator;
 	const ctx = toAccountContext(instr.account);
-	const upstreamRequestId = randomUUID();
 	instr.initiator = resolvedInitiator;
-	instr.upstreamRequestId = upstreamRequestId;
 	let response;
 	try {
 		response = await createResponses(responsesPayload, {
 			vision,
 			initiator: resolvedInitiator,
-			upstreamRequestId
+			upstreamRequestId: instr.upstreamRequestId,
+			subagentMarker,
+			sessionId
 		}, ctx);
 	} catch (error) {
 		return await handleResponsesCreateError({
@@ -4637,9 +4777,9 @@ const handleWithResponsesApi = async (params) => {
 		});
 	}
 	if (responsesPayload.stream && isAsyncIterable$1(response)) {
-		logger$2.debug("Streaming response from Copilot (Responses API)");
+		logger$5.debug("Streaming response from Copilot (Responses API)");
 		const fallbackEnabled = isMessageStartInputTokensFallbackEnabled();
-		const estimatedInputTokens = fallbackEnabled ? await estimateInputTokens(openAIPayload, selectedModel, logger$2) : void 0;
+		const estimatedInputTokens = fallbackEnabled ? await estimateInputTokens(openAIPayload, selectedModel, logger$5) : void 0;
 		const historicalUsage = fallbackEnabled && instr.promptCacheKey && instr.safetyIdentifier ? instr.store.getLastCompletedUsageBySession({
 			promptCacheKey: instr.promptCacheKey,
 			safetyIdentifier: instr.safetyIdentifier,
@@ -4724,9 +4864,9 @@ async function handleChatCompletionsNonStreaming(params) {
 	let errorMessage;
 	const finishedAtMs = Date.now();
 	try {
-		logger$2.debug("Non-streaming response from Copilot:", JSON.stringify(response));
+		logger$5.debug("Non-streaming response from Copilot:", JSON.stringify(response));
 		const anthropicResponse = translateToAnthropic(response);
-		logger$2.debug("Translated Anthropic response:", JSON.stringify(anthropicResponse));
+		logger$5.debug("Translated Anthropic response:", JSON.stringify(anthropicResponse));
 		return c.json(anthropicResponse);
 	} catch (error) {
 		const details = extractErrorDetails(error);
@@ -4774,7 +4914,7 @@ async function streamChatCompletionsAndLog(params) {
 	try {
 		for await (const rawEvent of response) {
 			if (ttfbMs === void 0) ttfbMs = Date.now() - instr.startedAtMs;
-			logger$2.debug("Copilot raw stream event:", JSON.stringify(rawEvent));
+			logger$5.debug("Copilot raw stream event:", JSON.stringify(rawEvent));
 			const { data: rawData } = rawEvent;
 			const data = typeof rawData === "string" ? rawData : await rawData;
 			if (data === "[DONE]") break;
@@ -4783,7 +4923,7 @@ async function streamChatCompletionsAndLog(params) {
 			if (chunk.usage) lastUsage = normalizeChatCompletionsUsage(chunk.usage);
 			const events$1 = translateChunkToAnthropicEvents(chunk, streamState);
 			for (const event of events$1) {
-				logger$2.debug("Translated Anthropic event:", JSON.stringify(event));
+				logger$5.debug("Translated Anthropic event:", JSON.stringify(event));
 				await stream.writeSSE({
 					event: event.type,
 					data: JSON.stringify(event)
@@ -4795,7 +4935,7 @@ async function streamChatCompletionsAndLog(params) {
 		errorName = details.errorName;
 		errorStatus = details.errorStatus;
 		errorMessage = details.errorMessage;
-		logger$2.warn("Streaming error:", error);
+		logger$5.warn("Streaming error:", error);
 		if (details.unauthorized) accountsManager.markAccountFailed(instr.account.id, "Unauthorized (401)");
 	} finally {
 		const finishedAtMs = Date.now();
@@ -4846,9 +4986,9 @@ async function handleResponsesNonStreaming(params) {
 	const finishedAtMs = Date.now();
 	try {
 		usage = extractResponsesUsageFromResult(result);
-		logger$2.debug("Non-streaming Responses result:", JSON.stringify(result).slice(-400));
+		logger$5.debug("Non-streaming Responses result:", JSON.stringify(result).slice(-400));
 		const anthropicResponse = translateResponsesResultToAnthropic(result);
-		logger$2.debug("Translated Anthropic response:", JSON.stringify(anthropicResponse));
+		logger$5.debug("Translated Anthropic response:", JSON.stringify(anthropicResponse));
 		return c.json(anthropicResponse);
 	} catch (error) {
 		const details = extractErrorDetails(error);
@@ -4878,7 +5018,7 @@ async function handleResponsesNonStreaming(params) {
 async function ensureResponsesStreamCompleted(params) {
 	const { stream, streamState, setStreamError } = params;
 	if (streamState.messageCompleted) return;
-	logger$2.warn("Responses stream ended without completion; sending error event");
+	logger$5.warn("Responses stream ended without completion; sending error event");
 	const msg = "Responses stream ended without completion";
 	const errorEvent = buildErrorEvent(msg);
 	setStreamError("StreamIncomplete", msg);
@@ -4911,21 +5051,21 @@ async function streamResponsesAndLog$1(params) {
 			}
 			const data = chunk.data;
 			if (!data) continue;
-			logger$2.debug("Responses raw stream event:", data);
+			logger$5.debug("Responses raw stream event:", data);
 			const parsed = JSON.parse(data);
 			const u = extractResponsesUsageFromStreamEvent(parsed);
 			if (u.usageJson) lastUsage = u;
 			const events$1 = translateResponsesStreamEvent(parsed, streamState);
 			for (const event of events$1) {
 				const eventData = JSON.stringify(event);
-				logger$2.debug("Translated Anthropic event:", eventData);
+				logger$5.debug("Translated Anthropic event:", eventData);
 				await stream.writeSSE({
 					event: event.type,
 					data: eventData
 				});
 			}
 			if (streamState.messageCompleted) {
-				logger$2.debug("Message completed, ending stream");
+				logger$5.debug("Message completed, ending stream");
 				break;
 			}
 		}
@@ -4942,7 +5082,7 @@ async function streamResponsesAndLog$1(params) {
 		errorName = details.errorName;
 		errorStatus = details.errorStatus;
 		errorMessage = details.errorMessage;
-		logger$2.warn("Streaming error:", error);
+		logger$5.warn("Streaming error:", error);
 		if (details.unauthorized) accountsManager.markAccountFailed(instr.account.id, "Unauthorized (401)");
 	} finally {
 		const finishedAtMs = Date.now();
@@ -4992,7 +5132,7 @@ async function handleMessagesNonStreaming(params) {
 	let errorMessage;
 	const finishedAtMs = Date.now();
 	try {
-		logger$2.debug("Non-streaming Messages result:", JSON.stringify(response).slice(-400));
+		logger$5.debug("Non-streaming Messages result:", JSON.stringify(response).slice(-400));
 		return c.json(response);
 	} catch (error) {
 		const details = extractErrorDetails(error);
@@ -5026,7 +5166,7 @@ const parseMessagesStreamUsage = (data) => {
 		if (parsed.type !== "message_delta" || !parsed.usage) return null;
 		return normalizeMessagesUsage(parsed.usage);
 	} catch (error) {
-		logger$2.warn("Failed to parse messages stream event", error);
+		logger$5.warn("Failed to parse messages stream event", error);
 		return null;
 	}
 };
@@ -5043,7 +5183,7 @@ async function streamMessagesAndLog(params) {
 			const eventNameRaw = rawEvent.event;
 			const eventName = typeof eventNameRaw === "string" && eventNameRaw.length > 0 ? eventNameRaw : "message";
 			const data = rawEvent.data ?? "";
-			logger$2.debug("Messages raw stream event:", data);
+			logger$5.debug("Messages raw stream event:", data);
 			const usage = parseMessagesStreamUsage(data);
 			if (usage) lastUsage = usage;
 			await stream.writeSSE({
@@ -5056,7 +5196,7 @@ async function streamMessagesAndLog(params) {
 		errorName = details.errorName;
 		errorStatus = details.errorStatus;
 		errorMessage = details.errorMessage;
-		logger$2.warn("Streaming error:", error);
+		logger$5.warn("Streaming error:", error);
 		if (details.unauthorized) accountsManager.markAccountFailed(instr.account.id, "Unauthorized (401)");
 	} finally {
 		const finishedAtMs = Date.now();
@@ -5078,27 +5218,31 @@ async function streamMessagesAndLog(params) {
 	}
 }
 const handleWithMessagesApi = async (params) => {
-	const { c, anthropicPayload, anthropicBetaHeader, initiatorOverride, instr, selectedModel } = params;
+	const { c, anthropicPayload, anthropicBetaHeader, initiatorOverride, subagentMarker, sessionId, instr, selectedModel } = params;
 	for (const msg of anthropicPayload.messages) if (msg.role === "assistant" && Array.isArray(msg.content)) msg.content = msg.content.filter((block) => {
 		if (block.type !== "thinking") return true;
 		return block.thinking && block.thinking !== "Thinking..." && block.signature && !block.signature.includes("@");
 	});
-	if (selectedModel.capabilities.supports.adaptive_thinking) {
+	const toolChoice = anthropicPayload.tool_choice;
+	if (toolChoice?.type === "any" || toolChoice?.type === "tool") {
+		delete anthropicPayload.thinking;
+		delete anthropicPayload.output_config;
+	} else if (selectedModel.capabilities.supports.adaptive_thinking) {
 		anthropicPayload.thinking = { type: "adaptive" };
 		anthropicPayload.output_config = { effort: getAnthropicEffortForModel(anthropicPayload.model) };
 	}
-	logger$2.debug("Translated Messages payload:", JSON.stringify(anthropicPayload));
+	logger$5.debug("Translated Messages payload:", JSON.stringify(anthropicPayload));
 	const ctx = toAccountContext(instr.account);
-	const upstreamRequestId = randomUUID();
 	const initiator = initiatorOverride ?? getMessagesInitiator(anthropicPayload);
 	instr.initiator = initiator;
-	instr.upstreamRequestId = upstreamRequestId;
 	let response;
 	try {
 		response = await createMessages(anthropicPayload, ctx, {
 			anthropicBetaHeader,
-			upstreamRequestId,
-			initiator
+			upstreamRequestId: instr.upstreamRequestId,
+			initiator,
+			subagentMarker,
+			sessionId
 		});
 	} catch (error) {
 		return await handleMessagesCreateError({
@@ -5108,7 +5252,7 @@ const handleWithMessagesApi = async (params) => {
 		});
 	}
 	if (isAsyncIterable$1(response)) {
-		logger$2.debug("Streaming response from Copilot (Messages API)");
+		logger$5.debug("Streaming response from Copilot (Messages API)");
 		return streamSSE(c, (stream) => streamMessagesAndLog({
 			stream,
 			response,
@@ -5192,6 +5336,182 @@ modelRoutes.get("/", async (c) => {
 	}
 });
+//#endregion
+//#region src/routes/provider/messages/count-tokens-handler.ts
+const logger$4 = createHandlerLogger("provider-count-tokens-handler");
+const createFallbackModel = (modelId) => ({
+	capabilities: {
+		family: "provider",
+		limits: {},
+		object: "model_capabilities",
+		supports: {},
+		tokenizer: "o200k_base",
+		type: "chat"
+	},
+	id: modelId,
+	model_picker_enabled: false,
+	name: modelId,
+	object: "model",
+	preview: false,
+	vendor: "provider",
+	version: "unknown"
+});
+async function handleProviderCountTokens(c) {
+	const provider = c.req.param("provider");
+	try {
+		const anthropicPayload = await c.req.json();
+		const openAIPayload = translateToOpenAI(anthropicPayload);
+		const modelId = anthropicPayload.model.trim();
+		let selectedModel = state.models?.data.find((model) => model.id === modelId);
+		if (!selectedModel && modelId) selectedModel = createFallbackModel(modelId);
+		if (!selectedModel) {
+			logger$4.warn("provider.count_tokens.model_not_found", {
+				provider,
+				model: anthropicPayload.model
+			});
+			return c.json({ input_tokens: 1 });
+		}
+		const tokenCount = await getTokenCount(openAIPayload, selectedModel);
+		const finalTokenCount = tokenCount.input + tokenCount.output;
+		logger$4.debug("provider.count_tokens.success", {
+			provider,
+			model: anthropicPayload.model,
+			input_tokens: finalTokenCount
+		});
+		return c.json({ input_tokens: finalTokenCount });
+	} catch (error) {
+		logger$4.error("provider.count_tokens.error", {
+			provider,
+			error
+		});
+		return c.json({ input_tokens: 1 });
+	}
+}
+//#endregion
+//#region src/services/providers/anthropic-proxy.ts
+const FORWARDABLE_HEADERS = [
+	"anthropic-version",
+	"anthropic-beta",
+	"accept",
+	"user-agent"
+];
+function buildProviderUpstreamHeaders(providerConfig, requestHeaders) {
+	const headers = {
+		"content-type": "application/json",
+		accept: "application/json",
+		"x-api-key": providerConfig.apiKey
+	};
+	for (const headerName of FORWARDABLE_HEADERS) {
+		const headerValue = requestHeaders.get(headerName);
+		if (headerValue) headers[headerName] = headerValue;
+	}
+	return headers;
+}
+async function forwardProviderMessages(providerConfig, payload, requestHeaders) {
+	return await fetch(`${providerConfig.baseUrl}/v1/messages`, {
+		method: "POST",
+		headers: buildProviderUpstreamHeaders(providerConfig, requestHeaders),
+		body: JSON.stringify(payload)
+	});
+}
+async function forwardProviderModels(providerConfig, requestHeaders) {
+	return await fetch(`${providerConfig.baseUrl}/v1/models`, {
+		method: "GET",
+		headers: buildProviderUpstreamHeaders(providerConfig, requestHeaders)
+	});
+}
+//#endregion
+//#region src/routes/provider/messages/handler.ts
+const logger$3 = createHandlerLogger("provider-messages-handler");
+async function handleProviderMessages(c) {
+	const provider = c.req.param("provider");
+	const providerConfig = getProviderConfig(provider);
+	if (!providerConfig) return c.json({ error: {
+		message: `Provider '${provider}' not found or disabled`,
+		type: "invalid_request_error"
+	} }, 404);
+	try {
+		const payload = await c.req.json();
+		payload.temperature ??= providerConfig.defaultTemperature;
+		payload.top_p ??= providerConfig.defaultTopP;
+		payload.top_k ??= providerConfig.defaultTopK;
+		logger$3.debug("provider.messages.request", JSON.stringify({
+			payload,
+			provider
+		}));
+		const upstreamResponse = await forwardProviderMessages(providerConfig, payload, c.req.raw.headers);
+		const contentType = upstreamResponse.headers.get("content-type") ?? "";
+		if (Boolean(payload.stream) && contentType.includes("text/event-stream")) {
+			logger$3.debug("provider.messages.streaming");
+			return streamSSE(c, async (stream) => {
+				for await (const event of events(upstreamResponse)) {
+					const eventName = event.event;
+					const data = event.data ?? "";
+					logger$3.debug("provider.messages.raw_stream_event", data);
+					await stream.writeSSE({
+						event: eventName,
+						data
+					});
+				}
+			});
+		}
+		return upstreamResponse;
+	} catch (error) {
+		logger$3.error("provider.messages.error", {
+			provider,
+			error
+		});
+		throw error;
+	}
+}
+//#endregion
+//#region src/routes/provider/messages/route.ts
+const providerMessageRoutes = new Hono();
+providerMessageRoutes.post("/", async (c) => {
+	try {
+		return await handleProviderMessages(c);
+	} catch (error) {
+		return await forwardError(c, error);
+	}
+});
+providerMessageRoutes.post("/count_tokens", async (c) => {
+	try {
+		return await handleProviderCountTokens(c);
+	} catch (error) {
+		return await forwardError(c, error);
+	}
+});
+//#endregion
+//#region src/routes/provider/models/route.ts
+const logger$2 = createHandlerLogger("provider-models-handler");
+const providerModelRoutes = new Hono();
+providerModelRoutes.get("/", async (c) => {
+	const provider = c.req.param("provider") ?? "";
+	try {
+		const providerConfig = getProviderConfig(provider);
+		if (!providerConfig) return c.json({ error: {
+			message: `Provider '${provider}' not found or disabled`,
+			type: "invalid_request_error"
+		} }, 404);
+		const upstreamResponse = await forwardProviderModels(providerConfig, c.req.raw.headers);
+		logger$2.debug("provider.models.response", {
+			provider,
+			statusCode: upstreamResponse.status
+		});
+		return upstreamResponse;
+	} catch (error) {
+		logger$2.error("provider.models.error", {
+			provider,
+			error
+		});
+		return await forwardError(c, error);
+	}
+});
 //#endregion
 //#region src/routes/responses/stream-id-sync.ts
 const createStreamIdTracker = () => ({ outputItems: /* @__PURE__ */ new Map() });
@@ -5241,6 +5561,7 @@ const handleResponses = async (c) => {
 	const clientModel = payload.model;
 	logger$1.debug("Responses request payload:", JSON.stringify(payload));
 	removeWebSearchTool(payload);
+	compactInputByLatestCompaction(payload);
 	const streamRequested = Boolean(payload.stream);
 	const { initiator: initialInitiator } = getResponsesRequestOptions(payload);
 	const userId = payload.metadata?.user_id;
@@ -5282,13 +5603,18 @@ const handleResponses = async (c) => {
 		model: selectedModel.id
 	};
 	useFunctionApplyPatch(upstreamPayload);
+	applyResponsesApiContextManagement(upstreamPayload, selectedModel.capabilities.limits.max_prompt_tokens);
+	compactInputByLatestCompaction(upstreamPayload);
 	const premiumRemainingBefore = account.premiumRemaining;
 	const premiumUnlimitedBefore = account.unlimited;
 	const { vision, initiator } = getResponsesRequestOptions(upstreamPayload);
 	request.initiator = initiator;
 	if (state.manualApprove) await awaitApproval();
 	const accountCtx = toAccountContext(account);
-	request.upstreamRequestId = randomUUID();
+	const upstreamRequestId = generateRequestIdFromPayload({ messages: upstreamPayload.input });
+	const upstreamSessionId = getUUID(upstreamRequestId);
+	request.upstreamRequestId = upstreamRequestId;
+	request.upstreamSessionId = upstreamSessionId;
 	if (streamRequested) return handleStreamingResponses({
 		c,
 		store,
@@ -5399,7 +5725,8 @@ async function handleStreamingResponses(params) {
 		response = await createResponses(payload, {
 			vision,
 			initiator,
-			upstreamRequestId: request.upstreamRequestId
+			upstreamRequestId: request.upstreamRequestId,
+			sessionId: request.upstreamSessionId
 		}, accountCtx);
 	} catch (error) {
 		return handleUpstreamCreateError({
@@ -5584,7 +5911,8 @@ async function handleNonStreamingResponses(params) {
 		const response = await createResponses(payload, {
 			vision,
 			initiator,
-			upstreamRequestId: request.upstreamRequestId
+			upstreamRequestId: request.upstreamRequestId,
+			sessionId: request.upstreamSessionId
 		}, accountCtx);
 		finishedAtMs = Date.now();
 		const streamResponse = handleUnexpectedResponsesStream(c, response);
@@ -5764,7 +6092,9 @@ server.route("/v1/models", modelRoutes);
 server.route("/v1/embeddings", embeddingRoutes);
 server.route("/v1/responses", responsesRoutes);
 server.route("/v1/messages", messageRoutes);
+server.route("/:provider/v1/messages", providerMessageRoutes);
+server.route("/:provider/v1/models", providerModelRoutes);
 //#endregion
 export { server };
-//# sourceMappingURL=server-dAi_n8ee.js.map
+//# sourceMappingURL=server-BgJ8vqcw.js.map