npm - @clinebot/llms - Versions diffs - 0.0.0 - Mend

@clinebot/llms 0.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (219) hide show

package/README.md +198 -0
package/dist/config-browser.d.ts +3 -0
package/dist/config.d.ts +3 -0
package/dist/index.browser.d.ts +4 -0
package/dist/index.browser.js +1 -0
package/dist/index.d.ts +5 -0
package/dist/index.js +7 -0
package/dist/models/generated-access.d.ts +4 -0
package/dist/models/generated-provider-loaders.d.ts +13 -0
package/dist/models/generated.d.ts +14 -0
package/dist/models/index.d.ts +43 -0
package/dist/models/models-dev-catalog.d.ts +32 -0
package/dist/models/providers/aihubmix.d.ts +5 -0
package/dist/models/providers/anthropic.d.ts +53 -0
package/dist/models/providers/asksage.d.ts +5 -0
package/dist/models/providers/baseten.d.ts +5 -0
package/dist/models/providers/bedrock.d.ts +7 -0
package/dist/models/providers/cerebras.d.ts +7 -0
package/dist/models/providers/claude-code.d.ts +4 -0
package/dist/models/providers/cline.d.ts +34 -0
package/dist/models/providers/deepseek.d.ts +8 -0
package/dist/models/providers/dify.d.ts +5 -0
package/dist/models/providers/doubao.d.ts +7 -0
package/dist/models/providers/fireworks.d.ts +8 -0
package/dist/models/providers/gemini.d.ts +9 -0
package/dist/models/providers/groq.d.ts +8 -0
package/dist/models/providers/hicap.d.ts +5 -0
package/dist/models/providers/huawei-cloud-maas.d.ts +5 -0
package/dist/models/providers/huggingface.d.ts +6 -0
package/dist/models/providers/index.d.ts +45 -0
package/dist/models/providers/litellm.d.ts +5 -0
package/dist/models/providers/lmstudio.d.ts +5 -0
package/dist/models/providers/minimax.d.ts +7 -0
package/dist/models/providers/mistral.d.ts +5 -0
package/dist/models/providers/moonshot.d.ts +7 -0
package/dist/models/providers/nebius.d.ts +7 -0
package/dist/models/providers/nous-research.d.ts +7 -0
package/dist/models/providers/oca.d.ts +9 -0
package/dist/models/providers/ollama.d.ts +5 -0
package/dist/models/providers/openai-codex.d.ts +10 -0
package/dist/models/providers/openai.d.ts +9 -0
package/dist/models/providers/opencode.d.ts +10 -0
package/dist/models/providers/openrouter.d.ts +7 -0
package/dist/models/providers/qwen-code.d.ts +7 -0
package/dist/models/providers/qwen.d.ts +7 -0
package/dist/models/providers/requesty.d.ts +6 -0
package/dist/models/providers/sambanova.d.ts +7 -0
package/dist/models/providers/sapaicore.d.ts +7 -0
package/dist/models/providers/together.d.ts +8 -0
package/dist/models/providers/vercel-ai-gateway.d.ts +5 -0
package/dist/models/providers/vertex.d.ts +7 -0
package/dist/models/providers/xai.d.ts +8 -0
package/dist/models/providers/zai.d.ts +7 -0
package/dist/models/query.d.ts +181 -0
package/dist/models/registry.d.ts +123 -0
package/dist/models/schemas/index.d.ts +7 -0
package/dist/models/schemas/model.d.ts +340 -0
package/dist/models/schemas/query.d.ts +191 -0
package/dist/providers/handlers/ai-sdk-community.d.ts +46 -0
package/dist/providers/handlers/ai-sdk-provider-base.d.ts +32 -0
package/dist/providers/handlers/anthropic-base.d.ts +26 -0
package/dist/providers/handlers/asksage.d.ts +12 -0
package/dist/providers/handlers/auth.d.ts +5 -0
package/dist/providers/handlers/base.d.ts +55 -0
package/dist/providers/handlers/bedrock-base.d.ts +23 -0
package/dist/providers/handlers/bedrock-client.d.ts +4 -0
package/dist/providers/handlers/community-sdk.d.ts +97 -0
package/dist/providers/handlers/fetch-base.d.ts +18 -0
package/dist/providers/handlers/gemini-base.d.ts +25 -0
package/dist/providers/handlers/index.d.ts +19 -0
package/dist/providers/handlers/openai-base.d.ts +54 -0
package/dist/providers/handlers/openai-responses.d.ts +64 -0
package/dist/providers/handlers/providers.d.ts +43 -0
package/dist/providers/handlers/r1-base.d.ts +62 -0
package/dist/providers/handlers/registry.d.ts +106 -0
package/dist/providers/handlers/vertex.d.ts +32 -0
package/dist/providers/index.d.ts +100 -0
package/dist/providers/public.browser.d.ts +2 -0
package/dist/providers/public.d.ts +3 -0
package/dist/providers/shared/openai-compatible.d.ts +10 -0
package/dist/providers/transform/ai-sdk-community-format.d.ts +9 -0
package/dist/providers/transform/anthropic-format.d.ts +24 -0
package/dist/providers/transform/content-format.d.ts +3 -0
package/dist/providers/transform/gemini-format.d.ts +19 -0
package/dist/providers/transform/index.d.ts +10 -0
package/dist/providers/transform/openai-format.d.ts +36 -0
package/dist/providers/transform/r1-format.d.ts +26 -0
package/dist/providers/types/config.d.ts +261 -0
package/dist/providers/types/handler.d.ts +71 -0
package/dist/providers/types/index.d.ts +11 -0
package/dist/providers/types/messages.d.ts +139 -0
package/dist/providers/types/model-info.d.ts +32 -0
package/dist/providers/types/provider-ids.d.ts +63 -0
package/dist/providers/types/settings.d.ts +308 -0
package/dist/providers/types/stream.d.ts +106 -0
package/dist/providers/utils/index.d.ts +7 -0
package/dist/providers/utils/retry.d.ts +38 -0
package/dist/providers/utils/stream-processor.d.ts +110 -0
package/dist/providers/utils/tool-processor.d.ts +34 -0
package/dist/sdk.d.ts +18 -0
package/dist/types.d.ts +60 -0
package/package.json +66 -0
package/src/catalog.ts +20 -0
package/src/config-browser.ts +11 -0
package/src/config.ts +49 -0
package/src/index.browser.ts +9 -0
package/src/index.ts +10 -0
package/src/live-providers.test.ts +137 -0
package/src/models/generated-access.ts +41 -0
package/src/models/generated-provider-loaders.ts +166 -0
package/src/models/generated.ts +11997 -0
package/src/models/index.ts +271 -0
package/src/models/models-dev-catalog.test.ts +161 -0
package/src/models/models-dev-catalog.ts +161 -0
package/src/models/providers/aihubmix.ts +19 -0
package/src/models/providers/anthropic.ts +60 -0
package/src/models/providers/asksage.ts +19 -0
package/src/models/providers/baseten.ts +21 -0
package/src/models/providers/bedrock.ts +30 -0
package/src/models/providers/cerebras.ts +24 -0
package/src/models/providers/claude-code.ts +51 -0
package/src/models/providers/cline.ts +25 -0
package/src/models/providers/deepseek.ts +33 -0
package/src/models/providers/dify.ts +17 -0
package/src/models/providers/doubao.ts +33 -0
package/src/models/providers/fireworks.ts +34 -0
package/src/models/providers/gemini.ts +43 -0
package/src/models/providers/groq.ts +33 -0
package/src/models/providers/hicap.ts +18 -0
package/src/models/providers/huawei-cloud-maas.ts +18 -0
package/src/models/providers/huggingface.ts +22 -0
package/src/models/providers/index.ts +162 -0
package/src/models/providers/litellm.ts +19 -0
package/src/models/providers/lmstudio.ts +22 -0
package/src/models/providers/minimax.ts +34 -0
package/src/models/providers/mistral.ts +19 -0
package/src/models/providers/moonshot.ts +34 -0
package/src/models/providers/nebius.ts +24 -0
package/src/models/providers/nous-research.ts +21 -0
package/src/models/providers/oca.ts +30 -0
package/src/models/providers/ollama.ts +18 -0
package/src/models/providers/openai-codex.ts +30 -0
package/src/models/providers/openai.ts +43 -0
package/src/models/providers/opencode.ts +28 -0
package/src/models/providers/openrouter.ts +24 -0
package/src/models/providers/qwen-code.ts +33 -0
package/src/models/providers/qwen.ts +34 -0
package/src/models/providers/requesty.ts +23 -0
package/src/models/providers/sambanova.ts +23 -0
package/src/models/providers/sapaicore.ts +34 -0
package/src/models/providers/together.ts +35 -0
package/src/models/providers/vercel-ai-gateway.ts +23 -0
package/src/models/providers/vertex.ts +36 -0
package/src/models/providers/xai.ts +34 -0
package/src/models/providers/zai.ts +25 -0
package/src/models/query.ts +407 -0
package/src/models/registry.ts +511 -0
package/src/models/schemas/index.ts +62 -0
package/src/models/schemas/model.ts +308 -0
package/src/models/schemas/query.ts +336 -0
package/src/providers/browser.ts +4 -0
package/src/providers/handlers/ai-sdk-community.ts +226 -0
package/src/providers/handlers/ai-sdk-provider-base.ts +193 -0
package/src/providers/handlers/anthropic-base.ts +372 -0
package/src/providers/handlers/asksage.test.ts +103 -0
package/src/providers/handlers/asksage.ts +138 -0
package/src/providers/handlers/auth.test.ts +19 -0
package/src/providers/handlers/auth.ts +121 -0
package/src/providers/handlers/base.test.ts +46 -0
package/src/providers/handlers/base.ts +160 -0
package/src/providers/handlers/bedrock-base.ts +390 -0
package/src/providers/handlers/bedrock-client.ts +100 -0
package/src/providers/handlers/codex.test.ts +123 -0
package/src/providers/handlers/community-sdk.test.ts +288 -0
package/src/providers/handlers/community-sdk.ts +392 -0
package/src/providers/handlers/fetch-base.ts +68 -0
package/src/providers/handlers/gemini-base.ts +302 -0
package/src/providers/handlers/index.ts +67 -0
package/src/providers/handlers/openai-base.ts +277 -0
package/src/providers/handlers/openai-responses.ts +598 -0
package/src/providers/handlers/providers.test.ts +120 -0
package/src/providers/handlers/providers.ts +563 -0
package/src/providers/handlers/r1-base.ts +280 -0
package/src/providers/handlers/registry.ts +185 -0
package/src/providers/handlers/vertex.test.ts +124 -0
package/src/providers/handlers/vertex.ts +292 -0
package/src/providers/index.ts +534 -0
package/src/providers/public.browser.ts +20 -0
package/src/providers/public.ts +51 -0
package/src/providers/shared/openai-compatible.ts +63 -0
package/src/providers/transform/ai-sdk-community-format.test.ts +73 -0
package/src/providers/transform/ai-sdk-community-format.ts +115 -0
package/src/providers/transform/anthropic-format.ts +218 -0
package/src/providers/transform/content-format.ts +34 -0
package/src/providers/transform/format-conversion.test.ts +310 -0
package/src/providers/transform/gemini-format.ts +167 -0
package/src/providers/transform/index.ts +22 -0
package/src/providers/transform/openai-format.ts +247 -0
package/src/providers/transform/r1-format.ts +287 -0
package/src/providers/types/config.ts +388 -0
package/src/providers/types/handler.ts +87 -0
package/src/providers/types/index.ts +120 -0
package/src/providers/types/messages.ts +158 -0
package/src/providers/types/model-info.test.ts +57 -0
package/src/providers/types/model-info.ts +65 -0
package/src/providers/types/provider-ids.test.ts +12 -0
package/src/providers/types/provider-ids.ts +89 -0
package/src/providers/types/settings.test.ts +49 -0
package/src/providers/types/settings.ts +533 -0
package/src/providers/types/stream.ts +117 -0
package/src/providers/utils/index.ts +27 -0
package/src/providers/utils/retry.test.ts +140 -0
package/src/providers/utils/retry.ts +188 -0
package/src/providers/utils/stream-processor.test.ts +232 -0
package/src/providers/utils/stream-processor.ts +472 -0
package/src/providers/utils/tool-processor.test.ts +34 -0
package/src/providers/utils/tool-processor.ts +111 -0
package/src/sdk.ts +264 -0
package/src/types.ts +79 -0

package/src/providers/handlers/anthropic-base.ts ADDED Viewed

@@ -0,0 +1,372 @@
+/**
+ * Anthropic Base Handler
+ *
+ * Handler for Anthropic's API using the official SDK.
+ * Supports prompt caching, extended thinking, and native tool calling.
+ */
+import { Anthropic } from "@anthropic-ai/sdk";
+import type {
+	Tool as AnthropicTool,
+	RawMessageStreamEvent,
+} from "@anthropic-ai/sdk/resources";
+import {
+	convertToAnthropicMessages,
+	convertToolsToAnthropic,
+} from "../transform/anthropic-format";
+import {
+	type ApiStream,
+	type HandlerModelInfo,
+	hasModelCapability,
+	type ProviderConfig,
+	supportsModelThinking,
+} from "../types";
+import type { Message, ToolDefinition } from "../types/messages";
+import { retryStream } from "../utils/retry";
+import { getMissingApiKeyError, resolveApiKeyForProvider } from "./auth";
+import { BaseHandler } from "./base";
+const DEFAULT_THINKING_BUDGET_TOKENS = 1024;
+const THINKING_DEBUG_ENV = "CLINE_DEBUG_THINKING";
+function isThinkingDebugEnabled(): boolean {
+	const raw = process.env[THINKING_DEBUG_ENV];
+	if (!raw) {
+		return false;
+	}
+	const normalized = raw.trim().toLowerCase();
+	return normalized === "1" || normalized === "true" || normalized === "yes";
+}
+/**
+ * Handler for Anthropic's API
+ */
+export class AnthropicHandler extends BaseHandler {
+	private client: Anthropic | undefined;
+	private ensureClient(): Anthropic {
+		if (!this.client) {
+			const apiKey = resolveApiKeyForProvider(
+				this.config.providerId,
+				this.config.apiKey,
+			);
+			if (!apiKey) {
+				throw new Error(getMissingApiKeyError(this.config.providerId));
+			}
+			this.client = new Anthropic({
+				apiKey,
+				baseURL: this.config.baseUrl || undefined,
+				defaultHeaders: this.getRequestHeaders(),
+			});
+		}
+		return this.client;
+	}
+	getModel(): HandlerModelInfo {
+		const modelId = this.config.modelId;
+		const knownModels = this.config.knownModels ?? {};
+		const fallbackModel = knownModels[modelId] ?? {};
+		const modelInfo = this.config.modelInfo ?? fallbackModel;
+		return { id: modelId, info: { ...modelInfo, id: modelId } };
+	}
+	getMessages(
+		_systemPrompt: string,
+		messages: Message[],
+	): Anthropic.MessageParam[] {
+		const supportsPromptCache = hasModelCapability(
+			this.getModel().info,
+			"prompt-cache",
+		);
+		return convertToAnthropicMessages(
+			messages,
+			supportsPromptCache,
+		) as Anthropic.MessageParam[];
+	}
+	async *createMessage(
+		systemPrompt: string,
+		messages: Message[],
+		tools?: ToolDefinition[],
+	): ApiStream {
+		yield* retryStream(() =>
+			this.createMessageInternal(systemPrompt, messages, tools),
+		);
+	}
+	private async *createMessageInternal(
+		systemPrompt: string,
+		messages: Message[],
+		tools?: ToolDefinition[],
+	): ApiStream {
+		const client = this.ensureClient();
+		const model = this.getModel();
+		const abortSignal = this.getAbortSignal();
+		const responseId = this.createResponseId();
+		const thinkingSupported = supportsModelThinking(model.info);
+		const requestedBudget =
+			this.config.thinkingBudgetTokens ??
+			(this.config.thinking ? DEFAULT_THINKING_BUDGET_TOKENS : 0);
+		const budgetTokens =
+			thinkingSupported && requestedBudget > 0 ? requestedBudget : 0;
+		const nativeToolsOn = tools && tools.length > 0;
+		const supportsPromptCache = hasModelCapability(model.info, "prompt-cache");
+		const reasoningOn = thinkingSupported && budgetTokens > 0;
+		const debugThinking = isThinkingDebugEnabled();
+		const debugChunkCounts: Record<string, number> = {};
+		const countChunk = (type: string): void => {
+			debugChunkCounts[type] = (debugChunkCounts[type] ?? 0) + 1;
+		};
+		if (debugThinking) {
+			console.error(
+				`[thinking-debug][anthropic][request] model=${model.id} thinkingFlag=${this.config.thinking === true} supportsModelThinking=${thinkingSupported} requestedBudget=${requestedBudget} effectiveBudget=${budgetTokens} reasoningOn=${reasoningOn} promptCache=${supportsPromptCache}`,
+			);
+		}
+		// Convert messages
+		const anthropicMessages = this.getMessages(systemPrompt, messages);
+		// Convert tools
+		const anthropicTools: AnthropicTool[] | undefined = nativeToolsOn
+			? convertToolsToAnthropic(tools)
+			: undefined;
+		// Request options with abort signal
+		const requestOptions = { signal: abortSignal };
+		// Create the request
+		const stream = await client.messages.create(
+			{
+				model: model.id,
+				thinking: reasoningOn
+					? { type: "enabled", budget_tokens: budgetTokens }
+					: undefined,
+				max_tokens: model.info.maxTokens || 8192,
+				temperature: reasoningOn ? undefined : 0,
+				system: supportsPromptCache
+					? [
+							{
+								text: systemPrompt,
+								type: "text",
+								cache_control: { type: "ephemeral" },
+							},
+						]
+					: [{ text: systemPrompt, type: "text" }],
+				messages: anthropicMessages as Anthropic.MessageParam[],
+				stream: true,
+				tools: anthropicTools,
+				tool_choice:
+					nativeToolsOn && !reasoningOn ? { type: "auto" } : undefined,
+			},
+			requestOptions,
+		);
+		// Track tool call state
+		const currentToolCall = { id: "", name: "", arguments: "" };
+		const usageSnapshot = {
+			inputTokens: 0,
+			outputTokens: 0,
+			cacheReadTokens: 0,
+			cacheWriteTokens: 0,
+		};
+		for await (const chunk of stream) {
+			if (debugThinking) {
+				countChunk(`event:${chunk.type}`);
+				if (chunk.type === "content_block_start") {
+					countChunk(
+						`content_block_start:${chunk.content_block?.type ?? "unknown"}`,
+					);
+				} else if (chunk.type === "content_block_delta") {
+					countChunk(`content_block_delta:${chunk.delta?.type ?? "unknown"}`);
+				}
+			}
+			yield* this.withResponseIdForAll(
+				this.processChunk(chunk, currentToolCall, usageSnapshot, responseId),
+				responseId,
+			);
+		}
+		if (debugThinking) {
+			const summary = Object.entries(debugChunkCounts)
+				.map(([key, count]) => `${key}=${count}`)
+				.sort()
+				.join(" ");
+			console.error(`[thinking-debug][anthropic][stream] ${summary}`);
+		}
+		// Yield done chunk to indicate streaming completed successfully
+		yield { type: "done", success: true, id: responseId };
+	}
+	private *processChunk(
+		chunk: RawMessageStreamEvent,
+		currentToolCall: { id: string; name: string; arguments: string },
+		usageSnapshot: {
+			inputTokens: number;
+			outputTokens: number;
+			cacheReadTokens: number;
+			cacheWriteTokens: number;
+		},
+		responseId: string,
+	): Generator<import("../types").ApiStreamChunk> {
+		switch (chunk.type) {
+			case "message_start": {
+				const usage = chunk.message.usage;
+				usageSnapshot.inputTokens = usage.input_tokens || 0;
+				usageSnapshot.outputTokens = usage.output_tokens || 0;
+				usageSnapshot.cacheWriteTokens =
+					(usage as any).cache_creation_input_tokens || 0;
+				usageSnapshot.cacheReadTokens =
+					(usage as any).cache_read_input_tokens || 0;
+				yield {
+					type: "usage",
+					inputTokens: usageSnapshot.inputTokens,
+					outputTokens: usageSnapshot.outputTokens,
+					cacheWriteTokens: usageSnapshot.cacheWriteTokens,
+					cacheReadTokens: usageSnapshot.cacheReadTokens,
+					totalCost: this.calculateCost(
+						usageSnapshot.inputTokens,
+						usageSnapshot.outputTokens,
+						usageSnapshot.cacheReadTokens,
+					),
+					id: responseId,
+				};
+				break;
+			}
+			case "message_delta": {
+				usageSnapshot.outputTokens =
+					chunk.usage.output_tokens || usageSnapshot.outputTokens;
+				yield {
+					type: "usage",
+					inputTokens: usageSnapshot.inputTokens,
+					outputTokens: usageSnapshot.outputTokens,
+					cacheWriteTokens: usageSnapshot.cacheWriteTokens,
+					cacheReadTokens: usageSnapshot.cacheReadTokens,
+					totalCost: this.calculateCost(
+						usageSnapshot.inputTokens,
+						usageSnapshot.outputTokens,
+						usageSnapshot.cacheReadTokens,
+					),
+					id: responseId,
+				};
+				break;
+			}
+			case "content_block_start": {
+				const block = chunk.content_block;
+				switch (block.type) {
+					case "thinking":
+						yield {
+							type: "reasoning",
+							reasoning:
+								typeof (block as { thinking?: unknown }).thinking === "string"
+									? ((block as { thinking: string }).thinking ?? "")
+									: "",
+							signature:
+								typeof (block as { signature?: unknown }).signature === "string"
+									? ((block as { signature: string }).signature ?? undefined)
+									: undefined,
+							id: responseId,
+						};
+						break;
+					case "redacted_thinking":
+						yield {
+							type: "reasoning",
+							reasoning: "",
+							redacted_data:
+								typeof (block as { data?: unknown }).data === "string"
+									? ((block as { data: string }).data ?? undefined)
+									: undefined,
+							id: responseId,
+						};
+						break;
+					case "text":
+						yield { type: "text", text: "", id: responseId };
+						break;
+					case "tool_use":
+						currentToolCall.id = block.id;
+						currentToolCall.name = block.name;
+						currentToolCall.arguments = "";
+						break;
+				}
+				break;
+			}
+			case "content_block_delta": {
+				const delta = chunk.delta;
+				switch (delta.type) {
+					case "thinking_delta":
+						yield {
+							type: "reasoning",
+							reasoning: delta.thinking,
+							id: responseId,
+						};
+						break;
+					case "signature_delta":
+						yield {
+							type: "reasoning",
+							reasoning: "",
+							signature:
+								typeof (delta as { signature?: unknown }).signature === "string"
+									? ((delta as { signature: string }).signature ?? undefined)
+									: undefined,
+							id: responseId,
+						};
+						break;
+					case "text_delta":
+						yield { type: "text", text: delta.text, id: responseId };
+						break;
+					case "input_json_delta":
+						currentToolCall.arguments += delta.partial_json;
+						break;
+				}
+				break;
+			}
+			case "content_block_stop": {
+				// If we have a tool call, yield it
+				if (currentToolCall.id) {
+					let parsedArgs: Record<string, unknown>;
+					try {
+						parsedArgs = JSON.parse(currentToolCall.arguments || "{}");
+					} catch {
+						parsedArgs = {};
+					}
+					yield {
+						type: "tool_calls",
+						id: responseId,
+						tool_call: {
+							call_id: currentToolCall.id,
+							function: {
+								name: currentToolCall.name,
+								arguments: parsedArgs,
+							},
+						},
+					};
+					// Reset tool call state
+					currentToolCall.id = "";
+					currentToolCall.name = "";
+					currentToolCall.arguments = "";
+				}
+				break;
+			}
+		}
+	}
+}
+/**
+ * Create an Anthropic handler
+ */
+export function createAnthropicHandler(
+	config: ProviderConfig,
+): AnthropicHandler {
+	return new AnthropicHandler(config);
+}

package/src/providers/handlers/asksage.test.ts ADDED Viewed

@@ -0,0 +1,103 @@
+import { beforeEach, describe, expect, it, vi } from "vitest";
+import { createHandler } from "../index";
+import type { ApiStreamChunk } from "../types";
+import { AskSageHandler } from "./asksage";
+vi.mock("./auth", async () => {
+	const actual = await vi.importActual("./auth");
+	return {
+		...(actual as object),
+		resolveApiKeyForProvider: (_providerId: string, explicitApiKey?: string) =>
+			explicitApiKey?.trim() || undefined,
+	};
+});
+describe("AskSageHandler", () => {
+	beforeEach(() => {
+		vi.restoreAllMocks();
+	});
+	it("formats request payload and emits text/usage/done chunks", async () => {
+		const fetchMock = vi.fn(async () => ({
+			ok: true,
+			json: async () => ({
+				message: "final answer",
+				tool_responses: [{ name: "search", ok: true }],
+				usage: {
+					model_tokens: {
+						prompt_tokens: 123,
+						completion_tokens: 45,
+						total_tokens: 168,
+					},
+					asksage_tokens: 17.5,
+				},
+			}),
+		}));
+		globalThis.fetch = fetchMock as unknown as typeof fetch;
+		const handler = new AskSageHandler({
+			providerId: "asksage",
+			modelId: "gpt-4o",
+			apiKey: "ask-key",
+		});
+		const chunks: ApiStreamChunk[] = [];
+		for await (const chunk of handler.createMessage("system prompt", [
+			{ role: "user", content: [{ type: "text", text: "hello" }] },
+			{ role: "assistant", content: "hi there" },
+		])) {
+			chunks.push(chunk);
+		}
+		expect(fetchMock).toHaveBeenCalledTimes(1);
+		const [url, init] = fetchMock.mock.calls[0] as unknown as [
+			string,
+			RequestInit & { body?: string },
+		];
+		expect(url).toBe("https://api.asksage.ai/server/query");
+		expect(init.method).toBe("POST");
+		expect(init.headers).toMatchObject({
+			"Content-Type": "application/json",
+			"x-access-tokens": "ask-key",
+		});
+		expect(JSON.parse(init.body ?? "{}")).toEqual({
+			system_prompt: "system prompt",
+			message: [
+				{ user: "me", message: "hello" },
+				{ user: "gpt", message: "hi there" },
+			],
+			model: "gpt-4o",
+			dataset: "none",
+			usage: true,
+		});
+		expect(chunks.map((chunk) => chunk.type)).toEqual([
+			"text",
+			"text",
+			"usage",
+			"done",
+		]);
+	});
+	it("is used by createHandler for built-in asksage provider id", () => {
+		const handler = createHandler({
+			providerId: "asksage",
+			modelId: "gpt-4o",
+			apiKey: "ask-key",
+		});
+		expect(handler).toBeInstanceOf(AskSageHandler);
+	});
+	it("throws when API key is missing", async () => {
+		const handler = new AskSageHandler({
+			providerId: "asksage",
+			modelId: "gpt-4o",
+		});
+		await expect(async () => {
+			for await (const _chunk of handler.createMessage("system", [])) {
+				// noop
+			}
+		}).rejects.toThrow("AskSage API key is required");
+	});
+});

package/src/providers/handlers/asksage.ts ADDED Viewed

@@ -0,0 +1,138 @@
+import type { ApiStream, HandlerModelInfo, ProviderConfig } from "../types";
+import type { ContentBlock, Message } from "../types/messages";
+import { resolveApiKeyForProvider } from "./auth";
+import { FetchBaseHandler } from "./fetch-base";
+export const DEFAULT_ASKSAGE_BASE_URL = "https://api.asksage.ai/server";
+const DEFAULT_ASKSAGE_MODEL_ID = "gpt-4o";
+type AskSageRequest = {
+	system_prompt: string;
+	message: Array<{
+		user: "gpt" | "me";
+		message: string;
+	}>;
+	model: string;
+	dataset: "none";
+	usage: boolean;
+};
+type AskSageUsage = {
+	model_tokens: {
+		completion_tokens: number;
+		prompt_tokens: number;
+		total_tokens: number;
+	};
+	asksage_tokens: number;
+};
+type AskSageResponse = {
+	message?: string;
+	usage?: AskSageUsage | null;
+	tool_responses?: unknown[];
+};
+export class AskSageHandler extends FetchBaseHandler {
+	protected getDefaultBaseUrl(): string {
+		return DEFAULT_ASKSAGE_BASE_URL;
+	}
+	getModel(): HandlerModelInfo {
+		const modelId = this.config.modelId?.trim() || DEFAULT_ASKSAGE_MODEL_ID;
+		const modelInfo = this.config.modelInfo ??
+			this.config.knownModels?.[modelId] ?? {
+				id: modelId,
+				capabilities: ["tools"],
+			};
+		return { id: modelId, info: { ...modelInfo, id: modelId } };
+	}
+	protected getJsonHeaders(
+		extra?: Record<string, string>,
+	): Record<string, string> {
+		const apiKey = resolveApiKeyForProvider(
+			this.config.providerId,
+			this.config.apiKey,
+		);
+		if (!apiKey) {
+			throw new Error("AskSage API key is required");
+		}
+		return super.getJsonHeaders({
+			"x-access-tokens": apiKey,
+			...(extra ?? {}),
+		});
+	}
+	protected async *createMessageWithFetch(
+		systemPrompt: string,
+		messages: Message[],
+	): ApiStream {
+		const responseId = this.createResponseId();
+		const { id: modelId } = this.getModel();
+		const payload: AskSageRequest = {
+			system_prompt: systemPrompt,
+			message: messages.map((message) => ({
+				user: message.role === "assistant" ? "gpt" : "me",
+				message: this.serializeMessageContent(message.content),
+			})),
+			model: modelId,
+			dataset: "none",
+			usage: true,
+		};
+		let result: AskSageResponse;
+		try {
+			result = await this.fetchJson<AskSageResponse>("/query", {
+				method: "POST",
+				body: payload,
+			});
+		} catch (error) {
+			const details = error instanceof Error ? error.message : String(error);
+			throw new Error(`AskSage request failed: ${details}`);
+		}
+		for (const toolResponse of result.tool_responses ?? []) {
+			yield {
+				type: "text",
+				text: `[Tool Response: ${JSON.stringify(toolResponse)}]\n`,
+				id: responseId,
+			};
+		}
+		const text = result.message?.trim();
+		if (!text) {
+			throw new Error("AskSage request failed: no content in response");
+		}
+		yield { type: "text", text, id: responseId };
+		if (result.usage) {
+			yield {
+				type: "usage",
+				inputTokens: result.usage.model_tokens.prompt_tokens,
+				outputTokens: result.usage.model_tokens.completion_tokens,
+				cacheReadTokens: 0,
+				cacheWriteTokens: 0,
+				totalCost: result.usage.asksage_tokens,
+				id: responseId,
+			};
+		}
+		yield { type: "done", success: true, id: responseId };
+	}
+	private serializeMessageContent(content: string | ContentBlock[]): string {
+		if (typeof content === "string") {
+			return content;
+		}
+		return content
+			.map((block) => ("text" in block ? block.text : ""))
+			.join("")
+			.trim();
+	}
+}
+export function createAskSageHandler(config: ProviderConfig): AskSageHandler {
+	return new AskSageHandler(config);
+}

package/src/providers/handlers/auth.test.ts ADDED Viewed

@@ -0,0 +1,19 @@
+import { describe, expect, it } from "vitest";
+import { resolveApiKeyForProvider } from "./auth";
+describe("resolveApiKeyForProvider", () => {
+	it("returns noop for lmstudio when no key is provided", () => {
+		const apiKey = resolveApiKeyForProvider("lmstudio", undefined, {});
+		expect(apiKey).toBe("noop");
+	});
+	it("prefers explicit api keys over provider defaults", () => {
+		const apiKey = resolveApiKeyForProvider("lmstudio", "real-key", {});
+		expect(apiKey).toBe("real-key");
+	});
+	it("does not apply lmstudio fallback to zai", () => {
+		const apiKey = resolveApiKeyForProvider("zai", undefined, {});
+		expect(apiKey).toBeUndefined();
+	});
+});