npm - @hebo-ai/gateway - Versions diffs - 0.9.4 → 0.10.1 - Mend

@hebo-ai/gateway 0.9.4 → 0.10.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (34) hide show

package/README.md +23 -12
package/dist/endpoints/chat-completions/schema.d.ts +289 -57
package/dist/endpoints/conversations/schema.d.ts +200 -40
package/dist/endpoints/messages/converters.d.ts +24 -0
package/dist/endpoints/messages/converters.js +661 -0
package/dist/endpoints/messages/handler.d.ts +2 -0
package/dist/endpoints/messages/handler.js +142 -0
package/dist/endpoints/messages/index.d.ts +4 -0
package/dist/endpoints/messages/index.js +4 -0
package/dist/endpoints/messages/otel.d.ts +6 -0
package/dist/endpoints/messages/otel.js +171 -0
package/dist/endpoints/messages/schema.d.ts +661 -0
package/dist/endpoints/messages/schema.js +232 -0
package/dist/endpoints/responses/schema.d.ts +237 -45
package/dist/endpoints/shared/schema.d.ts +23 -2
package/dist/endpoints/shared/schema.js +3 -1
package/dist/errors/anthropic.d.ts +10 -0
package/dist/errors/anthropic.js +46 -0
package/dist/errors/openai.js +1 -10
package/dist/errors/utils.d.ts +3 -1
package/dist/errors/utils.js +9 -0
package/dist/gateway.d.ts +1 -0
package/dist/gateway.js +2 -0
package/dist/index.d.ts +1 -0
package/dist/index.js +1 -0
package/dist/lifecycle.js +12 -3
package/dist/models/anthropic/middleware.js +5 -0
package/dist/providers/bedrock/middleware.js +16 -1
package/dist/providers/registry.d.ts +1 -1
package/dist/types.d.ts +6 -5
package/dist/utils/response.d.ts +1 -0
package/dist/utils/stream.d.ts +1 -0
package/dist/utils/stream.js +10 -3
package/package.json +14 -3

package/dist/endpoints/messages/converters.js ADDED Viewed

@@ -0,0 +1,661 @@
+import { Output, jsonSchema, tool } from "ai";
+import { parseBase64, parseImageInput, parsePromptCachingOptions, normalizeToolName, stripEmptyKeys, resolveResponseServiceTier, extractReasoningMetadata, parseJsonOrText, } from "../shared/converters";
+// --- Request Flow ---
+export function convertToTextCallOptions(inputs) {
+    const options = {
+        messages: convertToModelMessages(inputs.messages, inputs.system),
+        temperature: inputs.temperature,
+        maxOutputTokens: inputs.max_tokens,
+        topP: inputs.top_p,
+        stopSequences: inputs.stop_sequences,
+        providerOptions: {},
+    };
+    // Tools
+    const toolSet = convertToToolSet(inputs.tools);
+    if (toolSet)
+        options.tools = toolSet;
+    const toolChoice = convertToToolChoiceOptions(inputs.tool_choice);
+    if (toolChoice)
+        options.toolChoice = toolChoice;
+    // Build providerOptions.unknown in one pass — reasoning, cache control, metadata,
+    // and service tier all go into the same object for middleware consumption.
+    const unknown = {};
+    // Thinking/reasoning — convert to the shared `reasoning` config format so the
+    // model middleware (claudeReasoningMiddleware) and provider middleware
+    // (bedrockClaudeReasoningMiddleware) handle provider-specific conversion.
+    const reasoningResult = convertThinkingToReasoning(inputs.thinking, inputs.output_config);
+    if (reasoningResult) {
+        unknown["reasoning"] = reasoningResult.reasoning;
+        unknown["reasoning_effort"] = reasoningResult.reasoning_effort;
+    }
+    // Per-block cache control is handled in convertToModelMessages.
+    // Top-level automatic caching:
+    if (inputs.cache_control) {
+        Object.assign(unknown, parsePromptCachingOptions(undefined, undefined, inputs.cache_control));
+    }
+    // Metadata passthrough
+    if (inputs.metadata) {
+        unknown["metadata"] = inputs.metadata;
+    }
+    // Service tier — map Anthropic-native values to internal representation
+    if (inputs.service_tier) {
+        unknown["service_tier"] = toInternalServiceTier(inputs.service_tier);
+    }
+    if (Object.keys(unknown).length > 0) {
+        options.providerOptions["unknown"] = unknown;
+    }
+    // Structured output
+    if (inputs.output_config) {
+        options.output = convertToOutput(inputs.output_config);
+    }
+    return options;
+}
+function convertToOutput(config) {
+    if (!config.format || config.format.type !== "json_schema")
+        return undefined;
+    return Output.object({
+        schema: jsonSchema(config.format.schema),
+    });
+}
+export function convertThinkingToReasoning(thinking, outputConfig) {
+    // Map Anthropic "max" effort → internal "xhigh"
+    const effort = outputConfig?.effort === "max" ? "xhigh" : outputConfig?.effort;
+    if (!thinking) {
+        return effort ? { reasoning: { enabled: true, effort }, reasoning_effort: effort } : undefined;
+    }
+    if (thinking.type === "disabled") {
+        return { reasoning: { enabled: false } };
+    }
+    const summary = thinking.display === "summarized"
+        ? "auto"
+        : thinking.display === "omitted"
+            ? "none"
+            : undefined;
+    if (thinking.type === "enabled") {
+        const reasoning = {
+            enabled: true,
+            max_tokens: thinking.budget_tokens,
+            summary,
+        };
+        if (effort)
+            reasoning.effort = effort;
+        return { reasoning, reasoning_effort: effort };
+    }
+    // adaptive — no fixed token budget; effort defaults to "high" per API spec
+    const adaptiveEffort = effort ?? "high";
+    return {
+        reasoning: { enabled: true, effort: adaptiveEffort, summary },
+        reasoning_effort: adaptiveEffort,
+    };
+}
+// --- Message Conversion ---
+export function convertToModelMessages(messages, system) {
+    const modelMessages = [];
+    // System prompt
+    if (system) {
+        if (typeof system === "string") {
+            modelMessages.push({ role: "system", content: system });
+        }
+        else {
+            const text = system.map((block) => block.text).join("");
+            const msg = { role: "system", content: text };
+            // Pass through cache_control from the last system block that has it
+            for (let i = system.length - 1; i >= 0; i--) {
+                if (system[i].cache_control) {
+                    msg.providerOptions = { unknown: { cache_control: system[i].cache_control } };
+                    break;
+                }
+            }
+            modelMessages.push(msg);
+        }
+    }
+    // Tool call id → name map built incrementally; assistant messages always
+    // precede their corresponding tool results in a valid conversation.
+    const toolNameMap = new Map();
+    for (const message of messages) {
+        if (message.role === "user") {
+            const userMessages = fromUserMessage(message, toolNameMap);
+            for (let i = 0; i < userMessages.length; i++) {
+                modelMessages.push(userMessages[i]);
+            }
+        }
+        else if (message.role === "assistant") {
+            if (Array.isArray(message.content)) {
+                for (const block of message.content) {
+                    // oxlint-disable-next-line max-depth
+                    if (block.type === "tool_use")
+                        toolNameMap.set(block.id, block.name);
+                }
+            }
+            modelMessages.push(fromAssistantMessage(message));
+        }
+    }
+    return modelMessages;
+}
+function fromUserMessage(message, toolNameMap) {
+    const result = [];
+    if (typeof message.content === "string") {
+        result.push({ role: "user", content: message.content });
+        return result;
+    }
+    const userParts = [];
+    const toolResultParts = [];
+    for (const block of message.content) {
+        if (block.type === "tool_result") {
+            toolResultParts.push(fromToolResultBlock(block, toolNameMap));
+        }
+        else {
+            const part = fromUserContentBlock(block);
+            if (part)
+                userParts.push(part);
+        }
+    }
+    if (userParts.length > 0) {
+        result.push({ role: "user", content: userParts });
+    }
+    if (toolResultParts.length > 0) {
+        result.push({ role: "tool", content: toolResultParts });
+    }
+    // If only tool results and no user parts, still valid
+    if (userParts.length === 0 && toolResultParts.length === 0) {
+        result.push({ role: "user", content: "" });
+    }
+    return result;
+}
+function fromUserContentBlock(block) {
+    // tool_result blocks are handled separately in fromUserMessage
+    // oxlint-disable-next-line switch-exhaustiveness-check
+    switch (block.type) {
+        case "text": {
+            const part = { type: "text", text: block.text };
+            if (block.cache_control) {
+                part.providerOptions = { unknown: { cache_control: block.cache_control } };
+            }
+            return part;
+        }
+        case "image": {
+            if (block.source.type === "base64") {
+                const part = {
+                    type: "image",
+                    image: parseBase64(block.source.data),
+                    mediaType: block.source.media_type,
+                };
+                if (block.cache_control) {
+                    part.providerOptions = { unknown: { cache_control: block.cache_control } };
+                }
+                return part;
+            }
+            // URL source
+            const { image, mediaType } = parseImageInput(block.source.url);
+            const part = { type: "image", image, mediaType };
+            if (block.cache_control) {
+                part.providerOptions = { unknown: { cache_control: block.cache_control } };
+            }
+            return part;
+        }
+        case "document": {
+            if (block.source.type === "base64") {
+                const filePart = {
+                    type: "file",
+                    data: parseBase64(block.source.data),
+                    mediaType: block.source.media_type,
+                };
+                if (block.cache_control) {
+                    filePart.providerOptions = { unknown: { cache_control: block.cache_control } };
+                }
+                return filePart;
+            }
+            if (block.source.type === "url") {
+                const filePart = {
+                    type: "file",
+                    data: new URL(block.source.url),
+                    mediaType: "application/octet-stream",
+                };
+                if (block.cache_control) {
+                    filePart.providerOptions = { unknown: { cache_control: block.cache_control } };
+                }
+                return filePart;
+            }
+            // text source
+            const textPart = { type: "text", text: block.source.data };
+            if (block.cache_control) {
+                textPart.providerOptions = { unknown: { cache_control: block.cache_control } };
+            }
+            return textPart;
+        }
+        default:
+            return undefined;
+    }
+}
+function fromToolResultBlock(block, toolNameMap) {
+    let output;
+    if (block.content === undefined) {
+        output = { type: "text", value: "" };
+    }
+    else if (typeof block.content === "string") {
+        output = parseJsonOrText(block.content);
+    }
+    else {
+        const parts = [];
+        for (const part of block.content) {
+            if (part.type === "text") {
+                parts.push({ type: "text", text: part.text });
+            }
+            else if (part.type === "image") {
+                if (part.source.type === "base64") {
+                    parts.push({
+                        type: "image-data",
+                        data: part.source.data,
+                        mediaType: part.source.media_type,
+                    });
+                }
+                else {
+                    parts.push({ type: "image-url", url: part.source.url });
+                }
+            }
+        }
+        output = { type: "content", value: parts };
+    }
+    const result = {
+        type: "tool-result",
+        toolCallId: block.tool_use_id,
+        toolName: toolNameMap.get(block.tool_use_id) ?? "",
+        output,
+    };
+    if (block.cache_control) {
+        result.providerOptions = { unknown: { cache_control: block.cache_control } };
+    }
+    return result;
+}
+function fromAssistantMessage(message) {
+    if (typeof message.content === "string") {
+        return { role: "assistant", content: message.content };
+    }
+    const parts = [];
+    for (const block of message.content) {
+        switch (block.type) {
+            case "text":
+                parts.push({ type: "text", text: block.text });
+                break;
+            case "tool_use": {
+                const toolCallPart = {
+                    type: "tool-call",
+                    toolCallId: block.id,
+                    toolName: block.name,
+                    input: block.input,
+                };
+                if (block.extra_content)
+                    toolCallPart.providerOptions = block.extra_content;
+                parts.push(toolCallPart);
+                break;
+            }
+            case "thinking":
+                parts.push({
+                    type: "reasoning",
+                    text: block.thinking,
+                    providerOptions: {
+                        unknown: { signature: block.signature },
+                    },
+                });
+                break;
+            case "redacted_thinking":
+                parts.push({
+                    type: "reasoning",
+                    text: "",
+                    providerOptions: {
+                        unknown: { redactedData: block.data },
+                    },
+                });
+                break;
+        }
+    }
+    return {
+        role: "assistant",
+        content: parts.length > 0 ? parts : "",
+    };
+}
+// --- Tool Conversion ---
+export function convertToToolSet(tools) {
+    if (!tools || tools.length === 0)
+        return undefined;
+    const toolSet = {};
+    for (const t of tools) {
+        toolSet[t.name] = tool({
+            description: t.description,
+            inputSchema: jsonSchema(t.input_schema),
+            strict: t.strict,
+        });
+    }
+    return toolSet;
+}
+export function convertToToolChoiceOptions(toolChoice) {
+    if (!toolChoice)
+        return undefined;
+    switch (toolChoice.type) {
+        case "auto":
+            return "auto";
+        case "any":
+            return "required";
+        case "none":
+            return "none";
+        case "tool":
+            return { type: "tool", toolName: toolChoice.name };
+        default:
+            return undefined;
+    }
+}
+// --- Response Flow ---
+export function toMessages(result, modelId) {
+    const content = [];
+    // Thinking blocks
+    for (const part of result.content) {
+        if (part.type === "reasoning") {
+            content.push(toThinkingBlock(part));
+        }
+    }
+    // Text blocks
+    for (const part of result.content) {
+        if (part.type === "text" && part.text) {
+            content.push({ type: "text", text: part.text });
+        }
+    }
+    // Tool use blocks
+    const toolCalls = result.toolCalls;
+    for (let i = 0; i < toolCalls.length; i++) {
+        const tc = toolCalls[i];
+        const toolUseBlock = {
+            type: "tool_use",
+            id: tc.toolCallId,
+            name: normalizeToolName(tc.toolName),
+            input: stripEmptyKeys(tc.input) ?? {},
+        };
+        if (tc.providerMetadata)
+            toolUseBlock.extra_content = tc.providerMetadata;
+        content.push(toolUseBlock);
+    }
+    return {
+        id: `msg_${crypto.randomUUID()}`,
+        type: "message",
+        role: "assistant",
+        content,
+        model: modelId,
+        stop_reason: mapStopReason(result.finishReason),
+        stop_sequence: null,
+        usage: mapUsage(result.totalUsage),
+        service_tier: toMessagesServiceTier(resolveResponseServiceTier(result.providerMetadata)),
+    };
+}
+function toThinkingBlock(reasoning) {
+    const { redactedData, signature } = extractReasoningMetadata(reasoning.providerMetadata);
+    if (redactedData) {
+        return { type: "redacted_thinking", data: redactedData };
+    }
+    return {
+        type: "thinking",
+        thinking: reasoning.text,
+        signature: signature ?? "",
+    };
+}
+export function mapStopReason(reason) {
+    switch (reason) {
+        case "stop":
+            return "end_turn";
+        case "tool-calls":
+            return "tool_use";
+        case "length":
+            return "max_tokens";
+        case "content-filter":
+            return "end_turn";
+        case "error":
+        case "other":
+            return null;
+        default:
+            return null;
+    }
+}
+export function mapUsage(usage) {
+    const result = {
+        input_tokens: usage?.inputTokens ?? 0,
+        output_tokens: usage?.outputTokens ?? 0,
+    };
+    if (usage?.inputTokenDetails?.cacheWriteTokens !== undefined) {
+        result.cache_creation_input_tokens = usage.inputTokenDetails.cacheWriteTokens;
+    }
+    if (usage?.inputTokenDetails?.cacheReadTokens !== undefined) {
+        result.cache_read_input_tokens = usage.inputTokenDetails.cacheReadTokens;
+    }
+    return result;
+}
+// --- Service Tier Mapping ---
+function toInternalServiceTier(tier) {
+    if (tier === "standard_only")
+        return "default";
+    return tier; // "auto" maps directly
+}
+function toMessagesServiceTier(tier) {
+    if (!tier)
+        return undefined;
+    if (tier === "default")
+        return "standard_only";
+    if (tier === "auto")
+        return "auto";
+    return undefined; // flex, scale, priority don't have Anthropic equivalents
+}
+// --- Streaming ---
+export function toMessagesStream(result, modelId) {
+    return result.fullStream.pipeThrough(new MessagesTransformStream(modelId));
+}
+export class MessagesTransformStream extends TransformStream {
+    constructor(modelId) {
+        let blockIndex = 0;
+        let currentToolCallId;
+        super({
+            start(controller) {
+                const emptyMessage = {
+                    id: `msg_${crypto.randomUUID()}`,
+                    type: "message",
+                    role: "assistant",
+                    content: [],
+                    model: modelId,
+                    stop_reason: null,
+                    stop_sequence: null,
+                    usage: { input_tokens: 0, output_tokens: 0 },
+                };
+                controller.enqueue({
+                    event: "message_start",
+                    data: { type: "message_start", message: emptyMessage },
+                });
+            },
+            transform(part, controller) {
+                // Not all TextStreamPart types are relevant for Messages SSE format
+                // oxlint-disable-next-line switch-exhaustiveness-check
+                switch (part.type) {
+                    case "reasoning-start": {
+                        controller.enqueue({
+                            event: "content_block_start",
+                            data: {
+                                type: "content_block_start",
+                                index: blockIndex,
+                                content_block: { type: "thinking", thinking: "" },
+                            },
+                        });
+                        break;
+                    }
+                    case "reasoning-delta": {
+                        controller.enqueue({
+                            event: "content_block_delta",
+                            data: {
+                                type: "content_block_delta",
+                                index: blockIndex,
+                                delta: { type: "thinking_delta", thinking: part.text },
+                            },
+                        });
+                        break;
+                    }
+                    case "reasoning-end": {
+                        // Emit signature delta if available from provider metadata
+                        const { signature } = extractReasoningMetadata(part.providerMetadata);
+                        if (signature) {
+                            controller.enqueue({
+                                event: "content_block_delta",
+                                data: {
+                                    type: "content_block_delta",
+                                    index: blockIndex,
+                                    delta: { type: "signature_delta", signature },
+                                },
+                            });
+                        }
+                        controller.enqueue({
+                            event: "content_block_stop",
+                            data: { type: "content_block_stop", index: blockIndex },
+                        });
+                        blockIndex++;
+                        break;
+                    }
+                    case "text-start": {
+                        controller.enqueue({
+                            event: "content_block_start",
+                            data: {
+                                type: "content_block_start",
+                                index: blockIndex,
+                                content_block: { type: "text", text: "" },
+                            },
+                        });
+                        break;
+                    }
+                    case "text-delta": {
+                        controller.enqueue({
+                            event: "content_block_delta",
+                            data: {
+                                type: "content_block_delta",
+                                index: blockIndex,
+                                delta: { type: "text_delta", text: part.text },
+                            },
+                        });
+                        break;
+                    }
+                    case "text-end": {
+                        controller.enqueue({
+                            event: "content_block_stop",
+                            data: { type: "content_block_stop", index: blockIndex },
+                        });
+                        blockIndex++;
+                        break;
+                    }
+                    case "tool-input-start": {
+                        currentToolCallId = part.id;
+                        controller.enqueue({
+                            event: "content_block_start",
+                            data: {
+                                type: "content_block_start",
+                                index: blockIndex,
+                                content_block: {
+                                    type: "tool_use",
+                                    id: part.id,
+                                    name: normalizeToolName(part.toolName),
+                                    input: {},
+                                },
+                            },
+                        });
+                        break;
+                    }
+                    case "tool-input-delta": {
+                        controller.enqueue({
+                            event: "content_block_delta",
+                            data: {
+                                type: "content_block_delta",
+                                index: blockIndex,
+                                delta: { type: "input_json_delta", partial_json: part.delta },
+                            },
+                        });
+                        break;
+                    }
+                    case "tool-call": {
+                        // If we had streaming tool input, close the block
+                        if (currentToolCallId === part.toolCallId) {
+                            controller.enqueue({
+                                event: "content_block_stop",
+                                data: { type: "content_block_stop", index: blockIndex },
+                            });
+                            blockIndex++;
+                            currentToolCallId = undefined;
+                        }
+                        else {
+                            // Non-streaming tool call: emit start + stop
+                            const contentBlock = {
+                                type: "tool_use",
+                                id: part.toolCallId,
+                                name: normalizeToolName(part.toolName),
+                                input: {},
+                            };
+                            if (part.providerMetadata)
+                                contentBlock.extra_content = part.providerMetadata;
+                            controller.enqueue({
+                                event: "content_block_start",
+                                data: {
+                                    type: "content_block_start",
+                                    index: blockIndex,
+                                    content_block: contentBlock,
+                                },
+                            });
+                            const inputStr = typeof part.input === "string"
+                                ? part.input
+                                : JSON.stringify(stripEmptyKeys(part.input));
+                            if (inputStr) {
+                                controller.enqueue({
+                                    event: "content_block_delta",
+                                    data: {
+                                        type: "content_block_delta",
+                                        index: blockIndex,
+                                        delta: { type: "input_json_delta", partial_json: inputStr },
+                                    },
+                                });
+                            }
+                            controller.enqueue({
+                                event: "content_block_stop",
+                                data: { type: "content_block_stop", index: blockIndex },
+                            });
+                            blockIndex++;
+                        }
+                        break;
+                    }
+                    case "finish-step": {
+                        // No-op for messages; metadata is not surfaced in Anthropic stream format
+                        break;
+                    }
+                    case "finish": {
+                        const stopReason = mapStopReason(part.finishReason);
+                        const totalOutputTokens = part.totalUsage?.outputTokens ?? 0;
+                        const totalInputTokens = part.totalUsage?.inputTokens ?? 0;
+                        controller.enqueue({
+                            event: "message_delta",
+                            data: {
+                                type: "message_delta",
+                                delta: { stop_reason: stopReason, stop_sequence: null },
+                                usage: { output_tokens: totalOutputTokens, input_tokens: totalInputTokens },
+                            },
+                        });
+                        controller.enqueue({
+                            event: "message_stop",
+                            data: { type: "message_stop" },
+                        });
+                        break;
+                    }
+                    case "error": {
+                        const message = part.error instanceof Error ? part.error.message : String(part.error);
+                        controller.enqueue({
+                            event: "error",
+                            data: {
+                                type: "error",
+                                error: { type: "api_error", message },
+                            },
+                        });
+                        break;
+                    }
+                    default:
+                        break;
+                }
+            },
+        });
+    }
+}

package/dist/endpoints/messages/handler.d.ts ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ import type { GatewayConfig, Endpoint } from "../../types";
2	+ export declare const messages: (config: GatewayConfig) => Endpoint;