npm - @hebo-ai/gateway - Versions diffs - 0.6.2 → 0.8.0-rc0 - Mend

@hebo-ai/gateway 0.6.2 → 0.8.0-rc0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (168) hide show

package/README.md +134 -7
package/package.json +46 -1
package/dist/config.d.ts +0 -2
package/dist/config.js +0 -81
package/dist/endpoints/chat-completions/converters.d.ts +0 -43
package/dist/endpoints/chat-completions/converters.js +0 -625
package/dist/endpoints/chat-completions/handler.d.ts +0 -2
package/dist/endpoints/chat-completions/handler.js +0 -149
package/dist/endpoints/chat-completions/index.d.ts +0 -4
package/dist/endpoints/chat-completions/index.js +0 -4
package/dist/endpoints/chat-completions/otel.d.ts +0 -5
package/dist/endpoints/chat-completions/otel.js +0 -171
package/dist/endpoints/chat-completions/schema.d.ts +0 -1188
package/dist/endpoints/chat-completions/schema.js +0 -298
package/dist/endpoints/embeddings/converters.d.ts +0 -10
package/dist/endpoints/embeddings/converters.js +0 -31
package/dist/endpoints/embeddings/handler.d.ts +0 -2
package/dist/endpoints/embeddings/handler.js +0 -104
package/dist/endpoints/embeddings/index.d.ts +0 -4
package/dist/endpoints/embeddings/index.js +0 -4
package/dist/endpoints/embeddings/otel.d.ts +0 -5
package/dist/endpoints/embeddings/otel.js +0 -29
package/dist/endpoints/embeddings/schema.d.ts +0 -44
package/dist/endpoints/embeddings/schema.js +0 -29
package/dist/endpoints/models/converters.d.ts +0 -6
package/dist/endpoints/models/converters.js +0 -42
package/dist/endpoints/models/handler.d.ts +0 -2
package/dist/endpoints/models/handler.js +0 -29
package/dist/endpoints/models/index.d.ts +0 -3
package/dist/endpoints/models/index.js +0 -3
package/dist/endpoints/models/schema.d.ts +0 -42
package/dist/endpoints/models/schema.js +0 -31
package/dist/errors/ai-sdk.d.ts +0 -2
package/dist/errors/ai-sdk.js +0 -52
package/dist/errors/gateway.d.ts +0 -5
package/dist/errors/gateway.js +0 -13
package/dist/errors/openai.d.ts +0 -20
package/dist/errors/openai.js +0 -40
package/dist/errors/utils.d.ts +0 -22
package/dist/errors/utils.js +0 -44
package/dist/gateway.d.ts +0 -9
package/dist/gateway.js +0 -40
package/dist/index.d.ts +0 -14
package/dist/index.js +0 -13
package/dist/lifecycle.d.ts +0 -2
package/dist/lifecycle.js +0 -98
package/dist/logger/default.d.ts +0 -4
package/dist/logger/default.js +0 -81
package/dist/logger/index.d.ts +0 -11
package/dist/logger/index.js +0 -25
package/dist/middleware/common.d.ts +0 -12
package/dist/middleware/common.js +0 -146
package/dist/middleware/debug.d.ts +0 -3
package/dist/middleware/debug.js +0 -27
package/dist/middleware/matcher.d.ts +0 -28
package/dist/middleware/matcher.js +0 -118
package/dist/middleware/utils.d.ts +0 -2
package/dist/middleware/utils.js +0 -24
package/dist/models/amazon/index.d.ts +0 -2
package/dist/models/amazon/index.js +0 -2
package/dist/models/amazon/middleware.d.ts +0 -3
package/dist/models/amazon/middleware.js +0 -68
package/dist/models/amazon/presets.d.ts +0 -345
package/dist/models/amazon/presets.js +0 -80
package/dist/models/anthropic/index.d.ts +0 -2
package/dist/models/anthropic/index.js +0 -2
package/dist/models/anthropic/middleware.d.ts +0 -5
package/dist/models/anthropic/middleware.js +0 -127
package/dist/models/anthropic/presets.d.ts +0 -711
package/dist/models/anthropic/presets.js +0 -135
package/dist/models/catalog.d.ts +0 -4
package/dist/models/catalog.js +0 -8
package/dist/models/cohere/index.d.ts +0 -2
package/dist/models/cohere/index.js +0 -2
package/dist/models/cohere/middleware.d.ts +0 -3
package/dist/models/cohere/middleware.js +0 -62
package/dist/models/cohere/presets.d.ts +0 -411
package/dist/models/cohere/presets.js +0 -134
package/dist/models/google/index.d.ts +0 -2
package/dist/models/google/index.js +0 -2
package/dist/models/google/middleware.d.ts +0 -8
package/dist/models/google/middleware.js +0 -111
package/dist/models/google/presets.d.ts +0 -375
package/dist/models/google/presets.js +0 -82
package/dist/models/meta/index.d.ts +0 -1
package/dist/models/meta/index.js +0 -1
package/dist/models/meta/presets.d.ts +0 -483
package/dist/models/meta/presets.js +0 -95
package/dist/models/openai/index.d.ts +0 -2
package/dist/models/openai/index.js +0 -2
package/dist/models/openai/middleware.d.ts +0 -4
package/dist/models/openai/middleware.js +0 -88
package/dist/models/openai/presets.d.ts +0 -959
package/dist/models/openai/presets.js +0 -213
package/dist/models/types.d.ts +0 -20
package/dist/models/types.js +0 -84
package/dist/models/voyage/index.d.ts +0 -2
package/dist/models/voyage/index.js +0 -2
package/dist/models/voyage/middleware.d.ts +0 -2
package/dist/models/voyage/middleware.js +0 -19
package/dist/models/voyage/presets.d.ts +0 -436
package/dist/models/voyage/presets.js +0 -85
package/dist/providers/anthropic/canonical.d.ts +0 -3
package/dist/providers/anthropic/canonical.js +0 -9
package/dist/providers/anthropic/index.d.ts +0 -1
package/dist/providers/anthropic/index.js +0 -1
package/dist/providers/bedrock/canonical.d.ts +0 -17
package/dist/providers/bedrock/canonical.js +0 -61
package/dist/providers/bedrock/index.d.ts +0 -2
package/dist/providers/bedrock/index.js +0 -2
package/dist/providers/bedrock/middleware.d.ts +0 -4
package/dist/providers/bedrock/middleware.js +0 -104
package/dist/providers/cohere/canonical.d.ts +0 -3
package/dist/providers/cohere/canonical.js +0 -17
package/dist/providers/cohere/index.d.ts +0 -1
package/dist/providers/cohere/index.js +0 -1
package/dist/providers/groq/canonical.d.ts +0 -3
package/dist/providers/groq/canonical.js +0 -12
package/dist/providers/groq/index.d.ts +0 -1
package/dist/providers/groq/index.js +0 -1
package/dist/providers/openai/canonical.d.ts +0 -3
package/dist/providers/openai/canonical.js +0 -8
package/dist/providers/openai/index.d.ts +0 -1
package/dist/providers/openai/index.js +0 -1
package/dist/providers/registry.d.ts +0 -24
package/dist/providers/registry.js +0 -103
package/dist/providers/types.d.ts +0 -7
package/dist/providers/types.js +0 -11
package/dist/providers/vertex/canonical.d.ts +0 -3
package/dist/providers/vertex/canonical.js +0 -8
package/dist/providers/vertex/index.d.ts +0 -1
package/dist/providers/vertex/index.js +0 -1
package/dist/providers/voyage/canonical.d.ts +0 -3
package/dist/providers/voyage/canonical.js +0 -7
package/dist/providers/voyage/index.d.ts +0 -1
package/dist/providers/voyage/index.js +0 -1
package/dist/telemetry/ai-sdk.d.ts +0 -2
package/dist/telemetry/ai-sdk.js +0 -31
package/dist/telemetry/baggage.d.ts +0 -1
package/dist/telemetry/baggage.js +0 -24
package/dist/telemetry/fetch.d.ts +0 -2
package/dist/telemetry/fetch.js +0 -49
package/dist/telemetry/gen-ai.d.ts +0 -6
package/dist/telemetry/gen-ai.js +0 -78
package/dist/telemetry/http.d.ts +0 -3
package/dist/telemetry/http.js +0 -54
package/dist/telemetry/index.d.ts +0 -1
package/dist/telemetry/index.js +0 -1
package/dist/telemetry/memory.d.ts +0 -2
package/dist/telemetry/memory.js +0 -43
package/dist/telemetry/span.d.ts +0 -13
package/dist/telemetry/span.js +0 -60
package/dist/telemetry/stream.d.ts +0 -3
package/dist/telemetry/stream.js +0 -58
package/dist/types.d.ts +0 -176
package/dist/types.js +0 -1
package/dist/utils/env.d.ts +0 -2
package/dist/utils/env.js +0 -7
package/dist/utils/headers.d.ts +0 -4
package/dist/utils/headers.js +0 -22
package/dist/utils/preset.d.ts +0 -10
package/dist/utils/preset.js +0 -42
package/dist/utils/request.d.ts +0 -2
package/dist/utils/request.js +0 -43
package/dist/utils/response.d.ts +0 -3
package/dist/utils/response.js +0 -70
package/dist/utils/url.d.ts +0 -4
package/dist/utils/url.js +0 -21

package/dist/endpoints/chat-completions/handler.js DELETED Viewed

@@ -1,149 +0,0 @@
-import { generateText, Output, streamText, wrapLanguageModel, } from "ai";
-import * as z from "zod/mini";
-import { GatewayError } from "../../errors/gateway";
-import { winterCgHandler } from "../../lifecycle";
-import { logger } from "../../logger";
-import { modelMiddlewareMatcher } from "../../middleware/matcher";
-import { resolveProvider } from "../../providers/registry";
-import { getGenAiGeneralAttributes, recordTimePerOutputToken, recordTokenUsage, } from "../../telemetry/gen-ai";
-import { addSpanEvent, setSpanAttributes } from "../../telemetry/span";
-import { prepareForwardHeaders } from "../../utils/request";
-import { convertToTextCallOptions, toChatCompletions, toChatCompletionsStream } from "./converters";
-import { getChatRequestAttributes, getChatResponseAttributes } from "./otel";
-import { ChatCompletionsBodySchema } from "./schema";
-export const chatCompletions = (config) => {
-    const hooks = config.hooks;
-    const handler = async (ctx) => {
-        const start = performance.now();
-        ctx.operation = "chat";
-        addSpanEvent("hebo.handler.started");
-        // Guard: enforce HTTP method early.
-        if (!ctx.request || ctx.request.method !== "POST") {
-            throw new GatewayError("Method Not Allowed", 405);
-        }
-        // Parse + validate input.
-        try {
-            // oxlint-disable-next-line no-unsafe-assignment
-            ctx.body = await ctx.request.json();
-        }
-        catch {
-            throw new GatewayError("Invalid JSON", 400);
-        }
-        logger.trace({ requestId: ctx.requestId, body: ctx.body }, "[chat] ChatCompletionsBody");
-        addSpanEvent("hebo.request.deserialized");
-        const parsed = ChatCompletionsBodySchema.safeParse(ctx.body);
-        if (!parsed.success) {
-            // FUTURE: consider adding body shape to metadata
-            throw new GatewayError(z.prettifyError(parsed.error), 400, undefined, parsed.error);
-        }
-        ctx.body = parsed.data;
-        addSpanEvent("hebo.request.parsed");
-        if (hooks?.before) {
-            ctx.body =
-                (await hooks.before(ctx)) ?? ctx.body;
-            addSpanEvent("hebo.hooks.before.completed");
-        }
-        // Resolve model + provider (hooks may override defaults).
-        let inputs, stream;
-        ({ model: ctx.modelId, stream, ...inputs } = ctx.body);
-        ctx.resolvedModelId =
-            (await hooks?.resolveModelId?.(ctx)) ?? ctx.modelId;
-        logger.debug(`[chat] resolved ${ctx.modelId} to ${ctx.resolvedModelId}`);
-        addSpanEvent("hebo.model.resolved");
-        const override = await hooks?.resolveProvider?.(ctx);
-        ctx.provider =
-            override ??
-                resolveProvider({
-                    providers: ctx.providers,
-                    models: ctx.models,
-                    modelId: ctx.resolvedModelId,
-                    operation: ctx.operation,
-                });
-        const languageModel = ctx.provider.languageModel(ctx.resolvedModelId);
-        ctx.resolvedProviderId = languageModel.provider;
-        logger.debug(`[chat] using ${languageModel.provider} for ${ctx.resolvedModelId}`);
-        addSpanEvent("hebo.provider.resolved");
-        const genAiSignalLevel = config.telemetry?.signals?.gen_ai;
-        const genAiGeneralAttrs = getGenAiGeneralAttributes(ctx, genAiSignalLevel);
-        setSpanAttributes(genAiGeneralAttrs);
-        // Convert inputs to AI SDK call options.
-        // oxlint-disable-next-line no-unsafe-argument
-        const textOptions = convertToTextCallOptions(inputs);
-        logger.trace({
-            requestId: ctx.requestId,
-            options: textOptions,
-        }, "[chat] AI SDK options");
-        addSpanEvent("hebo.options.prepared");
-        setSpanAttributes(getChatRequestAttributes(ctx.body, genAiSignalLevel));
-        // Build middleware chain (model -> forward params -> provider).
-        const languageModelWithMiddleware = wrapLanguageModel({
-            model: languageModel,
-            middleware: modelMiddlewareMatcher.for(ctx.resolvedModelId, languageModel.provider),
-        });
-        // Execute request (streaming vs. non-streaming).
-        if (stream) {
-            addSpanEvent("hebo.ai-sdk.started");
-            const result = streamText({
-                model: languageModelWithMiddleware,
-                headers: prepareForwardHeaders(ctx.request),
-                abortSignal: ctx.request.signal,
-                timeout: {
-                    totalMs: 5 * 60 * 1000,
-                },
-                onAbort: () => {
-                    throw new DOMException("The operation was aborted.", "AbortError");
-                },
-                onError: () => { },
-                onFinish: (res) => {
-                    addSpanEvent("hebo.ai-sdk.completed");
-                    const streamResult = toChatCompletions(res, ctx.resolvedModelId);
-                    logger.trace({ requestId: ctx.requestId, result: streamResult }, "[chat] ChatCompletions");
-                    addSpanEvent("hebo.result.transformed");
-                    const genAiResponseAttrs = getChatResponseAttributes(streamResult, genAiSignalLevel);
-                    setSpanAttributes(genAiResponseAttrs);
-                    recordTokenUsage(genAiResponseAttrs, genAiGeneralAttrs, genAiSignalLevel);
-                    recordTimePerOutputToken(start, genAiResponseAttrs, genAiGeneralAttrs, genAiSignalLevel);
-                },
-                experimental_include: {
-                    requestBody: false,
-                },
-                includeRawChunks: false,
-                ...textOptions,
-            });
-            ctx.result = toChatCompletionsStream(result, ctx.resolvedModelId);
-            if (hooks?.after) {
-                ctx.result = (await hooks.after(ctx)) ?? ctx.result;
-                addSpanEvent("hebo.hooks.after.completed");
-            }
-            return ctx.result;
-        }
-        addSpanEvent("hebo.ai-sdk.started");
-        const result = await generateText({
-            model: languageModelWithMiddleware,
-            headers: prepareForwardHeaders(ctx.request),
-            abortSignal: ctx.request.signal,
-            timeout: 5 * 60 * 1000,
-            experimental_include: {
-                requestBody: false,
-                responseBody: false,
-            },
-            ...textOptions,
-        });
-        logger.trace({ requestId: ctx.requestId, result }, "[chat] AI SDK result");
-        addSpanEvent("hebo.ai-sdk.completed");
-        // Transform result.
-        ctx.result = toChatCompletions(result, ctx.resolvedModelId);
-        logger.trace({ requestId: ctx.requestId, result: ctx.result }, "[chat] ChatCompletions");
-        addSpanEvent("hebo.result.transformed");
-        const genAiResponseAttrs = getChatResponseAttributes(ctx.result, genAiSignalLevel);
-        setSpanAttributes(genAiResponseAttrs);
-        recordTokenUsage(genAiResponseAttrs, genAiGeneralAttrs, genAiSignalLevel);
-        if (hooks?.after) {
-            ctx.result = (await hooks.after(ctx)) ?? ctx.result;
-            addSpanEvent("hebo.hooks.after.completed");
-        }
-        recordTimePerOutputToken(start, genAiResponseAttrs, genAiGeneralAttrs, genAiSignalLevel);
-        return ctx.result;
-    };
-    return { handler: winterCgHandler(handler, config) };
-};

package/dist/endpoints/chat-completions/index.d.ts DELETED Viewed

@@ -1,4 +0,0 @@
-export * from "./converters";
-export * from "./handler";
-export * from "./schema";
-export * from "./otel";

package/dist/endpoints/chat-completions/index.js DELETED Viewed

@@ -1,4 +0,0 @@
-export * from "./converters";
-export * from "./handler";
-export * from "./schema";
-export * from "./otel";

package/dist/endpoints/chat-completions/otel.d.ts DELETED Viewed

@@ -1,5 +0,0 @@
-import type { Attributes } from "@opentelemetry/api";
-import type { ChatCompletions, ChatCompletionsBody } from "./schema";
-import { type TelemetrySignalLevel } from "../../types";
-export declare const getChatRequestAttributes: (inputs: ChatCompletionsBody, signalLevel?: TelemetrySignalLevel) => Attributes;
-export declare const getChatResponseAttributes: (completions: ChatCompletions, signalLevel?: TelemetrySignalLevel) => Attributes;

package/dist/endpoints/chat-completions/otel.js DELETED Viewed

@@ -1,171 +0,0 @@
-import {} from "../../types";
-import { parseDataUrl } from "../../utils/url";
-const toTextParts = (content) => {
-    if (typeof content === "string") {
-        return [{ type: "text", content }];
-    }
-    const result = [];
-    if (Array.isArray(content)) {
-        for (const part of content) {
-            if (part.type === "text") {
-                result.push({ type: "text", content: part.text });
-            }
-        }
-    }
-    return result;
-};
-const toBlobPart = (modality, mimeType) => {
-    const part = {
-        type: "blob",
-        modality,
-        content: "[REDACTED_BINARY_DATA]",
-    };
-    if (mimeType)
-        part["mime_type"] = mimeType;
-    return part;
-};
-const toToolResponsePart = (id, content) => ({
-    type: "tool_call_response",
-    id,
-    response: typeof content === "string" ? content : content.map((p) => p.text).join(""),
-});
-const toAssistantParts = (message) => {
-    const parts = [];
-    if (typeof message.reasoning === "string") {
-        parts.push({ type: "reasoning", content: message.reasoning });
-    }
-    for (const part of toTextParts(message.content)) {
-        parts.push(part);
-    }
-    if (Array.isArray(message.tool_calls)) {
-        for (const call of message.tool_calls) {
-            parts.push({
-                type: "tool_call",
-                id: call.id,
-                name: call.function.name,
-                arguments: call.function.arguments,
-            });
-        }
-    }
-    return parts;
-};
-const toUserParts = (content) => {
-    if (typeof content === "string")
-        return [{ type: "text", content }];
-    const parts = [];
-    for (const part of content) {
-        switch (part.type) {
-            case "text":
-                parts.push({ type: "text", content: part.text });
-                break;
-            case "image_url": {
-                const url = part.image_url.url;
-                if (url.slice(0, 5).toLowerCase() === "data:") {
-                    const { mimeType } = parseDataUrl(url);
-                    parts.push(toBlobPart("image", mimeType || undefined));
-                }
-                else {
-                    parts.push({ type: "uri", modality: "image", uri: url });
-                }
-                break;
-            }
-            case "input_audio":
-                parts.push(toBlobPart("audio", `audio/${part.input_audio.format}`));
-                break;
-            case "file": {
-                const filePart = toBlobPart("file", part.file.media_type);
-                if (part.file.filename)
-                    filePart["file_name"] = part.file.filename;
-                parts.push(filePart);
-                break;
-            }
-        }
-    }
-    return parts;
-};
-const toMessageParts = (message) => {
-    switch (message.role) {
-        case "assistant":
-            return toAssistantParts(message);
-        case "tool":
-            return [toToolResponsePart(message.tool_call_id, message.content)];
-        case "user":
-            return toUserParts(message.content);
-        // FUTURE: remove once Langfuse supports gen_ai.system_instructions
-        // https://github.com/langfuse/langfuse/issues/11607
-        case "system":
-            return toTextParts(message.content);
-        default:
-            throw new Error(`Unhandled content part type: ${message.role}`);
-    }
-};
-export const getChatRequestAttributes = (inputs, signalLevel) => {
-    if (!signalLevel || signalLevel === "off")
-        return {};
-    const attrs = {};
-    if (inputs.seed !== undefined) {
-        Object.assign(attrs, { "gen_ai.request.seed": inputs.seed });
-    }
-    if (signalLevel !== "required") {
-        Object.assign(attrs, {
-            // FUTURE: add reasoning info
-            "gen_ai.request.stream": inputs.stream,
-            "gen_ai.request.frequency_penalty": inputs.frequency_penalty,
-            "gen_ai.request.max_tokens": inputs.max_completion_tokens,
-            "gen_ai.request.presence_penalty": inputs.presence_penalty,
-            "gen_ai.request.stop_sequences": inputs.stop
-                ? Array.isArray(inputs.stop)
-                    ? inputs.stop
-                    : [inputs.stop]
-                : undefined,
-            "gen_ai.request.temperature": inputs.temperature,
-            "gen_ai.request.top_p": inputs.top_p,
-        });
-        if (inputs.metadata) {
-            for (const key in inputs.metadata) {
-                attrs[`gen_ai.request.metadata.${key}`] = inputs.metadata[key];
-            }
-        }
-    }
-    if (signalLevel === "full") {
-        Object.assign(attrs, {
-            // FUTURE: move system instructions from messages to here
-            // blocker: https://github.com/langfuse/langfuse/issues/11607
-            // "gen_ai.system_instructions": inputs.messages
-            //   .filter((m) => m.role === "system")
-            //   .map((m) => JSON.stringify(toTextPart(m.content))),
-            "gen_ai.input.messages": inputs.messages
-                //.filter((m) => m.role !== "system")
-                .map((m) => JSON.stringify({ role: m.role, parts: toMessageParts(m) })),
-            "gen_ai.tool.definitions": inputs.tools?.map((toolDefinition) => JSON.stringify(toolDefinition)),
-        });
-    }
-    return attrs;
-};
-export const getChatResponseAttributes = (completions, signalLevel) => {
-    if (!signalLevel || signalLevel === "off")
-        return {};
-    const attrs = {
-        "gen_ai.response.id": completions.id,
-    };
-    if (signalLevel !== "required") {
-        Object.assign(attrs, {
-            "gen_ai.response.finish_reasons": completions.choices?.map((c) => c.finish_reason),
-            "gen_ai.usage.total_tokens": completions.usage?.total_tokens,
-            "gen_ai.usage.input_tokens": completions.usage?.prompt_tokens,
-            "gen_ai.usage.cache_read.input_tokens": completions.usage?.prompt_tokens_details?.cached_tokens,
-            "gen_ai.usage.output_tokens": completions.usage?.completion_tokens,
-            "gen_ai.usage.reasoning.output_tokens": completions.usage?.completion_tokens_details?.reasoning_tokens,
-        });
-    }
-    if (signalLevel === "full") {
-        Object.assign(attrs, {
-            "gen_ai.output.messages": completions.choices?.map((c) => JSON.stringify({
-                role: c.message.role,
-                parts: toMessageParts(c.message),
-                finish_reason: c.finish_reason,
-            })),
-        });
-    }
-    return attrs;
-};