npm - @hebo-ai/gateway - Versions diffs - 0.5.2 → 0.6.0-rc0 - Mend

@hebo-ai/gateway 0.5.2 → 0.6.0-rc0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (180) hide show

package/README.md +32 -1
package/package.json +17 -12
package/src/endpoints/chat-completions/converters.test.ts +85 -1
package/src/endpoints/chat-completions/converters.ts +139 -18
package/src/endpoints/chat-completions/handler.test.ts +2 -0
package/src/endpoints/chat-completions/index.ts +1 -0
package/src/endpoints/chat-completions/otel.ts +1 -0
package/src/endpoints/chat-completions/schema.ts +38 -4
package/src/endpoints/embeddings/index.ts +1 -0
package/src/lifecycle.ts +2 -2
package/src/models/anthropic/middleware.test.ts +45 -1
package/src/models/anthropic/middleware.ts +21 -1
package/src/models/google/middleware.test.ts +30 -1
package/src/models/google/middleware.ts +20 -1
package/src/models/openai/middleware.test.ts +32 -1
package/src/models/openai/middleware.ts +25 -1
package/src/providers/bedrock/middleware.test.ts +121 -1
package/src/providers/bedrock/middleware.ts +61 -1
package/src/telemetry/fetch.ts +31 -4
package/src/telemetry/index.ts +1 -0
package/dist/config.d.ts +0 -2
package/dist/config.js +0 -81
package/dist/endpoints/chat-completions/converters.d.ts +0 -43
package/dist/endpoints/chat-completions/converters.js +0 -551
package/dist/endpoints/chat-completions/handler.d.ts +0 -2
package/dist/endpoints/chat-completions/handler.js +0 -145
package/dist/endpoints/chat-completions/index.d.ts +0 -3
package/dist/endpoints/chat-completions/index.js +0 -3
package/dist/endpoints/chat-completions/otel.d.ts +0 -6
package/dist/endpoints/chat-completions/otel.js +0 -134
package/dist/endpoints/chat-completions/schema.d.ts +0 -946
package/dist/endpoints/chat-completions/schema.js +0 -257
package/dist/endpoints/embeddings/converters.d.ts +0 -10
package/dist/endpoints/embeddings/converters.js +0 -31
package/dist/endpoints/embeddings/handler.d.ts +0 -2
package/dist/endpoints/embeddings/handler.js +0 -101
package/dist/endpoints/embeddings/index.d.ts +0 -3
package/dist/endpoints/embeddings/index.js +0 -3
package/dist/endpoints/embeddings/otel.d.ts +0 -6
package/dist/endpoints/embeddings/otel.js +0 -35
package/dist/endpoints/embeddings/schema.d.ts +0 -38
package/dist/endpoints/embeddings/schema.js +0 -26
package/dist/endpoints/models/converters.d.ts +0 -6
package/dist/endpoints/models/converters.js +0 -42
package/dist/endpoints/models/handler.d.ts +0 -2
package/dist/endpoints/models/handler.js +0 -29
package/dist/endpoints/models/index.d.ts +0 -3
package/dist/endpoints/models/index.js +0 -3
package/dist/endpoints/models/schema.d.ts +0 -42
package/dist/endpoints/models/schema.js +0 -31
package/dist/errors/ai-sdk.d.ts +0 -2
package/dist/errors/ai-sdk.js +0 -52
package/dist/errors/gateway.d.ts +0 -5
package/dist/errors/gateway.js +0 -13
package/dist/errors/openai.d.ts +0 -20
package/dist/errors/openai.js +0 -40
package/dist/errors/utils.d.ts +0 -22
package/dist/errors/utils.js +0 -44
package/dist/gateway.d.ts +0 -9
package/dist/gateway.js +0 -34
package/dist/index.d.ts +0 -14
package/dist/index.js +0 -13
package/dist/lifecycle.d.ts +0 -2
package/dist/lifecycle.js +0 -94
package/dist/logger/default.d.ts +0 -4
package/dist/logger/default.js +0 -81
package/dist/logger/index.d.ts +0 -14
package/dist/logger/index.js +0 -25
package/dist/middleware/common.d.ts +0 -12
package/dist/middleware/common.js +0 -145
package/dist/middleware/matcher.d.ts +0 -27
package/dist/middleware/matcher.js +0 -112
package/dist/middleware/utils.d.ts +0 -2
package/dist/middleware/utils.js +0 -27
package/dist/models/amazon/index.d.ts +0 -2
package/dist/models/amazon/index.js +0 -2
package/dist/models/amazon/middleware.d.ts +0 -3
package/dist/models/amazon/middleware.js +0 -65
package/dist/models/amazon/presets.d.ts +0 -2390
package/dist/models/amazon/presets.js +0 -80
package/dist/models/anthropic/index.d.ts +0 -2
package/dist/models/anthropic/index.js +0 -2
package/dist/models/anthropic/middleware.d.ts +0 -4
package/dist/models/anthropic/middleware.js +0 -111
package/dist/models/anthropic/presets.d.ts +0 -4802
package/dist/models/anthropic/presets.js +0 -135
package/dist/models/catalog.d.ts +0 -4
package/dist/models/catalog.js +0 -4
package/dist/models/cohere/index.d.ts +0 -2
package/dist/models/cohere/index.js +0 -2
package/dist/models/cohere/middleware.d.ts +0 -3
package/dist/models/cohere/middleware.js +0 -60
package/dist/models/cohere/presets.d.ts +0 -2918
package/dist/models/cohere/presets.js +0 -134
package/dist/models/google/index.d.ts +0 -2
package/dist/models/google/index.js +0 -2
package/dist/models/google/middleware.d.ts +0 -7
package/dist/models/google/middleware.js +0 -103
package/dist/models/google/presets.d.ts +0 -2553
package/dist/models/google/presets.js +0 -83
package/dist/models/meta/index.d.ts +0 -1
package/dist/models/meta/index.js +0 -1
package/dist/models/meta/presets.d.ts +0 -3254
package/dist/models/meta/presets.js +0 -95
package/dist/models/openai/index.d.ts +0 -2
package/dist/models/openai/index.js +0 -2
package/dist/models/openai/middleware.d.ts +0 -3
package/dist/models/openai/middleware.js +0 -62
package/dist/models/openai/presets.d.ts +0 -6634
package/dist/models/openai/presets.js +0 -213
package/dist/models/types.d.ts +0 -20
package/dist/models/types.js +0 -84
package/dist/models/voyage/index.d.ts +0 -2
package/dist/models/voyage/index.js +0 -2
package/dist/models/voyage/middleware.d.ts +0 -2
package/dist/models/voyage/middleware.js +0 -18
package/dist/models/voyage/presets.d.ts +0 -3471
package/dist/models/voyage/presets.js +0 -85
package/dist/providers/anthropic/canonical.d.ts +0 -3
package/dist/providers/anthropic/canonical.js +0 -9
package/dist/providers/anthropic/index.d.ts +0 -1
package/dist/providers/anthropic/index.js +0 -1
package/dist/providers/bedrock/canonical.d.ts +0 -17
package/dist/providers/bedrock/canonical.js +0 -61
package/dist/providers/bedrock/index.d.ts +0 -2
package/dist/providers/bedrock/index.js +0 -2
package/dist/providers/bedrock/middleware.d.ts +0 -3
package/dist/providers/bedrock/middleware.js +0 -55
package/dist/providers/cohere/canonical.d.ts +0 -3
package/dist/providers/cohere/canonical.js +0 -17
package/dist/providers/cohere/index.d.ts +0 -1
package/dist/providers/cohere/index.js +0 -1
package/dist/providers/groq/canonical.d.ts +0 -3
package/dist/providers/groq/canonical.js +0 -12
package/dist/providers/groq/index.d.ts +0 -1
package/dist/providers/groq/index.js +0 -1
package/dist/providers/openai/canonical.d.ts +0 -3
package/dist/providers/openai/canonical.js +0 -8
package/dist/providers/openai/index.d.ts +0 -1
package/dist/providers/openai/index.js +0 -1
package/dist/providers/registry.d.ts +0 -24
package/dist/providers/registry.js +0 -100
package/dist/providers/types.d.ts +0 -7
package/dist/providers/types.js +0 -11
package/dist/providers/vertex/canonical.d.ts +0 -3
package/dist/providers/vertex/canonical.js +0 -8
package/dist/providers/vertex/index.d.ts +0 -1
package/dist/providers/vertex/index.js +0 -1
package/dist/providers/voyage/canonical.d.ts +0 -3
package/dist/providers/voyage/canonical.js +0 -7
package/dist/providers/voyage/index.d.ts +0 -1
package/dist/providers/voyage/index.js +0 -1
package/dist/telemetry/ai-sdk.d.ts +0 -2
package/dist/telemetry/ai-sdk.js +0 -31
package/dist/telemetry/baggage.d.ts +0 -1
package/dist/telemetry/baggage.js +0 -24
package/dist/telemetry/fetch.d.ts +0 -2
package/dist/telemetry/fetch.js +0 -24
package/dist/telemetry/gen-ai.d.ts +0 -5
package/dist/telemetry/gen-ai.js +0 -60
package/dist/telemetry/http.d.ts +0 -3
package/dist/telemetry/http.js +0 -54
package/dist/telemetry/memory.d.ts +0 -2
package/dist/telemetry/memory.js +0 -27
package/dist/telemetry/span.d.ts +0 -13
package/dist/telemetry/span.js +0 -60
package/dist/telemetry/stream.d.ts +0 -3
package/dist/telemetry/stream.js +0 -51
package/dist/types.d.ts +0 -176
package/dist/types.js +0 -1
package/dist/utils/env.d.ts +0 -2
package/dist/utils/env.js +0 -5
package/dist/utils/headers.d.ts +0 -4
package/dist/utils/headers.js +0 -22
package/dist/utils/preset.d.ts +0 -9
package/dist/utils/preset.js +0 -41
package/dist/utils/request.d.ts +0 -2
package/dist/utils/request.js +0 -14
package/dist/utils/response.d.ts +0 -3
package/dist/utils/response.js +0 -68

package/dist/endpoints/chat-completions/handler.js DELETED Viewed

@@ -1,145 +0,0 @@
-import { generateText, Output, streamText, wrapLanguageModel, } from "ai";
-import * as z from "zod/mini";
-import { GatewayError } from "../../errors/gateway";
-import { winterCgHandler } from "../../lifecycle";
-import { logger } from "../../logger";
-import { modelMiddlewareMatcher } from "../../middleware/matcher";
-import { resolveProvider } from "../../providers/registry";
-import { recordRequestDuration, recordTimePerOutputToken, recordTokenUsage, } from "../../telemetry/gen-ai";
-import { addSpanEvent, setSpanAttributes } from "../../telemetry/span";
-import { prepareForwardHeaders } from "../../utils/request";
-import { convertToTextCallOptions, toChatCompletions, toChatCompletionsStream } from "./converters";
-import { getChatGeneralAttributes, getChatRequestAttributes, getChatResponseAttributes, } from "./otel";
-import { ChatCompletionsBodySchema } from "./schema";
-export const chatCompletions = (config) => {
-    const hooks = config.hooks;
-    const handler = async (ctx) => {
-        const start = performance.now();
-        ctx.operation = "chat";
-        addSpanEvent("hebo.handler.started");
-        // Guard: enforce HTTP method early.
-        if (!ctx.request || ctx.request.method !== "POST") {
-            throw new GatewayError("Method Not Allowed", 405);
-        }
-        // Parse + validate input.
-        try {
-            ctx.body = await ctx.request.json();
-        }
-        catch {
-            throw new GatewayError("Invalid JSON", 400);
-        }
-        addSpanEvent("hebo.request.deserialized");
-        const parsed = ChatCompletionsBodySchema.safeParse(ctx.body);
-        if (!parsed.success) {
-            // FUTURE: consider adding body shape to metadata
-            throw new GatewayError(z.prettifyError(parsed.error), 400, undefined, parsed.error);
-        }
-        ctx.body = parsed.data;
-        addSpanEvent("hebo.request.parsed");
-        if (hooks?.before) {
-            ctx.body = (await hooks.before(ctx)) ?? ctx.body;
-            addSpanEvent("hebo.hooks.before.completed");
-        }
-        // Resolve model + provider (hooks may override defaults).
-        let inputs, stream;
-        ({ model: ctx.modelId, stream, ...inputs } = ctx.body);
-        ctx.resolvedModelId =
-            (await hooks?.resolveModelId?.(ctx)) ?? ctx.modelId;
-        logger.debug(`[chat] resolved ${ctx.modelId} to ${ctx.resolvedModelId}`);
-        addSpanEvent("hebo.model.resolved");
-        const override = await hooks?.resolveProvider?.(ctx);
-        ctx.provider =
-            override ??
-                resolveProvider({
-                    providers: ctx.providers,
-                    models: ctx.models,
-                    modelId: ctx.resolvedModelId,
-                    operation: ctx.operation,
-                });
-        const languageModel = ctx.provider.languageModel(ctx.resolvedModelId);
-        ctx.resolvedProviderId = languageModel.provider;
-        logger.debug(`[chat] using ${languageModel.provider} for ${ctx.resolvedModelId}`);
-        addSpanEvent("hebo.provider.resolved");
-        const genAiSignalLevel = config.telemetry?.signals?.gen_ai;
-        const genAiGeneralAttrs = getChatGeneralAttributes(ctx, genAiSignalLevel);
-        setSpanAttributes(genAiGeneralAttrs);
-        // Convert inputs to AI SDK call options.
-        const textOptions = convertToTextCallOptions(inputs);
-        logger.trace({
-            requestId: ctx.requestId,
-            options: textOptions,
-        }, "[chat] AI SDK options");
-        addSpanEvent("hebo.options.prepared");
-        setSpanAttributes(getChatRequestAttributes(inputs, genAiSignalLevel));
-        // Build middleware chain (model -> forward params -> provider).
-        const languageModelWithMiddleware = wrapLanguageModel({
-            model: languageModel,
-            middleware: modelMiddlewareMatcher.for(ctx.resolvedModelId, languageModel.provider),
-        });
-        // Execute request (streaming vs. non-streaming).
-        if (stream) {
-            addSpanEvent("hebo.ai-sdk.started");
-            const result = streamText({
-                model: languageModelWithMiddleware,
-                headers: prepareForwardHeaders(ctx.request),
-                abortSignal: ctx.request.signal,
-                timeout: {
-                    totalMs: 5 * 60 * 1000,
-                },
-                onAbort: () => {
-                    throw new DOMException("The operation was aborted.", "AbortError");
-                },
-                onError: () => { },
-                onFinish: (res) => {
-                    addSpanEvent("hebo.ai-sdk.completed");
-                    const streamResult = toChatCompletions(res, ctx.resolvedModelId);
-                    addSpanEvent("hebo.result.transformed");
-                    const genAiResponseAttrs = getChatResponseAttributes(streamResult, genAiSignalLevel);
-                    setSpanAttributes(genAiResponseAttrs);
-                    recordTokenUsage(genAiResponseAttrs, genAiGeneralAttrs, genAiSignalLevel);
-                    recordTimePerOutputToken(start, genAiResponseAttrs, genAiGeneralAttrs, genAiSignalLevel);
-                    recordRequestDuration(start, genAiGeneralAttrs, genAiSignalLevel);
-                },
-                experimental_include: {
-                    requestBody: false,
-                },
-                includeRawChunks: false,
-                ...textOptions,
-            });
-            ctx.result = toChatCompletionsStream(result, ctx.resolvedModelId);
-            if (hooks?.after) {
-                ctx.result = (await hooks.after(ctx)) ?? ctx.result;
-                addSpanEvent("hebo.hooks.after.completed");
-            }
-            return ctx.result;
-        }
-        addSpanEvent("hebo.ai-sdk.started");
-        const result = await generateText({
-            model: languageModelWithMiddleware,
-            headers: prepareForwardHeaders(ctx.request),
-            abortSignal: ctx.request.signal,
-            timeout: 5 * 60 * 1000,
-            experimental_include: {
-                requestBody: false,
-                responseBody: false,
-            },
-            ...textOptions,
-        });
-        logger.trace({ requestId: ctx.requestId, result }, "[chat] AI SDK result");
-        addSpanEvent("hebo.ai-sdk.completed");
-        // Transform result.
-        ctx.result = toChatCompletions(result, ctx.resolvedModelId);
-        addSpanEvent("hebo.result.transformed");
-        const genAiResponseAttrs = getChatResponseAttributes(ctx.result, genAiSignalLevel);
-        setSpanAttributes(genAiResponseAttrs);
-        recordTokenUsage(genAiResponseAttrs, genAiGeneralAttrs, genAiSignalLevel);
-        if (hooks?.after) {
-            ctx.result = (await hooks.after(ctx)) ?? ctx.result;
-            addSpanEvent("hebo.hooks.after.completed");
-        }
-        recordTimePerOutputToken(start, genAiResponseAttrs, genAiGeneralAttrs, genAiSignalLevel);
-        recordRequestDuration(start, genAiGeneralAttrs, genAiSignalLevel);
-        return ctx.result;
-    };
-    return { handler: winterCgHandler(handler, config) };
-};

package/dist/endpoints/chat-completions/index.d.ts DELETED Viewed

@@ -1,3 +0,0 @@
-export * from "./converters";
-export * from "./handler";
-export * from "./schema";

package/dist/endpoints/chat-completions/index.js DELETED Viewed

@@ -1,3 +0,0 @@
-export * from "./converters";
-export * from "./handler";
-export * from "./schema";

package/dist/endpoints/chat-completions/otel.d.ts DELETED Viewed

@@ -1,6 +0,0 @@
-import type { Attributes } from "@opentelemetry/api";
-import type { ChatCompletions, ChatCompletionsBody } from "./schema";
-import { type GatewayContext, type TelemetrySignalLevel } from "../../types";
-export declare const getChatGeneralAttributes: (ctx: GatewayContext, signalLevel?: TelemetrySignalLevel) => Attributes;
-export declare const getChatRequestAttributes: (inputs: ChatCompletionsBody, signalLevel?: TelemetrySignalLevel) => Attributes;
-export declare const getChatResponseAttributes: (completions: ChatCompletions, signalLevel?: TelemetrySignalLevel) => Attributes;

package/dist/endpoints/chat-completions/otel.js DELETED Viewed

@@ -1,134 +0,0 @@
-import {} from "../../types";
-const toTextPart = (content) => ({ type: "text", content });
-const toMessageParts = (message) => {
-    if (message.role === "assistant") {
-        const parts = [];
-        if (typeof message.content === "string")
-            parts.push(toTextPart(message.content));
-        if (Array.isArray(message.tool_calls)) {
-            for (const call of message.tool_calls) {
-                parts.push({
-                    type: "tool_call",
-                    id: call.id,
-                    name: call.function.name,
-                    arguments: call.function.arguments,
-                });
-            }
-        }
-        return parts;
-    }
-    if (message.role === "tool") {
-        return [{ type: "tool_call_response", id: message.tool_call_id, content: message.content }];
-    }
-    if (message.role === "user") {
-        const parts = [];
-        if (typeof message.content === "string")
-            parts.push(toTextPart(message.content));
-        if (Array.isArray(message.content)) {
-            for (const part of message.content) {
-                if (part.type === "text") {
-                    parts.push(toTextPart(part.text));
-                }
-                else if (part.type === "image_url") {
-                    parts.push({ type: "image", content: part.image_url.url });
-                }
-                else if (part.type === "input_audio") {
-                    parts.push({
-                        type: "audio",
-                        content: "[REDACTED_BINARY_DATA]",
-                        format: part.input_audio.format,
-                    });
-                }
-                else {
-                    parts.push({
-                        type: "file",
-                        // FUTURE: optionally expose safe metadata without raw binary payloads.
-                        content: part.file.filename ?? "[REDACTED_BINARY_DATA]",
-                        media_type: part.file.media_type,
-                    });
-                }
-            }
-        }
-        return parts;
-    }
-    // FUTURE: remove once Langfuse supports gen_ai.system_instructions
-    if (message.role === "system") {
-        return [toTextPart(message.content)];
-    }
-    return [];
-};
-export const getChatGeneralAttributes = (ctx, signalLevel) => {
-    if (!signalLevel || signalLevel === "off")
-        return {};
-    const requestModel = typeof ctx.body?.model === "string" ? ctx.body.model : ctx.modelId;
-    return {
-        "gen_ai.operation.name": ctx.operation,
-        "gen_ai.request.model": requestModel,
-        "gen_ai.response.model": ctx.resolvedModelId,
-        "gen_ai.provider.name": ctx.resolvedProviderId,
-    };
-};
-export const getChatRequestAttributes = (inputs, signalLevel) => {
-    if (!signalLevel || signalLevel === "off")
-        return {};
-    const attrs = {};
-    if (inputs.seed !== undefined) {
-        Object.assign(attrs, { "gen_ai.request.seed": inputs.seed });
-    }
-    if (signalLevel !== "required") {
-        Object.assign(attrs, {
-            "gen_ai.request.stream": inputs.stream,
-            "gen_ai.request.frequency_penalty": inputs.frequency_penalty,
-            "gen_ai.request.max_tokens": inputs.max_completion_tokens,
-            "gen_ai.request.presence_penalty": inputs.presence_penalty,
-            "gen_ai.request.stop_sequences": inputs.stop
-                ? Array.isArray(inputs.stop)
-                    ? inputs.stop
-                    : [inputs.stop]
-                : undefined,
-            "gen_ai.request.temperature": inputs.temperature,
-            "gen_ai.request.top_p": inputs.top_p,
-        });
-    }
-    if (signalLevel === "full") {
-        Object.assign(attrs, {
-            // FUTURE: move system instructions from messages to here
-            // blocker: https://github.com/langfuse/langfuse/issues/11607
-            // "gen_ai.system_instructions": inputs.messages
-            //   .filter((m) => m.role === "system")
-            //   .map((m) => JSON.stringify(toTextPart(m.content))),
-            "gen_ai.input.messages": inputs.messages
-                //.filter((m) => m.role !== "system")
-                .map((m) => JSON.stringify({ role: m.role, parts: toMessageParts(m) })),
-            "gen_ai.tool.definitions": JSON.stringify(inputs.tools),
-        });
-    }
-    return attrs;
-};
-export const getChatResponseAttributes = (completions, signalLevel) => {
-    if (!signalLevel || signalLevel === "off")
-        return {};
-    const attrs = {
-        "gen_ai.response.id": completions.id,
-    };
-    if (signalLevel !== "required") {
-        Object.assign(attrs, {
-            "gen_ai.response.finish_reasons": completions.choices?.map((c) => c.finish_reason),
-            "gen_ai.usage.total_tokens": completions.usage?.total_tokens,
-            "gen_ai.usage.input_tokens": completions.usage?.prompt_tokens,
-            "gen_ai.usage.cached_tokens": completions.usage?.prompt_tokens_details?.cached_tokens,
-            "gen_ai.usage.output_tokens": completions.usage?.completion_tokens,
-            "gen_ai.usage.reasoning_tokens": completions.usage?.completion_tokens_details?.reasoning_tokens,
-        });
-    }
-    if (signalLevel === "full") {
-        Object.assign(attrs, {
-            "gen_ai.output.messages": completions.choices?.map((c) => JSON.stringify({
-                role: c.message.role,
-                parts: toMessageParts(c.message),
-                finish_reason: c.finish_reason,
-            })),
-        });
-    }
-    return attrs;
-};