npm - @hebo-ai/gateway - Versions diffs - 0.6.2 → 0.8.0-rc0 - Mend

@hebo-ai/gateway 0.6.2 → 0.8.0-rc0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (168) hide show

package/README.md +134 -7
package/package.json +46 -1
package/dist/config.d.ts +0 -2
package/dist/config.js +0 -81
package/dist/endpoints/chat-completions/converters.d.ts +0 -43
package/dist/endpoints/chat-completions/converters.js +0 -625
package/dist/endpoints/chat-completions/handler.d.ts +0 -2
package/dist/endpoints/chat-completions/handler.js +0 -149
package/dist/endpoints/chat-completions/index.d.ts +0 -4
package/dist/endpoints/chat-completions/index.js +0 -4
package/dist/endpoints/chat-completions/otel.d.ts +0 -5
package/dist/endpoints/chat-completions/otel.js +0 -171
package/dist/endpoints/chat-completions/schema.d.ts +0 -1188
package/dist/endpoints/chat-completions/schema.js +0 -298
package/dist/endpoints/embeddings/converters.d.ts +0 -10
package/dist/endpoints/embeddings/converters.js +0 -31
package/dist/endpoints/embeddings/handler.d.ts +0 -2
package/dist/endpoints/embeddings/handler.js +0 -104
package/dist/endpoints/embeddings/index.d.ts +0 -4
package/dist/endpoints/embeddings/index.js +0 -4
package/dist/endpoints/embeddings/otel.d.ts +0 -5
package/dist/endpoints/embeddings/otel.js +0 -29
package/dist/endpoints/embeddings/schema.d.ts +0 -44
package/dist/endpoints/embeddings/schema.js +0 -29
package/dist/endpoints/models/converters.d.ts +0 -6
package/dist/endpoints/models/converters.js +0 -42
package/dist/endpoints/models/handler.d.ts +0 -2
package/dist/endpoints/models/handler.js +0 -29
package/dist/endpoints/models/index.d.ts +0 -3
package/dist/endpoints/models/index.js +0 -3
package/dist/endpoints/models/schema.d.ts +0 -42
package/dist/endpoints/models/schema.js +0 -31
package/dist/errors/ai-sdk.d.ts +0 -2
package/dist/errors/ai-sdk.js +0 -52
package/dist/errors/gateway.d.ts +0 -5
package/dist/errors/gateway.js +0 -13
package/dist/errors/openai.d.ts +0 -20
package/dist/errors/openai.js +0 -40
package/dist/errors/utils.d.ts +0 -22
package/dist/errors/utils.js +0 -44
package/dist/gateway.d.ts +0 -9
package/dist/gateway.js +0 -40
package/dist/index.d.ts +0 -14
package/dist/index.js +0 -13
package/dist/lifecycle.d.ts +0 -2
package/dist/lifecycle.js +0 -98
package/dist/logger/default.d.ts +0 -4
package/dist/logger/default.js +0 -81
package/dist/logger/index.d.ts +0 -11
package/dist/logger/index.js +0 -25
package/dist/middleware/common.d.ts +0 -12
package/dist/middleware/common.js +0 -146
package/dist/middleware/debug.d.ts +0 -3
package/dist/middleware/debug.js +0 -27
package/dist/middleware/matcher.d.ts +0 -28
package/dist/middleware/matcher.js +0 -118
package/dist/middleware/utils.d.ts +0 -2
package/dist/middleware/utils.js +0 -24
package/dist/models/amazon/index.d.ts +0 -2
package/dist/models/amazon/index.js +0 -2
package/dist/models/amazon/middleware.d.ts +0 -3
package/dist/models/amazon/middleware.js +0 -68
package/dist/models/amazon/presets.d.ts +0 -345
package/dist/models/amazon/presets.js +0 -80
package/dist/models/anthropic/index.d.ts +0 -2
package/dist/models/anthropic/index.js +0 -2
package/dist/models/anthropic/middleware.d.ts +0 -5
package/dist/models/anthropic/middleware.js +0 -127
package/dist/models/anthropic/presets.d.ts +0 -711
package/dist/models/anthropic/presets.js +0 -135
package/dist/models/catalog.d.ts +0 -4
package/dist/models/catalog.js +0 -8
package/dist/models/cohere/index.d.ts +0 -2
package/dist/models/cohere/index.js +0 -2
package/dist/models/cohere/middleware.d.ts +0 -3
package/dist/models/cohere/middleware.js +0 -62
package/dist/models/cohere/presets.d.ts +0 -411
package/dist/models/cohere/presets.js +0 -134
package/dist/models/google/index.d.ts +0 -2
package/dist/models/google/index.js +0 -2
package/dist/models/google/middleware.d.ts +0 -8
package/dist/models/google/middleware.js +0 -111
package/dist/models/google/presets.d.ts +0 -375
package/dist/models/google/presets.js +0 -82
package/dist/models/meta/index.d.ts +0 -1
package/dist/models/meta/index.js +0 -1
package/dist/models/meta/presets.d.ts +0 -483
package/dist/models/meta/presets.js +0 -95
package/dist/models/openai/index.d.ts +0 -2
package/dist/models/openai/index.js +0 -2
package/dist/models/openai/middleware.d.ts +0 -4
package/dist/models/openai/middleware.js +0 -88
package/dist/models/openai/presets.d.ts +0 -959
package/dist/models/openai/presets.js +0 -213
package/dist/models/types.d.ts +0 -20
package/dist/models/types.js +0 -84
package/dist/models/voyage/index.d.ts +0 -2
package/dist/models/voyage/index.js +0 -2
package/dist/models/voyage/middleware.d.ts +0 -2
package/dist/models/voyage/middleware.js +0 -19
package/dist/models/voyage/presets.d.ts +0 -436
package/dist/models/voyage/presets.js +0 -85
package/dist/providers/anthropic/canonical.d.ts +0 -3
package/dist/providers/anthropic/canonical.js +0 -9
package/dist/providers/anthropic/index.d.ts +0 -1
package/dist/providers/anthropic/index.js +0 -1
package/dist/providers/bedrock/canonical.d.ts +0 -17
package/dist/providers/bedrock/canonical.js +0 -61
package/dist/providers/bedrock/index.d.ts +0 -2
package/dist/providers/bedrock/index.js +0 -2
package/dist/providers/bedrock/middleware.d.ts +0 -4
package/dist/providers/bedrock/middleware.js +0 -104
package/dist/providers/cohere/canonical.d.ts +0 -3
package/dist/providers/cohere/canonical.js +0 -17
package/dist/providers/cohere/index.d.ts +0 -1
package/dist/providers/cohere/index.js +0 -1
package/dist/providers/groq/canonical.d.ts +0 -3
package/dist/providers/groq/canonical.js +0 -12
package/dist/providers/groq/index.d.ts +0 -1
package/dist/providers/groq/index.js +0 -1
package/dist/providers/openai/canonical.d.ts +0 -3
package/dist/providers/openai/canonical.js +0 -8
package/dist/providers/openai/index.d.ts +0 -1
package/dist/providers/openai/index.js +0 -1
package/dist/providers/registry.d.ts +0 -24
package/dist/providers/registry.js +0 -103
package/dist/providers/types.d.ts +0 -7
package/dist/providers/types.js +0 -11
package/dist/providers/vertex/canonical.d.ts +0 -3
package/dist/providers/vertex/canonical.js +0 -8
package/dist/providers/vertex/index.d.ts +0 -1
package/dist/providers/vertex/index.js +0 -1
package/dist/providers/voyage/canonical.d.ts +0 -3
package/dist/providers/voyage/canonical.js +0 -7
package/dist/providers/voyage/index.d.ts +0 -1
package/dist/providers/voyage/index.js +0 -1
package/dist/telemetry/ai-sdk.d.ts +0 -2
package/dist/telemetry/ai-sdk.js +0 -31
package/dist/telemetry/baggage.d.ts +0 -1
package/dist/telemetry/baggage.js +0 -24
package/dist/telemetry/fetch.d.ts +0 -2
package/dist/telemetry/fetch.js +0 -49
package/dist/telemetry/gen-ai.d.ts +0 -6
package/dist/telemetry/gen-ai.js +0 -78
package/dist/telemetry/http.d.ts +0 -3
package/dist/telemetry/http.js +0 -54
package/dist/telemetry/index.d.ts +0 -1
package/dist/telemetry/index.js +0 -1
package/dist/telemetry/memory.d.ts +0 -2
package/dist/telemetry/memory.js +0 -43
package/dist/telemetry/span.d.ts +0 -13
package/dist/telemetry/span.js +0 -60
package/dist/telemetry/stream.d.ts +0 -3
package/dist/telemetry/stream.js +0 -58
package/dist/types.d.ts +0 -176
package/dist/types.js +0 -1
package/dist/utils/env.d.ts +0 -2
package/dist/utils/env.js +0 -7
package/dist/utils/headers.d.ts +0 -4
package/dist/utils/headers.js +0 -22
package/dist/utils/preset.d.ts +0 -10
package/dist/utils/preset.js +0 -42
package/dist/utils/request.d.ts +0 -2
package/dist/utils/request.js +0 -43
package/dist/utils/response.d.ts +0 -3
package/dist/utils/response.js +0 -70
package/dist/utils/url.d.ts +0 -4
package/dist/utils/url.js +0 -21

package/dist/endpoints/chat-completions/schema.js DELETED Viewed

@@ -1,298 +0,0 @@
-import * as z from "zod";
-export const ChatCompletionsCacheControlSchema = z.object({
-    type: z.literal("ephemeral"),
-    ttl: z.string().optional(),
-});
-export const ChatCompletionsContentPartTextSchema = z.object({
-    type: z.literal("text"),
-    text: z.string(),
-    // Extension origin: Anthropic/OpenRouter/Vercel
-    cache_control: ChatCompletionsCacheControlSchema.optional().meta({ extension: true }),
-});
-export const ChatCompletionsContentPartImageSchema = z.object({
-    type: z.literal("image_url"),
-    image_url: z.object({
-        url: z.string(),
-        detail: z.enum(["low", "high", "auto"]).optional(),
-    }),
-    // Extension origin: OpenRouter/Vercel/Anthropic
-    cache_control: ChatCompletionsCacheControlSchema.optional().meta({ extension: true }),
-});
-export const ChatCompletionsContentPartFileSchema = z.object({
-    type: z.literal("file"),
-    file: z.object({
-        data: z.string(),
-        media_type: z.string(),
-        filename: z.string().optional(),
-    }),
-    // Extension origin: OpenRouter/Vercel/Anthropic
-    cache_control: ChatCompletionsCacheControlSchema.optional().meta({ extension: true }),
-});
-export const ChatCompletionsContentPartAudioSchema = z.object({
-    type: z.literal("input_audio"),
-    input_audio: z.object({
-        data: z.string(),
-        // only wav and mp3 are official by OpenAI, rest is taken from Gemini support:
-        // https://docs.cloud.google.com/vertex-ai/generative-ai/docs/multimodal/audio-understanding
-        format: z.enum([
-            "x-aac",
-            "flac",
-            "mp3",
-            "m4a",
-            "mpeg",
-            "mpga",
-            "mp4",
-            "ogg",
-            "pcm",
-            "wav",
-            "webm",
-        ]),
-    }),
-    // Extension origin: OpenRouter/Vercel/Anthropic
-    cache_control: ChatCompletionsCacheControlSchema.optional().meta({ extension: true }),
-});
-export const ChatCompletionsContentPartSchema = z.discriminatedUnion("type", [
-    ChatCompletionsContentPartTextSchema,
-    ChatCompletionsContentPartImageSchema,
-    ChatCompletionsContentPartFileSchema,
-    ChatCompletionsContentPartAudioSchema,
-]);
-export const ChatCompletionsToolCallSchema = z.object({
-    type: z.literal("function"),
-    id: z.string(),
-    function: z.object({
-        arguments: z.string(),
-        name: z.string(),
-    }),
-    // Extension origin: Gemini
-    extra_content: z
-        .record(z.string(), z.record(z.string(), z.unknown()))
-        .optional()
-        .meta({ extension: true }),
-});
-export const ChatCompletionsSystemMessageSchema = z.object({
-    role: z.literal("system"),
-    content: z.string(),
-    name: z.string().optional(),
-    // Extension origin: OpenRouter/Vercel/Anthropic
-    cache_control: ChatCompletionsCacheControlSchema.optional().meta({ extension: true }),
-});
-export const ChatCompletionsUserMessageSchema = z.object({
-    role: z.literal("user"),
-    content: z.union([z.string(), z.array(ChatCompletionsContentPartSchema)]),
-    name: z.string().optional(),
-    // Extension origin: OpenRouter/Vercel/Anthropic
-    cache_control: ChatCompletionsCacheControlSchema.optional().meta({ extension: true }),
-});
-export const ChatCompletionsReasoningDetailSchema = z.object({
-    id: z.string().optional(),
-    index: z.int().nonnegative(),
-    type: z.string(),
-    text: z.string().optional(),
-    signature: z.string().optional(),
-    data: z.string().optional(),
-    summary: z.string().optional(),
-    format: z.string().optional(),
-});
-export const ChatCompletionsAssistantMessageSchema = z.object({
-    role: z.literal("assistant"),
-    content: z
-        .union([z.string(), z.null(), z.array(ChatCompletionsContentPartTextSchema)])
-        .optional(),
-    name: z.string().optional(),
-    // FUTURE: This should also support Custom Tool Calls
-    tool_calls: z.array(ChatCompletionsToolCallSchema).optional(),
-    // Extension origin: OpenRouter/Vercel
-    reasoning: z.string().optional().meta({ extension: true }),
-    // Extension origin: OpenRouter/Vercel
-    reasoning_details: z
-        .array(ChatCompletionsReasoningDetailSchema)
-        .optional()
-        .meta({ extension: true }),
-    // Extension origin: Gemini
-    extra_content: z
-        .record(z.string(), z.record(z.string(), z.unknown()))
-        .optional()
-        .meta({ extension: true }),
-    // Extension origin: OpenRouter/Vercel/Anthropic
-    cache_control: ChatCompletionsCacheControlSchema.optional().meta({ extension: true }),
-});
-export const ChatCompletionsToolMessageSchema = z.object({
-    role: z.literal("tool"),
-    content: z.union([z.string(), z.array(ChatCompletionsContentPartTextSchema)]),
-    tool_call_id: z.string(),
-});
-export const ChatCompletionsMessageSchema = z.discriminatedUnion("role", [
-    ChatCompletionsSystemMessageSchema,
-    ChatCompletionsUserMessageSchema,
-    ChatCompletionsAssistantMessageSchema,
-    ChatCompletionsToolMessageSchema,
-]);
-export const ChatCompletionsToolSchema = z.object({
-    type: z.literal("function"),
-    function: z.object({
-        name: z.string(),
-        description: z.string().optional(),
-        parameters: z.record(z.string(), z.unknown()),
-        strict: z.boolean().optional(),
-    }),
-    // FUTURE: cache_control support on tools
-});
-const ChatCompletionsNamedFunctionToolChoiceSchema = z.object({
-    type: z.literal("function"),
-    function: z.object({
-        name: z.string(),
-    }),
-});
-const ChatCompletionsAllowedFunctionToolChoiceSchema = z.object({
-    type: z.literal("allowed_tools"),
-    allowed_tools: z.object({
-        mode: z.enum(["auto", "required"]),
-        tools: z.array(ChatCompletionsNamedFunctionToolChoiceSchema).nonempty(),
-    }),
-});
-export const ChatCompletionsToolChoiceSchema = z.union([
-    z.enum(["none", "auto", "required", "validated"]),
-    z.discriminatedUnion("type", [
-        ChatCompletionsNamedFunctionToolChoiceSchema,
-        ChatCompletionsAllowedFunctionToolChoiceSchema,
-    ]),
-    // FUTURE: Missing CustomTool
-]);
-export const ChatCompletionsReasoningEffortSchema = z.enum([
-    "none",
-    "minimal",
-    "low",
-    "medium",
-    "high",
-    "xhigh",
-]);
-export const ChatCompletionsReasoningConfigSchema = z.object({
-    enabled: z.optional(z.boolean()),
-    effort: z.optional(ChatCompletionsReasoningEffortSchema),
-    max_tokens: z.optional(z.number()),
-    exclude: z.optional(z.boolean()),
-});
-export const ChatCompletionsResponseFormatJsonSchema = z.object({
-    // FUTURE: consider support for legacy json_object (if demand)
-    type: z.literal("json_schema"),
-    json_schema: z.object({
-        name: z.string(),
-        description: z.string().optional(),
-        schema: z.record(z.string(), z.unknown()),
-        // FUTURE: consider support for non-strict mode (for providers that support it)
-        strict: z.boolean().optional(),
-    }),
-});
-export const ChatCompletionsResponseFormatTextSchema = z.object({
-    type: z.literal("text"),
-});
-export const ChatCompletionsResponseFormatSchema = z.discriminatedUnion("type", [
-    ChatCompletionsResponseFormatJsonSchema,
-    ChatCompletionsResponseFormatTextSchema,
-]);
-export const ChatCompletionsMetadataSchema = z.record(z.string().min(1).max(64), z.string().max(512));
-const ChatCompletionsInputsSchema = z.object({
-    messages: z.array(ChatCompletionsMessageSchema),
-    tools: z.array(ChatCompletionsToolSchema).optional(),
-    tool_choice: ChatCompletionsToolChoiceSchema.optional(),
-    temperature: z.number().min(0).max(2).optional(),
-    max_tokens: z.int().nonnegative().optional(),
-    max_completion_tokens: z.int().nonnegative().optional(),
-    frequency_penalty: z.number().min(-2.0).max(2.0).optional(),
-    presence_penalty: z.number().min(-2.0).max(2.0).optional(),
-    seed: z.int().optional(),
-    stop: z.union([z.string(), z.array(z.string())]).optional(),
-    top_p: z.number().min(0).max(1.0).optional(),
-    metadata: ChatCompletionsMetadataSchema.optional(),
-    response_format: ChatCompletionsResponseFormatSchema.optional(),
-    reasoning_effort: ChatCompletionsReasoningEffortSchema.optional(),
-    prompt_cache_key: z.string().optional(),
-    prompt_cache_retention: z.enum(["in_memory", "24h"]).optional(),
-    // Extension origin: OpenRouter/Vercel/Anthropic
-    cache_control: ChatCompletionsCacheControlSchema.optional().meta({ extension: true }),
-    // Extension origin: OpenRouter
-    reasoning: ChatCompletionsReasoningConfigSchema.optional().meta({ extension: true }),
-    // Extension origin: Gemini extra_body
-    // https://docs.cloud.google.com/vertex-ai/generative-ai/docs/migrate/openai/overview#extra_body
-    extra_body: z
-        .record(z.string(), z.record(z.string(), z.unknown()))
-        .optional()
-        .meta({ extension: true }),
-});
-export const ChatCompletionsBodySchema = z.looseObject({
-    model: z.string(),
-    stream: z.boolean().optional(),
-    ...ChatCompletionsInputsSchema.shape,
-});
-export const ChatCompletionsFinishReasonSchema = z.enum([
-    "stop",
-    "length",
-    "content_filter",
-    "tool_calls",
-]);
-export const ChatCompletionsChoiceSchema = z.object({
-    index: z.int().nonnegative(),
-    message: ChatCompletionsAssistantMessageSchema,
-    finish_reason: ChatCompletionsFinishReasonSchema,
-    // FUTURE: model this out
-    logprobs: z.unknown().optional(),
-});
-export const ChatCompletionsUsageSchema = z.object({
-    prompt_tokens: z.int().nonnegative().optional(),
-    completion_tokens: z.int().nonnegative().optional(),
-    total_tokens: z.int().nonnegative().optional(),
-    completion_tokens_details: z
-        .object({
-        // FUTURE: add missing properties
-        reasoning_tokens: z.int().nonnegative().optional(),
-    })
-        .optional(),
-    prompt_tokens_details: z
-        .object({
-        // FUTURE: add missing properties
-        cached_tokens: z.int().nonnegative().optional(),
-        // Extension origin: OpenRouter
-        cache_write_tokens: z.int().nonnegative().optional().meta({ extension: true }),
-    })
-        .optional(),
-});
-export const ChatCompletionsSchema = z.object({
-    id: z.string(),
-    object: z.literal("chat.completion"),
-    created: z.int().nonnegative(),
-    model: z.string(),
-    choices: z.array(ChatCompletionsChoiceSchema),
-    usage: ChatCompletionsUsageSchema.nullable(),
-    // Extension origin: Vercel AI Gateway
-    provider_metadata: z
-        .record(z.string(), z.record(z.string(), z.unknown()))
-        .optional()
-        .meta({ extension: true }),
-});
-export const ChatCompletionsToolCallDeltaSchema = ChatCompletionsToolCallSchema.partial().extend({
-    index: z.int().nonnegative(),
-});
-export const ChatCompletionsAssistantMessageDeltaSchema = ChatCompletionsAssistantMessageSchema.partial().extend({
-    tool_calls: z.array(ChatCompletionsToolCallDeltaSchema).optional(),
-});
-export const ChatCompletionsChoiceDeltaSchema = z.object({
-    index: z.int().nonnegative(),
-    delta: ChatCompletionsAssistantMessageDeltaSchema,
-    finish_reason: ChatCompletionsFinishReasonSchema.nullable(),
-    // FUTURE: model this out
-    logprobs: z.unknown().optional(),
-});
-export const ChatCompletionsChunkSchema = z.object({
-    id: z.string(),
-    object: z.literal("chat.completion.chunk"),
-    created: z.int().nonnegative(),
-    model: z.string(),
-    choices: z.array(ChatCompletionsChoiceDeltaSchema),
-    usage: ChatCompletionsUsageSchema.nullable(),
-    // Extension origin: Vercel AI Gateway
-    provider_metadata: z
-        .record(z.string(), z.record(z.string(), z.unknown()))
-        .optional()
-        .meta({ extension: true }),
-});

package/dist/endpoints/embeddings/converters.d.ts DELETED Viewed

@@ -1,10 +0,0 @@
-import type { SharedV3ProviderOptions } from "@ai-sdk/provider";
-import type { EmbedManyResult } from "ai";
-import type { EmbeddingsInputs, Embeddings } from "./schema";
-export type EmbedCallOptions = {
-    values: string[];
-    providerOptions: SharedV3ProviderOptions;
-};
-export declare function convertToEmbedCallOptions(params: EmbeddingsInputs): EmbedCallOptions;
-export declare function toEmbeddings(embedManyResult: EmbedManyResult, modelId: string): Embeddings;
-export declare function createEmbeddingsResponse(embedManyResult: EmbedManyResult, modelId: string, responseInit?: ResponseInit): Response;

package/dist/endpoints/embeddings/converters.js DELETED Viewed

@@ -1,31 +0,0 @@
-import { toResponse } from "../../utils/response";
-export function convertToEmbedCallOptions(params) {
-    const { input, ...rest } = params;
-    return {
-        values: Array.isArray(input) ? input : [input],
-        providerOptions: {
-            unknown: rest,
-        },
-    };
-}
-export function toEmbeddings(embedManyResult, modelId) {
-    const data = embedManyResult.embeddings.map((embedding, index) => ({
-        object: "embedding",
-        embedding,
-        index,
-    }));
-    const usage = {
-        prompt_tokens: embedManyResult.usage.tokens,
-        total_tokens: embedManyResult.usage.tokens,
-    };
-    return {
-        object: "list",
-        data,
-        model: modelId,
-        usage,
-        provider_metadata: embedManyResult.providerMetadata,
-    };
-}
-export function createEmbeddingsResponse(embedManyResult, modelId, responseInit) {
-    return toResponse(toEmbeddings(embedManyResult, modelId), responseInit);
-}

package/dist/endpoints/embeddings/handler.d.ts DELETED Viewed

	@@ -1,2 +0,0 @@
1	- import type { GatewayConfig, Endpoint } from "../../types";
2	- export declare const embeddings: (config: GatewayConfig) => Endpoint;

package/dist/endpoints/embeddings/handler.js DELETED Viewed

@@ -1,104 +0,0 @@
-import { embedMany, wrapEmbeddingModel } from "ai";
-import * as z from "zod/mini";
-import { GatewayError } from "../../errors/gateway";
-import { winterCgHandler } from "../../lifecycle";
-import { logger } from "../../logger";
-import { modelMiddlewareMatcher } from "../../middleware/matcher";
-import { resolveProvider } from "../../providers/registry";
-import { getGenAiGeneralAttributes, recordTimePerOutputToken, recordTokenUsage, } from "../../telemetry/gen-ai";
-import { addSpanEvent, setSpanAttributes } from "../../telemetry/span";
-import { prepareForwardHeaders } from "../../utils/request";
-import { convertToEmbedCallOptions, toEmbeddings } from "./converters";
-import { getEmbeddingsRequestAttributes, getEmbeddingsResponseAttributes } from "./otel";
-import { EmbeddingsBodySchema } from "./schema";
-export const embeddings = (config) => {
-    const hooks = config.hooks;
-    const handler = async (ctx) => {
-        const start = performance.now();
-        ctx.operation = "embeddings";
-        addSpanEvent("hebo.handler.started");
-        // Guard: enforce HTTP method early.
-        if (!ctx.request || ctx.request.method !== "POST") {
-            throw new GatewayError("Method Not Allowed", 405);
-        }
-        // Parse + validate input.
-        try {
-            // oxlint-disable-next-line no-unsafe-assignment
-            ctx.body = await ctx.request.json();
-        }
-        catch {
-            throw new GatewayError("Invalid JSON", 400);
-        }
-        logger.trace({ requestId: ctx.requestId, result: ctx.body }, "[chat] EmbeddingsBody");
-        addSpanEvent("hebo.request.deserialized");
-        const parsed = EmbeddingsBodySchema.safeParse(ctx.body);
-        if (!parsed.success) {
-            // FUTURE: consider adding body shape to metadata
-            throw new GatewayError(z.prettifyError(parsed.error), 400, undefined, parsed.error);
-        }
-        ctx.body = parsed.data;
-        addSpanEvent("hebo.request.parsed");
-        if (hooks?.before) {
-            ctx.body = (await hooks.before(ctx)) ?? ctx.body;
-            addSpanEvent("hebo.hooks.before.completed");
-        }
-        // Resolve model + provider (hooks may override defaults).
-        let inputs;
-        ({ model: ctx.modelId, ...inputs } = ctx.body);
-        ctx.resolvedModelId =
-            (await hooks?.resolveModelId?.(ctx)) ?? ctx.modelId;
-        logger.debug(`[embeddings] resolved ${ctx.modelId} to ${ctx.resolvedModelId}`);
-        addSpanEvent("hebo.model.resolved");
-        const override = await hooks?.resolveProvider?.(ctx);
-        ctx.provider =
-            override ??
-                resolveProvider({
-                    providers: ctx.providers,
-                    models: ctx.models,
-                    modelId: ctx.resolvedModelId,
-                    operation: ctx.operation,
-                });
-        const embeddingModel = ctx.provider.embeddingModel(ctx.resolvedModelId);
-        ctx.resolvedProviderId = embeddingModel.provider;
-        logger.debug(`[embeddings] using ${embeddingModel.provider} for ${ctx.resolvedModelId}`);
-        addSpanEvent("hebo.provider.resolved");
-        const genAiSignalLevel = config.telemetry?.signals?.gen_ai;
-        const genAiGeneralAttrs = getGenAiGeneralAttributes(ctx, genAiSignalLevel);
-        setSpanAttributes(genAiGeneralAttrs);
-        // Convert inputs to AI SDK call options.
-        // oxlint-disable-next-line no-unsafe-argument
-        const embedOptions = convertToEmbedCallOptions(inputs);
-        logger.trace({ requestId: ctx.requestId, options: embedOptions }, "[embeddings] AI SDK options");
-        addSpanEvent("hebo.options.prepared");
-        setSpanAttributes(getEmbeddingsRequestAttributes(ctx.body, genAiSignalLevel));
-        // Build middleware chain (model -> forward params -> provider).
-        const embeddingModelWithMiddleware = wrapEmbeddingModel({
-            model: embeddingModel,
-            middleware: modelMiddlewareMatcher.forEmbedding(ctx.resolvedModelId, embeddingModel.provider),
-        });
-        // Execute request.
-        addSpanEvent("hebo.ai-sdk.started");
-        const result = await embedMany({
-            model: embeddingModelWithMiddleware,
-            headers: prepareForwardHeaders(ctx.request),
-            abortSignal: ctx.request.signal,
-            ...embedOptions,
-        });
-        logger.trace({ requestId: ctx.requestId, result }, "[embeddings] AI SDK result");
-        addSpanEvent("hebo.ai-sdk.completed");
-        // Transform result.
-        ctx.result = toEmbeddings(result, ctx.modelId);
-        logger.trace({ requestId: ctx.requestId, result: ctx.result }, "[chat] Embeddings");
-        addSpanEvent("hebo.result.transformed");
-        const genAiResponseAttrs = getEmbeddingsResponseAttributes(ctx.result, genAiSignalLevel);
-        recordTokenUsage(genAiResponseAttrs, genAiGeneralAttrs, genAiSignalLevel);
-        setSpanAttributes(genAiResponseAttrs);
-        if (hooks?.after) {
-            ctx.result = (await hooks.after(ctx)) ?? ctx.result;
-            addSpanEvent("hebo.hooks.after.completed");
-        }
-        recordTimePerOutputToken(start, genAiResponseAttrs, genAiGeneralAttrs, genAiSignalLevel);
-        return ctx.result;
-    };
-    return { handler: winterCgHandler(handler, config) };
-};

package/dist/endpoints/embeddings/index.d.ts DELETED Viewed

@@ -1,4 +0,0 @@
-export * from "./converters";
-export * from "./handler";
-export * from "./schema";
-export * from "./otel";

package/dist/endpoints/embeddings/index.js DELETED Viewed

@@ -1,4 +0,0 @@
-export * from "./converters";
-export * from "./handler";
-export * from "./schema";
-export * from "./otel";

package/dist/endpoints/embeddings/otel.d.ts DELETED Viewed

@@ -1,5 +0,0 @@
-import type { Attributes } from "@opentelemetry/api";
-import type { Embeddings, EmbeddingsInputs } from "./schema";
-import { type TelemetrySignalLevel } from "../../types";
-export declare const getEmbeddingsRequestAttributes: (inputs: EmbeddingsInputs, signalLevel?: TelemetrySignalLevel) => Attributes;
-export declare const getEmbeddingsResponseAttributes: (embeddings: Embeddings, signalLevel?: TelemetrySignalLevel) => Attributes;

package/dist/endpoints/embeddings/otel.js DELETED Viewed

@@ -1,29 +0,0 @@
-import {} from "../../types";
-export const getEmbeddingsRequestAttributes = (inputs, signalLevel) => {
-    if (!signalLevel || signalLevel === "off")
-        return {};
-    const attrs = {};
-    if (signalLevel !== "required") {
-        Object.assign(attrs, {
-            "gen_ai.embeddings.dimension.count": inputs.dimensions,
-        });
-        if (inputs.metadata) {
-            for (const key in inputs.metadata) {
-                attrs[`gen_ai.request.metadata.${key}`] = inputs.metadata[key];
-            }
-        }
-    }
-    return attrs;
-};
-export const getEmbeddingsResponseAttributes = (embeddings, signalLevel) => {
-    if (!signalLevel || signalLevel === "off")
-        return {};
-    const attrs = {};
-    if (signalLevel !== "required") {
-        Object.assign(attrs, {
-            "gen_ai.usage.input_tokens": embeddings.usage?.prompt_tokens,
-            "gen_ai.usage.total_tokens": embeddings.usage?.total_tokens,
-        });
-    }
-    return attrs;
-};

package/dist/endpoints/embeddings/schema.d.ts DELETED Viewed

@@ -1,44 +0,0 @@
-import * as z from "zod";
-export declare const EmbeddingsDimensionsSchema: z.ZodInt;
-export type EmbeddingsDimensions = z.infer<typeof EmbeddingsDimensionsSchema>;
-export declare const EmbeddingsMetadataSchema: z.ZodRecord<z.ZodString, z.ZodString>;
-export type EmbeddingsMetadata = z.infer<typeof EmbeddingsMetadataSchema>;
-export declare const EmbeddingsInputsSchema: z.ZodObject<{
-    input: z.ZodUnion<readonly [z.ZodString, z.ZodArray<z.ZodString>]>;
-    dimensions: z.ZodOptional<z.ZodInt>;
-    metadata: z.ZodOptional<z.ZodRecord<z.ZodString, z.ZodString>>;
-}, z.core.$strip>;
-export type EmbeddingsInputs = z.infer<typeof EmbeddingsInputsSchema>;
-export declare const EmbeddingsBodySchema: z.ZodObject<{
-    input: z.ZodUnion<readonly [z.ZodString, z.ZodArray<z.ZodString>]>;
-    dimensions: z.ZodOptional<z.ZodInt>;
-    metadata: z.ZodOptional<z.ZodRecord<z.ZodString, z.ZodString>>;
-    model: z.ZodString;
-}, z.core.$loose>;
-export type EmbeddingsBody = z.infer<typeof EmbeddingsBodySchema>;
-export declare const EmbeddingsDataSchema: z.ZodObject<{
-    object: z.ZodLiteral<"embedding">;
-    embedding: z.ZodArray<z.ZodNumber>;
-    index: z.ZodInt;
-}, z.core.$strip>;
-export type EmbeddingsData = z.infer<typeof EmbeddingsDataSchema>;
-export declare const EmbeddingsUsageSchema: z.ZodObject<{
-    prompt_tokens: z.ZodOptional<z.ZodInt>;
-    total_tokens: z.ZodOptional<z.ZodInt>;
-}, z.core.$strip>;
-export type EmbeddingsUsage = z.infer<typeof EmbeddingsUsageSchema>;
-export declare const EmbeddingsSchema: z.ZodObject<{
-    object: z.ZodLiteral<"list">;
-    data: z.ZodArray<z.ZodObject<{
-        object: z.ZodLiteral<"embedding">;
-        embedding: z.ZodArray<z.ZodNumber>;
-        index: z.ZodInt;
-    }, z.core.$strip>>;
-    model: z.ZodString;
-    usage: z.ZodNullable<z.ZodObject<{
-        prompt_tokens: z.ZodOptional<z.ZodInt>;
-        total_tokens: z.ZodOptional<z.ZodInt>;
-    }, z.core.$strip>>;
-    provider_metadata: z.ZodOptional<z.ZodUnknown>;
-}, z.core.$strip>;
-export type Embeddings = z.infer<typeof EmbeddingsSchema>;

package/dist/endpoints/embeddings/schema.js DELETED Viewed

@@ -1,29 +0,0 @@
-import * as z from "zod";
-export const EmbeddingsDimensionsSchema = z.int().nonnegative().max(65536);
-export const EmbeddingsMetadataSchema = z.record(z.string().min(1).max(64), z.string().max(512));
-export const EmbeddingsInputsSchema = z.object({
-    input: z.union([z.string(), z.array(z.string())]),
-    dimensions: EmbeddingsDimensionsSchema.optional(),
-    metadata: EmbeddingsMetadataSchema.optional(),
-});
-export const EmbeddingsBodySchema = z.looseObject({
-    model: z.string(),
-    ...EmbeddingsInputsSchema.shape,
-});
-export const EmbeddingsDataSchema = z.object({
-    object: z.literal("embedding"),
-    embedding: z.array(z.number()),
-    index: z.int().nonnegative(),
-});
-export const EmbeddingsUsageSchema = z.object({
-    prompt_tokens: z.int().nonnegative().optional(),
-    total_tokens: z.int().nonnegative().optional(),
-});
-export const EmbeddingsSchema = z.object({
-    object: z.literal("list"),
-    data: z.array(EmbeddingsDataSchema),
-    model: z.string(),
-    usage: EmbeddingsUsageSchema.nullable(),
-    // Extensions
-    provider_metadata: z.unknown().optional().meta({ extension: true }),
-});

package/dist/endpoints/models/converters.d.ts DELETED Viewed

@@ -1,6 +0,0 @@
-import type { ModelCatalog, CatalogModel } from "../../models/types";
-import type { ModelList, Model } from "./schema";
-export declare function toModel(id: string, catalogModel: CatalogModel): Model;
-export declare function toModels(models: ModelCatalog): ModelList;
-export declare function createModelsResponse(models: ModelCatalog, responseInit?: ResponseInit): Response;
-export declare function createModelResponse(id: string, catalogModel: CatalogModel, responseInit?: ResponseInit): Response;

package/dist/endpoints/models/converters.js DELETED Viewed

@@ -1,42 +0,0 @@
-import { toResponse } from "../../utils/response";
-export function toModel(id, catalogModel) {
-    const { created, providers, modalities, additionalProperties, ...rest } = catalogModel;
-    let createdTimestamp = Math.floor(Date.now() / 1000);
-    if (created) {
-        const parsed = Date.parse(created);
-        if (!isNaN(parsed)) {
-            createdTimestamp = Math.floor(parsed / 1000);
-        }
-    }
-    const model = {
-        id,
-        object: "model",
-        created: createdTimestamp,
-        owned_by: id.split("/")[0] ?? "system",
-        architecture: {
-            input_modalities: modalities?.input ?? [],
-            modality: modalities?.input &&
-                modalities?.output &&
-                `${modalities.input?.[0]}->${modalities.output?.[0]}`,
-            output_modalities: modalities?.output ?? [],
-        },
-        endpoints: providers?.map((provider) => ({
-            tag: provider,
-        })) || [],
-        ...rest,
-        ...additionalProperties,
-    };
-    return model;
-}
-export function toModels(models) {
-    return {
-        object: "list",
-        data: Object.entries(models).map(([id, catalogModel]) => toModel(id, catalogModel)),
-    };
-}
-export function createModelsResponse(models, responseInit) {
-    return toResponse(toModels(models), responseInit);
-}
-export function createModelResponse(id, catalogModel, responseInit) {
-    return toResponse(toModel(id, catalogModel), responseInit);
-}

package/dist/endpoints/models/handler.d.ts DELETED Viewed

	@@ -1,2 +0,0 @@
1	- import type { GatewayConfig, Endpoint } from "../../types";
2	- export declare const models: (config: GatewayConfig) => Endpoint;

package/dist/endpoints/models/handler.js DELETED Viewed

@@ -1,29 +0,0 @@
-import { GatewayError } from "../../errors/gateway";
-import { winterCgHandler } from "../../lifecycle";
-import { toModels, toModel } from "./converters";
-export const models = (config) => {
-    // oxlint-disable-next-line require-await
-    const handler = async (ctx) => {
-        ctx.operation = "models";
-        if (!ctx.request || ctx.request.method !== "GET") {
-            throw new GatewayError("Method Not Allowed", 405);
-        }
-        const rawId = ctx.request.url.split("/models/", 2)[1]?.split("?", 1)[0];
-        if (!rawId) {
-            return toModels(ctx.models);
-        }
-        let modelId = rawId;
-        try {
-            modelId = decodeURIComponent(rawId);
-        }
-        catch {
-            throw new GatewayError(`Invalid model ID: '${modelId}'`, 400);
-        }
-        const model = ctx.models[modelId];
-        if (!model) {
-            throw new GatewayError(`Model not found: '${modelId}'`, 404);
-        }
-        return toModel(modelId, model);
-    };
-    return { handler: winterCgHandler(handler, config) };
-};

package/dist/endpoints/models/index.d.ts DELETED Viewed

@@ -1,3 +0,0 @@
-export * from "./converters";
-export * from "./handler";
-export * from "./schema";

package/dist/endpoints/models/index.js DELETED Viewed

@@ -1,3 +0,0 @@
-export * from "./converters";
-export * from "./handler";
-export * from "./schema";