npm - @hebo-ai/gateway - Versions diffs - 0.6.2-rc0 → 0.6.2 - Mend

@hebo-ai/gateway 0.6.2-rc0 → 0.6.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (134) hide show

package/README.md +3 -3
package/dist/endpoints/chat-completions/converters.js +26 -21
package/dist/endpoints/chat-completions/handler.js +2 -0
package/dist/endpoints/chat-completions/otel.js +1 -1
package/dist/endpoints/chat-completions/schema.d.ts +4 -18
package/dist/endpoints/chat-completions/schema.js +14 -17
package/dist/endpoints/embeddings/handler.js +2 -0
package/dist/endpoints/embeddings/otel.js +5 -0
package/dist/endpoints/embeddings/schema.d.ts +6 -0
package/dist/endpoints/embeddings/schema.js +4 -1
package/dist/endpoints/models/converters.js +3 -3
package/dist/lifecycle.js +2 -2
package/dist/logger/default.js +3 -3
package/dist/logger/index.d.ts +2 -5
package/dist/middleware/common.js +1 -0
package/dist/middleware/utils.js +0 -3
package/dist/models/amazon/middleware.js +8 -5
package/dist/models/anthropic/middleware.js +13 -13
package/dist/models/catalog.js +5 -1
package/dist/models/cohere/middleware.js +7 -5
package/dist/models/google/middleware.d.ts +1 -1
package/dist/models/google/middleware.js +29 -25
package/dist/models/openai/middleware.js +13 -9
package/dist/models/voyage/middleware.js +2 -1
package/dist/providers/bedrock/middleware.js +21 -23
package/dist/providers/registry.js +3 -0
package/dist/telemetry/fetch.js +7 -2
package/dist/telemetry/gen-ai.js +15 -12
package/dist/telemetry/memory.d.ts +1 -1
package/dist/telemetry/memory.js +30 -14
package/dist/telemetry/span.js +1 -1
package/dist/telemetry/stream.js +30 -23
package/dist/utils/env.js +4 -2
package/dist/utils/preset.js +1 -0
package/dist/utils/response.js +3 -1
package/package.json +36 -50
package/src/config.ts +0 -98
package/src/endpoints/chat-completions/converters.test.ts +0 -631
package/src/endpoints/chat-completions/converters.ts +0 -899
package/src/endpoints/chat-completions/handler.test.ts +0 -391
package/src/endpoints/chat-completions/handler.ts +0 -201
package/src/endpoints/chat-completions/index.ts +0 -4
package/src/endpoints/chat-completions/otel.test.ts +0 -315
package/src/endpoints/chat-completions/otel.ts +0 -214
package/src/endpoints/chat-completions/schema.ts +0 -364
package/src/endpoints/embeddings/converters.ts +0 -51
package/src/endpoints/embeddings/handler.test.ts +0 -133
package/src/endpoints/embeddings/handler.ts +0 -137
package/src/endpoints/embeddings/index.ts +0 -4
package/src/endpoints/embeddings/otel.ts +0 -40
package/src/endpoints/embeddings/schema.ts +0 -36
package/src/endpoints/models/converters.ts +0 -56
package/src/endpoints/models/handler.test.ts +0 -122
package/src/endpoints/models/handler.ts +0 -37
package/src/endpoints/models/index.ts +0 -3
package/src/endpoints/models/schema.ts +0 -37
package/src/errors/ai-sdk.ts +0 -99
package/src/errors/gateway.ts +0 -17
package/src/errors/openai.ts +0 -57
package/src/errors/utils.ts +0 -47
package/src/gateway.ts +0 -50
package/src/index.ts +0 -19
package/src/lifecycle.ts +0 -135
package/src/logger/default.ts +0 -105
package/src/logger/index.ts +0 -42
package/src/middleware/common.test.ts +0 -215
package/src/middleware/common.ts +0 -163
package/src/middleware/debug.ts +0 -37
package/src/middleware/matcher.ts +0 -161
package/src/middleware/utils.ts +0 -34
package/src/models/amazon/index.ts +0 -2
package/src/models/amazon/middleware.test.ts +0 -133
package/src/models/amazon/middleware.ts +0 -79
package/src/models/amazon/presets.ts +0 -104
package/src/models/anthropic/index.ts +0 -2
package/src/models/anthropic/middleware.test.ts +0 -643
package/src/models/anthropic/middleware.ts +0 -148
package/src/models/anthropic/presets.ts +0 -191
package/src/models/catalog.ts +0 -13
package/src/models/cohere/index.ts +0 -2
package/src/models/cohere/middleware.test.ts +0 -138
package/src/models/cohere/middleware.ts +0 -76
package/src/models/cohere/presets.ts +0 -186
package/src/models/google/index.ts +0 -2
package/src/models/google/middleware.test.ts +0 -298
package/src/models/google/middleware.ts +0 -137
package/src/models/google/presets.ts +0 -118
package/src/models/meta/index.ts +0 -1
package/src/models/meta/presets.ts +0 -143
package/src/models/openai/index.ts +0 -2
package/src/models/openai/middleware.test.ts +0 -189
package/src/models/openai/middleware.ts +0 -103
package/src/models/openai/presets.ts +0 -280
package/src/models/types.ts +0 -114
package/src/models/voyage/index.ts +0 -2
package/src/models/voyage/middleware.test.ts +0 -28
package/src/models/voyage/middleware.ts +0 -23
package/src/models/voyage/presets.ts +0 -126
package/src/providers/anthropic/canonical.ts +0 -17
package/src/providers/anthropic/index.ts +0 -1
package/src/providers/bedrock/canonical.ts +0 -87
package/src/providers/bedrock/index.ts +0 -2
package/src/providers/bedrock/middleware.test.ts +0 -303
package/src/providers/bedrock/middleware.ts +0 -128
package/src/providers/cohere/canonical.ts +0 -26
package/src/providers/cohere/index.ts +0 -1
package/src/providers/groq/canonical.ts +0 -21
package/src/providers/groq/index.ts +0 -1
package/src/providers/openai/canonical.ts +0 -16
package/src/providers/openai/index.ts +0 -1
package/src/providers/registry.test.ts +0 -44
package/src/providers/registry.ts +0 -165
package/src/providers/types.ts +0 -20
package/src/providers/vertex/canonical.ts +0 -17
package/src/providers/vertex/index.ts +0 -1
package/src/providers/voyage/canonical.ts +0 -16
package/src/providers/voyage/index.ts +0 -1
package/src/telemetry/ai-sdk.ts +0 -46
package/src/telemetry/baggage.ts +0 -27
package/src/telemetry/fetch.ts +0 -62
package/src/telemetry/gen-ai.ts +0 -113
package/src/telemetry/http.ts +0 -62
package/src/telemetry/index.ts +0 -1
package/src/telemetry/memory.ts +0 -36
package/src/telemetry/span.ts +0 -85
package/src/telemetry/stream.ts +0 -64
package/src/types.ts +0 -223
package/src/utils/env.ts +0 -7
package/src/utils/headers.ts +0 -27
package/src/utils/preset.ts +0 -65
package/src/utils/request.test.ts +0 -75
package/src/utils/request.ts +0 -52
package/src/utils/response.ts +0 -84
package/src/utils/url.ts +0 -26

package/src/endpoints/chat-completions/otel.test.ts DELETED Viewed

@@ -1,315 +0,0 @@
-import { describe, expect, test } from "bun:test";
-import type { ChatCompletions, ChatCompletionsBody } from "./schema";
-import { getChatRequestAttributes, getChatResponseAttributes } from "./otel";
-describe("Chat Completions OTEL", () => {
-  test("should map request metadata into per-key attributes", () => {
-    const metadata = {
-      tenant: "acme",
-      "Org ID": "o-123",
-    };
-    const inputs: ChatCompletionsBody = {
-      model: "openai/gpt-oss-20b",
-      messages: [{ role: "user", content: "hi" }],
-      metadata,
-    };
-    const attrs = getChatRequestAttributes(inputs, "recommended");
-    expect(attrs["gen_ai.request.metadata"]).toBeUndefined();
-    expect(attrs["gen_ai.request.metadata.tenant"]).toBe("acme");
-    expect(attrs["gen_ai.request.metadata.Org ID"]).toBe("o-123");
-  });
-  test("should stringify each tool definition individually", () => {
-    const tool1 = {
-      type: "function" as const,
-      function: {
-        name: "get_weather",
-        parameters: {
-          type: "object",
-          properties: {
-            location: { type: "string" },
-          },
-          required: ["location"],
-        },
-      },
-    };
-    const tool2 = {
-      type: "function" as const,
-      function: {
-        name: "get_time",
-        parameters: {
-          type: "object",
-          properties: {
-            timezone: { type: "string" },
-          },
-        },
-      },
-    };
-    const inputs: ChatCompletionsBody = {
-      model: "openai/gpt-oss-20b",
-      messages: [{ role: "user", content: "hi" }],
-      tools: [tool1, tool2],
-    };
-    const attrs = getChatRequestAttributes(inputs, "full");
-    expect(attrs["gen_ai.tool.definitions"]).toEqual([
-      JSON.stringify(tool1),
-      JSON.stringify(tool2),
-    ]);
-  });
-  test("should map assistant text content part arrays in request attributes", () => {
-    const inputs: ChatCompletionsBody = {
-      model: "openai/gpt-oss-20b",
-      messages: [
-        {
-          role: "assistant",
-          content: [
-            { type: "text", text: "hello " },
-            { type: "text", text: "world" },
-          ],
-        },
-      ],
-    };
-    const attrs = getChatRequestAttributes(inputs, "full");
-    expect(attrs["gen_ai.input.messages"]).toEqual([
-      JSON.stringify({
-        role: "assistant",
-        parts: [
-          { type: "text", content: "hello " },
-          { type: "text", content: "world" },
-        ],
-      }),
-    ]);
-  });
-  test("should map assistant reasoning string in request attributes", () => {
-    const inputs: ChatCompletionsBody = {
-      model: "openai/gpt-oss-20b",
-      messages: [
-        {
-          role: "assistant",
-          content: "final answer",
-          reasoning: "fallback reasoning",
-          reasoning_details: [
-            {
-              type: "reasoning.text",
-              index: 0,
-              text: "step-by-step",
-            },
-            {
-              type: "reasoning.encrypted",
-              index: 1,
-              data: "encrypted",
-            },
-          ],
-        },
-      ],
-    };
-    const attrs = getChatRequestAttributes(inputs, "full");
-    expect(attrs["gen_ai.input.messages"]).toEqual([
-      JSON.stringify({
-        role: "assistant",
-        parts: [
-          { type: "reasoning", content: "fallback reasoning" },
-          { type: "text", content: "final answer" },
-        ],
-      }),
-    ]);
-  });
-  test("should flatten tool content part arrays in request attributes", () => {
-    const inputs: ChatCompletionsBody = {
-      model: "openai/gpt-oss-20b",
-      messages: [
-        {
-          role: "tool",
-          tool_call_id: "call_1",
-          content: [
-            { type: "text", text: "line-1 " },
-            { type: "text", text: "line-2" },
-          ],
-        },
-      ],
-    };
-    const attrs = getChatRequestAttributes(inputs, "full");
-    expect(attrs["gen_ai.input.messages"]).toEqual([
-      JSON.stringify({
-        role: "tool",
-        parts: [{ type: "tool_call_response", id: "call_1", response: "line-1 line-2" }],
-      }),
-    ]);
-  });
-  test("should map user media content parts to schema-compatible uri/blob parts", () => {
-    const inputs: ChatCompletionsBody = {
-      model: "openai/gpt-oss-20b",
-      messages: [
-        {
-          role: "user",
-          content: [
-            { type: "image_url", image_url: { url: "https://example.com/cat.png" } },
-            { type: "image_url", image_url: { url: "data:image/png;base64,AAAA" } },
-            { type: "input_audio", input_audio: { data: "AAAA", format: "wav" } },
-            {
-              type: "file",
-              file: { data: "AAAA", media_type: "application/pdf", filename: "brochure.pdf" },
-            },
-          ],
-        },
-      ],
-    };
-    const attrs = getChatRequestAttributes(inputs, "full");
-    expect(attrs["gen_ai.input.messages"]).toEqual([
-      JSON.stringify({
-        role: "user",
-        parts: [
-          { type: "uri", modality: "image", uri: "https://example.com/cat.png" },
-          {
-            type: "blob",
-            modality: "image",
-            content: "[REDACTED_BINARY_DATA]",
-            mime_type: "image/png",
-          },
-          {
-            type: "blob",
-            modality: "audio",
-            content: "[REDACTED_BINARY_DATA]",
-            mime_type: "audio/wav",
-          },
-          {
-            type: "blob",
-            modality: "file",
-            content: "[REDACTED_BINARY_DATA]",
-            mime_type: "application/pdf",
-            file_name: "brochure.pdf",
-          },
-        ],
-      }),
-    ]);
-  });
-  test("should map assistant text content part arrays in response attributes", () => {
-    const completions: ChatCompletions = {
-      id: "chatcmpl_123",
-      object: "chat.completion",
-      created: 1700000000,
-      model: "openai/gpt-oss-20b",
-      choices: [
-        {
-          index: 0,
-          message: {
-            role: "assistant",
-            content: [
-              { type: "text", text: "hello " },
-              { type: "text", text: "world" },
-            ],
-          },
-          finish_reason: "stop",
-        },
-      ],
-      usage: null,
-    };
-    const attrs = getChatResponseAttributes(completions, "full");
-    expect(attrs["gen_ai.output.messages"]).toEqual([
-      JSON.stringify({
-        role: "assistant",
-        parts: [
-          { type: "text", content: "hello " },
-          { type: "text", content: "world" },
-        ],
-        finish_reason: "stop",
-      }),
-    ]);
-  });
-  test("should map assistant reasoning string to reasoning parts in response attributes", () => {
-    const completions: ChatCompletions = {
-      id: "chatcmpl_123",
-      object: "chat.completion",
-      created: 1700000000,
-      model: "openai/gpt-oss-20b",
-      choices: [
-        {
-          index: 0,
-          message: {
-            role: "assistant",
-            content: "final answer",
-            reasoning: "chain-of-thought",
-          },
-          finish_reason: "stop",
-        },
-      ],
-      usage: null,
-    };
-    const attrs = getChatResponseAttributes(completions, "full");
-    expect(attrs["gen_ai.output.messages"]).toEqual([
-      JSON.stringify({
-        role: "assistant",
-        parts: [
-          { type: "reasoning", content: "chain-of-thought" },
-          { type: "text", content: "final answer" },
-        ],
-        finish_reason: "stop",
-      }),
-    ]);
-  });
-  test("should map usage token attributes with cache_read_input/reasoning_output names", () => {
-    const completions: ChatCompletions = {
-      id: "chatcmpl_123",
-      object: "chat.completion",
-      created: 1700000000,
-      model: "openai/gpt-oss-20b",
-      choices: [
-        {
-          index: 0,
-          message: {
-            role: "assistant",
-            content: "done",
-          },
-          finish_reason: "stop",
-        },
-      ],
-      usage: {
-        prompt_tokens: 10,
-        completion_tokens: 20,
-        total_tokens: 30,
-        prompt_tokens_details: {
-          cached_tokens: 4,
-        },
-        completion_tokens_details: {
-          reasoning_tokens: 6,
-        },
-      },
-    };
-    const attrs = getChatResponseAttributes(completions, "recommended");
-    expect(attrs["gen_ai.usage.input_tokens"]).toBe(10);
-    expect(attrs["gen_ai.usage.output_tokens"]).toBe(20);
-    expect(attrs["gen_ai.usage.total_tokens"]).toBe(30);
-    expect(attrs["gen_ai.usage.cache_read.input_tokens"]).toBe(4);
-    expect(attrs["gen_ai.usage.reasoning.output_tokens"]).toBe(6);
-  });
-});

package/src/endpoints/chat-completions/otel.ts DELETED Viewed

@@ -1,214 +0,0 @@
-import type { Attributes } from "@opentelemetry/api";
-import type {
-  ChatCompletionsAssistantMessage,
-  ChatCompletions,
-  ChatCompletionsBody,
-  ChatCompletionsContentPart,
-  ChatCompletionsContentPartText,
-  ChatCompletionsMessage,
-} from "./schema";
-import { type TelemetrySignalLevel } from "../../types";
-import { parseDataUrl } from "../../utils/url";
-const toTextParts = (content: string | ChatCompletionsContentPart[] | null | undefined) => {
-  if (typeof content === "string") {
-    return [{ type: "text", content }];
-  }
-  const result = [];
-  if (Array.isArray(content)) {
-    for (const part of content) {
-      if (part.type === "text") {
-        result.push({ type: "text", content: part.text });
-      }
-    }
-  }
-  return result;
-};
-const toBlobPart = (modality: string, mimeType?: string) => {
-  const part: Record<string, unknown> = {
-    type: "blob",
-    modality,
-    content: "[REDACTED_BINARY_DATA]",
-  };
-  if (mimeType) part["mime_type"] = mimeType;
-  return part;
-};
-const toToolResponsePart = (id: string, content: string | ChatCompletionsContentPartText[]) => ({
-  type: "tool_call_response" as const,
-  id,
-  response: typeof content === "string" ? content : content.map((p) => p.text).join(""),
-});
-const toAssistantParts = (message: ChatCompletionsAssistantMessage) => {
-  const parts: Record<string, unknown>[] = [];
-  if (typeof message.reasoning === "string") {
-    parts.push({ type: "reasoning", content: message.reasoning });
-  }
-  for (const part of toTextParts(message.content)) {
-    parts.push(part);
-  }
-  if (Array.isArray(message.tool_calls)) {
-    for (const call of message.tool_calls) {
-      parts.push({
-        type: "tool_call",
-        id: call.id,
-        name: call.function.name,
-        arguments: call.function.arguments,
-      });
-    }
-  }
-  return parts;
-};
-const toUserParts = (content: string | ChatCompletionsContentPart[]) => {
-  if (typeof content === "string") return [{ type: "text", content }];
-  const parts: Record<string, unknown>[] = [];
-  for (const part of content) {
-    switch (part.type) {
-      case "text":
-        parts.push({ type: "text", content: part.text });
-        break;
-      case "image_url": {
-        const url = part.image_url.url;
-        if (url.slice(0, 5).toLowerCase() === "data:") {
-          const { mimeType } = parseDataUrl(url);
-          parts.push(toBlobPart("image", mimeType || undefined));
-        } else {
-          parts.push({ type: "uri", modality: "image", uri: url });
-        }
-        break;
-      }
-      case "input_audio":
-        parts.push(toBlobPart("audio", `audio/${part.input_audio.format}`));
-        break;
-      case "file": {
-        const filePart = toBlobPart("file", part.file.media_type);
-        if (part.file.filename) filePart["file_name"] = part.file.filename;
-        parts.push(filePart);
-        break;
-      }
-    }
-  }
-  return parts;
-};
-const toMessageParts = (message: ChatCompletionsMessage) => {
-  switch (message.role) {
-    case "assistant":
-      return toAssistantParts(message);
-    case "tool":
-      return [toToolResponsePart(message.tool_call_id, message.content)];
-    case "user":
-      return toUserParts(message.content);
-    // FUTURE: remove once Langfuse supports gen_ai.system_instructions
-    // https://github.com/langfuse/langfuse/issues/11607
-    case "system":
-      return toTextParts(message.content);
-    default:
-      return [];
-  }
-};
-export const getChatRequestAttributes = (
-  inputs: ChatCompletionsBody,
-  signalLevel?: TelemetrySignalLevel,
-): Attributes => {
-  if (!signalLevel || signalLevel === "off") return {};
-  const attrs: Attributes = {};
-  if (inputs.seed !== undefined) {
-    Object.assign(attrs, { "gen_ai.request.seed": inputs.seed });
-  }
-  if (signalLevel !== "required") {
-    Object.assign(attrs, {
-      // FUTURE: add reasoning info
-      "gen_ai.request.stream": inputs.stream,
-      "gen_ai.request.frequency_penalty": inputs.frequency_penalty,
-      "gen_ai.request.max_tokens": inputs.max_completion_tokens,
-      "gen_ai.request.presence_penalty": inputs.presence_penalty,
-      "gen_ai.request.stop_sequences": inputs.stop
-        ? Array.isArray(inputs.stop)
-          ? inputs.stop
-          : [inputs.stop]
-        : undefined,
-      "gen_ai.request.temperature": inputs.temperature,
-      "gen_ai.request.top_p": inputs.top_p,
-    });
-    if (inputs.metadata) {
-      for (const key in inputs.metadata) {
-        attrs[`gen_ai.request.metadata.${key}`] = inputs.metadata[key];
-      }
-    }
-  }
-  if (signalLevel === "full") {
-    Object.assign(attrs, {
-      // FUTURE: move system instructions from messages to here
-      // blocker: https://github.com/langfuse/langfuse/issues/11607
-      // "gen_ai.system_instructions": inputs.messages
-      //   .filter((m) => m.role === "system")
-      //   .map((m) => JSON.stringify(toTextPart(m.content))),
-      "gen_ai.input.messages": inputs.messages
-        //.filter((m) => m.role !== "system")
-        .map((m) => JSON.stringify({ role: m.role, parts: toMessageParts(m) })),
-      "gen_ai.tool.definitions": inputs.tools?.map((toolDefinition) =>
-        JSON.stringify(toolDefinition),
-      ),
-    });
-  }
-  return attrs;
-};
-export const getChatResponseAttributes = (
-  completions: ChatCompletions,
-  signalLevel?: TelemetrySignalLevel,
-): Attributes => {
-  if (!signalLevel || signalLevel === "off") return {};
-  const attrs: Attributes = {
-    "gen_ai.response.id": completions.id,
-  };
-  if (signalLevel !== "required") {
-    Object.assign(attrs, {
-      "gen_ai.response.finish_reasons": completions.choices?.map((c) => c.finish_reason),
-      "gen_ai.usage.total_tokens": completions.usage?.total_tokens,
-      "gen_ai.usage.input_tokens": completions.usage?.prompt_tokens,
-      "gen_ai.usage.cache_read.input_tokens":
-        completions.usage?.prompt_tokens_details?.cached_tokens,
-      "gen_ai.usage.output_tokens": completions.usage?.completion_tokens,
-      "gen_ai.usage.reasoning.output_tokens":
-        completions.usage?.completion_tokens_details?.reasoning_tokens,
-    });
-  }
-  if (signalLevel === "full") {
-    Object.assign(attrs, {
-      "gen_ai.output.messages": completions.choices?.map((c) =>
-        JSON.stringify({
-          role: c.message.role,
-          parts: toMessageParts(c.message),
-          finish_reason: c.finish_reason,
-        }),
-      ),
-    });
-  }
-  return attrs;
-};