npm - @hebo-ai/gateway - Versions diffs - 0.6.2-rc0 → 0.6.2 - Mend

@hebo-ai/gateway 0.6.2-rc0 → 0.6.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (134) hide show

package/README.md +3 -3
package/dist/endpoints/chat-completions/converters.js +26 -21
package/dist/endpoints/chat-completions/handler.js +2 -0
package/dist/endpoints/chat-completions/otel.js +1 -1
package/dist/endpoints/chat-completions/schema.d.ts +4 -18
package/dist/endpoints/chat-completions/schema.js +14 -17
package/dist/endpoints/embeddings/handler.js +2 -0
package/dist/endpoints/embeddings/otel.js +5 -0
package/dist/endpoints/embeddings/schema.d.ts +6 -0
package/dist/endpoints/embeddings/schema.js +4 -1
package/dist/endpoints/models/converters.js +3 -3
package/dist/lifecycle.js +2 -2
package/dist/logger/default.js +3 -3
package/dist/logger/index.d.ts +2 -5
package/dist/middleware/common.js +1 -0
package/dist/middleware/utils.js +0 -3
package/dist/models/amazon/middleware.js +8 -5
package/dist/models/anthropic/middleware.js +13 -13
package/dist/models/catalog.js +5 -1
package/dist/models/cohere/middleware.js +7 -5
package/dist/models/google/middleware.d.ts +1 -1
package/dist/models/google/middleware.js +29 -25
package/dist/models/openai/middleware.js +13 -9
package/dist/models/voyage/middleware.js +2 -1
package/dist/providers/bedrock/middleware.js +21 -23
package/dist/providers/registry.js +3 -0
package/dist/telemetry/fetch.js +7 -2
package/dist/telemetry/gen-ai.js +15 -12
package/dist/telemetry/memory.d.ts +1 -1
package/dist/telemetry/memory.js +30 -14
package/dist/telemetry/span.js +1 -1
package/dist/telemetry/stream.js +30 -23
package/dist/utils/env.js +4 -2
package/dist/utils/preset.js +1 -0
package/dist/utils/response.js +3 -1
package/package.json +36 -50
package/src/config.ts +0 -98
package/src/endpoints/chat-completions/converters.test.ts +0 -631
package/src/endpoints/chat-completions/converters.ts +0 -899
package/src/endpoints/chat-completions/handler.test.ts +0 -391
package/src/endpoints/chat-completions/handler.ts +0 -201
package/src/endpoints/chat-completions/index.ts +0 -4
package/src/endpoints/chat-completions/otel.test.ts +0 -315
package/src/endpoints/chat-completions/otel.ts +0 -214
package/src/endpoints/chat-completions/schema.ts +0 -364
package/src/endpoints/embeddings/converters.ts +0 -51
package/src/endpoints/embeddings/handler.test.ts +0 -133
package/src/endpoints/embeddings/handler.ts +0 -137
package/src/endpoints/embeddings/index.ts +0 -4
package/src/endpoints/embeddings/otel.ts +0 -40
package/src/endpoints/embeddings/schema.ts +0 -36
package/src/endpoints/models/converters.ts +0 -56
package/src/endpoints/models/handler.test.ts +0 -122
package/src/endpoints/models/handler.ts +0 -37
package/src/endpoints/models/index.ts +0 -3
package/src/endpoints/models/schema.ts +0 -37
package/src/errors/ai-sdk.ts +0 -99
package/src/errors/gateway.ts +0 -17
package/src/errors/openai.ts +0 -57
package/src/errors/utils.ts +0 -47
package/src/gateway.ts +0 -50
package/src/index.ts +0 -19
package/src/lifecycle.ts +0 -135
package/src/logger/default.ts +0 -105
package/src/logger/index.ts +0 -42
package/src/middleware/common.test.ts +0 -215
package/src/middleware/common.ts +0 -163
package/src/middleware/debug.ts +0 -37
package/src/middleware/matcher.ts +0 -161
package/src/middleware/utils.ts +0 -34
package/src/models/amazon/index.ts +0 -2
package/src/models/amazon/middleware.test.ts +0 -133
package/src/models/amazon/middleware.ts +0 -79
package/src/models/amazon/presets.ts +0 -104
package/src/models/anthropic/index.ts +0 -2
package/src/models/anthropic/middleware.test.ts +0 -643
package/src/models/anthropic/middleware.ts +0 -148
package/src/models/anthropic/presets.ts +0 -191
package/src/models/catalog.ts +0 -13
package/src/models/cohere/index.ts +0 -2
package/src/models/cohere/middleware.test.ts +0 -138
package/src/models/cohere/middleware.ts +0 -76
package/src/models/cohere/presets.ts +0 -186
package/src/models/google/index.ts +0 -2
package/src/models/google/middleware.test.ts +0 -298
package/src/models/google/middleware.ts +0 -137
package/src/models/google/presets.ts +0 -118
package/src/models/meta/index.ts +0 -1
package/src/models/meta/presets.ts +0 -143
package/src/models/openai/index.ts +0 -2
package/src/models/openai/middleware.test.ts +0 -189
package/src/models/openai/middleware.ts +0 -103
package/src/models/openai/presets.ts +0 -280
package/src/models/types.ts +0 -114
package/src/models/voyage/index.ts +0 -2
package/src/models/voyage/middleware.test.ts +0 -28
package/src/models/voyage/middleware.ts +0 -23
package/src/models/voyage/presets.ts +0 -126
package/src/providers/anthropic/canonical.ts +0 -17
package/src/providers/anthropic/index.ts +0 -1
package/src/providers/bedrock/canonical.ts +0 -87
package/src/providers/bedrock/index.ts +0 -2
package/src/providers/bedrock/middleware.test.ts +0 -303
package/src/providers/bedrock/middleware.ts +0 -128
package/src/providers/cohere/canonical.ts +0 -26
package/src/providers/cohere/index.ts +0 -1
package/src/providers/groq/canonical.ts +0 -21
package/src/providers/groq/index.ts +0 -1
package/src/providers/openai/canonical.ts +0 -16
package/src/providers/openai/index.ts +0 -1
package/src/providers/registry.test.ts +0 -44
package/src/providers/registry.ts +0 -165
package/src/providers/types.ts +0 -20
package/src/providers/vertex/canonical.ts +0 -17
package/src/providers/vertex/index.ts +0 -1
package/src/providers/voyage/canonical.ts +0 -16
package/src/providers/voyage/index.ts +0 -1
package/src/telemetry/ai-sdk.ts +0 -46
package/src/telemetry/baggage.ts +0 -27
package/src/telemetry/fetch.ts +0 -62
package/src/telemetry/gen-ai.ts +0 -113
package/src/telemetry/http.ts +0 -62
package/src/telemetry/index.ts +0 -1
package/src/telemetry/memory.ts +0 -36
package/src/telemetry/span.ts +0 -85
package/src/telemetry/stream.ts +0 -64
package/src/types.ts +0 -223
package/src/utils/env.ts +0 -7
package/src/utils/headers.ts +0 -27
package/src/utils/preset.ts +0 -65
package/src/utils/request.test.ts +0 -75
package/src/utils/request.ts +0 -52
package/src/utils/response.ts +0 -84
package/src/utils/url.ts +0 -26

package/src/models/anthropic/middleware.test.ts DELETED Viewed

@@ -1,643 +0,0 @@
-import { MockLanguageModelV3 } from "ai/test";
-import { expect, test } from "bun:test";
-import { modelMiddlewareMatcher } from "../../middleware/matcher";
-import { CANONICAL_MODEL_IDS } from "../../models/types";
-import { claudePromptCachingMiddleware, claudeReasoningMiddleware } from "./middleware";
-test("claudeReasoningMiddleware > matching patterns", () => {
-  const matching = [
-    "anthropic/claude-opus-4.6",
-    "anthropic/claude-sonnet-4.6",
-    "anthropic/claude-sonnet-3.7",
-    "anthropic/claude-opus-4.5",
-    "anthropic/claude-sonnet-4.5",
-    "anthropic/claude-haiku-4.5",
-    "anthropic/claude-opus-4.1",
-    "anthropic/claude-sonnet-4",
-    "anthropic/claude-opus-4",
-  ] satisfies (typeof CANONICAL_MODEL_IDS)[number][];
-  const nonMatching = [
-    "anthropic/claude-sonnet-3.5",
-    "anthropic/claude-haiku-3.5",
-    "anthropic/claude-haiku-3",
-  ] satisfies (typeof CANONICAL_MODEL_IDS)[number][];
-  for (const id of matching) {
-    const middleware = modelMiddlewareMatcher.resolve({ kind: "text", modelId: id });
-    expect(middleware).toContain(claudeReasoningMiddleware);
-    expect(middleware).toContain(claudePromptCachingMiddleware);
-  }
-  for (const id of nonMatching) {
-    const middleware = modelMiddlewareMatcher.resolve({ kind: "text", modelId: id });
-    expect(middleware).not.toContain(claudeReasoningMiddleware);
-  }
-});
-test("claudePromptCachingMiddleware > should not auto-enable top-level cache control", async () => {
-  const params = {
-    prompt: [],
-    providerOptions: {
-      unknown: {},
-    },
-  };
-  const result = await claudePromptCachingMiddleware.transformParams!({
-    type: "generate",
-    params,
-    model: new MockLanguageModelV3({ modelId: "anthropic/claude-sonnet-4.6" }),
-  });
-  expect(result.providerOptions).toEqual({
-    unknown: {},
-  });
-});
-test("claudePromptCachingMiddleware > should map cache_control ttl", async () => {
-  const params = {
-    prompt: [],
-    providerOptions: {
-      unknown: {
-        cache_control: { type: "ephemeral", ttl: "1h" },
-      },
-    },
-  };
-  const result = await claudePromptCachingMiddleware.transformParams!({
-    type: "generate",
-    params,
-    model: new MockLanguageModelV3({ modelId: "anthropic/claude-sonnet-4.6" }),
-  });
-  expect(result.providerOptions).toEqual({
-    anthropic: {
-      cacheControl: { type: "ephemeral", ttl: "1h" },
-    },
-    unknown: {},
-  });
-});
-test("claudeReasoningMiddleware > should transform reasoning_effort string to thinking budget", async () => {
-  const params = {
-    prompt: [],
-    maxOutputTokens: 10000,
-    providerOptions: {
-      unknown: {
-        reasoning: { enabled: true, effort: "high" },
-      },
-    },
-  };
-  const result = await claudeReasoningMiddleware.transformParams!({
-    type: "generate",
-    params,
-    model: new MockLanguageModelV3(),
-  });
-  expect(result).toEqual({
-    prompt: [],
-    maxOutputTokens: 10000,
-    providerOptions: {
-      anthropic: {
-        thinking: {
-          type: "enabled",
-          budgetTokens: 8000,
-        },
-      },
-      unknown: {},
-    },
-  });
-});
-test("claudeReasoningMiddleware > should respect Anthropic minimum budget of 1024", async () => {
-  const params = {
-    prompt: [],
-    maxOutputTokens: 2000,
-    providerOptions: {
-      unknown: {
-        reasoning: { enabled: true, effort: "minimal" },
-      },
-    },
-  };
-  const result = await claudeReasoningMiddleware.transformParams!({
-    type: "generate",
-    params,
-    model: new MockLanguageModelV3(),
-  });
-  expect(result).toEqual({
-    prompt: [],
-    maxOutputTokens: 2000,
-    providerOptions: {
-      anthropic: {
-        thinking: {
-          type: "enabled",
-          budgetTokens: 1024,
-        },
-      },
-      unknown: {},
-    },
-  });
-});
-test("claudeReasoningMiddleware > should transform reasoning object to thinking budget", async () => {
-  const params = {
-    prompt: [],
-    providerOptions: {
-      unknown: {
-        reasoning: {
-          enabled: true,
-          effort: "medium",
-          max_tokens: 2000,
-        },
-      },
-    },
-  };
-  const result = await claudeReasoningMiddleware.transformParams!({
-    type: "generate",
-    params,
-    model: new MockLanguageModelV3(),
-  });
-  expect(result).toEqual({
-    prompt: [],
-    providerOptions: {
-      anthropic: {
-        thinking: {
-          type: "enabled",
-          budgetTokens: 2000,
-        },
-      },
-      unknown: {},
-    },
-  });
-});
-test("claudeReasoningMiddleware > should handle disabled reasoning", async () => {
-  const params = {
-    prompt: [],
-    providerOptions: {
-      unknown: {
-        reasoning: {
-          enabled: false,
-        },
-      },
-    },
-  };
-  const result = await claudeReasoningMiddleware.transformParams!({
-    type: "generate",
-    params,
-    model: new MockLanguageModelV3(),
-  });
-  expect(result).toEqual({
-    prompt: [],
-    providerOptions: {
-      anthropic: {
-        thinking: {
-          type: "disabled",
-        },
-      },
-      unknown: {},
-    },
-  });
-});
-test("claudeReasoningMiddleware > should default reasoning budget when enabled without effort", async () => {
-  const params = {
-    prompt: [],
-    maxOutputTokens: 10000,
-    providerOptions: {
-      unknown: {
-        reasoning: {
-          enabled: true,
-        },
-      },
-    },
-  };
-  const result = await claudeReasoningMiddleware.transformParams!({
-    type: "generate",
-    params,
-    model: new MockLanguageModelV3(),
-  });
-  expect(result).toEqual({
-    prompt: [],
-    maxOutputTokens: 10000,
-    providerOptions: {
-      anthropic: {
-        thinking: {
-          type: "enabled",
-        },
-      },
-      unknown: {},
-    },
-  });
-});
-test("claudeReasoningMiddleware > should use 64k as default fallback for maxOutputTokens", async () => {
-  const params = {
-    prompt: [],
-    providerOptions: {
-      unknown: {
-        reasoning: {
-          // 0.5 * 64000 = 32000
-          enabled: true,
-          effort: "medium",
-        },
-      },
-    },
-  };
-  const result = await claudeReasoningMiddleware.transformParams!({
-    type: "generate",
-    params,
-    model: new MockLanguageModelV3(),
-  });
-  expect(result.providerOptions?.anthropic?.thinking?.budgetTokens).toBe(32000);
-});
-test("claudeReasoningMiddleware > should cap default maxOutputTokens for Opus 4.1", async () => {
-  const params = {
-    prompt: [],
-    providerOptions: {
-      unknown: {
-        reasoning: {
-          enabled: true,
-          effort: "medium",
-        },
-      },
-    },
-  };
-  const result = await claudeReasoningMiddleware.transformParams!({
-    type: "generate",
-    params,
-    model: new MockLanguageModelV3({ modelId: "anthropic/claude-opus-4.1" }),
-  });
-  expect(result.providerOptions?.anthropic?.thinking?.budgetTokens).toBe(16000);
-});
-test("claudeReasoningMiddleware > should clamp max_tokens for Opus 4", async () => {
-  const params = {
-    prompt: [],
-    providerOptions: {
-      unknown: {
-        reasoning: {
-          enabled: true,
-          max_tokens: 50000,
-        },
-      },
-    },
-  };
-  const result = await claudeReasoningMiddleware.transformParams!({
-    type: "generate",
-    params,
-    model: new MockLanguageModelV3({ modelId: "anthropic/claude-opus-4" }),
-  });
-  expect(result.providerOptions?.anthropic?.thinking?.budgetTokens).toBe(32000);
-});
-test("claudeReasoningMiddleware > should pass through max effort for Claude 4.6", async () => {
-  const params = {
-    prompt: [],
-    providerOptions: {
-      unknown: {
-        reasoning: {
-          enabled: true,
-          effort: "max",
-        },
-      },
-    },
-  };
-  const result = await claudeReasoningMiddleware.transformParams!({
-    type: "generate",
-    params,
-    model: new MockLanguageModelV3({ modelId: "anthropic/claude-opus-4.6" }),
-  });
-  expect(result.providerOptions?.anthropic?.thinking).toEqual({
-    type: "adaptive",
-  });
-  expect(result.providerOptions?.anthropic?.effort).toBe("max");
-});
-test("claudeReasoningMiddleware > should map xhigh effort to max for Claude Opus 4.6", async () => {
-  const params = {
-    prompt: [],
-    providerOptions: {
-      unknown: {
-        reasoning: {
-          enabled: true,
-          effort: "xhigh",
-        },
-      },
-    },
-  };
-  const result = await claudeReasoningMiddleware.transformParams!({
-    type: "generate",
-    params,
-    model: new MockLanguageModelV3({ modelId: "anthropic/claude-opus-4.6" }),
-  });
-  expect(result.providerOptions?.anthropic?.thinking).toEqual({
-    type: "adaptive",
-  });
-  expect(result.providerOptions?.anthropic?.effort).toBe("max");
-});
-test("claudeReasoningMiddleware > should map max effort to high for Claude Sonnet 4.6", async () => {
-  const params = {
-    prompt: [],
-    providerOptions: {
-      unknown: {
-        reasoning: {
-          enabled: true,
-          effort: "max",
-        },
-      },
-    },
-  };
-  const result = await claudeReasoningMiddleware.transformParams!({
-    type: "generate",
-    params,
-    model: new MockLanguageModelV3({ modelId: "anthropic/claude-sonnet-4.6" }),
-  });
-  expect(result.providerOptions?.anthropic?.thinking).toEqual({
-    type: "adaptive",
-  });
-  expect(result.providerOptions?.anthropic?.effort).toBe("high");
-});
-test("claudeReasoningMiddleware > should map minimal effort to low for Claude Sonnet 4.6", async () => {
-  const params = {
-    prompt: [],
-    providerOptions: {
-      unknown: {
-        reasoning: {
-          enabled: true,
-          effort: "minimal",
-        },
-      },
-    },
-  };
-  const result = await claudeReasoningMiddleware.transformParams!({
-    type: "generate",
-    params,
-    model: new MockLanguageModelV3({ modelId: "anthropic/claude-sonnet-4.6" }),
-  });
-  expect(result.providerOptions?.anthropic?.thinking).toEqual({
-    type: "adaptive",
-  });
-  expect(result.providerOptions?.anthropic?.effort).toBe("low");
-});
-test("claudeReasoningMiddleware > should use manual thinking for Claude Sonnet 4.6 when max_tokens is provided", async () => {
-  const params = {
-    prompt: [],
-    providerOptions: {
-      unknown: {
-        reasoning: {
-          enabled: true,
-          effort: "medium",
-          max_tokens: 2000,
-        },
-      },
-    },
-  };
-  const result = await claudeReasoningMiddleware.transformParams!({
-    type: "generate",
-    params,
-    model: new MockLanguageModelV3({ modelId: "anthropic/claude-sonnet-4.6" }),
-  });
-  expect(result.providerOptions?.anthropic?.thinking).toEqual({
-    type: "enabled",
-    budgetTokens: 2000,
-  });
-  expect(result.providerOptions?.anthropic?.effort).toBe("medium");
-});
-test("claudeReasoningMiddleware > should map none effort to low for Claude Sonnet 4.5", async () => {
-  const params = {
-    prompt: [],
-    providerOptions: {
-      unknown: {
-        reasoning: {
-          enabled: true,
-          effort: "none",
-        },
-      },
-    },
-  };
-  const result = await claudeReasoningMiddleware.transformParams!({
-    type: "generate",
-    params,
-    model: new MockLanguageModelV3({ modelId: "anthropic/claude-sonnet-4.5" }),
-  });
-  expect(result.providerOptions?.anthropic?.thinking).toEqual({
-    type: "enabled",
-    budgetTokens: 1024,
-  });
-  expect(result.providerOptions?.anthropic?.effort).toBe("low");
-});
-test("claudeReasoningMiddleware > should include effort and max_tokens for Claude 4.6", async () => {
-  const params = {
-    prompt: [],
-    providerOptions: {
-      unknown: {
-        reasoning: {
-          enabled: true,
-          effort: "medium",
-          max_tokens: 2000,
-        },
-      },
-    },
-  };
-  const result = await claudeReasoningMiddleware.transformParams!({
-    type: "generate",
-    params,
-    model: new MockLanguageModelV3({ modelId: "anthropic/claude-opus-4.6" }),
-  });
-  expect(result.providerOptions?.anthropic?.thinking).toEqual({
-    type: "adaptive",
-    budgetTokens: 2000,
-  });
-  expect(result.providerOptions?.anthropic?.effort).toBe("medium");
-});
-test("claudeReasoningMiddleware > should clamp max_tokens to 128k for Claude Opus 4.6", async () => {
-  const params = {
-    prompt: [],
-    providerOptions: {
-      unknown: {
-        reasoning: {
-          enabled: true,
-          effort: "medium",
-          max_tokens: 200000,
-        },
-      },
-    },
-  };
-  const result = await claudeReasoningMiddleware.transformParams!({
-    type: "generate",
-    params,
-    model: new MockLanguageModelV3({ modelId: "anthropic/claude-opus-4.6" }),
-  });
-  expect(result.providerOptions?.anthropic?.thinking).toEqual({
-    type: "adaptive",
-    budgetTokens: 128000,
-  });
-  expect(result.providerOptions?.anthropic?.effort).toBe("medium");
-});
-test("claudeReasoningMiddleware > should include effort and max_tokens for Claude Sonnet 4.5", async () => {
-  const params = {
-    prompt: [],
-    providerOptions: {
-      unknown: {
-        reasoning: {
-          enabled: true,
-          effort: "medium",
-          max_tokens: 2000,
-        },
-      },
-    },
-  };
-  const result = await claudeReasoningMiddleware.transformParams!({
-    type: "generate",
-    params,
-    model: new MockLanguageModelV3({ modelId: "anthropic/claude-sonnet-4.5" }),
-  });
-  expect(result.providerOptions?.anthropic?.thinking).toEqual({
-    type: "enabled",
-    budgetTokens: 2000,
-  });
-  expect(result.providerOptions?.anthropic?.effort).toBe("medium");
-});
-test("claudeReasoningMiddleware > should map max effort to high for Claude Sonnet 4.5", async () => {
-  const params = {
-    prompt: [],
-    providerOptions: {
-      unknown: {
-        reasoning: {
-          enabled: true,
-          effort: "max",
-        },
-      },
-    },
-  };
-  const result = await claudeReasoningMiddleware.transformParams!({
-    type: "generate",
-    params,
-    model: new MockLanguageModelV3({ modelId: "anthropic/claude-sonnet-4.5" }),
-  });
-  expect(result.providerOptions?.anthropic?.thinking).toEqual({
-    type: "enabled",
-    budgetTokens: 60800,
-  });
-  expect(result.providerOptions?.anthropic?.effort).toBe("high");
-});
-test("claudeReasoningMiddleware > should map xhigh effort to high for Claude Sonnet 4.5", async () => {
-  const params = {
-    prompt: [],
-    providerOptions: {
-      unknown: {
-        reasoning: {
-          enabled: true,
-          effort: "xhigh",
-        },
-      },
-    },
-  };
-  const result = await claudeReasoningMiddleware.transformParams!({
-    type: "generate",
-    params,
-    model: new MockLanguageModelV3({ modelId: "anthropic/claude-sonnet-4.5" }),
-  });
-  expect(result.providerOptions?.anthropic?.thinking).toEqual({
-    type: "enabled",
-    budgetTokens: 60800,
-  });
-  expect(result.providerOptions?.anthropic?.effort).toBe("high");
-});
-test("claudeReasoningMiddleware > should keep xhigh as budget for non-4.6 models", async () => {
-  const params = {
-    prompt: [],
-    providerOptions: {
-      unknown: {
-        reasoning: {
-          enabled: true,
-          effort: "xhigh",
-        },
-      },
-    },
-  };
-  const result = await claudeReasoningMiddleware.transformParams!({
-    type: "generate",
-    params,
-    model: new MockLanguageModelV3({ modelId: "anthropic/claude-sonnet-4" }),
-  });
-  expect(result.providerOptions?.anthropic?.thinking?.budgetTokens).toBe(60800);
-});
-test("claudeReasoningMiddleware > should map xhigh effort for Claude Opus 4.5 without default budget", async () => {
-  const params = {
-    prompt: [],
-    providerOptions: {
-      unknown: {
-        reasoning: {
-          enabled: true,
-          effort: "xhigh",
-        },
-      },
-    },
-  };
-  const result = await claudeReasoningMiddleware.transformParams!({
-    type: "generate",
-    params,
-    model: new MockLanguageModelV3({ modelId: "anthropic/claude-opus-4.5" }),
-  });
-  expect(result.providerOptions?.anthropic?.thinking).toEqual({
-    type: "enabled",
-    budgetTokens: 60800,
-  });
-  expect(result.providerOptions?.anthropic?.effort).toBe("high");
-});