npm - @hebo-ai/gateway - Versions diffs - 0.5.2 → 0.6.0-rc0 - Mend

@hebo-ai/gateway 0.5.2 → 0.6.0-rc0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (180) hide show

package/README.md +32 -1
package/package.json +17 -12
package/src/endpoints/chat-completions/converters.test.ts +85 -1
package/src/endpoints/chat-completions/converters.ts +139 -18
package/src/endpoints/chat-completions/handler.test.ts +2 -0
package/src/endpoints/chat-completions/index.ts +1 -0
package/src/endpoints/chat-completions/otel.ts +1 -0
package/src/endpoints/chat-completions/schema.ts +38 -4
package/src/endpoints/embeddings/index.ts +1 -0
package/src/lifecycle.ts +2 -2
package/src/models/anthropic/middleware.test.ts +45 -1
package/src/models/anthropic/middleware.ts +21 -1
package/src/models/google/middleware.test.ts +30 -1
package/src/models/google/middleware.ts +20 -1
package/src/models/openai/middleware.test.ts +32 -1
package/src/models/openai/middleware.ts +25 -1
package/src/providers/bedrock/middleware.test.ts +121 -1
package/src/providers/bedrock/middleware.ts +61 -1
package/src/telemetry/fetch.ts +31 -4
package/src/telemetry/index.ts +1 -0
package/dist/config.d.ts +0 -2
package/dist/config.js +0 -81
package/dist/endpoints/chat-completions/converters.d.ts +0 -43
package/dist/endpoints/chat-completions/converters.js +0 -551
package/dist/endpoints/chat-completions/handler.d.ts +0 -2
package/dist/endpoints/chat-completions/handler.js +0 -145
package/dist/endpoints/chat-completions/index.d.ts +0 -3
package/dist/endpoints/chat-completions/index.js +0 -3
package/dist/endpoints/chat-completions/otel.d.ts +0 -6
package/dist/endpoints/chat-completions/otel.js +0 -134
package/dist/endpoints/chat-completions/schema.d.ts +0 -946
package/dist/endpoints/chat-completions/schema.js +0 -257
package/dist/endpoints/embeddings/converters.d.ts +0 -10
package/dist/endpoints/embeddings/converters.js +0 -31
package/dist/endpoints/embeddings/handler.d.ts +0 -2
package/dist/endpoints/embeddings/handler.js +0 -101
package/dist/endpoints/embeddings/index.d.ts +0 -3
package/dist/endpoints/embeddings/index.js +0 -3
package/dist/endpoints/embeddings/otel.d.ts +0 -6
package/dist/endpoints/embeddings/otel.js +0 -35
package/dist/endpoints/embeddings/schema.d.ts +0 -38
package/dist/endpoints/embeddings/schema.js +0 -26
package/dist/endpoints/models/converters.d.ts +0 -6
package/dist/endpoints/models/converters.js +0 -42
package/dist/endpoints/models/handler.d.ts +0 -2
package/dist/endpoints/models/handler.js +0 -29
package/dist/endpoints/models/index.d.ts +0 -3
package/dist/endpoints/models/index.js +0 -3
package/dist/endpoints/models/schema.d.ts +0 -42
package/dist/endpoints/models/schema.js +0 -31
package/dist/errors/ai-sdk.d.ts +0 -2
package/dist/errors/ai-sdk.js +0 -52
package/dist/errors/gateway.d.ts +0 -5
package/dist/errors/gateway.js +0 -13
package/dist/errors/openai.d.ts +0 -20
package/dist/errors/openai.js +0 -40
package/dist/errors/utils.d.ts +0 -22
package/dist/errors/utils.js +0 -44
package/dist/gateway.d.ts +0 -9
package/dist/gateway.js +0 -34
package/dist/index.d.ts +0 -14
package/dist/index.js +0 -13
package/dist/lifecycle.d.ts +0 -2
package/dist/lifecycle.js +0 -94
package/dist/logger/default.d.ts +0 -4
package/dist/logger/default.js +0 -81
package/dist/logger/index.d.ts +0 -14
package/dist/logger/index.js +0 -25
package/dist/middleware/common.d.ts +0 -12
package/dist/middleware/common.js +0 -145
package/dist/middleware/matcher.d.ts +0 -27
package/dist/middleware/matcher.js +0 -112
package/dist/middleware/utils.d.ts +0 -2
package/dist/middleware/utils.js +0 -27
package/dist/models/amazon/index.d.ts +0 -2
package/dist/models/amazon/index.js +0 -2
package/dist/models/amazon/middleware.d.ts +0 -3
package/dist/models/amazon/middleware.js +0 -65
package/dist/models/amazon/presets.d.ts +0 -2390
package/dist/models/amazon/presets.js +0 -80
package/dist/models/anthropic/index.d.ts +0 -2
package/dist/models/anthropic/index.js +0 -2
package/dist/models/anthropic/middleware.d.ts +0 -4
package/dist/models/anthropic/middleware.js +0 -111
package/dist/models/anthropic/presets.d.ts +0 -4802
package/dist/models/anthropic/presets.js +0 -135
package/dist/models/catalog.d.ts +0 -4
package/dist/models/catalog.js +0 -4
package/dist/models/cohere/index.d.ts +0 -2
package/dist/models/cohere/index.js +0 -2
package/dist/models/cohere/middleware.d.ts +0 -3
package/dist/models/cohere/middleware.js +0 -60
package/dist/models/cohere/presets.d.ts +0 -2918
package/dist/models/cohere/presets.js +0 -134
package/dist/models/google/index.d.ts +0 -2
package/dist/models/google/index.js +0 -2
package/dist/models/google/middleware.d.ts +0 -7
package/dist/models/google/middleware.js +0 -103
package/dist/models/google/presets.d.ts +0 -2553
package/dist/models/google/presets.js +0 -83
package/dist/models/meta/index.d.ts +0 -1
package/dist/models/meta/index.js +0 -1
package/dist/models/meta/presets.d.ts +0 -3254
package/dist/models/meta/presets.js +0 -95
package/dist/models/openai/index.d.ts +0 -2
package/dist/models/openai/index.js +0 -2
package/dist/models/openai/middleware.d.ts +0 -3
package/dist/models/openai/middleware.js +0 -62
package/dist/models/openai/presets.d.ts +0 -6634
package/dist/models/openai/presets.js +0 -213
package/dist/models/types.d.ts +0 -20
package/dist/models/types.js +0 -84
package/dist/models/voyage/index.d.ts +0 -2
package/dist/models/voyage/index.js +0 -2
package/dist/models/voyage/middleware.d.ts +0 -2
package/dist/models/voyage/middleware.js +0 -18
package/dist/models/voyage/presets.d.ts +0 -3471
package/dist/models/voyage/presets.js +0 -85
package/dist/providers/anthropic/canonical.d.ts +0 -3
package/dist/providers/anthropic/canonical.js +0 -9
package/dist/providers/anthropic/index.d.ts +0 -1
package/dist/providers/anthropic/index.js +0 -1
package/dist/providers/bedrock/canonical.d.ts +0 -17
package/dist/providers/bedrock/canonical.js +0 -61
package/dist/providers/bedrock/index.d.ts +0 -2
package/dist/providers/bedrock/index.js +0 -2
package/dist/providers/bedrock/middleware.d.ts +0 -3
package/dist/providers/bedrock/middleware.js +0 -55
package/dist/providers/cohere/canonical.d.ts +0 -3
package/dist/providers/cohere/canonical.js +0 -17
package/dist/providers/cohere/index.d.ts +0 -1
package/dist/providers/cohere/index.js +0 -1
package/dist/providers/groq/canonical.d.ts +0 -3
package/dist/providers/groq/canonical.js +0 -12
package/dist/providers/groq/index.d.ts +0 -1
package/dist/providers/groq/index.js +0 -1
package/dist/providers/openai/canonical.d.ts +0 -3
package/dist/providers/openai/canonical.js +0 -8
package/dist/providers/openai/index.d.ts +0 -1
package/dist/providers/openai/index.js +0 -1
package/dist/providers/registry.d.ts +0 -24
package/dist/providers/registry.js +0 -100
package/dist/providers/types.d.ts +0 -7
package/dist/providers/types.js +0 -11
package/dist/providers/vertex/canonical.d.ts +0 -3
package/dist/providers/vertex/canonical.js +0 -8
package/dist/providers/vertex/index.d.ts +0 -1
package/dist/providers/vertex/index.js +0 -1
package/dist/providers/voyage/canonical.d.ts +0 -3
package/dist/providers/voyage/canonical.js +0 -7
package/dist/providers/voyage/index.d.ts +0 -1
package/dist/providers/voyage/index.js +0 -1
package/dist/telemetry/ai-sdk.d.ts +0 -2
package/dist/telemetry/ai-sdk.js +0 -31
package/dist/telemetry/baggage.d.ts +0 -1
package/dist/telemetry/baggage.js +0 -24
package/dist/telemetry/fetch.d.ts +0 -2
package/dist/telemetry/fetch.js +0 -24
package/dist/telemetry/gen-ai.d.ts +0 -5
package/dist/telemetry/gen-ai.js +0 -60
package/dist/telemetry/http.d.ts +0 -3
package/dist/telemetry/http.js +0 -54
package/dist/telemetry/memory.d.ts +0 -2
package/dist/telemetry/memory.js +0 -27
package/dist/telemetry/span.d.ts +0 -13
package/dist/telemetry/span.js +0 -60
package/dist/telemetry/stream.d.ts +0 -3
package/dist/telemetry/stream.js +0 -51
package/dist/types.d.ts +0 -176
package/dist/types.js +0 -1
package/dist/utils/env.d.ts +0 -2
package/dist/utils/env.js +0 -5
package/dist/utils/headers.d.ts +0 -4
package/dist/utils/headers.js +0 -22
package/dist/utils/preset.d.ts +0 -9
package/dist/utils/preset.js +0 -41
package/dist/utils/request.d.ts +0 -2
package/dist/utils/request.js +0 -14
package/dist/utils/response.d.ts +0 -3
package/dist/utils/response.js +0 -68

package/src/lifecycle.ts CHANGED Viewed

@@ -10,7 +10,7 @@ import { GatewayError } from "./errors/gateway";
 import { toOpenAIErrorResponse } from "./errors/openai";
 import { logger } from "./logger";
 import { getBaggageAttributes } from "./telemetry/baggage";
-import { initFetch } from "./telemetry/fetch";
+import { instrumentFetch } from "./telemetry/fetch";
 import { getRequestAttributes, getResponseAttributes } from "./telemetry/http";
 import { recordV8jsMemory } from "./telemetry/memory";
 import { addSpanEvent, setSpanEventsEnabled, setSpanTracer, startSpan } from "./telemetry/span";
@@ -27,7 +27,7 @@ export const winterCgHandler = (
   if (parsedConfig.telemetry?.enabled) {
     setSpanTracer(parsedConfig.telemetry?.tracer);
     setSpanEventsEnabled(parsedConfig.telemetry?.signals?.hebo);
-    initFetch(parsedConfig.telemetry?.signals?.hebo);
+    instrumentFetch(parsedConfig.telemetry?.signals?.hebo);
   }
   return async (request: Request, state?: Record<string, unknown>): Promise<Response> => {

package/src/models/anthropic/middleware.test.ts CHANGED Viewed

@@ -3,7 +3,7 @@ import { expect, test } from "bun:test";
 import { modelMiddlewareMatcher } from "../../middleware/matcher";
 import { CANONICAL_MODEL_IDS } from "../../models/types";
-import { claudeReasoningMiddleware } from "./middleware";
+import { claudePromptCachingMiddleware, claudeReasoningMiddleware } from "./middleware";
 test("claudeReasoningMiddleware > matching patterns", () => {
   const matching = [
@@ -27,6 +27,7 @@ test("claudeReasoningMiddleware > matching patterns", () => {
   for (const id of matching) {
     const middleware = modelMiddlewareMatcher.resolve({ kind: "text", modelId: id });
     expect(middleware).toContain(claudeReasoningMiddleware);
+    expect(middleware).toContain(claudePromptCachingMiddleware);
   }
   for (const id of nonMatching) {
@@ -35,6 +36,49 @@ test("claudeReasoningMiddleware > matching patterns", () => {
   }
 });
+test("claudePromptCachingMiddleware > should not auto-enable top-level cache control", async () => {
+  const params = {
+    prompt: [],
+    providerOptions: {
+      unknown: {},
+    },
+  };
+  const result = await claudePromptCachingMiddleware.transformParams!({
+    type: "generate",
+    params,
+    model: new MockLanguageModelV3({ modelId: "anthropic/claude-sonnet-4.6" }),
+  });
+  expect(result.providerOptions).toEqual({
+    unknown: {},
+  });
+});
+test("claudePromptCachingMiddleware > should map cache_control ttl", async () => {
+  const params = {
+    prompt: [],
+    providerOptions: {
+      unknown: {
+        cache_control: { type: "ephemeral", ttl: "1h" },
+      },
+    },
+  };
+  const result = await claudePromptCachingMiddleware.transformParams!({
+    type: "generate",
+    params,
+    model: new MockLanguageModelV3({ modelId: "anthropic/claude-sonnet-4.6" }),
+  });
+  expect(result.providerOptions).toEqual({
+    anthropic: {
+      cacheControl: { type: "ephemeral", ttl: "1h" },
+    },
+    unknown: {},
+  });
+});
 test("claudeReasoningMiddleware > should transform reasoning_effort string to thinking budget", async () => {
   const params = {
     prompt: [],

package/src/models/anthropic/middleware.ts CHANGED Viewed

@@ -1,6 +1,7 @@
 import type { LanguageModelMiddleware } from "ai";
 import type {
+  ChatCompletionsCacheControl,
   ChatCompletionsReasoningConfig,
   ChatCompletionsReasoningEffort,
 } from "../../endpoints/chat-completions/schema";
@@ -123,6 +124,25 @@ export const claudeReasoningMiddleware: LanguageModelMiddleware = {
   },
 };
+// https://platform.claude.com/docs/en/build-with-claude/prompt-caching
+export const claudePromptCachingMiddleware: LanguageModelMiddleware = {
+  specificationVersion: "v3",
+  // eslint-disable-next-line require-await
+  transformParams: async ({ params }) => {
+    const unknown = params.providerOptions?.["unknown"];
+    if (!unknown) return params;
+    const cacheControl = unknown["cache_control"] as ChatCompletionsCacheControl;
+    if (cacheControl) {
+      (params.providerOptions!["anthropic"] ??= {})["cacheControl"] = cacheControl;
+    }
+    delete unknown["cache_control"];
+    return params;
+  },
+};
 modelMiddlewareMatcher.useForModel(["anthropic/claude-*3*7*", "anthropic/claude-*4*"], {
-  language: [claudeReasoningMiddleware],
+  language: [claudeReasoningMiddleware, claudePromptCachingMiddleware],
 });

package/src/models/google/middleware.test.ts CHANGED Viewed

@@ -4,7 +4,11 @@ import { expect, test } from "bun:test";
 import { modelMiddlewareMatcher } from "../../middleware/matcher";
 import { calculateReasoningBudgetFromEffort } from "../../middleware/utils";
 import { CANONICAL_MODEL_IDS } from "../../models/types";
-import { geminiDimensionsMiddleware, geminiReasoningMiddleware } from "./middleware";
+import {
+  geminiDimensionsMiddleware,
+  geminiPromptCachingMiddleware,
+  geminiReasoningMiddleware,
+} from "./middleware";
 test("geminiReasoningMiddleware > matching patterns", () => {
   const matching = [
@@ -21,6 +25,7 @@ test("geminiReasoningMiddleware > matching patterns", () => {
   for (const id of matching) {
     const middleware = modelMiddlewareMatcher.resolve({ kind: "text", modelId: id });
     expect(middleware).toContain(geminiReasoningMiddleware);
+    expect(middleware).toContain(geminiPromptCachingMiddleware);
   }
   for (const id of nonMatching) {
@@ -29,6 +34,30 @@ test("geminiReasoningMiddleware > matching patterns", () => {
   }
 });
+test("geminiPromptCachingMiddleware > should map normalized cached_content", async () => {
+  const params = {
+    prompt: [],
+    providerOptions: {
+      unknown: {
+        cached_content: "cachedContents/reusable",
+      },
+    },
+  };
+  const result = await geminiPromptCachingMiddleware.transformParams!({
+    type: "generate",
+    params,
+    model: new MockLanguageModelV3({ modelId: "google/gemini-2.5-flash" }),
+  });
+  expect(result.providerOptions).toEqual({
+    google: {
+      cachedContent: "cachedContents/reusable",
+    },
+    unknown: {},
+  });
+});
 test("geminiDimensionsMiddleware > matching patterns", () => {
   const matching = ["google/gemini-embedding-001"];
   const nonMatching = [

package/src/models/google/middleware.ts CHANGED Viewed

@@ -123,10 +123,29 @@ export const geminiReasoningMiddleware: LanguageModelMiddleware = {
   },
 };
+// https://ai.google.dev/gemini-api/docs/caching
+// FUTURE: auto-create cached_content for message-level cache_control blocks
+export const geminiPromptCachingMiddleware: LanguageModelMiddleware = {
+  specificationVersion: "v3",
+  // eslint-disable-next-line require-await
+  transformParams: async ({ params }) => {
+    const unknown = params.providerOptions?.["unknown"];
+    if (!unknown) return params;
+    const cachedContent = unknown["cached_content"] as string | undefined;
+    if (cachedContent) {
+      (params.providerOptions!["google"] ??= {})["cachedContent"] = cachedContent;
+    }
+    delete unknown["cached_content"];
+    return params;
+  },
+};
 modelMiddlewareMatcher.useForModel("google/gemini-*embedding-*", {
   embedding: [geminiDimensionsMiddleware],
 });
 modelMiddlewareMatcher.useForModel(["google/gemini-2*", "google/gemini-3*"], {
-  language: [geminiReasoningMiddleware],
+  language: [geminiReasoningMiddleware, geminiPromptCachingMiddleware],
 });

package/src/models/openai/middleware.test.ts CHANGED Viewed

@@ -3,7 +3,11 @@ import { expect, test } from "bun:test";
 import { modelMiddlewareMatcher } from "../../middleware/matcher";
 import { CANONICAL_MODEL_IDS } from "../../models/types";
-import { openAIDimensionsMiddleware, openAIReasoningMiddleware } from "./middleware";
+import {
+  openAIDimensionsMiddleware,
+  openAIPromptCachingMiddleware,
+  openAIReasoningMiddleware,
+} from "./middleware";
 test("openAI middleware > matching patterns", () => {
   const languageMatching = [
@@ -21,6 +25,7 @@ test("openAI middleware > matching patterns", () => {
   for (const id of languageMatching) {
     const middleware = modelMiddlewareMatcher.resolve({ kind: "text", modelId: id });
     expect(middleware).toContain(openAIReasoningMiddleware);
+    expect(middleware).toContain(openAIPromptCachingMiddleware);
   }
   for (const id of languageNonMatching) {
@@ -46,6 +51,32 @@ test("openAI middleware > matching patterns", () => {
   }
 });
+test("openAIPromptCachingMiddleware > should map key and retention", async () => {
+  const params = {
+    prompt: [],
+    providerOptions: {
+      unknown: {
+        prompt_cache_key: "tenant:shared:legal-v1",
+        prompt_cache_retention: "24h",
+      },
+    },
+  };
+  const result = await openAIPromptCachingMiddleware.transformParams!({
+    type: "generate",
+    params,
+    model: new MockLanguageModelV3({ modelId: "openai/gpt-5" }),
+  });
+  expect(result.providerOptions).toEqual({
+    openai: {
+      promptCacheKey: "tenant:shared:legal-v1",
+      promptCacheRetention: "24h",
+    },
+    unknown: {},
+  });
+});
 test("openAIReasoningMiddleware > should map reasoning effort to OpenAI provider options", async () => {
   const params = {
     prompt: [],

package/src/models/openai/middleware.ts CHANGED Viewed

@@ -70,10 +70,34 @@ export const openAIReasoningMiddleware: LanguageModelMiddleware = {
   },
 };
+// https://developers.openai.com/api/docs/guides/prompt-caching/
+export const openAIPromptCachingMiddleware: LanguageModelMiddleware = {
+  specificationVersion: "v3",
+  // eslint-disable-next-line require-await
+  transformParams: async ({ params }) => {
+    const unknown = params.providerOptions?.["unknown"];
+    if (!unknown) return params;
+    const key = unknown["prompt_cache_key"] as string | undefined;
+    const retention = unknown["prompt_cache_retention"] as "in_memory" | "24h" | undefined;
+    if (key || retention) {
+      const target = (params.providerOptions!["openai"] ??= {});
+      if (key) target["promptCacheKey"] = key;
+      if (retention) target["promptCacheRetention"] = retention;
+    }
+    delete unknown["prompt_cache_key"];
+    delete unknown["prompt_cache_retention"];
+    return params;
+  },
+};
 modelMiddlewareMatcher.useForModel("openai/text-embedding-*", {
   embedding: [openAIDimensionsMiddleware],
 });
 modelMiddlewareMatcher.useForModel("openai/gpt-*", {
-  language: [openAIReasoningMiddleware],
+  language: [openAIReasoningMiddleware, openAIPromptCachingMiddleware],
 });

package/src/providers/bedrock/middleware.test.ts CHANGED Viewed

@@ -2,7 +2,11 @@ import { MockLanguageModelV3 } from "ai/test";
 import { expect, test } from "bun:test";
 import { modelMiddlewareMatcher } from "../../middleware/matcher";
-import { bedrockClaudeReasoningMiddleware, bedrockGptReasoningMiddleware } from "./middleware";
+import {
+  bedrockClaudeReasoningMiddleware,
+  bedrockGptReasoningMiddleware,
+  bedrockPromptCachingMiddleware,
+} from "./middleware";
 test("bedrock middlewares > matching provider resolves GPT middleware", () => {
   const middleware = modelMiddlewareMatcher.resolve({
@@ -24,6 +28,26 @@ test("bedrock middlewares > matching provider resolves Claude middleware", () =>
   expect(middleware).toContain(bedrockClaudeReasoningMiddleware);
 });
+test("bedrock middlewares > matching provider resolves prompt caching middleware for Claude", () => {
+  const middleware = modelMiddlewareMatcher.resolve({
+    kind: "text",
+    modelId: "anthropic/claude-opus-4.6",
+    providerId: "amazon-bedrock",
+  });
+  expect(middleware).toContain(bedrockPromptCachingMiddleware);
+});
+test("bedrock middlewares > matching provider resolves prompt caching middleware for Nova", () => {
+  const middleware = modelMiddlewareMatcher.resolve({
+    kind: "text",
+    modelId: "amazon/nova-2-lite",
+    providerId: "amazon-bedrock",
+  });
+  expect(middleware).toContain(bedrockPromptCachingMiddleware);
+});
 test("bedrockGptReasoningMiddleware > should map reasoningEffort into reasoningConfig", async () => {
   const params = {
     prompt: [],
@@ -181,3 +205,99 @@ test("bedrockClaudeReasoningMiddleware > should not set maxReasoningEffort for C
     },
   });
 });
+test("bedrockPromptCachingMiddleware > should map message and part cacheControl to cachePoint", async () => {
+  const params = {
+    prompt: [
+      {
+        role: "system",
+        content: [
+          {
+            type: "text",
+            text: "Policy",
+            providerOptions: {
+              bedrock: {
+                cacheControl: { type: "ephemeral", ttl: "1h" },
+              },
+            },
+          },
+        ],
+        providerOptions: {
+          bedrock: {
+            cacheControl: { type: "ephemeral", ttl: "1h" },
+          },
+        },
+      },
+    ],
+    providerOptions: {
+      bedrock: {},
+    },
+  };
+  const result = await bedrockPromptCachingMiddleware.transformParams!({
+    type: "generate",
+    params: params as any,
+    model: new MockLanguageModelV3({ modelId: "amazon/nova-2-lite" }),
+  });
+  expect((result.prompt[0] as any).providerOptions.bedrock.cachePoint).toEqual({
+    type: "default",
+  });
+  expect((result.prompt[0] as any).providerOptions.bedrock.cacheControl).toBeUndefined();
+  expect((result.prompt[0] as any).content[0].providerOptions.bedrock.cachePoint).toEqual({
+    type: "default",
+  });
+  expect((result.prompt[0] as any).content[0].providerOptions.bedrock.cacheControl).toBeUndefined();
+});
+test("bedrockPromptCachingMiddleware > should fallback from top-level cacheControl", async () => {
+  const params = {
+    prompt: [
+      {
+        role: "system",
+        content: "Reusable context",
+      },
+      {
+        role: "user",
+        content: "Question",
+      },
+    ],
+    providerOptions: {
+      bedrock: {
+        cacheControl: { type: "ephemeral", ttl: "1h" },
+      },
+    },
+  };
+  const result = await bedrockPromptCachingMiddleware.transformParams!({
+    type: "generate",
+    params: params as any,
+    model: new MockLanguageModelV3({ modelId: "anthropic/claude-opus-4.6" }),
+  });
+  expect((result.prompt[1] as any).providerOptions).toBeUndefined();
+  expect((result.providerOptions as any).bedrock.cacheControl).toBeUndefined();
+});
+test("bedrockPromptCachingMiddleware > should skip non-claude non-nova models", async () => {
+  const params = {
+    prompt: [{ role: "user", content: "Hello" }],
+    providerOptions: {
+      bedrock: {
+        cacheControl: { type: "ephemeral", ttl: "1h" },
+      },
+    },
+  };
+  const result = await bedrockPromptCachingMiddleware.transformParams!({
+    type: "generate",
+    params: params as any,
+    model: new MockLanguageModelV3({ modelId: "openai/gpt-oss-20b" }),
+  });
+  expect((result.providerOptions as any).bedrock.cacheControl).toEqual({
+    type: "ephemeral",
+    ttl: "1h",
+  });
+  expect((result.prompt[0] as any).providerOptions).toBeUndefined();
+});

package/src/providers/bedrock/middleware.ts CHANGED Viewed

@@ -1,5 +1,7 @@
 import type { LanguageModelMiddleware } from "ai";
+import type { ChatCompletionsCacheControl } from "../../endpoints/chat-completions/schema";
 import { modelMiddlewareMatcher } from "../../middleware/matcher";
 const isClaude46 = (modelId: string) => modelId.includes("-4-6");
@@ -63,6 +65,64 @@ export const bedrockClaudeReasoningMiddleware: LanguageModelMiddleware = {
   },
 };
+function toBedrockCachePoint(modelId: string, cacheControl?: ChatCompletionsCacheControl) {
+  const out: { type: "default"; ttl?: string } = { type: "default" };
+  // Nova currently only supports 5m
+  if (cacheControl?.ttl && !modelId.includes("nova")) {
+    out.ttl = cacheControl.ttl;
+  }
+  return out;
+}
+// https://docs.aws.amazon.com/bedrock/latest/userguide/prompt-caching.html
+export const bedrockPromptCachingMiddleware: LanguageModelMiddleware = {
+  specificationVersion: "v3",
+  // eslint-disable-next-line require-await
+  transformParams: async ({ params, model }) => {
+    if (!model.modelId.includes("nova") && !model.modelId.includes("claude")) return params;
+    let hasExplicitCacheControl = false;
+    let lastCacheableBlock;
+    const processCacheControl = (providerOptions?: Record<string, any>) => {
+      if (!providerOptions) return;
+      const entryBedrock = providerOptions["bedrock"] as Record<string, unknown> | undefined;
+      const entryCacheControl = entryBedrock?.["cacheControl"] as ChatCompletionsCacheControl;
+      if (!entryBedrock || !entryCacheControl) return;
+      hasExplicitCacheControl = true;
+      entryBedrock["cachePoint"] = toBedrockCachePoint(model.modelId, entryCacheControl);
+      delete entryBedrock["cacheControl"];
+    };
+    for (const message of params.prompt) {
+      processCacheControl(message["providerOptions"]);
+      if (!Array.isArray(message["content"])) continue;
+      for (const part of message["content"]) {
+        processCacheControl(part["providerOptions"]);
+      }
+      lastCacheableBlock = message;
+    }
+    const bedrock = params.providerOptions?.["bedrock"];
+    const cacheControl = bedrock?.["cacheControl"] as ChatCompletionsCacheControl;
+    if (cacheControl && !hasExplicitCacheControl && lastCacheableBlock) {
+      ((lastCacheableBlock["providerOptions"] ??= {})["bedrock"] ??= {})["cachePoint"] =
+        toBedrockCachePoint(model.modelId, cacheControl);
+    }
+    delete bedrock?.["cacheControl"];
+    return params;
+  },
+};
 modelMiddlewareMatcher.useForProvider("amazon-bedrock", {
-  language: [bedrockGptReasoningMiddleware, bedrockClaudeReasoningMiddleware],
+  language: [
+    bedrockGptReasoningMiddleware,
+    bedrockClaudeReasoningMiddleware,
+    bedrockPromptCachingMiddleware,
+  ],
 });

package/src/telemetry/fetch.ts CHANGED Viewed

@@ -1,8 +1,8 @@
-import { SpanKind } from "@opentelemetry/api";
+import { SpanKind, type Attributes } from "@opentelemetry/api";
 import type { TelemetrySignalLevel } from "../types";
-import { withSpan } from "./span";
+import { setSpanAttributes, withSpan } from "./span";
 const ORIGINAL_FETCH_KEY = Symbol.for("@hebo/fetch/original-fetch");
@@ -13,6 +13,21 @@ type GlobalFetchState = typeof globalThis & {
 const g = globalThis as GlobalFetchState;
 let fetchTracingEnabled = false;
+const isRequest = (value: unknown): value is Request =>
+  typeof Request !== "undefined" && value instanceof Request;
+const getRequestAttributes = (input: RequestInfo | URL, init?: RequestInit): Attributes => {
+  const attrs: Attributes = {
+    "http.request.method": init?.method ?? (isRequest(input) ? input.method : "GET"),
+  };
+  if (input instanceof URL) attrs["url.full"] = input.href;
+  else if (typeof input === "string") attrs["url.full"] = input;
+  else if (isRequest(input)) attrs["url.full"] = input.url;
+  return attrs;
+};
 const shouldTraceFetch = (init?: RequestInit): boolean =>
   typeof (init?.headers as any)?.["user-agent"] === "string" &&
   (init!.headers as any)["user-agent"].indexOf("ai-sdk/provider-utils") !== -1;
@@ -22,10 +37,22 @@ const otelFetch = (input: RequestInfo | URL, init?: RequestInit) => {
   if (!fetchTracingEnabled) return original(input, init);
   if (!shouldTraceFetch(init)) return original(input, init);
-  return withSpan("fetch", () => original(input, init), { kind: SpanKind.CLIENT });
+  return withSpan(
+    "fetch",
+    async () => {
+      const response = await original(input, init);
+      setSpanAttributes({ "http.response.status_code": response.status });
+      return response;
+    },
+    {
+      kind: SpanKind.CLIENT,
+      attributes: getRequestAttributes(input, init),
+    },
+  );
 };
-export const initFetch = (level?: TelemetrySignalLevel) => {
+export const instrumentFetch = (level?: TelemetrySignalLevel) => {
   fetchTracingEnabled = level === "full";
   if (!fetchTracingEnabled) return;
   if (g[ORIGINAL_FETCH_KEY]) return;

package/src/telemetry/index.ts ADDED Viewed

	@@ -0,0 +1 @@
1	+ export * from "./fetch";

package/dist/config.d.ts DELETED Viewed

	@@ -1,2 +0,0 @@
1	- import { type GatewayConfig, type GatewayConfigParsed } from "./types";
2	- export declare const parseConfig: (config: GatewayConfig) => GatewayConfigParsed;

package/dist/config.js DELETED Viewed

@@ -1,81 +0,0 @@
-import { isLogger, logger, setLoggerInstance } from "./logger";
-import { createDefaultLogger } from "./logger/default";
-import { installAiSdkWarningLogger } from "./telemetry/ai-sdk";
-import { kParsed, } from "./types";
-export const parseConfig = (config) => {
-    // If it has been parsed before, just return.
-    if (kParsed in config)
-        return config;
-    const providers = config.providers ?? {};
-    const parsedProviders = {};
-    const models = config.models ?? {};
-    // Set the global logger instance.
-    if (config.logger === undefined) {
-        setLoggerInstance(createDefaultLogger({}));
-    }
-    else if (config.logger !== null) {
-        setLoggerInstance(isLogger(config.logger) ? config.logger : createDefaultLogger(config.logger));
-        logger.info(isLogger(config.logger)
-            ? `[logger] custom logger configured`
-            : `[logger] logger configured: level=${config.logger.level}`);
-    }
-    // Strip providers that are not configured.
-    for (const id in providers) {
-        const provider = providers[id];
-        if (provider === undefined) {
-            logger.warn(`[config] ${id} provider removed (undefined)`);
-            continue;
-        }
-        parsedProviders[id] = provider;
-    }
-    if (Object.keys(parsedProviders).length === 0) {
-        throw new Error("No providers configured (config.providers is empty)");
-    }
-    // Strip providers that are not configured from models.
-    const parsedModels = {};
-    const warnings = new Set();
-    for (const id in models) {
-        const model = models[id];
-        const kept = [];
-        for (const p of model.providers) {
-            if (p in parsedProviders)
-                kept.push(p);
-            else
-                warnings.add(p);
-        }
-        if (kept.length > 0)
-            parsedModels[id] = { ...model, providers: kept };
-    }
-    for (const warning of warnings) {
-        logger.warn(`[config] ${warning} provider removed (not configured)`);
-    }
-    if (Object.keys(parsedModels).length === 0) {
-        throw new Error("No models configured (config.models is empty)");
-    }
-    // Default for the telemetry settings.
-    const telemetryEnabled = config.telemetry?.enabled ?? false;
-    const telemetrySignals = telemetryEnabled
-        ? {
-            http: config.telemetry?.signals?.http ?? "recommended",
-            gen_ai: config.telemetry?.signals?.gen_ai ?? "full",
-            hebo: config.telemetry?.signals?.hebo ?? "off",
-        }
-        : {
-            http: "off",
-            gen_ai: "off",
-            hebo: "off",
-        };
-    installAiSdkWarningLogger(telemetrySignals.gen_ai);
-    // Return parsed config.
-    return {
-        ...config,
-        telemetry: {
-            ...config.telemetry,
-            enabled: telemetryEnabled,
-            signals: telemetrySignals,
-        },
-        providers: parsedProviders,
-        models: parsedModels,
-        [kParsed]: true,
-    };
-};