npm - @hebo-ai/gateway - Versions diffs - 0.1.2 → 0.2.0 - Mend

@hebo-ai/gateway 0.1.2 → 0.2.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (202) hide show

package/README.md +172 -67
package/dist/config.js +2 -12
package/dist/endpoints/chat-completions/converters.d.ts +28 -24
package/dist/endpoints/chat-completions/converters.js +99 -73
package/dist/endpoints/chat-completions/handler.js +36 -30
package/dist/endpoints/chat-completions/schema.d.ts +394 -272
package/dist/endpoints/chat-completions/schema.js +124 -57
package/dist/endpoints/embeddings/converters.d.ts +4 -4
package/dist/endpoints/embeddings/converters.js +8 -9
package/dist/endpoints/embeddings/handler.js +32 -26
package/dist/endpoints/embeddings/schema.d.ts +28 -38
package/dist/endpoints/embeddings/schema.js +10 -10
package/dist/endpoints/models/converters.d.ts +2 -2
package/dist/endpoints/models/converters.js +9 -12
package/dist/endpoints/models/handler.js +8 -9
package/dist/endpoints/models/schema.d.ts +37 -31
package/dist/endpoints/models/schema.js +23 -12
package/dist/gateway.d.ts +8 -9
package/dist/gateway.js +7 -10
package/dist/index.d.ts +2 -0
package/dist/index.js +2 -0
package/dist/lifecycle.d.ts +2 -0
package/dist/{utils/hooks.js → lifecycle.js} +16 -8
package/dist/middleware/common.d.ts +4 -0
package/dist/middleware/common.js +44 -0
package/dist/middleware/matcher.d.ts +18 -0
package/dist/middleware/matcher.js +83 -0
package/dist/models/amazon/index.d.ts +2 -0
package/dist/models/amazon/index.js +2 -0
package/dist/models/amazon/middleware.d.ts +2 -0
package/dist/models/amazon/middleware.js +20 -0
package/dist/models/amazon/presets.d.ts +2390 -0
package/dist/models/amazon/presets.js +80 -0
package/dist/models/anthropic/index.d.ts +2 -0
package/dist/models/anthropic/index.js +2 -0
package/dist/models/anthropic/middleware.d.ts +5 -0
package/dist/models/anthropic/middleware.js +67 -0
package/dist/models/anthropic/presets.d.ts +4106 -0
package/dist/models/anthropic/presets.js +113 -0
package/dist/models/catalog.d.ts +3 -1
package/dist/models/catalog.js +3 -2
package/dist/models/cohere/index.d.ts +2 -0
package/dist/models/cohere/index.js +2 -0
package/dist/models/cohere/middleware.d.ts +2 -0
package/dist/models/cohere/middleware.js +18 -0
package/dist/models/cohere/presets.d.ts +2918 -0
package/dist/models/cohere/presets.js +129 -0
package/dist/models/google/index.d.ts +2 -0
package/dist/models/google/index.js +2 -0
package/dist/models/google/middleware.d.ts +2 -0
package/dist/models/google/middleware.js +20 -0
package/dist/models/{presets/gemini.d.ts → google/presets.d.ts} +400 -174
package/dist/models/{presets/gemini.js → google/presets.js} +20 -5
package/dist/models/meta/index.d.ts +1 -0
package/dist/models/meta/index.js +1 -0
package/dist/models/meta/presets.d.ts +3254 -0
package/dist/models/{presets/llama.js → meta/presets.js} +44 -7
package/dist/models/openai/index.d.ts +2 -0
package/dist/models/openai/index.js +2 -0
package/dist/models/openai/middleware.d.ts +2 -0
package/dist/models/openai/middleware.js +20 -0
package/dist/models/openai/presets.d.ts +6252 -0
package/dist/models/openai/presets.js +206 -0
package/dist/models/types.d.ts +3 -3
package/dist/models/types.js +27 -0
package/dist/models/voyage/index.d.ts +2 -0
package/dist/models/voyage/index.js +2 -0
package/dist/models/voyage/middleware.d.ts +2 -0
package/dist/models/voyage/middleware.js +18 -0
package/dist/models/{presets/voyage.d.ts → voyage/presets.d.ts} +322 -323
package/dist/providers/anthropic/canonical.d.ts +3 -0
package/dist/providers/anthropic/canonical.js +9 -0
package/dist/providers/anthropic/index.d.ts +1 -0
package/dist/providers/anthropic/index.js +1 -0
package/dist/providers/bedrock/canonical.d.ts +15 -0
package/dist/providers/{canonical/bedrock.js → bedrock/canonical.js} +13 -15
package/dist/providers/bedrock/index.d.ts +1 -0
package/dist/providers/bedrock/index.js +1 -0
package/dist/providers/cohere/canonical.d.ts +3 -0
package/dist/providers/{canonical/cohere.js → cohere/canonical.js} +6 -6
package/dist/providers/cohere/index.d.ts +1 -0
package/dist/providers/cohere/index.js +1 -0
package/dist/providers/groq/canonical.d.ts +3 -0
package/dist/providers/groq/canonical.js +12 -0
package/dist/providers/groq/index.d.ts +1 -0
package/dist/providers/groq/index.js +1 -0
package/dist/providers/openai/canonical.d.ts +3 -0
package/dist/providers/openai/canonical.js +8 -0
package/dist/providers/openai/index.d.ts +1 -0
package/dist/providers/openai/index.js +1 -0
package/dist/providers/registry.d.ts +16 -26
package/dist/providers/registry.js +19 -26
package/dist/providers/types.d.ts +1 -1
package/dist/providers/types.js +1 -0
package/dist/providers/vertex/canonical.d.ts +3 -0
package/dist/providers/vertex/canonical.js +8 -0
package/dist/providers/vertex/index.d.ts +1 -0
package/dist/providers/vertex/index.js +1 -0
package/dist/providers/voyage/canonical.d.ts +3 -0
package/dist/providers/voyage/canonical.js +7 -0
package/dist/providers/voyage/index.d.ts +1 -0
package/dist/providers/voyage/index.js +1 -0
package/dist/types.d.ts +60 -30
package/dist/utils/errors.js +2 -0
package/dist/utils/preset.d.ts +1 -7
package/dist/utils/preset.js +1 -1
package/dist/utils/response.d.ts +1 -0
package/dist/utils/response.js +10 -0
package/package.json +79 -70
package/src/config.ts +2 -18
package/src/endpoints/chat-completions/converters.test.ts +39 -0
package/src/endpoints/chat-completions/converters.ts +191 -112
package/src/endpoints/chat-completions/handler.test.ts +47 -18
package/src/endpoints/chat-completions/handler.ts +40 -34
package/src/endpoints/chat-completions/schema.ts +161 -88
package/src/endpoints/embeddings/converters.ts +15 -11
package/src/endpoints/embeddings/handler.test.ts +27 -30
package/src/endpoints/embeddings/handler.ts +34 -28
package/src/endpoints/embeddings/schema.ts +10 -10
package/src/endpoints/models/converters.ts +22 -14
package/src/endpoints/models/handler.test.ts +26 -29
package/src/endpoints/models/handler.ts +10 -12
package/src/endpoints/models/schema.ts +26 -20
package/src/gateway.ts +10 -24
package/src/index.ts +3 -0
package/src/{utils/hooks.ts → lifecycle.ts} +21 -11
package/src/middleware/common.ts +68 -0
package/src/middleware/matcher.ts +117 -0
package/src/models/amazon/index.ts +2 -0
package/src/models/amazon/middleware.ts +25 -0
package/src/models/amazon/presets.ts +104 -0
package/src/models/anthropic/index.ts +2 -0
package/src/models/anthropic/middleware.test.ts +184 -0
package/src/models/anthropic/middleware.ts +75 -0
package/src/models/anthropic/presets.ts +161 -0
package/src/models/catalog.ts +10 -2
package/src/models/cohere/index.ts +2 -0
package/src/models/cohere/middleware.ts +23 -0
package/src/models/cohere/presets.ts +181 -0
package/src/models/google/index.ts +2 -0
package/src/models/google/middleware.ts +25 -0
package/src/models/{presets/gemini.ts → google/presets.ts} +25 -5
package/src/models/meta/index.ts +1 -0
package/src/models/{presets/llama.ts → meta/presets.ts} +68 -7
package/src/models/openai/index.ts +2 -0
package/src/models/openai/middleware.ts +25 -0
package/src/models/openai/presets.ts +269 -0
package/src/models/types.ts +29 -2
package/src/models/voyage/index.ts +2 -0
package/src/models/voyage/middleware.ts +23 -0
package/src/providers/anthropic/canonical.ts +17 -0
package/src/providers/anthropic/index.ts +1 -0
package/src/providers/{canonical/bedrock.ts → bedrock/canonical.ts} +22 -32
package/src/providers/bedrock/index.ts +1 -0
package/src/providers/cohere/canonical.ts +26 -0
package/src/providers/cohere/index.ts +1 -0
package/src/providers/groq/canonical.ts +21 -0
package/src/providers/groq/index.ts +1 -0
package/src/providers/openai/canonical.ts +16 -0
package/src/providers/openai/index.ts +1 -0
package/src/providers/registry.test.ts +12 -10
package/src/providers/registry.ts +43 -43
package/src/providers/types.ts +1 -0
package/src/providers/vertex/canonical.ts +17 -0
package/src/providers/vertex/index.ts +1 -0
package/src/providers/voyage/canonical.ts +16 -0
package/src/providers/voyage/index.ts +1 -0
package/src/types.ts +64 -28
package/src/utils/errors.ts +2 -0
package/src/utils/preset.ts +2 -6
package/src/utils/response.ts +15 -0
package/dist/models/presets/claude.d.ts +0 -1165
package/dist/models/presets/claude.js +0 -40
package/dist/models/presets/cohere.d.ts +0 -383
package/dist/models/presets/cohere.js +0 -26
package/dist/models/presets/gpt-oss.d.ts +0 -779
package/dist/models/presets/gpt-oss.js +0 -40
package/dist/models/presets/llama.d.ts +0 -1400
package/dist/providers/canonical/anthropic.d.ts +0 -25
package/dist/providers/canonical/anthropic.js +0 -14
package/dist/providers/canonical/bedrock.d.ts +0 -26
package/dist/providers/canonical/cohere.d.ts +0 -17
package/dist/providers/canonical/groq.d.ts +0 -17
package/dist/providers/canonical/groq.js +0 -10
package/dist/providers/canonical/openai.d.ts +0 -17
package/dist/providers/canonical/openai.js +0 -8
package/dist/providers/canonical/vertex.d.ts +0 -17
package/dist/providers/canonical/vertex.js +0 -10
package/dist/providers/canonical/voyage.d.ts +0 -17
package/dist/providers/canonical/voyage.js +0 -8
package/dist/utils/hooks.d.ts +0 -2
package/src/models/presets/claude.ts +0 -59
package/src/models/presets/cohere.ts +0 -37
package/src/models/presets/gpt-oss.ts +0 -55
package/src/providers/canonical/anthropic.ts +0 -32
package/src/providers/canonical/cohere.ts +0 -36
package/src/providers/canonical/groq.ts +0 -25
package/src/providers/canonical/openai.ts +0 -16
package/src/providers/canonical/vertex.ts +0 -18
package/src/providers/canonical/voyage.ts +0 -16
package/dist/models/{presets/voyage.js → voyage/presets.js} +10 -10
package/src/models/{presets/voyage.ts → voyage/presets.ts} +10 -10

package/README.md CHANGED Viewed

@@ -21,7 +21,7 @@ Hebo Gateway is an open-source, embeddable AI gateway framework built to live in
 ## Installation
 ```bash
-bun add @hebo-ai/gateway ai @ai-sdk/groq
+bun install @hebo-ai/gateway
 ```
 ## Quickstart
@@ -31,33 +31,39 @@ bun add @hebo-ai/gateway ai @ai-sdk/groq
 Start by creating a gateway instance with at least one provider and a few models.
 ```ts
-import { gateway, createModelCatalog } from "@hebo-ai/gateway";
-import { createGroqWithCanonicalIds } from "@hebo-ai/gateway/providers/groq";
-import { gptOss20b, gptOss } from "@hebo-ai/gateway/models/gpt-oss";
+import { createGroq } from "@ai-sdk/groq";
+import { gateway, defineModelCatalog } from "@hebo-ai/gateway";
+import { withCanonicalIdsForGroq } from "@hebo-ai/gateway/providers/groq";
+import { gptOss20b, gptOss } from "@hebo-ai/gateway/models/openai";
 export const gw = gateway({
   // PROVIDER REGISTRY
   providers: {
-    // Any Vercel AI SDK provider +WithCanonicalIds
-    groq: createGroqWithCanonicalIds({
-      apiKey: process.env.GROQ_API_KEY,
-    },
+    // Any Vercel AI SDK provider + withCanonicalIdsForX helper
+    groq: withCanonicalIdsForGroq(
+      createGroq({
+        apiKey: process.env.GROQ_API_KEY,
+      }),
+    ),
   },
   // MODEL CATALOG
-  models: createModelCatalog(
-    // Choose a preset for common SOTA models
-    gptOss20b({
-      providers: ["groq"],
-    }),
-    // Or add a whole model family
-    ...gptOss["all"].map((preset) =>
-      preset({})
+  models: defineModelCatalog(
+    // Choose a pre-configured preset for common SOTA models
+    gptOss20b,
+    // Or add a whole model family with your own provider list
+    gptOss["all"].map(
+      preset => preset({
+        providers: ["groq"],
+      })
     ),
   ),
 });
 ```
+> [!NOTE]
+> Don't forget to install the Groq provider package too: `@ai-sdk/groq`.
 ### Mount Route Handlers
 Hebo Gateway plugs into your favorite web framework. Simply mount the gateway’s `handler` under a prefix, and keep using your existing lifecycle hooks for authentication, logging, observability, and more.
@@ -194,39 +200,41 @@ Hebo Gateway’s provider registry accepts any **Vercel AI SDK Provider**. For H
 Out-of-the-box canonical providers:
-- Amazon Bedrock (`createAmazonBedrockWithCanonicalIds`): `@hebo-ai/gateway/providers/bedrock`
-- Anthropic (`createAnthropicWithCanonicalIds`): `@hebo-ai/gateway/providers/anthropic`
-- Cohere (`createCohereWithCanonicalIds`): `@hebo-ai/gateway/providers/cohere`
-- Google Vertex AI (`createVertexWithCanonicalIds`): `@hebo-ai/gateway/providers/vertex`
-- Groq (`createGroqWithCanonicalIds`): `@hebo-ai/gateway/providers/groq`
-- OpenAI (`createOpenAIWithCanonicalIds`): `@hebo-ai/gateway/providers/openai`
-- Voyage (`createVoyageWithCanonicalIds`): `@hebo-ai/gateway/providers/voyage`
+- Amazon Bedrock (`withCanonicalIdsForBedrock`): `@hebo-ai/gateway/providers/bedrock`
+- Anthropic (`withCanonicalIdsForAnthropic`): `@hebo-ai/gateway/providers/anthropic`
+- Cohere (`withCanonicalIdsForCohere`): `@hebo-ai/gateway/providers/cohere`
+- Google Vertex AI (`withCanonicalIdsForVertex`): `@hebo-ai/gateway/providers/vertex`
+- Groq (`withCanonicalIdsForGroq`): `@hebo-ai/gateway/providers/groq`
+- OpenAI (`withCanonicalIdsForOpenAI`): `@hebo-ai/gateway/providers/openai`
+- Voyage (`withCanonicalIdsForVoyage`): `@hebo-ai/gateway/providers/voyage`
 If an adapter is not yet provided, you can create your own by wrapping the provider instance with the `withCanonicalIds` helper and define your custom canonicalization mapping & rules.
 ```ts
-import { createOpenAI } from "@ai-sdk/openai";
+import { createAzure } from "@ai-sdk/openai";
 import {
   gateway,
-  createModelCatalog,
   withCanonicalIds,
 } from "@hebo-ai/gateway";
-const openai = withCanonicalIds(
-  createOpenAI({ apiKey: process.env.OPENAI_API_KEY }),
-  {
-    "openai/gpt-4.1-mini": "gpt-4.1-mini",
-    "openai/text-embedding-3-small": "text-embedding-3-small",
-  },
+const azure = withCanonicalIds(
+  createAzure({
+    resourceName: process.env["AZURE_RESOURCE_NAME"],
+    apiKey: process.env["AZURE_API_KEY"]
+  }), {
+  mapping: {
+    "openai/gpt-4.1-mini": "your-gpt-4.1-mini-deployment-name",
+    "openai/text-embedding-3-small": "your-embeddings-3-small-deployment-name",
+  }},
 );
 const gw = gateway({
   providers: {
-    openai,
+    azure,
   },
-  models: createModelCatalog({
+  models: {
     // ...your models pointing at canonical IDs above
-  }),
+  },
 });
 ```
@@ -236,46 +244,53 @@ Registering models tells Hebo Gateway which models are available, under which ca
 #### Model Presets
-To simplify the registration, Hebo Gateway ships a set of model presets under `@hebo-ai/gateway/models`. Use these when you want ready-to-use catalog entries with sane defaults for common SOTA models.
+To simplify the registration, Hebo Gateway ships a set of model presets under `@hebo-ai/gateway/models`. Use these when you want ready-to-use catalog entries with sane defaults for common SOTA models.
 Presets come in two forms:
 - Individual presets (e.g. `gptOss20b`, `claudeSonnet45`) for a single model.
 - Family presets (e.g. `claude`, `gemini`, `llama`) which group multiple models and expose helpers like `latest`, `all`, and versioned arrays (for example `claude["v4.5"]`).
 Out-of-the-box model presets:
-- **Claude** — `@hebo-ai/gateway/models/claude`
-  Family: `claude` (`v4.5`, `v4.x`, `latest`, `all`)
+- **Amazon** — `@hebo-ai/gateway/models/amazon`
+  Nova: `nova` (`v1`, `v2`, `v1.x`, `v2.x`, `latest`, `embeddings`, `all`)
-- **Gemini** — `@hebo-ai/gateway/models/gemini`
-  Family: `gemini` (`v2.5`, `v3-preview`, `v2.x`, `v3.x`, `latest`, `preview`, `all`)
+- **Anthropic** — `@hebo-ai/gateway/models/anthropic`
+  Claude: `claude` (`v4.5`, `v4.1`, `v4`, `v3.7`, `v3.5`, `v3`, `v4.x`, `v3.x`, `haiku`, `sonnet`, `opus`, `latest`, `all`)
-- **GPT-OSS** — `@hebo-ai/gateway/models/gpt-oss`
-  Family: `gptOss` (`v1`, `v1.x`, `latest`, `all`)
+- **Cohere** — `@hebo-ai/gateway/models/cohere`
+  Command: `command` (`A`, `R`, `latest`, `all`)
+  Embed: `embed` (`v4`, `v3`, `latest`, `all`)
-- **Llama** — `@hebo-ai/gateway/models/llama`
-  Family: `llama` (`v3.1`, `v3.3`, `v4`, `v3.x`, `v4.x`, `latest`, `all`)
+- **Google** — `@hebo-ai/gateway/models/google`
+  Gemini: `gemini` (`v2.5`, `v3-preview`, `v2.x`, `v3.x`, `embeddings`, `latest`, `preview`, `all`)
-- **Cohere** — `@hebo-ai/gateway/models/cohere`
-  Family: `cohere` (`v4`, `v4.x`, `latest`, `all`)
+- **Meta** — `@hebo-ai/gateway/models/meta`
+  Llama: `llama` (`v3.1`, `v3.2`, `v3.3`, `v4`, `v3.x`, `v4.x`, `latest`, `all`)
+- **OpenAI** — `@hebo-ai/gateway/models/openai`
+  GPT: `gpt` (`v5`, `v5.1`, `v5.2`, `v5.x`, `chat`, `codex`, `pro`, `latest`, `all`)
+  GPT-OSS: `gptOss` (`v1`, `v1.x`, `latest`, `all`)
+  Embeddings: `textEmbeddings` (`v3`, `v3.x`, `latest`, `all`)
 - **Voyage** — `@hebo-ai/gateway/models/voyage`
-  Family: `voyage` (`v2`, `v3`, `v3.5`, `v4`, `v2.x`, `v3.x`, `v4.x`, `latest`, `all`)
+  Voyage: `voyage` (`v2`, `v3`, `v3.5`, `v4`, `v2.x`, `v3.x`, `v4.x`, `latest`, `all`)
 ```ts
-import { createModelCatalog } from "@hebo-ai/gateway";
-import { gptOss20b } from "@hebo-ai/gateway/models/gpt-oss";
-import { claudeSonnet45, claude } from "@hebo-ai/gateway/models/claude";
+import { defineModelCatalog } from "@hebo-ai/gateway";
+import { gptOss20b } from "@hebo-ai/gateway/models/openai";
+import { claudeSonnet45, claude } from "@hebo-ai/gateway/models/anthropic";
 // Individual preset
-const models = createModelCatalog(
+const models = defineModelCatalog(
   gptOss20b({ providers: ["groq"] }),
   claudeSonnet45({ providers: ["bedrock"] }),
 );
 // Family preset (pick a group and apply the same override to each)
-const modelsFromFamily = createModelCatalog(
-  ...claude["latest"].map((preset) => preset({ providers: ["anthropic"] })),
+const modelsFromFamily = defineModelCatalog(
+  claude["latest"].map((preset) => preset({ providers: ["anthropic"] })),
 );
 ```
@@ -288,7 +303,7 @@ const gw = gateway({
   providers: {
     // ...
   },
-  models: createModelCatalog({
+  models: {
     "openai/gpt-5.2": {
       name: "GPT 5.2",
       created: "2025-12-11",
@@ -312,10 +327,12 @@ const gw = gateway({
       }
     },
     // ...
-  }),
+  },
 });
 ```
+Note: the only mandatory property is the `providers` array, everything else is optional metadata.
 ### Hooks
 Hooks allow you to plug-into the lifecycle of the gateway and enrich it with additional functionality. All hooks are available as async and non-async.
@@ -345,26 +362,32 @@ const gw = gateway({
     },
     /**
      * Maps a user-provided model ID or alias to a canonical ID.
+     * @param ctx.body The parsed body object with all call parameters.
      * @param ctx.modelId Incoming model ID.
      * @returns Canonical model ID or undefined to keep original.
      */
-    resolveModelId: async (ctx: { modelId: ModelId }): Promise<ModelId | void> => {
+    resolveModelId?: (ctx: {
+      body: ChatCompletionsBody | EmbeddingsBody;
+      modelId: ModelId;
+    }) => ModelId | void | Promise<ModelId | void> {
       // Example Use Cases:
       // - Resolve modelAlias to modelId
       return undefined;
     },
     /**
      * Picks a provider instance for the request.
-     * @param ctx.providers Provider registry.
+     * @param ctx.providers ProviderRegistry from config.
      * @param ctx.models ModelCatalog from config.
+     * @param ctx.body The parsed body object with all call parameters.
      * @param ctx.modelId Resolved model ID.
      * @param ctx.operation Operation type ("text" | "embeddings").
      * @returns ProviderV3 to override, or undefined to use default.
      */
     resolveProvider: async (ctx: {
-      providers: ProviderRegistryProvider;
+      providers: ProviderRegistry;
       models: ModelCatalog;
       modelId: ModelId;
+      body: ChatCompletionsBody | EmbeddingsBody;
       operation: "text" | "embeddings";
     }): Promise<ProviderV3 | void> => {
       // Example Use Cases:
@@ -387,8 +410,86 @@ const gw = gateway({
 });
 ```
+Hook contexts are **readonly for core fields**. Use return values to override request / response and return modelId / provider.
+To pass data between hooks, use `ctx.state`. It’s a per-request mutable bag in which you can stash things like auth info, routing decisions, timers, or trace IDs and read them later again in any of the other hooks.
+## OpenAI Extensions
+### Reasoning
+In addition to the official `reasoning_effort` parameter, the chat completions endpoint accepts a `reasoning` object for more fine-grained control of the budget. It's treated as provider-agnostic input and normalized before hitting the upstream model.
+```json
+{
+  "model": "anthropic/claude-4-sonnet",
+  "messages": [{ "role": "user", "content": "Explain the tradeoffs." }],
+  "reasoning": { "effort": "medium" }
+}
+```
+Normalization rules:
+- `enabled` -> fall-back to model default if none provided
+- `max_tokens`: fall-back to model default if model supports
+- `effort` -> budget = percentage of `max_tokens`
+  - `none`: 0%
+  - `minimal`: 10%
+  - `low`: 20%
+  - `medium`: 50% (default)
+  - `high`: 80%
+  - `xhigh`: 95%
+Reasoning output is surfaced as extension to the `completion` object.
+- When present, it is returned on the assistant message as `reasoning_content`. Reasoning token counts (when available) are returned on `usage.completion_tokens_details.reasoning_tokens`.
+- For stream responses, reasoning text is sent incrementally as `reasoning_content` part (separate from normal text `content` deltas). Token counts land in the final `usage` object on the terminating chunk.
+Most SDKs handle these fields out-of-the-box.
 ## Advanced Usage
+### Passing Framework State to Hooks
+You can pass per-request info from your framework into the gateway via the second `state` argument on the handler, then read it in hooks through `ctx.state`.
+```ts
+import { Elysia } from "elysia";
+import { gateway } from "@hebo-ai/gateway";
+const basePath = "/v1/gateway";
+const gw = gateway({
+  basePath,
+  providers: {
+    // ...
+  },
+  models: {
+    // ...
+  },
+  hooks: {
+    resolveProvider: async (ctx) => {
+      // Select provider based on userId
+      const user = ctx.state.auth.userId;
+      if (user.startsWith("vip:")) {
+        return ctx.providers["openai"];
+      } else {
+        return ctx.providers["groq"];
+      }
+    },
+  },
+});
+const app = new Elysia()
+  .derive(({ headers }) => ({
+    auth: {
+      userId: headers["x-user-id"],
+    },
+  }))
+  .all(`${basepath}`, ({ request, auth }) => gw.handler(request, { auth }))
+  .listen(3000);
+```
 ### Selective Route Mounting
 If you want to have more flexibility, for example for custom rate limit checks per route, you can also choose to only mount individual routes from the gateway's `routes` property.
@@ -410,14 +511,15 @@ console.log(`🐒 /chat/completions mounted to ${app.server?.url}/chat`);
 We also provide full schemas, helper functions and types to convert between **OpenAI <> Vercel AI SDK** for advanced use cases like creating your own endpoint. They are available via deep-imports and completely tree-shakeable.
 ```ts
-import { streamText } from "ai";
+import { streamText, wrapLanguageModel } from "ai";
 import { createGroq } from "@ai-sdk/groq";
 import * as z from "zod";
 import {
-  CompletionsBodySchema,
-  transformCompletionsInputs,
-  createCompletionsStreamResponse,
+  ChatCompletionsBodySchema,
+  convertToTextCallOptions,
+  toChatCompletionsStreamResponse,
 } from "@hebo-ai/gateway/endpoints/chat-completions";
+import { forwardParamsMiddleware } from "@hebo-ai/gateway/middleware/common";
 const groq = createGroq({ apiKey: process.env.GROQ_API_KEY });
@@ -425,24 +527,27 @@ export async function handler(req: Request): Promise<Response> {
   const body = await req.json();
-  const parsed = CompletionsBodySchema.safeParse(body);
+  const parsed = ChatCompletionsBodySchema.safeParse(body);
   if (!parsed.success) {
     return new Response(z.prettifyError(parsed.error), { status: 422 });
   }
   const { model, ...inputs } = parsed.data;
-  const textOptions = transformCompletionsInputs(inputs);
+  const textOptions = convertToTextCallOptions(inputs);
   const result = await streamText({
-    model: groq(model),
+    model: wrapLanguageModel({
+      model: groq(model),
+      middleware: forwardParamsMiddleware("groq"),
+    }),
     ...textOptions
   });
-  return createCompletionsStreamResponse(result, model);
+  return toChatCompletionsStreamResponse(result, model);
 }
 ```
-Non-streaming versions are available via `createCompletionsResponse`. Equivalent schemas and helper are available in the `embeddings` and `models` endpoints.
+Non-streaming versions are available via `createChatCompletionsResponse`. Equivalent schemas and helpers are available in the `embeddings` and `models` endpoints.
-Since Zod v4.3 you can also generate a JSON Schema from any zod object by calling the `.toJSONSchema()` function. This can be useful, for example, to create OpenAPI documentation.
+Since Zod v4.3 you can also generate a JSON Schema from any zod object by calling the `z.toJSONSchema(...)` function. This can be useful, for example, to create OpenAPI documentation.

package/dist/config.js CHANGED Viewed

@@ -1,4 +1,3 @@
-import { createProviderRegistry } from "ai";
 import { kParsed } from "./types";
 export const parseConfig = (config) => {
     // If it has been parsed before, just return
@@ -9,22 +8,13 @@ export const parseConfig = (config) => {
     if (Object.keys(providers).length === 0) {
         throw new Error("Gateway config error: no providers configured (config.providers is empty).");
     }
-    // Initialize ProviderRegistry (if nessecary)
-    let registry;
-    if ("languageModel" in providers) {
-        registry = providers;
-    }
-    else {
-        registry = createProviderRegistry(providers);
-    }
     // Strip out providers from models that are not configured
-    const providerKeys = Object.keys(registry.providers);
     const parsedModels = {};
     for (const id in models) {
         const model = models[id];
         const kept = [];
         for (const p of model.providers) {
-            if (providerKeys.includes(p))
+            if (p in providers)
                 kept.push(p);
             else
                 console.warn(`[models] ${id}: provider "${p}" removed (not configured)`);
@@ -35,5 +25,5 @@ export const parseConfig = (config) => {
     if (Object.keys(parsedModels).length === 0) {
         throw new Error("Gateway config error: no models configured (config.models is empty).");
     }
-    return { ...config, providers: registry, models: parsedModels, [kParsed]: true };
+    return { ...config, providers, models: parsedModels, [kParsed]: true };
 };

package/dist/endpoints/chat-completions/converters.d.ts CHANGED Viewed

@@ -1,32 +1,36 @@
-import type { ProviderOptions } from "@ai-sdk/provider-utils";
-import type { GenerateTextResult, StreamTextResult, FinishReason, ToolChoice, ToolSet, ModelMessage, UserContent, LanguageModelUsage, Output } from "ai";
-import type { CompletionsInputs, CompletionsToolCall, CompletionsTool, CompletionsToolChoice, CompletionsContentPart, CompletionsMessage, CompletionsUserMessage, CompletionsAssistantMessage, CompletionsToolMessage, Completions, CompletionsFinishReason, CompletionsUsage } from "./schema";
+import type { SharedV3ProviderOptions } from "@ai-sdk/provider";
+import type { GenerateTextResult, StreamTextResult, FinishReason, ToolChoice, ToolSet, ModelMessage, UserContent, LanguageModelUsage, Output, TextStreamPart, AssistantModelMessage, ToolModelMessage, UserModelMessage } from "ai";
+import type { ChatCompletionsToolCall, ChatCompletionsTool, ChatCompletionsToolChoice, ChatCompletionsContentPart, ChatCompletionsMessage, ChatCompletionsUserMessage, ChatCompletionsAssistantMessage, ChatCompletionsToolMessage, ChatCompletionsFinishReason, ChatCompletionsUsage, ChatCompletionsInputs, ChatCompletions, ChatCompletionsChunk } from "./schema";
+import { OpenAIError } from "../../utils/errors";
 export type TextCallOptions = {
     messages: ModelMessage[];
     tools?: ToolSet;
     toolChoice?: ToolChoice<ToolSet>;
     temperature?: number;
-    providerOptions: ProviderOptions;
+    maxOutputTokens?: number;
+    frequencyPenalty?: number;
+    presencePenalty?: number;
+    seed?: number;
+    stopSequences?: string[];
+    topP?: number;
+    providerOptions: SharedV3ProviderOptions;
 };
-export declare function transformCompletionsInputs(params: CompletionsInputs): TextCallOptions;
-export declare function fromCompletionsMessages(messages: CompletionsMessage[]): ModelMessage[];
-export declare function fromCompletionsUserMessage(message: CompletionsUserMessage): ModelMessage;
-export declare function fromCompletionsAssistantMessage(message: CompletionsAssistantMessage): ModelMessage;
-export declare function fromCompletionsToolResultMessage(message: CompletionsAssistantMessage, toolById: Map<string, CompletionsToolMessage>): ModelMessage | undefined;
-export declare function fromCompletionsContent(content: CompletionsContentPart[]): UserContent;
-export declare const fromCompletionsTools: (tools: CompletionsTool[] | undefined) => ToolSet | undefined;
-export declare const fromCompletionsToolChoice: (toolChoice: CompletionsToolChoice | undefined) => ToolChoice<ToolSet> | undefined;
-export declare function toCompletions(result: GenerateTextResult<ToolSet, Output.Output>, model: string): Completions;
-export declare function createCompletionsResponse(result: GenerateTextResult<ToolSet, Output.Output>, model: string): Response;
-export declare function toCompletionsStream(result: StreamTextResult<ToolSet, Output.Output>, model: string): ReadableStream<Uint8Array>;
-export declare function createCompletionsStreamResponse(result: StreamTextResult<ToolSet, Output.Output>, model: string): Response;
-export declare class CompletionsStream extends TransformStream {
+export declare function convertToTextCallOptions(params: ChatCompletionsInputs): TextCallOptions;
+export declare function convertToModelMessages(messages: ChatCompletionsMessage[]): ModelMessage[];
+export declare function fromChatCompletionsUserMessage(message: ChatCompletionsUserMessage): UserModelMessage;
+export declare function fromChatCompletionsAssistantMessage(message: ChatCompletionsAssistantMessage): AssistantModelMessage;
+export declare function fromChatCompletionsToolResultMessage(message: ChatCompletionsAssistantMessage, toolById: Map<string, ChatCompletionsToolMessage>): ToolModelMessage | undefined;
+export declare function fromChatCompletionsContent(content: ChatCompletionsContentPart[]): UserContent;
+export declare const convertToToolSet: (tools: ChatCompletionsTool[] | undefined) => ToolSet | undefined;
+export declare const convertToToolChoice: (toolChoice: ChatCompletionsToolChoice | undefined) => ToolChoice<ToolSet> | undefined;
+export declare function toChatCompletions(result: GenerateTextResult<ToolSet, Output.Output>, model: string): ChatCompletions;
+export declare function toChatCompletionsResponse(result: GenerateTextResult<ToolSet, Output.Output>, model: string, responseInit?: ResponseInit): Response;
+export declare function toChatCompletionsStream(result: StreamTextResult<ToolSet, Output.Output>, model: string): ReadableStream<Uint8Array>;
+export declare function toChatCompletionsStreamResponse(result: StreamTextResult<ToolSet, Output.Output>, model: string, responseInit?: ResponseInit): Response;
+export declare class ChatCompletionsStream extends TransformStream<TextStreamPart<ToolSet>, ChatCompletionsChunk | OpenAIError> {
     constructor(model: string);
 }
-export declare class SSETransformStream extends TransformStream {
-    constructor();
-}
-export declare const toCompletionsMessage: (result: GenerateTextResult<ToolSet, Output.Output>) => CompletionsAssistantMessage;
-export declare function toCompletionsUsage(usage: LanguageModelUsage | undefined): CompletionsUsage | undefined;
-export declare function toCompletionsToolCall(id: string, name: string, args: unknown): CompletionsToolCall;
-export declare const toCompletionsFinishReason: (finishReason: FinishReason) => CompletionsFinishReason;
+export declare const toChatCompletionsAssistantMessage: (result: GenerateTextResult<ToolSet, Output.Output>) => ChatCompletionsAssistantMessage;
+export declare function toChatCompletionsUsage(usage: LanguageModelUsage): ChatCompletionsUsage;
+export declare function toChatCompletionsToolCall(id: string, name: string, args: unknown): ChatCompletionsToolCall;
+export declare const toChatCompletionsFinishReason: (finishReason: FinishReason) => ChatCompletionsFinishReason;