npm - @hebo-ai/gateway - Versions diffs - 0.6.2-rc0 → 0.6.2 - Mend

@hebo-ai/gateway 0.6.2-rc0 → 0.6.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (134) hide show

package/README.md +3 -3
package/dist/endpoints/chat-completions/converters.js +26 -21
package/dist/endpoints/chat-completions/handler.js +2 -0
package/dist/endpoints/chat-completions/otel.js +1 -1
package/dist/endpoints/chat-completions/schema.d.ts +4 -18
package/dist/endpoints/chat-completions/schema.js +14 -17
package/dist/endpoints/embeddings/handler.js +2 -0
package/dist/endpoints/embeddings/otel.js +5 -0
package/dist/endpoints/embeddings/schema.d.ts +6 -0
package/dist/endpoints/embeddings/schema.js +4 -1
package/dist/endpoints/models/converters.js +3 -3
package/dist/lifecycle.js +2 -2
package/dist/logger/default.js +3 -3
package/dist/logger/index.d.ts +2 -5
package/dist/middleware/common.js +1 -0
package/dist/middleware/utils.js +0 -3
package/dist/models/amazon/middleware.js +8 -5
package/dist/models/anthropic/middleware.js +13 -13
package/dist/models/catalog.js +5 -1
package/dist/models/cohere/middleware.js +7 -5
package/dist/models/google/middleware.d.ts +1 -1
package/dist/models/google/middleware.js +29 -25
package/dist/models/openai/middleware.js +13 -9
package/dist/models/voyage/middleware.js +2 -1
package/dist/providers/bedrock/middleware.js +21 -23
package/dist/providers/registry.js +3 -0
package/dist/telemetry/fetch.js +7 -2
package/dist/telemetry/gen-ai.js +15 -12
package/dist/telemetry/memory.d.ts +1 -1
package/dist/telemetry/memory.js +30 -14
package/dist/telemetry/span.js +1 -1
package/dist/telemetry/stream.js +30 -23
package/dist/utils/env.js +4 -2
package/dist/utils/preset.js +1 -0
package/dist/utils/response.js +3 -1
package/package.json +36 -50
package/src/config.ts +0 -98
package/src/endpoints/chat-completions/converters.test.ts +0 -631
package/src/endpoints/chat-completions/converters.ts +0 -899
package/src/endpoints/chat-completions/handler.test.ts +0 -391
package/src/endpoints/chat-completions/handler.ts +0 -201
package/src/endpoints/chat-completions/index.ts +0 -4
package/src/endpoints/chat-completions/otel.test.ts +0 -315
package/src/endpoints/chat-completions/otel.ts +0 -214
package/src/endpoints/chat-completions/schema.ts +0 -364
package/src/endpoints/embeddings/converters.ts +0 -51
package/src/endpoints/embeddings/handler.test.ts +0 -133
package/src/endpoints/embeddings/handler.ts +0 -137
package/src/endpoints/embeddings/index.ts +0 -4
package/src/endpoints/embeddings/otel.ts +0 -40
package/src/endpoints/embeddings/schema.ts +0 -36
package/src/endpoints/models/converters.ts +0 -56
package/src/endpoints/models/handler.test.ts +0 -122
package/src/endpoints/models/handler.ts +0 -37
package/src/endpoints/models/index.ts +0 -3
package/src/endpoints/models/schema.ts +0 -37
package/src/errors/ai-sdk.ts +0 -99
package/src/errors/gateway.ts +0 -17
package/src/errors/openai.ts +0 -57
package/src/errors/utils.ts +0 -47
package/src/gateway.ts +0 -50
package/src/index.ts +0 -19
package/src/lifecycle.ts +0 -135
package/src/logger/default.ts +0 -105
package/src/logger/index.ts +0 -42
package/src/middleware/common.test.ts +0 -215
package/src/middleware/common.ts +0 -163
package/src/middleware/debug.ts +0 -37
package/src/middleware/matcher.ts +0 -161
package/src/middleware/utils.ts +0 -34
package/src/models/amazon/index.ts +0 -2
package/src/models/amazon/middleware.test.ts +0 -133
package/src/models/amazon/middleware.ts +0 -79
package/src/models/amazon/presets.ts +0 -104
package/src/models/anthropic/index.ts +0 -2
package/src/models/anthropic/middleware.test.ts +0 -643
package/src/models/anthropic/middleware.ts +0 -148
package/src/models/anthropic/presets.ts +0 -191
package/src/models/catalog.ts +0 -13
package/src/models/cohere/index.ts +0 -2
package/src/models/cohere/middleware.test.ts +0 -138
package/src/models/cohere/middleware.ts +0 -76
package/src/models/cohere/presets.ts +0 -186
package/src/models/google/index.ts +0 -2
package/src/models/google/middleware.test.ts +0 -298
package/src/models/google/middleware.ts +0 -137
package/src/models/google/presets.ts +0 -118
package/src/models/meta/index.ts +0 -1
package/src/models/meta/presets.ts +0 -143
package/src/models/openai/index.ts +0 -2
package/src/models/openai/middleware.test.ts +0 -189
package/src/models/openai/middleware.ts +0 -103
package/src/models/openai/presets.ts +0 -280
package/src/models/types.ts +0 -114
package/src/models/voyage/index.ts +0 -2
package/src/models/voyage/middleware.test.ts +0 -28
package/src/models/voyage/middleware.ts +0 -23
package/src/models/voyage/presets.ts +0 -126
package/src/providers/anthropic/canonical.ts +0 -17
package/src/providers/anthropic/index.ts +0 -1
package/src/providers/bedrock/canonical.ts +0 -87
package/src/providers/bedrock/index.ts +0 -2
package/src/providers/bedrock/middleware.test.ts +0 -303
package/src/providers/bedrock/middleware.ts +0 -128
package/src/providers/cohere/canonical.ts +0 -26
package/src/providers/cohere/index.ts +0 -1
package/src/providers/groq/canonical.ts +0 -21
package/src/providers/groq/index.ts +0 -1
package/src/providers/openai/canonical.ts +0 -16
package/src/providers/openai/index.ts +0 -1
package/src/providers/registry.test.ts +0 -44
package/src/providers/registry.ts +0 -165
package/src/providers/types.ts +0 -20
package/src/providers/vertex/canonical.ts +0 -17
package/src/providers/vertex/index.ts +0 -1
package/src/providers/voyage/canonical.ts +0 -16
package/src/providers/voyage/index.ts +0 -1
package/src/telemetry/ai-sdk.ts +0 -46
package/src/telemetry/baggage.ts +0 -27
package/src/telemetry/fetch.ts +0 -62
package/src/telemetry/gen-ai.ts +0 -113
package/src/telemetry/http.ts +0 -62
package/src/telemetry/index.ts +0 -1
package/src/telemetry/memory.ts +0 -36
package/src/telemetry/span.ts +0 -85
package/src/telemetry/stream.ts +0 -64
package/src/types.ts +0 -223
package/src/utils/env.ts +0 -7
package/src/utils/headers.ts +0 -27
package/src/utils/preset.ts +0 -65
package/src/utils/request.test.ts +0 -75
package/src/utils/request.ts +0 -52
package/src/utils/response.ts +0 -84
package/src/utils/url.ts +0 -26

package/dist/models/google/middleware.js CHANGED Viewed

@@ -11,14 +11,15 @@ export const geminiDimensionsMiddleware = {
         const dimensions = unknown["dimensions"];
         if (!dimensions)
             return params;
-        (params.providerOptions["google"] ??= {})["outputDimensionality"] = dimensions;
+        const target = (params.providerOptions["google"] ??= {});
+        target.outputDimensionality = dimensions;
         delete unknown["dimensions"];
         return params;
     },
 };
 // https://ai.google.dev/gemini-api/docs/thinking#thinking-levels
 export function mapGeminiReasoningEffort(effort, modelId) {
-    if (modelId.includes("gemini-3.1-pro")) {
+    if (modelId.includes("pro")) {
         switch (effort) {
             case "none":
             case "minimal":
@@ -28,26 +29,22 @@ export function mapGeminiReasoningEffort(effort, modelId) {
                 return "medium";
             case "high":
             case "xhigh":
-            case "max":
                 return "high";
         }
     }
-    if (modelId.includes("gemini-3-flash") || modelId.includes("gemini-3.1-flash")) {
-        switch (effort) {
-            case "none":
-            case "minimal":
-                return "minimal";
-            case "low":
-                return "low";
-            case "medium":
-                return "medium";
-            case "high":
-            case "xhigh":
-            case "max":
-                return "high";
-        }
+    // Flash
+    switch (effort) {
+        case "none":
+        case "minimal":
+            return "minimal";
+        case "low":
+            return "low";
+        case "medium":
+            return "medium";
+        case "high":
+        case "xhigh":
+            return "high";
     }
-    return effort;
 }
 export const GEMINI_DEFAULT_MAX_OUTPUT_TOKENS = 65536;
 export const GEMINI_2_5_PRO_MIN_THINKING_BUDGET = 128;
@@ -58,6 +55,9 @@ export const geminiReasoningMiddleware = {
         const unknown = params.providerOptions?.["unknown"];
         if (!unknown)
             return params;
+        // If thinking options exist, just pass through
+        if (unknown["thinking_config"])
+            return params;
         const reasoning = unknown["reasoning"];
         if (!reasoning)
             return params;
@@ -65,19 +65,19 @@ export const geminiReasoningMiddleware = {
         const modelId = model.modelId;
         if (modelId.includes("gemini-2")) {
             const is25Pro = modelId.includes("gemini-2.5-pro");
-            target["thinkingConfig"] = {
+            target.thinkingConfig = {
                 thinkingBudget: reasoning.max_tokens ??
                     calculateReasoningBudgetFromEffort(reasoning.effort ?? "none", params.maxOutputTokens ?? GEMINI_DEFAULT_MAX_OUTPUT_TOKENS, is25Pro ? GEMINI_2_5_PRO_MIN_THINKING_BUDGET : 0),
             };
         }
         else if (modelId.includes("gemini-3") && reasoning.effort) {
-            target["thinkingConfig"] = {
+            target.thinkingConfig = {
                 thinkingLevel: mapGeminiReasoningEffort(reasoning.effort, modelId),
             };
             // FUTURE: warn if model is gemini-3 and max_tokens (unsupported) was ignored
         }
-        (target["thinkingConfig"] ??= {})["includeThoughts"] =
-            reasoning.enabled ? !reasoning.exclude : false;
+        const thinkingConfig = (target.thinkingConfig ??= {});
+        thinkingConfig.includeThoughts = reasoning.enabled ? !reasoning.exclude : false;
         delete unknown["reasoning"];
         return params;
     },
@@ -91,9 +91,13 @@ export const geminiPromptCachingMiddleware = {
         const unknown = params.providerOptions?.["unknown"];
         if (!unknown)
             return params;
-        const cachedContent = unknown["cached_content"];
-        if (cachedContent) {
-            (params.providerOptions["google"] ??= {})["cachedContent"] = cachedContent;
+        // If cached_content options exist, just pass through
+        if (unknown["cached_content"])
+            return params;
+        const promptCacheKey = unknown["prompt_cache_key"];
+        if (promptCacheKey) {
+            (params.providerOptions["google"] ??= {}).cachedContent =
+                promptCacheKey;
         }
         delete unknown["cached_content"];
         return params;

package/dist/models/openai/middleware.js CHANGED Viewed

@@ -10,21 +10,25 @@ export const openAIDimensionsMiddleware = {
         const dimensions = unknown["dimensions"];
         if (!dimensions)
             return params;
-        (params.providerOptions["openai"] ??= {})["dimensions"] = dimensions;
+        const target = (params.providerOptions["openai"] ??= {});
+        target.dimensions = dimensions;
         delete unknown["dimensions"];
         return params;
     },
 };
 function mapGptOssReasoningEffort(effort) {
     switch (effort) {
+        case undefined:
+        case "none":
+            return;
+        case "minimal":
+        case "low":
+            return "low";
         case "medium":
             return "medium";
         case "high":
         case "xhigh":
-        case "max":
             return "high";
-        default:
-            return "low";
     }
 }
 export const openAIReasoningMiddleware = {
@@ -41,13 +45,13 @@ export const openAIReasoningMiddleware = {
         const isGptOss = model.modelId.includes("gpt-oss");
         if (isGptOss) {
             // FUTURE: warn that unable to disable reasoning for gpt-oss models
-            target["reasoningEffort"] = mapGptOssReasoningEffort(reasoning.effort);
+            target.reasoningEffort = mapGptOssReasoningEffort(reasoning.effort);
         }
         else if (reasoning.enabled === false) {
-            target["reasoningEffort"] = "none";
+            target.reasoningEffort = "none";
         }
         else if (reasoning.effort) {
-            target["reasoningEffort"] = reasoning.effort;
+            target.reasoningEffort = reasoning.effort;
         }
         // FUTURE: warn that reasoning.max_tokens (not supported) was ignored
         delete unknown["reasoning"];
@@ -67,9 +71,9 @@ export const openAIPromptCachingMiddleware = {
         if (key || retention) {
             const target = (params.providerOptions["openai"] ??= {});
             if (key)
-                target["promptCacheKey"] = key;
+                target.promptCacheKey = key;
             if (retention)
-                target["promptCacheRetention"] = retention;
+                target.promptCacheRetention = retention;
         }
         delete unknown["prompt_cache_key"];
         delete unknown["prompt_cache_retention"];

package/dist/models/voyage/middleware.js CHANGED Viewed

@@ -10,7 +10,8 @@ export const voyageDimensionsMiddleware = {
         const dimensions = unknown["dimensions"];
         if (!dimensions)
             return params;
-        (params.providerOptions["voyage"] ??= {})["outputDimension"] = dimensions;
+        const target = (params.providerOptions["voyage"] ??= {});
+        target.outputDimension = dimensions;
         delete unknown["dimensions"];
         return params;
     },

package/dist/providers/bedrock/middleware.js CHANGED Viewed

@@ -7,14 +7,15 @@ export const bedrockGptReasoningMiddleware = {
         if (!model.modelId.includes("gpt"))
             return params;
         const bedrock = params.providerOptions?.["bedrock"];
-        if (!bedrock || typeof bedrock !== "object")
+        if (!bedrock)
             return params;
-        const effort = bedrock["reasoningEffort"];
+        const effort = bedrock.reasoningEffort;
         if (effort === undefined)
             return params;
-        const target = (bedrock["reasoningConfig"] ??= {});
-        target["maxReasoningEffort"] = effort;
-        delete bedrock["reasoningEffort"];
+        const target = (bedrock.reasoningConfig ??= {});
+        // @ts-expect-error AI SDK does accept this
+        target.maxReasoningEffort = effort;
+        delete bedrock.reasoningEffort;
         return params;
     },
 };
@@ -25,28 +26,25 @@ export const bedrockClaudeReasoningMiddleware = {
         if (!model.modelId.includes("claude"))
             return params;
         const bedrock = params.providerOptions?.["bedrock"];
-        if (!bedrock || typeof bedrock !== "object")
+        if (!bedrock)
             return params;
-        const thinking = bedrock["thinking"];
-        const effort = bedrock["effort"];
+        const thinking = bedrock.thinking;
+        const effort = bedrock.effort;
         if (!thinking && effort === undefined)
             return params;
-        const target = (bedrock["reasoningConfig"] ??= {});
+        const target = (bedrock.reasoningConfig ??= {});
         if (thinking && typeof thinking === "object") {
-            const thinkingOptions = thinking;
-            if (thinkingOptions["type"] !== undefined) {
-                target["type"] = thinkingOptions["type"];
-            }
-            if (thinkingOptions["budgetTokens"] !== undefined) {
-                target["budgetTokens"] = thinkingOptions["budgetTokens"];
+            target.type = thinking.type;
+            if ("budgetTokens" in thinking && thinking.budgetTokens !== undefined) {
+                target.budgetTokens = thinking.budgetTokens;
             }
         }
         // FUTURE: bedrock currently does not support "effort" for other 4.x models
         if (effort !== undefined && isClaude46(model.modelId)) {
-            target["maxReasoningEffort"] = effort;
+            target.maxReasoningEffort = effort;
         }
-        delete bedrock["thinking"];
-        delete bedrock["effort"];
+        delete bedrock.thinking;
+        delete bedrock.effort;
         return params;
     },
 };
@@ -79,18 +77,18 @@ export const bedrockPromptCachingMiddleware = {
             delete entryBedrock["cacheControl"];
         };
         for (const message of params.prompt) {
-            processCacheControl(message["providerOptions"]);
-            if (!Array.isArray(message["content"]))
+            processCacheControl(message.providerOptions);
+            if (!Array.isArray(message.content))
                 continue;
-            for (const part of message["content"]) {
-                processCacheControl(part["providerOptions"]);
+            for (const part of message.content) {
+                processCacheControl(part.providerOptions);
             }
             lastCacheableBlock = message;
         }
         const bedrock = params.providerOptions?.["bedrock"];
         const cacheControl = bedrock?.["cacheControl"];
         if (cacheControl && !hasExplicitCacheControl && lastCacheableBlock) {
-            ((lastCacheableBlock["providerOptions"] ??= {})["bedrock"] ??= {})["cachePoint"] =
+            ((lastCacheableBlock.providerOptions ??= {})["bedrock"] ??= {})["cachePoint"] =
                 toBedrockCachePoint(model.modelId, cacheControl);
         }
         delete bedrock?.["cacheControl"];

package/dist/providers/registry.js CHANGED Viewed

@@ -55,7 +55,9 @@ export const withCanonicalIds = (provider, config = {}) => {
     };
     const needsFallbackWrap = stripNamespace || normalizeDelimiters || namespaceSeparator !== "/" || !!prefix || !!postfix;
     // FUTURE: use embeddingModel instead of textEmbeddingModel once voyage supports it
+    // oxlint-disable-next-line unbound-method
     const languageModel = provider.languageModel;
+    // oxlint-disable-next-line unbound-method, no-deprecated
     const embeddingModel = provider.textEmbeddingModel;
     const fallbackProvider = needsFallbackWrap
         ? {
@@ -69,6 +71,7 @@ export const withCanonicalIds = (provider, config = {}) => {
             embeddingModel: (id) => {
                 const mapped = applyFallbackAffixes(normalizeId(id));
                 logger.debug(`[canonical] mapped ${id} to ${mapped}`);
+                // oxlint-disable-next-line no-deprecated
                 return embeddingModel(mapped);
             },
         }

package/dist/telemetry/fetch.js CHANGED Viewed

@@ -16,8 +16,13 @@ const getRequestAttributes = (input, init) => {
         attrs["url.full"] = input.url;
     return attrs;
 };
-const shouldTraceFetch = (init) => typeof init?.headers?.["user-agent"] === "string" &&
-    init.headers["user-agent"].indexOf("ai-sdk/provider-utils") !== -1;
+const shouldTraceFetch = (init) => {
+    const h = init?.headers;
+    if (!h || typeof h !== "object" || Array.isArray(h) || h instanceof Headers)
+        return false;
+    const ua = h["user-agent"];
+    return typeof ua === "string" && ua.includes("ai-sdk/provider-utils");
+};
 const otelFetch = (input, init) => {
     const original = g[ORIGINAL_FETCH_KEY];
     if (!fetchTracingEnabled)

package/dist/telemetry/gen-ai.js CHANGED Viewed

@@ -1,7 +1,10 @@
 import { metrics } from "@opentelemetry/api";
 import { STATUS_CODE } from "../errors/utils";
-const meter = metrics.getMeter("@hebo/gateway");
-const requestDurationHistogram = meter.createHistogram("gen_ai.server.request.duration", {
+const getMeter = () => metrics.getMeter("@hebo/gateway");
+let requestDurationHistogram;
+let timePerOutputTokenHistogram;
+let tokenUsageHistogram;
+const getRequestDurationHistogram = () => (requestDurationHistogram ??= getMeter().createHistogram("gen_ai.server.request.duration", {
     description: "End-to-end gateway request duration",
     unit: "s",
     advice: {
@@ -9,8 +12,8 @@ const requestDurationHistogram = meter.createHistogram("gen_ai.server.request.du
             0.005, 0.01, 0.025, 0.05, 0.1, 0.25, 0.5, 1, 2.5, 5, 10, 30, 60, 120, 240,
         ],
     },
-});
-const timePerOutputTokenHistogram = meter.createHistogram("gen_ai.server.time_per_output_token", {
+}));
+const getTimePerOutputTokenHistogram = () => (timePerOutputTokenHistogram ??= getMeter().createHistogram("gen_ai.server.time_per_output_token", {
     description: "End-to-end gateway request duration per output token",
     unit: "s",
     advice: {
@@ -18,17 +21,17 @@ const timePerOutputTokenHistogram = meter.createHistogram("gen_ai.server.time_pe
             0.01, 0.025, 0.05, 0.075, 0.1, 0.15, 0.2, 0.3, 0.4, 0.5, 0.75, 1.0, 2.5,
         ],
     },
-});
-const tokenUsageHistogram = meter.createHistogram("gen_ai.client.token.usage", {
+}));
+const getTokenUsageHistogram = () => (tokenUsageHistogram ??= getMeter().createHistogram("gen_ai.client.token.usage", {
     description: "Token usage reported by upstream model responses",
     unit: "{token}",
     advice: {
         explicitBucketBoundaries: [
-            1, 8, 16, 32, 64, 128, 256, 512, 1024, 2048, 4096, 8192, 16384, 32768, 65536, 131072, 262144,
-            524288, 1048576,
+            1, 8, 16, 32, 64, 128, 256, 512, 1024, 2048, 4096, 8192, 16384, 32768, 65536, 131072,
+            262144, 524288, 1048576,
         ],
     },
-});
+}));
 export const getGenAiGeneralAttributes = (ctx, signalLevel) => {
     if (!signalLevel || signalLevel === "off")
         return {};
@@ -47,7 +50,7 @@ export const recordRequestDuration = (duration, status, ctx, signalLevel) => {
     if (status !== 200) {
         attrs["error.type"] = `${status} ${STATUS_CODE(status).toLowerCase()}`;
     }
-    requestDurationHistogram.record(duration / 1000, attrs);
+    getRequestDurationHistogram().record(duration / 1000, attrs);
 };
 // FUTURE: record unsuccessful calls
 export const recordTimePerOutputToken = (start, tokenAttrs, metricAttrs, signalLevel) => {
@@ -56,7 +59,7 @@ export const recordTimePerOutputToken = (start, tokenAttrs, metricAttrs, signalL
     const outputTokens = tokenAttrs["gen_ai.usage.output_tokens"];
     if (typeof outputTokens !== "number" || outputTokens <= 0)
         return;
-    timePerOutputTokenHistogram.record((performance.now() - start) / 1000 / outputTokens, metricAttrs);
+    getTimePerOutputTokenHistogram().record((performance.now() - start) / 1000 / outputTokens, metricAttrs);
 };
 // FUTURE: record unsuccessful calls
 export const recordTokenUsage = (tokenAttrs, metricAttrs, signalLevel) => {
@@ -65,7 +68,7 @@ export const recordTokenUsage = (tokenAttrs, metricAttrs, signalLevel) => {
     const record = (value, tokenType) => {
         if (typeof value !== "number")
             return;
-        tokenUsageHistogram.record(value, Object.assign({}, metricAttrs, { "gen_ai.token.type": tokenType }));
+        getTokenUsageHistogram().record(value, Object.assign({}, metricAttrs, { "gen_ai.token.type": tokenType }));
     };
     record(tokenAttrs["gen_ai.usage.input_tokens"], "input");
     record(tokenAttrs["gen_ai.usage.output_tokens"], "output");

package/dist/telemetry/memory.d.ts CHANGED Viewed

@@ -1,2 +1,2 @@
 import type { TelemetrySignalLevel } from "../types";
-export declare const recordV8jsMemory: (level?: TelemetrySignalLevel) => void;
+export declare const observeV8jsMemoryMetrics: (level?: TelemetrySignalLevel) => void;

package/dist/telemetry/memory.js CHANGED Viewed

@@ -1,18 +1,9 @@
 import { metrics } from "@opentelemetry/api";
-const meter = metrics.getMeter("@hebo/gateway");
+const getMeter = () => metrics.getMeter("@hebo/gateway");
 const defaultHeapSpaceAttrs = { "v8js.heap.space.name": "total" };
-const heapUsedCounter = meter.createUpDownCounter("v8js.memory.heap.used", {
-    description: "Used bytes in the V8 heap",
-    unit: "By",
-});
-const heapSpacePhysicalSizeCounter = meter.createUpDownCounter("v8js.memory.heap.space.physical_size", {
-    description: "Physical bytes allocated for the V8 heap space",
-    unit: "By",
-});
+let registered = false;
 const isEnabled = (level) => level === "recommended" || level === "full";
-export const recordV8jsMemory = (level) => {
-    if (!isEnabled(level))
-        return;
+const observeMemory = (observe) => {
     let usage;
     try {
         usage = globalThis.process?.memoryUsage?.();
@@ -22,6 +13,31 @@ export const recordV8jsMemory = (level) => {
     }
     if (!usage)
         return;
-    heapUsedCounter.add(usage.heapUsed, defaultHeapSpaceAttrs);
-    heapSpacePhysicalSizeCounter.add(usage.rss, defaultHeapSpaceAttrs);
+    observe(usage.heapUsed, usage.rss);
+};
+export const observeV8jsMemoryMetrics = (level) => {
+    if (!isEnabled(level) || registered)
+        return;
+    registered = true;
+    const meter = getMeter();
+    meter
+        .createObservableGauge("v8js.memory.heap.used", {
+        description: "Used bytes in the V8 heap",
+        unit: "By",
+    })
+        .addCallback((result) => {
+        observeMemory((heapUsed) => {
+            result.observe(heapUsed, defaultHeapSpaceAttrs);
+        });
+    });
+    meter
+        .createObservableGauge("v8js.memory.heap.space.physical_size", {
+        description: "Physical bytes allocated for the V8 heap space",
+        unit: "By",
+    })
+        .addCallback((result) => {
+        observeMemory((_, rss) => {
+            result.observe(rss, defaultHeapSpaceAttrs);
+        });
+    });
 };

package/dist/telemetry/span.js CHANGED Viewed

@@ -34,7 +34,7 @@ export const startSpan = (name, options) => {
 };
 export const withSpan = async (name, run, options) => {
     if (!spanTracer) {
-        return await run();
+        return run();
     }
     const started = startSpan(name, options);
     try {

package/dist/telemetry/stream.js CHANGED Viewed

@@ -1,51 +1,58 @@
 import { toOpenAIError } from "../errors/openai";
-const isErrorChunk = (v) => v instanceof Error || !!v?.error;
+const isErrorChunk = (v) => v instanceof Error || (typeof v === "object" && v !== null && "error" in v);
 export const wrapStream = (src, hooks) => {
     let finished = false;
-    const done = (reader, controller, status, reason) => {
-        if (!finished) {
-            finished = true;
-            hooks.onDone?.(status, reason);
+    let reader;
+    const done = (controller, status, reason) => {
+        if (finished)
+            return;
+        finished = true;
+        hooks.onDone?.(status, reason);
+        if (status !== 200) {
+            reader?.cancel(reason).catch(() => { });
+        }
+        try {
+            controller.close();
         }
-        reader.cancel(reason).catch(() => { });
-        controller.close();
+        catch { }
     };
     return new ReadableStream({
         async start(controller) {
-            const reader = src.getReader();
+            reader = src.getReader();
             try {
                 for (;;) {
-                    // oxlint-disable-next-line no-await-in-loop
+                    // oxlint-disable-next-line no-await-in-loop, no-unsafe-assignment
                     const { value, done: eof } = await reader.read();
                     if (eof)
                         break;
-                    const out = isErrorChunk(value) ? toOpenAIError(value) : value;
-                    controller.enqueue(out);
-                    if (out !== value) {
-                        const status = out.error?.type === "invalid_request_error" ? 422 : 502;
-                        done(reader, controller, status, value);
+                    controller.enqueue(value);
+                    if (isErrorChunk(value)) {
+                        done(controller, toOpenAIError(value).error.type === "invalid_request_error" ? 422 : 502, value);
                         return;
                     }
                 }
-                done(reader, controller, 200);
+                done(controller, 200);
             }
             catch (err) {
-                controller.enqueue(toOpenAIError(err));
-                done(reader, controller, 502, err);
+                try {
+                    controller.enqueue(toOpenAIError(err));
+                }
+                catch { }
+                done(controller, 502, err);
             }
             finally {
                 try {
-                    reader.releaseLock();
+                    reader?.releaseLock();
                 }
                 catch { }
             }
         },
         cancel(reason) {
-            if (!finished) {
-                finished = true;
-                hooks.onDone?.(499, reason);
-            }
-            src.cancel(reason).catch(() => { });
+            if (finished)
+                return;
+            finished = true;
+            hooks.onDone?.(499, reason);
+            reader?.cancel(reason).catch(() => { });
         },
     });
 };

package/dist/utils/env.js CHANGED Viewed

@@ -1,5 +1,7 @@
 const NODE_ENV = typeof process === "undefined"
-    ? (globalThis.NODE_ENV ?? globalThis.ENV?.NODE_ENV)
-    : process.env?.NODE_ENV;
+    ? // oxlint-disable-next-line no-unsafe-member-access
+        (globalThis.NODE_ENV ?? globalThis.ENV?.NODE_ENV)
+    : // oxlint-disable-next-line no-unsafe-assignment
+        process.env?.NODE_ENV;
 export const isProduction = () => NODE_ENV === "production";
 export const isTest = () => NODE_ENV === "test";

package/dist/utils/preset.js CHANGED Viewed

@@ -1,6 +1,7 @@
 function isPlainObject(v) {
     if (!v || typeof v !== "object" || Array.isArray(v))
         return false;
+    // oxlint-disable-next-line no-unsafe-assignment
     const proto = Object.getPrototypeOf(v);
     return proto === Object.prototype || proto === null;
 }

package/dist/utils/response.js CHANGED Viewed

@@ -19,7 +19,9 @@ export const mergeResponseInit = (defaultHeaders, responseInit) => {
     const headers = new Headers(defaultHeaders);
     const override = responseInit?.headers;
     if (override) {
-        new Headers(override).forEach((value, key) => headers.set(key, value));
+        new Headers(override).forEach((value, key) => {
+            headers.set(key, value);
+        });
     }
     if (!responseInit)
         return { headers };