npm - @hebo-ai/gateway - Versions diffs - 0.4.0-beta.4 → 0.4.1 - Mend

@hebo-ai/gateway 0.4.0-beta.4 → 0.4.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (42) hide show

package/README.md +34 -7
package/dist/endpoints/chat-completions/converters.d.ts +3 -3
package/dist/endpoints/chat-completions/converters.js +15 -7
package/dist/endpoints/chat-completions/handler.js +9 -9
package/dist/endpoints/chat-completions/otel.js +10 -4
package/dist/endpoints/embeddings/handler.js +5 -4
package/dist/errors/gateway.d.ts +1 -1
package/dist/errors/gateway.js +3 -3
package/dist/errors/openai.js +2 -1
package/dist/errors/utils.d.ts +2 -1
package/dist/errors/utils.js +1 -0
package/dist/lifecycle.js +14 -6
package/dist/models/anthropic/presets.d.ts +463 -0
package/dist/models/anthropic/presets.js +10 -2
package/dist/models/types.d.ts +1 -1
package/dist/models/types.js +1 -0
package/dist/providers/bedrock/canonical.js +1 -0
package/dist/telemetry/gen-ai.d.ts +2 -1
package/dist/telemetry/gen-ai.js +21 -3
package/dist/telemetry/memory.d.ts +2 -0
package/dist/telemetry/memory.js +27 -0
package/dist/telemetry/span.js +1 -1
package/dist/telemetry/stream.d.ts +1 -1
package/dist/telemetry/stream.js +25 -28
package/dist/types.d.ts +2 -3
package/package.json +2 -1
package/src/endpoints/chat-completions/converters.ts +17 -10
package/src/endpoints/chat-completions/handler.ts +13 -9
package/src/endpoints/chat-completions/otel.ts +11 -4
package/src/endpoints/embeddings/handler.ts +9 -4
package/src/errors/gateway.ts +5 -4
package/src/errors/openai.ts +2 -1
package/src/errors/utils.ts +1 -0
package/src/lifecycle.ts +17 -6
package/src/models/anthropic/presets.ts +14 -2
package/src/models/types.ts +1 -0
package/src/providers/bedrock/canonical.ts +1 -0
package/src/telemetry/gen-ai.ts +31 -3
package/src/telemetry/memory.ts +36 -0
package/src/telemetry/span.ts +1 -1
package/src/telemetry/stream.ts +31 -31
package/src/types.ts +3 -6

package/src/telemetry/stream.ts CHANGED Viewed

@@ -1,54 +1,51 @@
-const isErrorChunk = (v: unknown) => !!(v as any)?.error;
+import { toOpenAIError } from "../errors/openai";
+const isErrorChunk = (v: unknown) => v instanceof Error || !!(v as any)?.error;
 export const wrapStream = (
   src: ReadableStream,
   hooks: { onDone?: (status: number, reason: unknown) => void },
-  signal?: AbortSignal,
 ): ReadableStream => {
-  let finishOnce = false;
-  const finish = (status: number, reason?: unknown) => {
-    if (finishOnce) return;
-    finishOnce = true;
+  let finished = false;
-    hooks.onDone?.(status, reason ?? signal?.reason);
+  const done = (
+    reader: ReadableStreamDefaultReader,
+    controller: ReadableStreamDefaultController,
+    status: number,
+    reason?: unknown,
+  ) => {
+    if (!finished) {
+      finished = true;
+      hooks.onDone?.(status, reason);
+    }
+    reader.cancel(reason).catch(() => {});
+    controller.close();
   };
   return new ReadableStream({
     async start(controller) {
       const reader = src.getReader();
-      const close = (status: number, reason?: unknown) => {
-        finish(status, reason);
-        reader.cancel(reason).catch(() => {});
-        controller.close();
-      };
       try {
         for (;;) {
-          if (signal?.aborted) {
-            close(499, signal.reason);
-            return;
-          }
           // eslint-disable-next-line no-await-in-loop
-          const { value, done } = await reader.read();
-          if (done) break;
+          const { value, done: eof } = await reader.read();
+          if (eof) break;
-          controller.enqueue(value);
+          const out = isErrorChunk(value) ? toOpenAIError(value) : value;
+          controller.enqueue(out);
-          if (isErrorChunk(value)) {
-            const status = value.error.type === "invalid_request_error" ? 422 : 502;
-            close(status, value.error.message);
+          if (out !== value) {
+            const status = out.error?.type === "invalid_request_error" ? 422 : 502;
+            done(reader, controller, status, value);
             return;
           }
         }
-        finish(200);
-        controller.close();
+        done(reader, controller, 200);
       } catch (err) {
-        const status = signal?.aborted ? 499 : (err as any)?.name === "AbortError" ? 503 : 502;
-        close(status, err);
+        controller.enqueue(toOpenAIError(err));
+        done(reader, controller, 502, err);
       } finally {
         try {
           reader.releaseLock();
@@ -56,8 +53,11 @@ export const wrapStream = (
       }
     },
-    cancel(reason?: unknown) {
-      finish(499, reason);
+    cancel(reason) {
+      if (!finished) {
+        finished = true;
+        hooks.onDone?.(499, reason);
+      }
       src.cancel(reason).catch(() => {});
     },
   });

package/src/types.ts CHANGED Viewed

@@ -8,7 +8,6 @@ import type {
 } from "./endpoints/chat-completions/schema";
 import type { Embeddings, EmbeddingsBody } from "./endpoints/embeddings/schema";
 import type { Model, ModelList } from "./endpoints/models";
-import type { OpenAIError } from "./errors/openai";
 import type { Logger, LoggerConfig } from "./logger";
 import type { ModelCatalog, ModelId } from "./models/types";
 import type { ProviderId, ProviderRegistry } from "./providers/types";
@@ -76,7 +75,7 @@ export type GatewayContext = {
    */
   result?:
     | ChatCompletions
-    | ReadableStream<ChatCompletionsChunk | OpenAIError>
+    | ReadableStream<ChatCompletionsChunk | Error>
     | Embeddings
     | Model
     | ModelList;
@@ -150,11 +149,9 @@ export type GatewayHooks = {
   ) =>
     | void
     | ChatCompletions
-    | ReadableStream<ChatCompletionsChunk | OpenAIError>
+    | ReadableStream<ChatCompletionsChunk | Error>
     | Embeddings
-    | Promise<
-        void | ChatCompletions | ReadableStream<ChatCompletionsChunk | OpenAIError> | Embeddings
-      >;
+    | Promise<void | ChatCompletions | ReadableStream<ChatCompletionsChunk | Error> | Embeddings>;
   /**
    * Runs after the lifecycle has produced the final Response.
    * @returns Replacement Response, or undefined to keep original.