npm - @inference-gateway/sdk - Versions diffs - 0.5.1 → 0.6.0 - Mend

@inference-gateway/sdk 0.5.1 → 0.6.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (6) hide show

package/CHANGELOG.md +6 -0
package/README.md +1 -0
package/dist/src/client.d.ts +2 -1
package/dist/src/client.js +3 -0
package/dist/tests/client.test.js +52 -0
package/package.json +1 -1

package/CHANGELOG.md CHANGED Viewed

@@ -2,6 +2,12 @@
 All notable changes to this project will be documented in this file.
+## [0.6.0](https://github.com/inference-gateway/typescript-sdk/compare/v0.5.1...v0.6.0) (2025-04-28)
+### ✨ Features
+* Add usage metrics handling to streaming chat completions and update tests ([#10](https://github.com/inference-gateway/typescript-sdk/issues/10)) ([576ff71](https://github.com/inference-gateway/typescript-sdk/commit/576ff711140c9e357bea4ba572e92027297c428b))
 ## [0.5.1](https://github.com/inference-gateway/typescript-sdk/compare/v0.5.0...v0.5.1) (2025-04-27)
 ### 🐛 Bug Fixes

package/README.md CHANGED Viewed

@@ -127,6 +127,7 @@ try {
       onOpen: () => console.log('Stream opened'),
       onContent: (content) => process.stdout.write(content),
       onChunk: (chunk) => console.log('Received chunk:', chunk.id),
+      onUsageMetrics: (metrics) => console.log('Usage metrics:', metrics),
       onFinish: () => console.log('\nStream completed'),
       onError: (error) => console.error('Stream error:', error),
     },

package/dist/src/client.d.ts CHANGED Viewed

@@ -1,10 +1,11 @@
-import type { Provider, SchemaChatCompletionMessageToolCall, SchemaCreateChatCompletionRequest, SchemaCreateChatCompletionResponse, SchemaCreateChatCompletionStreamResponse, SchemaError, SchemaListModelsResponse } from './types/generated';
+import type { Provider, SchemaChatCompletionMessageToolCall, SchemaCompletionUsage, SchemaCreateChatCompletionRequest, SchemaCreateChatCompletionResponse, SchemaCreateChatCompletionStreamResponse, SchemaError, SchemaListModelsResponse } from './types/generated';
 interface ChatCompletionStreamCallbacks {
     onOpen?: () => void;
     onChunk?: (chunk: SchemaCreateChatCompletionStreamResponse) => void;
     onReasoning?: (reasoningContent: string) => void;
     onContent?: (content: string) => void;
     onTool?: (toolCall: SchemaChatCompletionMessageToolCall) => void;
+    onUsageMetrics?: (usage: SchemaCompletionUsage) => void;
     onFinish?: (response: SchemaCreateChatCompletionStreamResponse | null) => void;
     onError?: (error: SchemaError) => void;
 }

package/dist/src/client.js CHANGED Viewed

@@ -162,6 +162,9 @@ class InferenceGatewayClient {
                         try {
                             const chunk = JSON.parse(data);
                             callbacks.onChunk?.(chunk);
+                            if (chunk.usage && callbacks.onUsageMetrics) {
+                                callbacks.onUsageMetrics(chunk.usage);
+                            }
                             const reasoning_content = chunk.choices[0]?.delta?.reasoning_content;
                             if (reasoning_content !== undefined) {
                                 callbacks.onReasoning?.(reasoning_content);

package/dist/tests/client.test.js CHANGED Viewed

@@ -330,6 +330,58 @@ describe('InferenceGatewayClient', () => {
             await expect(client.streamChatCompletion(mockRequest, callbacks)).rejects.toThrow('Bad Request');
             expect(callbacks.onError).toHaveBeenCalledTimes(1);
         });
+        it('should handle streaming chat completions with usage metrics', async () => {
+            const mockRequest = {
+                model: 'gpt-4o',
+                messages: [{ role: generated_1.MessageRole.user, content: 'Hello' }],
+                stream: true,
+                stream_options: {
+                    include_usage: true,
+                },
+            };
+            const mockStream = new web_1.TransformStream();
+            const writer = mockStream.writable.getWriter();
+            const encoder = new node_util_1.TextEncoder();
+            mockFetch.mockResolvedValueOnce({
+                ok: true,
+                body: mockStream.readable,
+            });
+            const callbacks = {
+                onOpen: jest.fn(),
+                onChunk: jest.fn(),
+                onContent: jest.fn(),
+                onUsageMetrics: jest.fn(),
+                onFinish: jest.fn(),
+                onError: jest.fn(),
+            };
+            const streamPromise = client.streamChatCompletion(mockRequest, callbacks);
+            await writer.write(encoder.encode('data: {"id":"chatcmpl-123","object":"chat.completion.chunk","created":1677652288,"model":"gpt-4o","choices":[{"index":0,"delta":{"role":"assistant"},"finish_reason":null}]}\n\n' +
+                'data: {"id":"chatcmpl-123","object":"chat.completion.chunk","created":1677652288,"model":"gpt-4o","choices":[{"index":0,"delta":{"content":"Hello"},"finish_reason":null}]}\n\n' +
+                'data: {"id":"chatcmpl-123","object":"chat.completion.chunk","created":1677652288,"model":"gpt-4o","choices":[{"index":0,"delta":{"content":"!"},"finish_reason":null}]}\n\n' +
+                'data: {"id":"chatcmpl-123","object":"chat.completion.chunk","created":1677652288,"model":"gpt-4o","choices":[{"index":0,"delta":{},"finish_reason":"stop"}]}\n\n' +
+                'data: {"id":"chatcmpl-123","object":"chat.completion.chunk","created":1677652288,"model":"gpt-4o","choices":[],"usage":{"prompt_tokens":10,"completion_tokens":8,"total_tokens":18}}\n\n' +
+                'data: [DONE]\n\n'));
+            await writer.close();
+            await streamPromise;
+            expect(callbacks.onOpen).toHaveBeenCalledTimes(1);
+            expect(callbacks.onChunk).toHaveBeenCalledTimes(5);
+            expect(callbacks.onContent).toHaveBeenCalledWith('Hello');
+            expect(callbacks.onContent).toHaveBeenCalledWith('!');
+            expect(callbacks.onUsageMetrics).toHaveBeenCalledTimes(1);
+            expect(callbacks.onUsageMetrics).toHaveBeenCalledWith({
+                prompt_tokens: 10,
+                completion_tokens: 8,
+                total_tokens: 18,
+            });
+            expect(callbacks.onFinish).toHaveBeenCalledTimes(1);
+            expect(mockFetch).toHaveBeenCalledWith('http://localhost:8080/v1/chat/completions', expect.objectContaining({
+                method: 'POST',
+                body: JSON.stringify({
+                    ...mockRequest,
+                    stream: true,
+                }),
+            }));
+        });
     });
     describe('proxy', () => {
         it('should proxy requests to a specific provider', async () => {

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@inference-gateway/sdk",
-  "version": "0.5.1",
+  "version": "0.6.0",
   "description": "An SDK written in Typescript for the [Inference Gateway](https://github.com/inference-gateway/inference-gateway).",
   "main": "dist/src/index.js",
   "types": "dist/src/index.d.ts",