npm - @crewdle/mist-connector-openai - Versions diffs - 1.0.14 → 1.0.15 - Mend

@crewdle/mist-connector-openai 1.0.14 → 1.0.15

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (4) hide show

package/dist/models/OpenAIGenerativeAIWorkerConnector.js +177 -4
package/dist/models/OpenAISpeechConnector.js +4 -3
package/dist/types/models/OpenAISpeechConnector.d.ts +1 -1
package/package.json +3 -3

package/dist/models/OpenAIGenerativeAIWorkerConnector.js CHANGED Viewed

@@ -1,4 +1,5 @@
 import OpenAI from 'openai';
+import { GenerativeAIEngineType, GenerativeAITaskType } from '@crewdle/web-sdk-types';
 export class OpenAIGenerativeAIWorkerConnector {
     models = new Map();
     apiKey;
@@ -22,7 +23,7 @@ export class OpenAIGenerativeAIWorkerConnector {
         this.models.clear();
     }
     getEngineType() {
-        return 'openai';
+        return GenerativeAIEngineType.OpenAI;
     }
     async processJob(parameters, options) {
         if (!this.client) {
@@ -31,7 +32,7 @@ export class OpenAIGenerativeAIWorkerConnector {
         if (!options || !this.models.has(options.model.id)) {
             throw new Error('Model not initialized');
         }
-        if (options.model.outputType === 'vector') {
+        if (options.model.taskType === GenerativeAITaskType.Embeddings) {
             const response = await this.client.embeddings.create({
                 model: options.model.id,
                 input: parameters.prompt,
@@ -41,12 +42,89 @@ export class OpenAIGenerativeAIWorkerConnector {
                 throw new Error('No response data');
             }
             return {
-                type: 'prompt',
+                type: "prompt" /* GenerativeAIJobType.Prompt */,
                 output: response.data[0].embedding,
                 inputTokens: response.usage?.prompt_tokens ?? 0,
                 outputTokens: 0,
             };
         }
+        if (options.model.taskType === GenerativeAITaskType.SpeechToText) {
+            if (typeof parameters.prompt === 'string') {
+                throw new Error('Prompt must be an array of messages');
+            }
+            let file;
+            for (const message of parameters.prompt) {
+                if (message.type === 'input_audio') {
+                    file = new File([message.input_audio.data], 'audio.mp3', { type: message.input_audio.format });
+                }
+            }
+            if (!file) {
+                throw new Error('No file found');
+            }
+            console.log('OpenAIGenerativeAIWorkerConnector.processJob audio transcription');
+            const response = await this.client.audio.transcriptions.create({
+                model: options.model.id,
+                file,
+                response_format: 'json',
+            });
+            console.log('OpenAIGenerativeAIWorkerConnector.processJob audio transcription response');
+            return {
+                type: "prompt" /* GenerativeAIJobType.Prompt */,
+                output: response.text,
+                inputTokens: response.usage?.type === 'tokens' ? response.usage.input_tokens : 0,
+                outputTokens: response.usage?.type === 'tokens' ? response.usage.output_tokens : 0,
+            };
+        }
+        if (options.model.taskType === GenerativeAITaskType.ImageGeneration) {
+            const images = [];
+            let prompt = parameters.prompt;
+            if (typeof parameters.prompt !== 'string') {
+                for (const message of parameters.prompt) {
+                    if (message.type === 'image_url') {
+                        const parts = message.image_url.url.split(',');
+                        const data = parts[1];
+                        const type = parts[0].replace('data:', '').replace(';base64', '');
+                        const byteArray = Uint8Array.from(Buffer.from(data, 'base64'));
+                        const blob = new Blob([byteArray], { type });
+                        images.push(new File([blob], `image.${type.split('/')[1]}`, { type }));
+                    }
+                    if (message.type === 'text') {
+                        prompt = message.text;
+                    }
+                }
+            }
+            if (images.length === 0) {
+                console.log('OpenAIGenerativeAIWorkerConnector.processJob image generation');
+                const response = await this.client.images.generate({
+                    model: options.model.id,
+                    prompt,
+                });
+                console.log('OpenAIGenerativeAIWorkerConnector.processJob image generation response');
+                return {
+                    type: "prompt" /* GenerativeAIJobType.Prompt */,
+                    output: '',
+                    resultFile: `data:image/png;base64,${response.data?.[0]?.b64_json ?? ''}`,
+                    inputTokens: response.usage?.input_tokens ?? 0,
+                    outputTokens: response.usage?.output_tokens ?? 0,
+                };
+            }
+            else {
+                console.log('OpenAIGenerativeAIWorkerConnector.processJob image edit');
+                const response = await this.client.images.edit({
+                    model: options.model.id,
+                    image: images.length === 1 ? images[0] : images,
+                    prompt,
+                });
+                console.log('OpenAIGenerativeAIWorkerConnector.processJob image edit response');
+                return {
+                    type: "prompt" /* GenerativeAIJobType.Prompt */,
+                    output: '',
+                    resultFile: `data:image/png;base64,${response.data?.[0]?.b64_json ?? ''}`,
+                    inputTokens: response.usage?.input_tokens ?? 0,
+                    outputTokens: response.usage?.output_tokens ?? 0,
+                };
+            }
+        }
         const responseFormat = this.getResponseFormat(parameters);
         const tools = this.getTools(parameters);
         const messages = this.getMessages(parameters);
@@ -54,6 +132,7 @@ export class OpenAIGenerativeAIWorkerConnector {
         let outputTokens = 0;
         let output = '';
         while (true) {
+            console.log('OpenAIGenerativeAIWorkerConnector.processJob', options.model.id);
             const response = await this.client.responses.create({
                 model: options.model.id,
                 input: messages,
@@ -62,6 +141,7 @@ export class OpenAIGenerativeAIWorkerConnector {
                 text: responseFormat,
                 tools,
             });
+            console.log('OpenAIGenerativeAIWorkerConnector.processJob response');
             inputTokens += response.usage?.input_tokens ?? 0;
             outputTokens += response.usage?.output_tokens ?? 0;
             const promises = [];
@@ -96,10 +176,99 @@ export class OpenAIGenerativeAIWorkerConnector {
         if (!options || !this.models.has(options.model.id)) {
             throw new Error('Model not initialized');
         }
+        if (options.model.taskType === GenerativeAITaskType.SpeechToText) {
+            if (typeof parameters.prompt === 'string') {
+                throw new Error('Prompt must be an array of messages');
+            }
+            let file;
+            for (const message of parameters.prompt) {
+                if (message.type === 'input_audio') {
+                    const dataParts = message.input_audio.data.split(',');
+                    const data = dataParts[1];
+                    const type = dataParts[0].replace('data:', '').replace(';base64', '');
+                    const byteArray = Uint8Array.from(Buffer.from(data, 'base64'));
+                    const blob = new Blob([byteArray], { type });
+                    file = new File([blob], `audio.${message.input_audio.format}`, { type });
+                }
+            }
+            if (!file) {
+                throw new Error('No file found');
+            }
+            console.log('OpenAIGenerativeAIWorkerConnector.processJobStream audio transcription');
+            const stream = await this.client.audio.transcriptions.create({
+                model: options.model.id,
+                file,
+                response_format: 'json',
+                stream: true,
+            });
+            console.log('OpenAIGenerativeAIWorkerConnector.processJobStream audio transcription response');
+            for await (const chunk of stream) {
+                yield {
+                    type: "prompt" /* GenerativeAIJobType.Prompt */,
+                    output: chunk.type === 'transcript.text.delta' ? chunk.delta : '',
+                    inputTokens: chunk.type === 'transcript.text.done' ? 0 : chunk.usage?.input_tokens ?? 0,
+                    outputTokens: chunk.type === 'transcript.text.done' ? 0 : chunk.usage?.output_tokens ?? 0,
+                };
+            }
+            return;
+        }
+        if (options.model.taskType === GenerativeAITaskType.ImageGeneration) {
+            const images = [];
+            let prompt = parameters.prompt;
+            if (typeof parameters.prompt !== 'string') {
+                for (const message of parameters.prompt) {
+                    if (message.type === 'image_url') {
+                        const parts = message.image_url.url.split(',');
+                        const data = parts[1];
+                        const type = parts[0].replace('data:', '').replace(';base64', '');
+                        const byteArray = Uint8Array.from(Buffer.from(data, 'base64'));
+                        const blob = new Blob([byteArray], { type });
+                        images.push(new File([blob], `image.${type.split('/')[1]}`, { type }));
+                    }
+                    if (message.type === 'text') {
+                        prompt = message.text;
+                    }
+                }
+            }
+            if (images.length === 0) {
+                console.log('OpenAIGenerativeAIWorkerConnector.processJobStream images.length === 0');
+                const response = await this.client.images.generate({
+                    model: options.model.id,
+                    prompt,
+                });
+                console.log('OpenAIGenerativeAIWorkerConnector.processJobStream images.length === 0 response');
+                yield {
+                    type: "prompt" /* GenerativeAIJobType.Prompt */,
+                    output: '',
+                    resultFile: `data:image/png;base64,${response.data?.[0]?.b64_json ?? ''}`,
+                    inputTokens: response.usage?.input_tokens ?? 0,
+                    outputTokens: response.usage?.output_tokens ?? 0,
+                };
+                return;
+            }
+            else {
+                console.log('OpenAIGenerativeAIWorkerConnector.processJobStream images.length > 0');
+                const response = await this.client.images.edit({
+                    model: options.model.id,
+                    image: images.length === 1 ? images[0] : images,
+                    prompt,
+                });
+                console.log('OpenAIGenerativeAIWorkerConnector.processJobStream images.length > 0 response');
+                yield {
+                    type: "prompt" /* GenerativeAIJobType.Prompt */,
+                    output: '',
+                    resultFile: `data:image/png;base64,${response.data?.[0]?.b64_json ?? ''}`,
+                    inputTokens: response.usage?.input_tokens ?? 0,
+                    outputTokens: response.usage?.output_tokens ?? 0,
+                };
+                return;
+            }
+        }
         const responseFormat = this.getResponseFormat(parameters);
         const tools = this.getTools(parameters);
         const messages = this.getMessages(parameters);
         while (true) {
+            console.log('OpenAIGenerativeAIWorkerConnector.processJobStream', options.model.id);
             const stream = await this.client.responses.create({
                 model: options.model.id,
                 input: messages,
@@ -109,6 +278,7 @@ export class OpenAIGenerativeAIWorkerConnector {
                 tools,
                 stream: true,
             });
+            console.log('OpenAIGenerativeAIWorkerConnector.processJobStream response');
             const promises = [];
             for await (const chunk of stream) {
                 if (chunk.type === 'response.output_text.delta') {
@@ -166,12 +336,15 @@ export class OpenAIGenerativeAIWorkerConnector {
             if (input === '') {
                 input = '{}';
             }
+            console.log('OpenAIGenerativeAIWorkerConnector.processToolCall', toolName, input);
             const result = func.callback(JSON.parse(input));
             if (result instanceof Promise) {
+                const output = await result;
+                console.log('OpenAIGenerativeAIWorkerConnector.processToolCall result');
                 messages.push({
                     type: 'function_call_output',
                     call_id: toolCallId,
-                    output: await result,
+                    output,
                 });
             }
             else {

package/dist/models/OpenAISpeechConnector.js CHANGED Viewed

@@ -1,4 +1,5 @@
 import OpenAI from 'openai';
+import { GenerativeAIEngineType } from '@crewdle/web-sdk-types';
 export class OpenAISpeechConnector {
     client;
     constructor(apiKey) {
@@ -6,13 +7,13 @@ export class OpenAISpeechConnector {
             apiKey,
         });
     }
-    async speak(model, text, voice, instructions) {
+    async speak(model, text, voice, format, instructions) {
         const response = await this.client.audio.speech.create({
             model,
             voice: voice,
             input: text,
             instructions,
-            response_format: 'pcm',
+            response_format: format,
         });
         if (!response.body) {
             throw new Error('No response body');
@@ -30,6 +31,6 @@ export class OpenAISpeechConnector {
         });
     }
     getEngineType() {
-        return 'openai';
+        return GenerativeAIEngineType.OpenAI;
     }
 }

package/dist/types/models/OpenAISpeechConnector.d.ts CHANGED Viewed

@@ -2,6 +2,6 @@ import { GenerativeAIEngineType, IGenerativeAISpeechConnector } from '@crewdle/w
 export declare class OpenAISpeechConnector implements IGenerativeAISpeechConnector {
     private client;
     constructor(apiKey: string);
-    speak(model: string, text: string, voice: string, instructions?: string): Promise<ReadableStream>;
+    speak(model: string, text: string, voice: string, format: string, instructions?: string): Promise<ReadableStream>;
     getEngineType(): GenerativeAIEngineType;
 }

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@crewdle/mist-connector-openai",
-  "version": "1.0.14",
+  "version": "1.0.15",
   "description": "",
   "main": "dist/index.js",
   "types": "dist/types/index.d.ts",
@@ -15,11 +15,11 @@
     "dist/"
   ],
   "devDependencies": {
-    "@crewdle/web-sdk-types": "^1.0.46",
+    "@crewdle/web-sdk-types": "^1.0.48",
     "@types/node": "^22.13.9",
     "typescript": "^5.8.2"
   },
   "dependencies": {
-    "openai": "^5.5.1"
+    "openai": "^5.8.2"
   }
 }