npm - @aigne/openai - Versions diffs - 0.15.4 → 0.16.0-beta - Mend

@aigne/openai 0.15.4 → 0.16.0-beta

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (7) hide show

package/CHANGELOG.md +17 -0
package/lib/cjs/openai-image-model.d.ts +3 -3
package/lib/cjs/openai-image-model.js +13 -4
package/lib/dts/openai-image-model.d.ts +3 -3
package/lib/esm/openai-image-model.d.ts +3 -3
package/lib/esm/openai-image-model.js +14 -5
package/package.json +4 -4

package/CHANGELOG.md CHANGED Viewed

@@ -1,5 +1,22 @@
 # Changelog
+## [0.16.0-beta](https://github.com/AIGNE-io/aigne-framework/compare/openai-v0.15.4...openai-v0.16.0-beta) (2025-09-22)
+### Features
+* improve image model architecture and file handling ([#527](https://github.com/AIGNE-io/aigne-framework/issues/527)) ([4db50aa](https://github.com/AIGNE-io/aigne-framework/commit/4db50aa0387a1a0f045ca11aaa61613e36ca7597))
+### Dependencies
+* The following workspace dependencies were updated
+  * dependencies
+    * @aigne/core bumped to 1.61.0-beta
+    * @aigne/platform-helpers bumped to 0.6.3-beta
+  * devDependencies
+    * @aigne/test-utils bumped to 0.5.53-beta
 ## [0.15.4](https://github.com/AIGNE-io/aigne-framework/compare/openai-v0.15.3...openai-v0.15.4) (2025-09-18)

package/lib/cjs/openai-image-model.d.ts CHANGED Viewed

@@ -1,8 +1,8 @@
-import { ImageModel, type ImageModelInput, type ImageModelOptions, type ImageModelOutput } from "@aigne/core";
+import { type AgentInvokeOptions, ImageModel, type ImageModelInput, type ImageModelOptions, type ImageModelOutput } from "@aigne/core";
 import { type Camelize } from "@aigne/core/utils/camelize.js";
 import type OpenAI from "openai";
 import type { ClientOptions } from "openai";
-export interface OpenAIImageModelInput extends ImageModelInput, Camelize<Omit<OpenAI.ImageGenerateParams, "prompt" | "model" | "n" | "response_format">> {
+export interface OpenAIImageModelInput extends ImageModelInput, Camelize<Omit<OpenAI.ImageGenerateParams | OpenAI.ImageEditParams, "prompt" | "model" | "n" | "response_format">> {
 }
 export interface OpenAIImageModelOutput extends ImageModelOutput {
 }
@@ -51,5 +51,5 @@ export declare class OpenAIImageModel extends ImageModel<OpenAIImageModelInput,
      * @param input The input to process
      * @returns The generated response
      */
-    process(input: OpenAIImageModelInput): Promise<OpenAIImageModelOutput>;
+    process(input: OpenAIImageModelInput, options: AgentInvokeOptions): Promise<OpenAIImageModelOutput>;
 }

package/lib/cjs/openai-image-model.js CHANGED Viewed

@@ -7,6 +7,7 @@ const type_utils_js_1 = require("@aigne/core/utils/type-utils.js");
 const zod_1 = require("zod");
 const openai_js_1 = require("./openai.js");
 const DEFAULT_MODEL = "dall-e-2";
+const OUTPUT_MIME_TYPE = "image/png";
 const openAIImageModelInputSchema = core_1.imageModelInputSchema.extend({});
 const openAIImageModelOptionsSchema = zod_1.z.object({
     apiKey: zod_1.z.string().optional(),
@@ -57,7 +58,7 @@ class OpenAIImageModel extends core_1.ImageModel {
      * @param input The input to process
      * @returns The generated response
      */
-    async process(input) {
+    async process(input, options) {
         const model = input.model || this.credential.model;
         const map = {
             "dall-e-2": ["prompt", "size", "n"],
@@ -83,13 +84,21 @@ class OpenAIImageModel extends core_1.ImageModel {
             response_format: responseFormat,
             model,
         };
-        const response = await this.client.images.generate({ ...body, stream: false });
+        const response = input.image?.length
+            ? await this.client.images.edit({
+                ...body,
+                image: await Promise.all(input.image.map((image) => this.transformFileOutput(core_1.FileOutputType.file, image, options).then((file) => new File([Buffer.from(file.data, "base64")], file.filename || "image.png", {
+                    type: file.mimeType,
+                })))),
+                stream: false,
+            })
+            : await this.client.images.generate({ ...body, stream: false });
         return {
             images: (response.data ?? []).map((image) => {
                 if (image.url)
-                    return { url: image.url };
+                    return { type: "url", url: image.url, mimeType: OUTPUT_MIME_TYPE };
                 if (image.b64_json)
-                    return { base64: image.b64_json };
+                    return { type: "file", data: image.b64_json, mimeType: OUTPUT_MIME_TYPE };
                 throw new Error("Image response does not contain a valid URL or base64 data");
             }),
             usage: {

package/lib/dts/openai-image-model.d.ts CHANGED Viewed

@@ -1,8 +1,8 @@
-import { ImageModel, type ImageModelInput, type ImageModelOptions, type ImageModelOutput } from "@aigne/core";
+import { type AgentInvokeOptions, ImageModel, type ImageModelInput, type ImageModelOptions, type ImageModelOutput } from "@aigne/core";
 import { type Camelize } from "@aigne/core/utils/camelize.js";
 import type OpenAI from "openai";
 import type { ClientOptions } from "openai";
-export interface OpenAIImageModelInput extends ImageModelInput, Camelize<Omit<OpenAI.ImageGenerateParams, "prompt" | "model" | "n" | "response_format">> {
+export interface OpenAIImageModelInput extends ImageModelInput, Camelize<Omit<OpenAI.ImageGenerateParams | OpenAI.ImageEditParams, "prompt" | "model" | "n" | "response_format">> {
 }
 export interface OpenAIImageModelOutput extends ImageModelOutput {
 }
@@ -51,5 +51,5 @@ export declare class OpenAIImageModel extends ImageModel<OpenAIImageModelInput,
      * @param input The input to process
      * @returns The generated response
      */
-    process(input: OpenAIImageModelInput): Promise<OpenAIImageModelOutput>;
+    process(input: OpenAIImageModelInput, options: AgentInvokeOptions): Promise<OpenAIImageModelOutput>;
 }

package/lib/esm/openai-image-model.d.ts CHANGED Viewed

@@ -1,8 +1,8 @@
-import { ImageModel, type ImageModelInput, type ImageModelOptions, type ImageModelOutput } from "@aigne/core";
+import { type AgentInvokeOptions, ImageModel, type ImageModelInput, type ImageModelOptions, type ImageModelOutput } from "@aigne/core";
 import { type Camelize } from "@aigne/core/utils/camelize.js";
 import type OpenAI from "openai";
 import type { ClientOptions } from "openai";
-export interface OpenAIImageModelInput extends ImageModelInput, Camelize<Omit<OpenAI.ImageGenerateParams, "prompt" | "model" | "n" | "response_format">> {
+export interface OpenAIImageModelInput extends ImageModelInput, Camelize<Omit<OpenAI.ImageGenerateParams | OpenAI.ImageEditParams, "prompt" | "model" | "n" | "response_format">> {
 }
 export interface OpenAIImageModelOutput extends ImageModelOutput {
 }
@@ -51,5 +51,5 @@ export declare class OpenAIImageModel extends ImageModel<OpenAIImageModelInput,
      * @param input The input to process
      * @returns The generated response
      */
-    process(input: OpenAIImageModelInput): Promise<OpenAIImageModelOutput>;
+    process(input: OpenAIImageModelInput, options: AgentInvokeOptions): Promise<OpenAIImageModelOutput>;
 }

package/lib/esm/openai-image-model.js CHANGED Viewed

@@ -1,9 +1,10 @@
-import { ImageModel, imageModelInputSchema, } from "@aigne/core";
+import { FileOutputType, ImageModel, imageModelInputSchema, } from "@aigne/core";
 import { snakelize } from "@aigne/core/utils/camelize.js";
 import { checkArguments, pick } from "@aigne/core/utils/type-utils.js";
 import { z } from "zod";
 import { CustomOpenAI } from "./openai.js";
 const DEFAULT_MODEL = "dall-e-2";
+const OUTPUT_MIME_TYPE = "image/png";
 const openAIImageModelInputSchema = imageModelInputSchema.extend({});
 const openAIImageModelOptionsSchema = z.object({
     apiKey: z.string().optional(),
@@ -54,7 +55,7 @@ export class OpenAIImageModel extends ImageModel {
      * @param input The input to process
      * @returns The generated response
      */
-    async process(input) {
+    async process(input, options) {
         const model = input.model || this.credential.model;
         const map = {
             "dall-e-2": ["prompt", "size", "n"],
@@ -80,13 +81,21 @@ export class OpenAIImageModel extends ImageModel {
             response_format: responseFormat,
             model,
         };
-        const response = await this.client.images.generate({ ...body, stream: false });
+        const response = input.image?.length
+            ? await this.client.images.edit({
+                ...body,
+                image: await Promise.all(input.image.map((image) => this.transformFileOutput(FileOutputType.file, image, options).then((file) => new File([Buffer.from(file.data, "base64")], file.filename || "image.png", {
+                    type: file.mimeType,
+                })))),
+                stream: false,
+            })
+            : await this.client.images.generate({ ...body, stream: false });
         return {
             images: (response.data ?? []).map((image) => {
                 if (image.url)
-                    return { url: image.url };
+                    return { type: "url", url: image.url, mimeType: OUTPUT_MIME_TYPE };
                 if (image.b64_json)
-                    return { base64: image.b64_json };
+                    return { type: "file", data: image.b64_json, mimeType: OUTPUT_MIME_TYPE };
                 throw new Error("Image response does not contain a valid URL or base64 data");
             }),
             usage: {

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@aigne/openai",
-  "version": "0.15.4",
+  "version": "0.16.0-beta",
   "description": "AIGNE OpenAI SDK for integrating with OpenAI's GPT models and API services",
   "publishConfig": {
     "access": "public"
@@ -39,8 +39,8 @@
     "openai": "^5.20.3",
     "uuid": "^13.0.0",
     "zod": "^3.25.67",
-    "@aigne/core": "^1.60.3",
-    "@aigne/platform-helpers": "^0.6.2"
+    "@aigne/platform-helpers": "^0.6.3-beta",
+    "@aigne/core": "^1.61.0-beta"
   },
   "devDependencies": {
     "@types/bun": "^1.2.22",
@@ -48,7 +48,7 @@
     "npm-run-all": "^4.1.5",
     "rimraf": "^6.0.1",
     "typescript": "^5.9.2",
-    "@aigne/test-utils": "^0.5.52"
+    "@aigne/test-utils": "^0.5.53-beta"
   },
   "scripts": {
     "lint": "tsc --noEmit",