npm - @ai-sdk/prodia - Versions diffs - 2.0.0-beta.4 → 2.0.0-beta.53 - Mend

@ai-sdk/prodia 2.0.0-beta.4 → 2.0.0-beta.53

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (20) hide show

package/CHANGELOG.md +406 -0
package/README.md +2 -0
package/dist/index.d.ts +39 -7
package/dist/index.js +838 -222
package/dist/index.js.map +1 -1
package/package.json +14 -14
package/src/index.ts +5 -1
package/src/prodia-api.ts +201 -0
package/src/prodia-image-model-options.ts +61 -0
package/src/prodia-image-model.ts +34 -254
package/src/prodia-language-model-options.ts +35 -0
package/src/prodia-language-model-settings.ts +6 -0
package/src/prodia-language-model.ts +423 -0
package/src/prodia-provider.ts +42 -10
package/src/prodia-video-model-options.ts +21 -0
package/src/prodia-video-model-settings.ts +7 -0
package/src/prodia-video-model.ts +266 -0
package/dist/index.d.mts +0 -58
package/dist/index.mjs +0 -423
package/dist/index.mjs.map +0 -1

package/src/prodia-language-model.ts ADDED Viewed

@@ -0,0 +1,423 @@
+import {
+  UnsupportedFunctionalityError,
+  type LanguageModelV4,
+  type LanguageModelV4CallOptions,
+  type LanguageModelV4Content,
+  type LanguageModelV4StreamPart,
+  type SharedV4Warning,
+} from '@ai-sdk/provider';
+import {
+  combineHeaders,
+  isCustomReasoning,
+  convertBase64ToUint8Array,
+  detectMediaType,
+  generateId,
+  getTopLevelMediaType,
+  isFullMediaType,
+  parseJSON,
+  parseProviderOptions,
+  postFormDataToApi,
+  resolve,
+  serializeModelOptions,
+  WORKFLOW_SERIALIZE,
+  WORKFLOW_DESERIALIZE,
+  zodSchema,
+} from '@ai-sdk/provider-utils';
+import {
+  buildProdiaProviderMetadata,
+  parseMultipart,
+  prodiaFailedResponseHandler,
+  prodiaJobResultSchema,
+  type ProdiaJobResult,
+  type ProdiaModelConfig,
+} from './prodia-api';
+import { prodiaLanguageModelOptionsSchema } from './prodia-language-model-options';
+import type { ProdiaLanguageModelId } from './prodia-language-model-settings';
+export class ProdiaLanguageModel implements LanguageModelV4 {
+  readonly specificationVersion = 'v4';
+  readonly supportedUrls = {};
+  get provider(): string {
+    return this.config.provider;
+  }
+  static [WORKFLOW_SERIALIZE](model: ProdiaLanguageModel) {
+    return serializeModelOptions({
+      modelId: model.modelId,
+      config: model.config,
+    });
+  }
+  static [WORKFLOW_DESERIALIZE](options: {
+    modelId: ProdiaLanguageModelId;
+    config: ProdiaModelConfig;
+  }) {
+    return new ProdiaLanguageModel(options.modelId, options.config);
+  }
+  constructor(
+    readonly modelId: ProdiaLanguageModelId,
+    private readonly config: ProdiaModelConfig,
+  ) {}
+  async doGenerate(options: LanguageModelV4CallOptions) {
+    const warnings: Array<SharedV4Warning> = [];
+    // Warn about unsupported LLM features
+    if (options.temperature !== undefined) {
+      warnings.push({ type: 'unsupported', feature: 'temperature' });
+    }
+    if (options.topP !== undefined) {
+      warnings.push({ type: 'unsupported', feature: 'topP' });
+    }
+    if (options.topK !== undefined) {
+      warnings.push({ type: 'unsupported', feature: 'topK' });
+    }
+    if (options.maxOutputTokens !== undefined) {
+      warnings.push({ type: 'unsupported', feature: 'maxOutputTokens' });
+    }
+    if (options.stopSequences !== undefined) {
+      warnings.push({ type: 'unsupported', feature: 'stopSequences' });
+    }
+    if (options.presencePenalty !== undefined) {
+      warnings.push({ type: 'unsupported', feature: 'presencePenalty' });
+    }
+    if (options.frequencyPenalty !== undefined) {
+      warnings.push({ type: 'unsupported', feature: 'frequencyPenalty' });
+    }
+    if (options.tools !== undefined && options.tools.length > 0) {
+      warnings.push({ type: 'unsupported', feature: 'tools' });
+    }
+    if (options.toolChoice !== undefined) {
+      warnings.push({ type: 'unsupported', feature: 'toolChoice' });
+    }
+    if (
+      options.responseFormat !== undefined &&
+      options.responseFormat.type !== 'text'
+    ) {
+      warnings.push({ type: 'unsupported', feature: 'responseFormat' });
+    }
+    if (isCustomReasoning(options.reasoning)) {
+      warnings.push({
+        type: 'unsupported',
+        feature: 'reasoning',
+        details: 'This provider does not support reasoning configuration.',
+      });
+    }
+    const prodiaOptions = await parseProviderOptions({
+      provider: 'prodia',
+      providerOptions: options.providerOptions,
+      schema: prodiaLanguageModelOptionsSchema,
+    });
+    // Extract text prompt from messages
+    let prompt = '';
+    let systemMessage = '';
+    for (const message of options.prompt) {
+      if (message.role === 'system') {
+        systemMessage = message.content;
+      }
+    }
+    // Get text from the last user message
+    for (let i = options.prompt.length - 1; i >= 0; i--) {
+      const message = options.prompt[i];
+      if (message.role === 'user') {
+        for (const part of message.content) {
+          if (part.type === 'text') {
+            prompt += (prompt ? '\n' : '') + part.text;
+          }
+        }
+        break;
+      }
+    }
+    if (systemMessage) {
+      prompt = systemMessage + '\n' + prompt;
+    }
+    // Extract image from user messages
+    let imageBytes: Uint8Array | undefined;
+    let imageMediaType = 'image/png';
+    for (let i = options.prompt.length - 1; i >= 0; i--) {
+      const message = options.prompt[i];
+      if (message.role === 'user') {
+        for (const part of message.content) {
+          if (
+            part.type === 'file' &&
+            getTopLevelMediaType(part.mediaType) === 'image'
+          ) {
+            switch (part.data.type) {
+              case 'reference': {
+                throw new UnsupportedFunctionalityError({
+                  functionality: 'file parts with provider references',
+                });
+              }
+              case 'text': {
+                throw new UnsupportedFunctionalityError({
+                  functionality: 'text file parts',
+                });
+              }
+              case 'data': {
+                if (part.data.data instanceof Uint8Array) {
+                  imageBytes = part.data.data;
+                } else {
+                  imageBytes = convertBase64ToUint8Array(part.data.data);
+                }
+                break;
+              }
+              case 'url': {
+                const fetchFn = this.config.fetch ?? globalThis.fetch;
+                const response = await fetchFn(part.data.url.toString());
+                const arrayBuffer = await response.arrayBuffer();
+                imageBytes = new Uint8Array(arrayBuffer);
+                break;
+              }
+            }
+            if (isFullMediaType(part.mediaType)) {
+              imageMediaType = part.mediaType;
+            } else if (imageBytes !== undefined) {
+              const detected = detectMediaType({
+                data: imageBytes,
+                topLevelType: getTopLevelMediaType(part.mediaType),
+              });
+              if (detected !== undefined) {
+                imageMediaType = detected;
+              }
+            }
+            break;
+          }
+        }
+        break;
+      }
+    }
+    const jobConfig: Record<string, unknown> = {
+      prompt,
+      include_messages: true,
+    };
+    if (prodiaOptions?.aspectRatio !== undefined) {
+      jobConfig.aspect_ratio = prodiaOptions.aspectRatio;
+    }
+    const body = {
+      type: this.modelId,
+      config: jobConfig,
+    };
+    const currentDate = this.config._internal?.currentDate?.() ?? new Date();
+    const combinedHeaders = combineHeaders(
+      this.config.headers ? await resolve(this.config.headers) : undefined,
+      options.headers,
+    );
+    // Always use multipart form-data since img2img requires image input
+    const formData = new FormData();
+    formData.append(
+      'job',
+      new Blob([JSON.stringify(body)], { type: 'application/json' }),
+      'job.json',
+    );
+    if (imageBytes) {
+      const fileExtension =
+        imageMediaType === 'image/png'
+          ? '.png'
+          : imageMediaType === 'image/jpeg'
+            ? '.jpg'
+            : imageMediaType === 'image/webp'
+              ? '.webp'
+              : '';
+      formData.append(
+        'input',
+        new Blob([imageBytes], { type: imageMediaType }),
+        'input' + fileExtension,
+      );
+    }
+    const { value: multipartResult, responseHeaders } = await postFormDataToApi(
+      {
+        url: `${this.config.baseURL}/job?price=true`,
+        headers: {
+          ...combinedHeaders,
+          Accept: 'multipart/form-data',
+        },
+        formData,
+        failedResponseHandler: prodiaFailedResponseHandler,
+        successfulResponseHandler: createLanguageMultipartResponseHandler(),
+        abortSignal: options.abortSignal,
+        fetch: this.config.fetch,
+      },
+    );
+    const { jobResult, textContent, fileContent } = multipartResult;
+    const content: Array<LanguageModelV4Content> = [];
+    if (textContent !== undefined) {
+      content.push({ type: 'text', text: textContent });
+    }
+    for (const file of fileContent) {
+      content.push({
+        type: 'file',
+        mediaType: file.mediaType,
+        data: { type: 'data', data: file.data },
+      });
+    }
+    return {
+      content,
+      finishReason: { unified: 'stop' as const, raw: undefined },
+      usage: {
+        inputTokens: {
+          total: undefined,
+          noCache: undefined,
+          cacheRead: undefined,
+          cacheWrite: undefined,
+        },
+        outputTokens: {
+          total: undefined,
+          text: undefined,
+          reasoning: undefined,
+        },
+      },
+      warnings,
+      providerMetadata: {
+        prodia: buildProdiaProviderMetadata(jobResult),
+      },
+      response: {
+        modelId: this.modelId,
+        timestamp: currentDate,
+        headers: responseHeaders,
+      },
+    };
+  }
+  async doStream(options: LanguageModelV4CallOptions) {
+    const result = await this.doGenerate(options);
+    const stream = new ReadableStream<LanguageModelV4StreamPart>({
+      start(controller) {
+        controller.enqueue({
+          type: 'stream-start',
+          warnings: result.warnings,
+        });
+        controller.enqueue({
+          type: 'response-metadata',
+          modelId: result.response?.modelId,
+          timestamp: result.response?.timestamp,
+        });
+        for (const part of result.content) {
+          if (part.type === 'text') {
+            const id = generateId();
+            controller.enqueue({ type: 'text-start', id });
+            controller.enqueue({
+              type: 'text-delta',
+              id,
+              delta: part.text,
+            });
+            controller.enqueue({ type: 'text-end', id });
+          } else if (part.type === 'file') {
+            controller.enqueue({
+              type: 'file',
+              mediaType: part.mediaType,
+              data: part.data,
+            });
+          }
+        }
+        controller.enqueue({
+          type: 'finish',
+          usage: result.usage,
+          finishReason: result.finishReason,
+          providerMetadata: result.providerMetadata,
+        });
+        controller.close();
+      },
+    });
+    return {
+      stream,
+      response: {
+        headers: result.response?.headers,
+      },
+    };
+  }
+}
+interface LanguageMultipartResult {
+  jobResult: ProdiaJobResult;
+  textContent: string | undefined;
+  fileContent: Array<{ mediaType: string; data: Uint8Array }>;
+}
+function createLanguageMultipartResponseHandler() {
+  return async ({
+    response,
+  }: {
+    response: Response;
+  }): Promise<{
+    value: LanguageMultipartResult;
+    responseHeaders: Record<string, string>;
+  }> => {
+    const contentType = response.headers.get('content-type') ?? '';
+    const responseHeaders: Record<string, string> = {};
+    response.headers.forEach((value, key) => {
+      responseHeaders[key] = value;
+    });
+    const boundaryMatch = contentType.match(/boundary=([^\s;]+)/);
+    if (!boundaryMatch) {
+      throw new Error(
+        `Prodia response missing multipart boundary in content-type: ${contentType}`,
+      );
+    }
+    const boundary = boundaryMatch[1];
+    const arrayBuffer = await response.arrayBuffer();
+    const bytes = new Uint8Array(arrayBuffer);
+    const parts = parseMultipart(bytes, boundary);
+    let jobResult: ProdiaJobResult | undefined;
+    let textContent: string | undefined;
+    const fileContent: Array<{ mediaType: string; data: Uint8Array }> = [];
+    for (const part of parts) {
+      const contentDisposition = part.headers['content-disposition'] ?? '';
+      const partContentType = part.headers['content-type'] ?? '';
+      if (contentDisposition.includes('name="job"')) {
+        const jsonStr = new TextDecoder().decode(part.body);
+        jobResult = await parseJSON({
+          text: jsonStr,
+          schema: zodSchema(prodiaJobResultSchema),
+        });
+      } else if (contentDisposition.includes('name="output"')) {
+        if (
+          partContentType.startsWith('text/') ||
+          contentDisposition.includes('.txt')
+        ) {
+          textContent = new TextDecoder().decode(part.body);
+        } else if (partContentType.startsWith('image/')) {
+          fileContent.push({
+            mediaType: partContentType,
+            data: part.body,
+          });
+        }
+      }
+    }
+    if (!jobResult) {
+      throw new Error('Prodia multipart response missing job part');
+    }
+    return {
+      value: { jobResult, textContent, fileContent },
+      responseHeaders,
+    };
+  };
+}

package/src/prodia-provider.ts CHANGED Viewed

@@ -1,16 +1,22 @@
 import {
-  type ImageModelV4,
   NoSuchModelError,
+  type Experimental_VideoModelV4,
+  type ImageModelV4,
+  type LanguageModelV4,
   type ProviderV4,
 } from '@ai-sdk/provider';
-import type { FetchFunction } from '@ai-sdk/provider-utils';
 import {
   loadApiKey,
   withoutTrailingSlash,
   withUserAgentSuffix,
+  type FetchFunction,
 } from '@ai-sdk/provider-utils';
 import { ProdiaImageModel } from './prodia-image-model';
 import type { ProdiaImageModelId } from './prodia-image-settings';
+import { ProdiaLanguageModel } from './prodia-language-model';
+import type { ProdiaLanguageModelId } from './prodia-language-model-settings';
+import { ProdiaVideoModel } from './prodia-video-model';
+import type { ProdiaVideoModelId } from './prodia-video-model-settings';
 import { VERSION } from './version';
 export interface ProdiaProviderSettings {
@@ -37,6 +43,11 @@ export interface ProdiaProviderSettings {
 }
 export interface ProdiaProvider extends ProviderV4 {
+  /**
+   * Creates a language model for multimodal generation (img2img with text+image output).
+   */
+  languageModel(modelId: ProdiaLanguageModelId): LanguageModelV4;
   /**
    * Creates a model for image generation.
    */
@@ -47,6 +58,16 @@ export interface ProdiaProvider extends ProviderV4 {
    */
   imageModel(modelId: ProdiaImageModelId): ImageModelV4;
+  /**
+   * Creates a model for video generation.
+   */
+  video(modelId: ProdiaVideoModelId): Experimental_VideoModelV4;
+  /**
+   * Creates a model for video generation.
+   */
+  videoModel(modelId: ProdiaVideoModelId): Experimental_VideoModelV4;
   /**
    * @deprecated Use `embeddingModel` instead.
    */
@@ -80,25 +101,36 @@ export function createProdia(
       fetch: options.fetch,
     });
-  const embeddingModel = (modelId: string) => {
-    throw new NoSuchModelError({
-      modelId,
-      modelType: 'embeddingModel',
+  const createLanguageModel = (modelId: ProdiaLanguageModelId) =>
+    new ProdiaLanguageModel(modelId, {
+      provider: 'prodia.language',
+      baseURL: baseURL ?? defaultBaseURL,
+      headers: getHeaders,
+      fetch: options.fetch,
     });
-  };
-  const languageModel = (modelId: string) => {
+  const createVideoModel = (modelId: ProdiaVideoModelId) =>
+    new ProdiaVideoModel(modelId, {
+      provider: 'prodia.video',
+      baseURL: baseURL ?? defaultBaseURL,
+      headers: getHeaders,
+      fetch: options.fetch,
+    });
+  const embeddingModel = (modelId: string) => {
     throw new NoSuchModelError({
       modelId,
-      modelType: 'languageModel',
+      modelType: 'embeddingModel',
     });
   };
   return {
     specificationVersion: 'v4',
+    languageModel: createLanguageModel,
     imageModel: createImageModel,
     image: createImageModel,
-    languageModel,
+    videoModel: createVideoModel,
+    video: createVideoModel,
     embeddingModel,
     textEmbeddingModel: embeddingModel,
   };

package/src/prodia-video-model-options.ts ADDED Viewed

@@ -0,0 +1,21 @@
+import {
+  lazySchema,
+  zodSchema,
+  type InferSchema,
+} from '@ai-sdk/provider-utils';
+import { z } from 'zod/v4';
+export const prodiaVideoModelOptionsSchema = lazySchema(() =>
+  zodSchema(
+    z.object({
+      /**
+       * Video resolution (e.g. "480p", "720p").
+       */
+      resolution: z.string().optional(),
+    }),
+  ),
+);
+export type ProdiaVideoModelOptions = InferSchema<
+  typeof prodiaVideoModelOptionsSchema
+>;

package/src/prodia-video-model-settings.ts ADDED Viewed

@@ -0,0 +1,7 @@
+/**
+ * Prodia job types for video generation.
+ */
+export type ProdiaVideoModelId =
+  | 'inference.wan2-2.lightning.txt2vid.v0'
+  | 'inference.wan2-2.lightning.img2vid.v0'
+  | (string & {});