npm - openai - Versions diffs - 4.97.0 → 4.99.0 - Mend

openai 4.97.0 → 4.99.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (242) hide show

package/CHANGELOG.md +29 -0
package/index.d.mts +5 -2
package/index.d.ts +5 -2
package/index.d.ts.map +1 -1
package/index.js +3 -0
package/index.js.map +1 -1
package/index.mjs +3 -0
package/index.mjs.map +1 -1
package/package.json +1 -1
package/resources/audio/speech.d.ts +12 -0
package/resources/audio/speech.d.ts.map +1 -1
package/resources/audio/speech.js +12 -0
package/resources/audio/speech.js.map +1 -1
package/resources/audio/speech.mjs +12 -0
package/resources/audio/speech.mjs.map +1 -1
package/resources/audio/transcriptions.d.ts +38 -0
package/resources/audio/transcriptions.d.ts.map +1 -1
package/resources/audio/transcriptions.js.map +1 -1
package/resources/audio/transcriptions.mjs.map +1 -1
package/resources/audio/translations.d.ts +8 -0
package/resources/audio/translations.d.ts.map +1 -1
package/resources/audio/translations.js.map +1 -1
package/resources/audio/translations.mjs.map +1 -1
package/resources/beta/assistants.d.ts +36 -0
package/resources/beta/assistants.d.ts.map +1 -1
package/resources/beta/assistants.js +28 -0
package/resources/beta/assistants.js.map +1 -1
package/resources/beta/assistants.mjs +28 -0
package/resources/beta/assistants.mjs.map +1 -1
package/resources/beta/realtime/sessions.d.ts +6 -0
package/resources/beta/realtime/sessions.d.ts.map +1 -1
package/resources/beta/realtime/sessions.js +6 -0
package/resources/beta/realtime/sessions.js.map +1 -1
package/resources/beta/realtime/sessions.mjs +6 -0
package/resources/beta/realtime/sessions.mjs.map +1 -1
package/resources/beta/realtime/transcription-sessions.d.ts +6 -0
package/resources/beta/realtime/transcription-sessions.d.ts.map +1 -1
package/resources/beta/realtime/transcription-sessions.js +6 -0
package/resources/beta/realtime/transcription-sessions.js.map +1 -1
package/resources/beta/realtime/transcription-sessions.mjs +6 -0
package/resources/beta/realtime/transcription-sessions.mjs.map +1 -1
package/resources/beta/threads/messages.d.ts +43 -0
package/resources/beta/threads/messages.d.ts.map +1 -1
package/resources/beta/threads/messages.js +33 -0
package/resources/beta/threads/messages.js.map +1 -1
package/resources/beta/threads/messages.mjs +33 -0
package/resources/beta/threads/messages.mjs.map +1 -1
package/resources/beta/threads/runs/runs.d.ts +52 -0
package/resources/beta/threads/runs/runs.d.ts.map +1 -1
package/resources/beta/threads/runs/runs.js +24 -0
package/resources/beta/threads/runs/runs.js.map +1 -1
package/resources/beta/threads/runs/runs.mjs +24 -0
package/resources/beta/threads/runs/runs.mjs.map +1 -1
package/resources/beta/threads/runs/steps.d.ts +21 -0
package/resources/beta/threads/runs/steps.d.ts.map +1 -1
package/resources/beta/threads/runs/steps.js.map +1 -1
package/resources/beta/threads/runs/steps.mjs.map +1 -1
package/resources/beta/threads/threads.d.ts +33 -0
package/resources/beta/threads/threads.d.ts.map +1 -1
package/resources/beta/threads/threads.js +21 -0
package/resources/beta/threads/threads.js.map +1 -1
package/resources/beta/threads/threads.mjs +21 -0
package/resources/beta/threads/threads.mjs.map +1 -1
package/resources/chat/completions/completions.d.ts +38 -0
package/resources/chat/completions/completions.d.ts.map +1 -1
package/resources/chat/completions/completions.js +20 -0
package/resources/chat/completions/completions.js.map +1 -1
package/resources/chat/completions/completions.mjs +20 -0
package/resources/chat/completions/completions.mjs.map +1 -1
package/resources/chat/completions/messages.d.ts +10 -0
package/resources/chat/completions/messages.d.ts.map +1 -1
package/resources/chat/completions/messages.js.map +1 -1
package/resources/chat/completions/messages.mjs.map +1 -1
package/resources/completions.d.ts +8 -0
package/resources/completions.d.ts.map +1 -1
package/resources/completions.js.map +1 -1
package/resources/completions.mjs.map +1 -1
package/resources/embeddings.d.ts +13 -3
package/resources/embeddings.d.ts.map +1 -1
package/resources/embeddings.js +9 -0
package/resources/embeddings.js.map +1 -1
package/resources/embeddings.mjs +9 -0
package/resources/embeddings.mjs.map +1 -1
package/resources/evals/evals.d.ts +164 -519
package/resources/evals/evals.d.ts.map +1 -1
package/resources/evals/evals.js.map +1 -1
package/resources/evals/evals.mjs.map +1 -1
package/resources/evals/index.d.ts +1 -1
package/resources/evals/index.d.ts.map +1 -1
package/resources/evals/index.js.map +1 -1
package/resources/evals/index.mjs.map +1 -1
package/resources/evals/runs/runs.d.ts +64 -69
package/resources/evals/runs/runs.d.ts.map +1 -1
package/resources/evals/runs/runs.js.map +1 -1
package/resources/evals/runs/runs.mjs.map +1 -1
package/resources/fine-tuning/alpha/alpha.d.ts +10 -0
package/resources/fine-tuning/alpha/alpha.d.ts.map +1 -0
package/resources/fine-tuning/alpha/alpha.js +39 -0
package/resources/fine-tuning/alpha/alpha.js.map +1 -0
package/resources/fine-tuning/alpha/alpha.mjs +12 -0
package/resources/fine-tuning/alpha/alpha.mjs.map +1 -0
package/resources/fine-tuning/alpha/graders.d.ts +107 -0
package/resources/fine-tuning/alpha/graders.d.ts.map +1 -0
package/resources/fine-tuning/alpha/graders.js +50 -0
package/resources/fine-tuning/alpha/graders.js.map +1 -0
package/resources/fine-tuning/alpha/graders.mjs +46 -0
package/resources/fine-tuning/alpha/graders.mjs.map +1 -0
package/resources/fine-tuning/alpha/index.d.ts +3 -0
package/resources/fine-tuning/alpha/index.d.ts.map +1 -0
package/resources/fine-tuning/alpha/index.js +9 -0
package/resources/fine-tuning/alpha/index.js.map +1 -0
package/resources/fine-tuning/alpha/index.mjs +4 -0
package/resources/fine-tuning/alpha/index.mjs.map +1 -0
package/resources/fine-tuning/alpha.d.ts +2 -0
package/resources/fine-tuning/alpha.d.ts.map +1 -0
package/resources/fine-tuning/alpha.js +19 -0
package/resources/fine-tuning/alpha.js.map +1 -0
package/resources/fine-tuning/alpha.mjs +3 -0
package/resources/fine-tuning/alpha.mjs.map +1 -0
package/resources/fine-tuning/checkpoints/permissions.d.ts +28 -0
package/resources/fine-tuning/checkpoints/permissions.d.ts.map +1 -1
package/resources/fine-tuning/checkpoints/permissions.js +20 -0
package/resources/fine-tuning/checkpoints/permissions.js.map +1 -1
package/resources/fine-tuning/checkpoints/permissions.mjs +20 -0
package/resources/fine-tuning/checkpoints/permissions.mjs.map +1 -1
package/resources/fine-tuning/fine-tuning.d.ts +8 -0
package/resources/fine-tuning/fine-tuning.d.ts.map +1 -1
package/resources/fine-tuning/fine-tuning.js +8 -0
package/resources/fine-tuning/fine-tuning.js.map +1 -1
package/resources/fine-tuning/fine-tuning.mjs +8 -0
package/resources/fine-tuning/fine-tuning.mjs.map +1 -1
package/resources/fine-tuning/index.d.ts +2 -0
package/resources/fine-tuning/index.d.ts.map +1 -1
package/resources/fine-tuning/index.js +11 -7
package/resources/fine-tuning/index.js.map +1 -1
package/resources/fine-tuning/index.mjs +2 -0
package/resources/fine-tuning/index.mjs.map +1 -1
package/resources/fine-tuning/jobs/checkpoints.d.ts +10 -0
package/resources/fine-tuning/jobs/checkpoints.d.ts.map +1 -1
package/resources/fine-tuning/jobs/checkpoints.js.map +1 -1
package/resources/fine-tuning/jobs/checkpoints.mjs.map +1 -1
package/resources/fine-tuning/jobs/jobs.d.ts +78 -145
package/resources/fine-tuning/jobs/jobs.d.ts.map +1 -1
package/resources/fine-tuning/jobs/jobs.js +48 -0
package/resources/fine-tuning/jobs/jobs.js.map +1 -1
package/resources/fine-tuning/jobs/jobs.mjs +48 -0
package/resources/fine-tuning/jobs/jobs.mjs.map +1 -1
package/resources/fine-tuning/methods.d.ts +120 -0
package/resources/fine-tuning/methods.d.ts.map +1 -0
package/resources/fine-tuning/methods.js +9 -0
package/resources/fine-tuning/methods.js.map +1 -0
package/resources/fine-tuning/methods.mjs +5 -0
package/resources/fine-tuning/methods.mjs.map +1 -0
package/resources/graders/grader-models.d.ts +234 -0
package/resources/graders/grader-models.d.ts.map +1 -0
package/resources/graders/grader-models.js +9 -0
package/resources/graders/grader-models.js.map +1 -0
package/resources/graders/grader-models.mjs +5 -0
package/resources/graders/grader-models.mjs.map +1 -0
package/resources/graders/graders.d.ts +10 -0
package/resources/graders/graders.d.ts.map +1 -0
package/resources/graders/graders.js +39 -0
package/resources/graders/graders.js.map +1 -0
package/resources/graders/graders.mjs +12 -0
package/resources/graders/graders.mjs.map +1 -0
package/resources/graders/index.d.ts +3 -0
package/resources/graders/index.d.ts.map +1 -0
package/resources/graders/index.js +9 -0
package/resources/graders/index.js.map +1 -0
package/resources/graders/index.mjs +4 -0
package/resources/graders/index.mjs.map +1 -0
package/resources/graders.d.ts +2 -0
package/resources/graders.d.ts.map +1 -0
package/resources/graders.js +19 -0
package/resources/graders.js.map +1 -0
package/resources/graders.mjs +3 -0
package/resources/graders.mjs.map +1 -0
package/resources/images.d.ts +22 -0
package/resources/images.d.ts.map +1 -1
package/resources/images.js +22 -0
package/resources/images.js.map +1 -1
package/resources/images.mjs +22 -0
package/resources/images.mjs.map +1 -1
package/resources/index.d.ts +2 -1
package/resources/index.d.ts.map +1 -1
package/resources/index.js +3 -1
package/resources/index.js.map +1 -1
package/resources/index.mjs +1 -0
package/resources/index.mjs.map +1 -1
package/resources/responses/input-items.d.ts +10 -0
package/resources/responses/input-items.d.ts.map +1 -1
package/resources/responses/input-items.js.map +1 -1
package/resources/responses/input-items.mjs.map +1 -1
package/resources/responses/responses.d.ts +22 -0
package/resources/responses/responses.d.ts.map +1 -1
package/resources/responses/responses.js +7 -0
package/resources/responses/responses.js.map +1 -1
package/resources/responses/responses.mjs +7 -0
package/resources/responses/responses.mjs.map +1 -1
package/resources/shared.d.ts +1 -1
package/resources/shared.d.ts.map +1 -1
package/src/index.ts +5 -6
package/src/resources/audio/speech.ts +12 -0
package/src/resources/audio/transcriptions.ts +43 -0
package/src/resources/audio/translations.ts +8 -0
package/src/resources/beta/assistants.ts +36 -0
package/src/resources/beta/realtime/sessions.ts +6 -0
package/src/resources/beta/realtime/transcription-sessions.ts +6 -0
package/src/resources/beta/threads/messages.ts +43 -0
package/src/resources/beta/threads/runs/runs.ts +52 -0
package/src/resources/beta/threads/runs/steps.ts +21 -0
package/src/resources/beta/threads/threads.ts +33 -0
package/src/resources/chat/completions/completions.ts +38 -0
package/src/resources/chat/completions/messages.ts +10 -0
package/src/resources/completions.ts +8 -0
package/src/resources/embeddings.ts +13 -3
package/src/resources/evals/evals.ts +194 -628
package/src/resources/evals/index.ts +0 -3
package/src/resources/evals/runs/runs.ts +69 -77
package/src/resources/fine-tuning/alpha/alpha.ts +27 -0
package/src/resources/fine-tuning/alpha/graders.ts +168 -0
package/src/resources/fine-tuning/alpha/index.ts +10 -0
package/src/resources/fine-tuning/alpha.ts +3 -0
package/src/resources/fine-tuning/checkpoints/permissions.ts +28 -0
package/src/resources/fine-tuning/fine-tuning.ts +28 -0
package/src/resources/fine-tuning/index.ts +10 -0
package/src/resources/fine-tuning/jobs/checkpoints.ts +10 -0
package/src/resources/fine-tuning/jobs/jobs.ts +84 -161
package/src/resources/fine-tuning/methods.ts +152 -0
package/src/resources/graders/grader-models.ts +296 -0
package/src/resources/graders/graders.ts +31 -0
package/src/resources/graders/index.ts +12 -0
package/src/resources/graders.ts +3 -0
package/src/resources/images.ts +22 -0
package/src/resources/index.ts +1 -3
package/src/resources/responses/input-items.ts +10 -0
package/src/resources/responses/responses.ts +22 -0
package/src/resources/shared.ts +1 -0
package/src/version.ts +1 -1
package/version.d.ts +1 -1
package/version.js +1 -1
package/version.mjs +1 -1

package/src/resources/fine-tuning/index.ts CHANGED Viewed

@@ -1,5 +1,6 @@
 // File generated from our OpenAPI spec by Stainless. See CONTRIBUTING.md for details.
+export { Alpha } from './alpha/index';
 export { Checkpoints } from './checkpoints/index';
 export { FineTuning } from './fine-tuning';
 export {
@@ -15,3 +16,12 @@ export {
   type JobListParams,
   type JobListEventsParams,
 } from './jobs/index';
+export {
+  Methods,
+  type DpoHyperparameters,
+  type DpoMethod,
+  type ReinforcementHyperparameters,
+  type ReinforcementMethod,
+  type SupervisedHyperparameters,
+  type SupervisedMethod,
+} from './methods';

package/src/resources/fine-tuning/jobs/checkpoints.ts CHANGED Viewed

@@ -8,6 +8,16 @@ import { CursorPage, type CursorPageParams } from '../../../pagination';
 export class Checkpoints extends APIResource {
   /**
    * List checkpoints for a fine-tuning job.
+   *
+   * @example
+   * ```ts
+   * // Automatically fetches more pages as needed.
+   * for await (const fineTuningJobCheckpoint of client.fineTuning.jobs.checkpoints.list(
+   *   'ft-AF1WoRqd3aJAHsqc9NY7iL8F',
+   * )) {
+   *   // ...
+   * }
+   * ```
    */
   list(
     fineTuningJobId: string,

package/src/resources/fine-tuning/jobs/jobs.ts CHANGED Viewed

@@ -3,6 +3,7 @@
 import { APIResource } from '../../../resource';
 import { isRequestOptions } from '../../../core';
 import * as Core from '../../../core';
+import * as MethodsAPI from '../methods';
 import * as CheckpointsAPI from './checkpoints';
 import {
   CheckpointListParams,
@@ -23,6 +24,14 @@ export class Jobs extends APIResource {
    * of the fine-tuned models once complete.
    *
    * [Learn more about fine-tuning](https://platform.openai.com/docs/guides/fine-tuning)
+   *
+   * @example
+   * ```ts
+   * const fineTuningJob = await client.fineTuning.jobs.create({
+   *   model: 'gpt-4o-mini',
+   *   training_file: 'file-abc123',
+   * });
+   * ```
    */
   create(body: JobCreateParams, options?: Core.RequestOptions): Core.APIPromise<FineTuningJob> {
     return this._client.post('/fine_tuning/jobs', { body, ...options });
@@ -32,6 +41,13 @@ export class Jobs extends APIResource {
    * Get info about a fine-tuning job.
    *
    * [Learn more about fine-tuning](https://platform.openai.com/docs/guides/fine-tuning)
+   *
+   * @example
+   * ```ts
+   * const fineTuningJob = await client.fineTuning.jobs.retrieve(
+   *   'ft-AF1WoRqd3aJAHsqc9NY7iL8F',
+   * );
+   * ```
    */
   retrieve(fineTuningJobId: string, options?: Core.RequestOptions): Core.APIPromise<FineTuningJob> {
     return this._client.get(`/fine_tuning/jobs/${fineTuningJobId}`, options);
@@ -39,6 +55,14 @@ export class Jobs extends APIResource {
   /**
    * List your organization's fine-tuning jobs
+   *
+   * @example
+   * ```ts
+   * // Automatically fetches more pages as needed.
+   * for await (const fineTuningJob of client.fineTuning.jobs.list()) {
+   *   // ...
+   * }
+   * ```
    */
   list(
     query?: JobListParams,
@@ -57,6 +81,13 @@ export class Jobs extends APIResource {
   /**
    * Immediately cancel a fine-tune job.
+   *
+   * @example
+   * ```ts
+   * const fineTuningJob = await client.fineTuning.jobs.cancel(
+   *   'ft-AF1WoRqd3aJAHsqc9NY7iL8F',
+   * );
+   * ```
    */
   cancel(fineTuningJobId: string, options?: Core.RequestOptions): Core.APIPromise<FineTuningJob> {
     return this._client.post(`/fine_tuning/jobs/${fineTuningJobId}/cancel`, options);
@@ -64,6 +95,16 @@ export class Jobs extends APIResource {
   /**
    * Get status updates for a fine-tuning job.
+   *
+   * @example
+   * ```ts
+   * // Automatically fetches more pages as needed.
+   * for await (const fineTuningJobEvent of client.fineTuning.jobs.listEvents(
+   *   'ft-AF1WoRqd3aJAHsqc9NY7iL8F',
+   * )) {
+   *   // ...
+   * }
+   * ```
    */
   listEvents(
     fineTuningJobId: string,
@@ -87,6 +128,34 @@ export class Jobs extends APIResource {
       ...options,
     });
   }
+  /**
+   * Pause a fine-tune job.
+   *
+   * @example
+   * ```ts
+   * const fineTuningJob = await client.fineTuning.jobs.pause(
+   *   'ft-AF1WoRqd3aJAHsqc9NY7iL8F',
+   * );
+   * ```
+   */
+  pause(fineTuningJobId: string, options?: Core.RequestOptions): Core.APIPromise<FineTuningJob> {
+    return this._client.post(`/fine_tuning/jobs/${fineTuningJobId}/pause`, options);
+  }
+  /**
+   * Resume a fine-tune job.
+   *
+   * @example
+   * ```ts
+   * const fineTuningJob = await client.fineTuning.jobs.resume(
+   *   'ft-AF1WoRqd3aJAHsqc9NY7iL8F',
+   * );
+   * ```
+   */
+  resume(fineTuningJobId: string, options?: Core.RequestOptions): Core.APIPromise<FineTuningJob> {
+    return this._client.post(`/fine_tuning/jobs/${fineTuningJobId}/resume`, options);
+  }
 }
 export class FineTuningJobsPage extends CursorPage<FineTuningJob> {}
@@ -233,7 +302,7 @@ export namespace FineTuningJob {
      * Number of examples in each batch. A larger batch size means that model
      * parameters are updated less frequently, but with lower variance.
      */
-    batch_size?: 'auto' | number;
+    batch_size?: unknown | 'auto' | number | null;
     /**
      * Scaling factor for the learning rate. A smaller learning rate may be useful to
@@ -253,97 +322,24 @@ export namespace FineTuningJob {
    */
   export interface Method {
     /**
-     * Configuration for the DPO fine-tuning method.
+     * The type of method. Is either `supervised`, `dpo`, or `reinforcement`.
      */
-    dpo?: Method.Dpo;
+    type: 'supervised' | 'dpo' | 'reinforcement';
     /**
-     * Configuration for the supervised fine-tuning method.
-     */
-    supervised?: Method.Supervised;
-    /**
-     * The type of method. Is either `supervised` or `dpo`.
+     * Configuration for the DPO fine-tuning method.
      */
-    type?: 'supervised' | 'dpo';
-  }
+    dpo?: MethodsAPI.DpoMethod;
-  export namespace Method {
     /**
-     * Configuration for the DPO fine-tuning method.
+     * Configuration for the reinforcement fine-tuning method.
      */
-    export interface Dpo {
-      /**
-       * The hyperparameters used for the fine-tuning job.
-       */
-      hyperparameters?: Dpo.Hyperparameters;
-    }
-    export namespace Dpo {
-      /**
-       * The hyperparameters used for the fine-tuning job.
-       */
-      export interface Hyperparameters {
-        /**
-         * Number of examples in each batch. A larger batch size means that model
-         * parameters are updated less frequently, but with lower variance.
-         */
-        batch_size?: 'auto' | number;
-        /**
-         * The beta value for the DPO method. A higher beta value will increase the weight
-         * of the penalty between the policy and reference model.
-         */
-        beta?: 'auto' | number;
-        /**
-         * Scaling factor for the learning rate. A smaller learning rate may be useful to
-         * avoid overfitting.
-         */
-        learning_rate_multiplier?: 'auto' | number;
-        /**
-         * The number of epochs to train the model for. An epoch refers to one full cycle
-         * through the training dataset.
-         */
-        n_epochs?: 'auto' | number;
-      }
-    }
+    reinforcement?: MethodsAPI.ReinforcementMethod;
     /**
      * Configuration for the supervised fine-tuning method.
      */
-    export interface Supervised {
-      /**
-       * The hyperparameters used for the fine-tuning job.
-       */
-      hyperparameters?: Supervised.Hyperparameters;
-    }
-    export namespace Supervised {
-      /**
-       * The hyperparameters used for the fine-tuning job.
-       */
-      export interface Hyperparameters {
-        /**
-         * Number of examples in each batch. A larger batch size means that model
-         * parameters are updated less frequently, but with lower variance.
-         */
-        batch_size?: 'auto' | number;
-        /**
-         * Scaling factor for the learning rate. A smaller learning rate may be useful to
-         * avoid overfitting.
-         */
-        learning_rate_multiplier?: 'auto' | number;
-        /**
-         * The number of epochs to train the model for. An epoch refers to one full cycle
-         * through the training dataset.
-         */
-        n_epochs?: 'auto' | number;
-      }
-    }
+    supervised?: MethodsAPI.SupervisedMethod;
   }
 }
@@ -597,97 +593,24 @@ export namespace JobCreateParams {
    */
   export interface Method {
     /**
-     * Configuration for the DPO fine-tuning method.
+     * The type of method. Is either `supervised`, `dpo`, or `reinforcement`.
      */
-    dpo?: Method.Dpo;
+    type: 'supervised' | 'dpo' | 'reinforcement';
     /**
-     * Configuration for the supervised fine-tuning method.
+     * Configuration for the DPO fine-tuning method.
      */
-    supervised?: Method.Supervised;
+    dpo?: MethodsAPI.DpoMethod;
     /**
-     * The type of method. Is either `supervised` or `dpo`.
+     * Configuration for the reinforcement fine-tuning method.
      */
-    type?: 'supervised' | 'dpo';
-  }
-  export namespace Method {
-    /**
-     * Configuration for the DPO fine-tuning method.
-     */
-    export interface Dpo {
-      /**
-       * The hyperparameters used for the fine-tuning job.
-       */
-      hyperparameters?: Dpo.Hyperparameters;
-    }
-    export namespace Dpo {
-      /**
-       * The hyperparameters used for the fine-tuning job.
-       */
-      export interface Hyperparameters {
-        /**
-         * Number of examples in each batch. A larger batch size means that model
-         * parameters are updated less frequently, but with lower variance.
-         */
-        batch_size?: 'auto' | number;
-        /**
-         * The beta value for the DPO method. A higher beta value will increase the weight
-         * of the penalty between the policy and reference model.
-         */
-        beta?: 'auto' | number;
-        /**
-         * Scaling factor for the learning rate. A smaller learning rate may be useful to
-         * avoid overfitting.
-         */
-        learning_rate_multiplier?: 'auto' | number;
-        /**
-         * The number of epochs to train the model for. An epoch refers to one full cycle
-         * through the training dataset.
-         */
-        n_epochs?: 'auto' | number;
-      }
-    }
+    reinforcement?: MethodsAPI.ReinforcementMethod;
     /**
      * Configuration for the supervised fine-tuning method.
      */
-    export interface Supervised {
-      /**
-       * The hyperparameters used for the fine-tuning job.
-       */
-      hyperparameters?: Supervised.Hyperparameters;
-    }
-    export namespace Supervised {
-      /**
-       * The hyperparameters used for the fine-tuning job.
-       */
-      export interface Hyperparameters {
-        /**
-         * Number of examples in each batch. A larger batch size means that model
-         * parameters are updated less frequently, but with lower variance.
-         */
-        batch_size?: 'auto' | number;
-        /**
-         * Scaling factor for the learning rate. A smaller learning rate may be useful to
-         * avoid overfitting.
-         */
-        learning_rate_multiplier?: 'auto' | number;
-        /**
-         * The number of epochs to train the model for. An epoch refers to one full cycle
-         * through the training dataset.
-         */
-        n_epochs?: 'auto' | number;
-      }
-    }
+    supervised?: MethodsAPI.SupervisedMethod;
   }
 }

package/src/resources/fine-tuning/methods.ts ADDED Viewed

@@ -0,0 +1,152 @@
+// File generated from our OpenAPI spec by Stainless. See CONTRIBUTING.md for details.
+import { APIResource } from '../../resource';
+import * as GraderModelsAPI from '../graders/grader-models';
+export class Methods extends APIResource {}
+/**
+ * The hyperparameters used for the DPO fine-tuning job.
+ */
+export interface DpoHyperparameters {
+  /**
+   * Number of examples in each batch. A larger batch size means that model
+   * parameters are updated less frequently, but with lower variance.
+   */
+  batch_size?: 'auto' | number;
+  /**
+   * The beta value for the DPO method. A higher beta value will increase the weight
+   * of the penalty between the policy and reference model.
+   */
+  beta?: 'auto' | number;
+  /**
+   * Scaling factor for the learning rate. A smaller learning rate may be useful to
+   * avoid overfitting.
+   */
+  learning_rate_multiplier?: 'auto' | number;
+  /**
+   * The number of epochs to train the model for. An epoch refers to one full cycle
+   * through the training dataset.
+   */
+  n_epochs?: 'auto' | number;
+}
+/**
+ * Configuration for the DPO fine-tuning method.
+ */
+export interface DpoMethod {
+  /**
+   * The hyperparameters used for the DPO fine-tuning job.
+   */
+  hyperparameters?: DpoHyperparameters;
+}
+/**
+ * The hyperparameters used for the reinforcement fine-tuning job.
+ */
+export interface ReinforcementHyperparameters {
+  /**
+   * Number of examples in each batch. A larger batch size means that model
+   * parameters are updated less frequently, but with lower variance.
+   */
+  batch_size?: 'auto' | number;
+  /**
+   * Multiplier on amount of compute used for exploring search space during training.
+   */
+  compute_multiplier?: 'auto' | number;
+  /**
+   * The number of training steps between evaluation runs.
+   */
+  eval_interval?: 'auto' | number;
+  /**
+   * Number of evaluation samples to generate per training step.
+   */
+  eval_samples?: 'auto' | number;
+  /**
+   * Scaling factor for the learning rate. A smaller learning rate may be useful to
+   * avoid overfitting.
+   */
+  learning_rate_multiplier?: 'auto' | number;
+  /**
+   * The number of epochs to train the model for. An epoch refers to one full cycle
+   * through the training dataset.
+   */
+  n_epochs?: 'auto' | number;
+  /**
+   * Level of reasoning effort.
+   */
+  reasoning_effort?: 'default' | 'low' | 'medium' | 'high';
+}
+/**
+ * Configuration for the reinforcement fine-tuning method.
+ */
+export interface ReinforcementMethod {
+  /**
+   * The grader used for the fine-tuning job.
+   */
+  grader:
+    | GraderModelsAPI.StringCheckGrader
+    | GraderModelsAPI.TextSimilarityGrader
+    | GraderModelsAPI.PythonGrader
+    | GraderModelsAPI.ScoreModelGrader
+    | GraderModelsAPI.MultiGrader;
+  /**
+   * The hyperparameters used for the reinforcement fine-tuning job.
+   */
+  hyperparameters?: ReinforcementHyperparameters;
+}
+/**
+ * The hyperparameters used for the fine-tuning job.
+ */
+export interface SupervisedHyperparameters {
+  /**
+   * Number of examples in each batch. A larger batch size means that model
+   * parameters are updated less frequently, but with lower variance.
+   */
+  batch_size?: 'auto' | number;
+  /**
+   * Scaling factor for the learning rate. A smaller learning rate may be useful to
+   * avoid overfitting.
+   */
+  learning_rate_multiplier?: 'auto' | number;
+  /**
+   * The number of epochs to train the model for. An epoch refers to one full cycle
+   * through the training dataset.
+   */
+  n_epochs?: 'auto' | number;
+}
+/**
+ * Configuration for the supervised fine-tuning method.
+ */
+export interface SupervisedMethod {
+  /**
+   * The hyperparameters used for the fine-tuning job.
+   */
+  hyperparameters?: SupervisedHyperparameters;
+}
+export declare namespace Methods {
+  export {
+    type DpoHyperparameters as DpoHyperparameters,
+    type DpoMethod as DpoMethod,
+    type ReinforcementHyperparameters as ReinforcementHyperparameters,
+    type ReinforcementMethod as ReinforcementMethod,
+    type SupervisedHyperparameters as SupervisedHyperparameters,
+    type SupervisedMethod as SupervisedMethod,
+  };
+}