npm - @elizaos/training - Versions diffs - 2.0.0-alpha.13 → 2.0.0-alpha.15 - Mend

@elizaos/training 2.0.0-alpha.13 → 2.0.0-alpha.15

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (87) hide show

package/package.json +2 -2
package/research-output/training-runs/training-run-1773726941205.json +38 -0
package/scripts/rank_trajectories.ts +0 -1
package/scripts/run_task_benchmark.ts +4 -11
package/src/adapter.ts +96 -49
package/src/archetypes/ArchetypeConfigService.ts +188 -185
package/src/archetypes/derive-archetype.ts +47 -47
package/src/archetypes/index.ts +2 -2
package/src/benchmark/ArchetypeMatchupBenchmark.ts +70 -70
package/src/benchmark/BenchmarkChartGenerator.ts +70 -69
package/src/benchmark/BenchmarkDataGenerator.ts +136 -136
package/src/benchmark/BenchmarkDataViewer.ts +32 -30
package/src/benchmark/BenchmarkHistoryService.ts +13 -12
package/src/benchmark/BenchmarkRunner.ts +87 -83
package/src/benchmark/BenchmarkValidator.ts +48 -46
package/src/benchmark/FastEvalRunner.ts +17 -16
package/src/benchmark/MetricsValidator.ts +20 -21
package/src/benchmark/MetricsVisualizer.ts +92 -85
package/src/benchmark/ModelBenchmarkService.ts +90 -82
package/src/benchmark/ModelRegistry.ts +44 -44
package/src/benchmark/RulerBenchmarkIntegration.ts +24 -24
package/src/benchmark/SimulationA2AInterface.ts +118 -118
package/src/benchmark/SimulationEngine.ts +51 -51
package/src/benchmark/TaskRunner.ts +87 -79
package/src/benchmark/__tests__/BenchmarkRunner.test.ts +80 -80
package/src/benchmark/__tests__/HeadToHead.test.ts +26 -26
package/src/benchmark/index.ts +27 -27
package/src/benchmark/parseSimulationMetrics.ts +32 -32
package/src/benchmark/simulation-types.ts +10 -10
package/src/dependencies.ts +34 -34
package/src/generation/TrajectoryGenerator.ts +39 -37
package/src/generation/index.ts +1 -1
package/src/huggingface/HuggingFaceDatasetUploader.ts +72 -72
package/src/huggingface/HuggingFaceIntegrationService.ts +59 -53
package/src/huggingface/HuggingFaceModelUploader.ts +60 -59
package/src/huggingface/index.ts +6 -6
package/src/huggingface/shared/HuggingFaceUploadUtil.ts +32 -32
package/src/index.ts +27 -27
package/src/init-training.ts +6 -6
package/src/metrics/TrajectoryMetricsExtractor.ts +70 -71
package/src/metrics/__tests__/TrajectoryMetricsExtractor.test.ts +182 -182
package/src/metrics/index.ts +2 -2
package/src/rubrics/__tests__/index.test.ts +73 -73
package/src/rubrics/ass-kisser.ts +6 -6
package/src/rubrics/degen.ts +6 -6
package/src/rubrics/goody-twoshoes.ts +6 -6
package/src/rubrics/index.ts +50 -50
package/src/rubrics/information-trader.ts +6 -6
package/src/rubrics/infosec.ts +6 -6
package/src/rubrics/liar.ts +6 -6
package/src/rubrics/perps-trader.ts +6 -6
package/src/rubrics/researcher.ts +6 -6
package/src/rubrics/scammer.ts +6 -6
package/src/rubrics/social-butterfly.ts +7 -7
package/src/rubrics/super-predictor.ts +6 -6
package/src/rubrics/trader.ts +5 -5
package/src/scoring/ArchetypeScoringService.ts +56 -54
package/src/scoring/JudgePromptBuilder.ts +96 -96
package/src/scoring/LLMJudgeCache.ts +26 -23
package/src/scoring/index.ts +3 -3
package/src/training/AutomationPipeline.ts +149 -140
package/src/training/BenchmarkService.ts +49 -45
package/src/training/ConfigValidator.ts +38 -32
package/src/training/MarketOutcomesTracker.ts +22 -12
package/src/training/ModelDeployer.ts +15 -15
package/src/training/ModelFetcher.ts +7 -7
package/src/training/ModelSelectionService.ts +32 -32
package/src/training/ModelUsageVerifier.ts +31 -24
package/src/training/MultiModelOrchestrator.ts +44 -44
package/src/training/RLModelConfig.ts +57 -57
package/src/training/RewardBackpropagationService.ts +18 -17
package/src/training/RulerScoringService.ts +73 -72
package/src/training/TrainingMonitor.ts +29 -29
package/src/training/TrajectoryRecorder.ts +25 -27
package/src/training/__tests__/TrajectoryRecorder.test.ts +105 -105
package/src/training/index.ts +36 -36
package/src/training/logRLConfig.ts +7 -7
package/src/training/pipeline.ts +13 -16
package/src/training/storage/ModelStorageService.ts +32 -32
package/src/training/storage/TrainingDataArchiver.ts +21 -21
package/src/training/storage/index.ts +2 -2
package/src/training/types.ts +6 -6
package/src/training/window-utils.ts +14 -14
package/src/utils/index.ts +7 -7
package/src/utils/logger.ts +5 -5
package/src/utils/snowflake.ts +1 -1
package/src/utils/synthetic-detector.ts +7 -7

package/src/generation/TrajectoryGenerator.ts CHANGED Viewed

@@ -9,16 +9,16 @@
  * @packageDocumentation
  */
-import { getTrainingDataAdapter } from '../adapter';
-import type { IAgentRuntimeLike, UserLike } from '../dependencies';
-import { ArchetypeConfigService } from '../archetypes/ArchetypeConfigService';
+import { getTrainingDataAdapter } from "../adapter";
+import { ArchetypeConfigService } from "../archetypes/ArchetypeConfigService";
+import type { IAgentRuntimeLike, UserLike } from "../dependencies";
 import {
   areAgentDependenciesConfigured,
   getAgentRuntimeManager,
   getAgentService,
   getAutonomousCoordinator,
-} from '../dependencies';
-import { logger } from '../utils/logger';
+} from "../dependencies";
+import { logger } from "../utils/logger";
 export interface ParallelGenerationConfig {
   // Agent configuration
@@ -58,7 +58,7 @@ export interface ParallelGenerationResult {
 function ensureDependencies(): void {
   if (!areAgentDependenciesConfigured()) {
     throw new Error(
-      'Training dependencies not configured. Call configureTrainingDependencies() with agentService, agentRuntimeManager, and autonomousCoordinator first.'
+      "Training dependencies not configured. Call configureTrainingDependencies() with agentService, agentRuntimeManager, and autonomousCoordinator first.",
     );
   }
 }
@@ -68,7 +68,8 @@ function ensureDependencies(): void {
  */
 export class TrajectoryGenerator {
   private config: ParallelGenerationConfig;
-  private agents: Map<string, { user: UserLike; archetype: string }> = new Map();
+  private agents: Map<string, { user: UserLike; archetype: string }> =
+    new Map();
   constructor(config: ParallelGenerationConfig) {
     this.config = {
@@ -86,12 +87,12 @@ export class TrajectoryGenerator {
     const agentService = getAgentService();
     logger.info(
-      'Creating archetype-based agents...',
+      "Creating archetype-based agents...",
       {
         archetypes: this.config.archetypes,
         perArchetype: this.config.agentsPerArchetype,
       },
-      'TrajectoryGenerator'
+      "TrajectoryGenerator",
     );
     for (const archetype of this.config.archetypes) {
@@ -115,10 +116,10 @@ export class TrajectoryGenerator {
         // Disable A2A to allow offline training without localhost server
         await getTrainingDataAdapter().updateAgentConfig(agent.id, {
           autonomousTrading: archetypeConfig.actionWeights.trade > 0.3,
-          autonomousPosting: archetypeConfig.postFrequency !== 'low',
+          autonomousPosting: archetypeConfig.postFrequency !== "low",
           autonomousCommenting:
-            archetypeConfig.engagementStyle === 'helpful' ||
-            archetypeConfig.engagementStyle === 'analytical',
+            archetypeConfig.engagementStyle === "helpful" ||
+            archetypeConfig.engagementStyle === "analytical",
           autonomousDMs: archetypeConfig.dmActivity,
           autonomousGroupChats: archetypeConfig.groupChatActivity,
           maxActionsPerTick: 5,
@@ -131,7 +132,7 @@ export class TrajectoryGenerator {
         logger.info(
           `Created ${archetype} agent: ${agent.username}`,
           {},
-          'TrajectoryGenerator'
+          "TrajectoryGenerator",
         );
       }
     }
@@ -139,7 +140,7 @@ export class TrajectoryGenerator {
     logger.info(
       `Created ${this.agents.size} agents total`,
       {},
-      'TrajectoryGenerator'
+      "TrajectoryGenerator",
     );
   }
@@ -171,7 +172,7 @@ export class TrajectoryGenerator {
         logger.warn(
           `Runtime creation returned null for ${agentId}, skipping`,
           {},
-          'TrajectoryGenerator'
+          "TrajectoryGenerator",
         );
         return;
       }
@@ -179,44 +180,44 @@ export class TrajectoryGenerator {
       // Apply archetype configuration to runtime character if available
       const archetypeConfig = ArchetypeConfigService.getConfig(
-        agentInfo.archetype
+        agentInfo.archetype,
       );
       const character = runtime.character as
         | { name?: string; bio?: string | string[]; topics?: string[] }
         | undefined;
       if (character) {
         character.name = archetypeConfig.name;
-        character.bio = archetypeConfig.bio.join(' ');
+        character.bio = archetypeConfig.bio.join(" ");
         if (!character.topics) {
           character.topics = [];
         }
         // Add archetype-specific topics
-        if (archetypeConfig.preferredMarkets.includes('perpetual')) {
-          character.topics.push('perpetual_trading', 'leverage');
+        if (archetypeConfig.preferredMarkets.includes("perpetual")) {
+          character.topics.push("perpetual_trading", "leverage");
         }
-        if (archetypeConfig.preferredMarkets.includes('prediction')) {
-          character.topics.push('prediction_markets', 'forecasting');
+        if (archetypeConfig.preferredMarkets.includes("prediction")) {
+          character.topics.push("prediction_markets", "forecasting");
         }
       }
       // Run ticks for this agent
       for (let tick = 0; tick < this.config.ticksPerAgent; tick++) {
         logger.debug(
-          `Agent ${agentInfo.user.username} - Tick ${tick + 1}/${this.config.ticksPerAgent}`
+          `Agent ${agentInfo.user.username} - Tick ${tick + 1}/${this.config.ticksPerAgent}`,
         );
         // Execute autonomous tick with trajectory recording
         const result = await autonomousCoordinator.executeAutonomousTick(
           agentId,
           runtime,
-          true // Enable trajectory recording
+          true, // Enable trajectory recording
         );
         if (result.trajectoryId) {
           trajectoryIds.push(result.trajectoryId);
           logger.debug(
-            `Recorded trajectory ${result.trajectoryId} for ${agentInfo.user.username}`
+            `Recorded trajectory ${result.trajectoryId} for ${agentInfo.user.username}`,
           );
         }
@@ -230,19 +231,19 @@ export class TrajectoryGenerator {
           trajectories: trajectoryIds.length,
           archetype: agentInfo.archetype,
         },
-        'TrajectoryGenerator'
+        "TrajectoryGenerator",
       );
     });
     // Wait for all agents in batch to complete
     await Promise.allSettled(promises).then((results) => {
       for (const result of results) {
-        if (result.status === 'rejected') {
+        if (result.status === "rejected") {
           const errorMsg = `Agent batch error: ${result.reason instanceof Error ? result.reason.message : String(result.reason)}`;
           logger.error(
             errorMsg,
             { error: result.reason },
-            'TrajectoryGenerator'
+            "TrajectoryGenerator",
           );
           errors.push(errorMsg);
         }
@@ -288,15 +289,15 @@ export class TrajectoryGenerator {
     }
     logger.info(
-      'Starting parallel trajectory generation',
+      "Starting parallel trajectory generation",
       {
         totalAgents: this.agents.size,
         parallelBatches: Math.ceil(
-          this.agents.size / this.config.parallelAgents
+          this.agents.size / this.config.parallelAgents,
         ),
         ticksPerAgent: this.config.ticksPerAgent,
       },
-      'TrajectoryGenerator'
+      "TrajectoryGenerator",
     );
     // Process agents in parallel batches
@@ -309,7 +310,7 @@ export class TrajectoryGenerator {
         {
           agents: batch.length,
         },
-        'TrajectoryGenerator'
+        "TrajectoryGenerator",
       );
       const batchResult = await this.runParallelBatch(batch);
@@ -321,7 +322,8 @@ export class TrajectoryGenerator {
     // Calculate stats
     for (const trajId of result.trajectoryIds) {
       // Get trajectory to determine archetype
-      const trajectory = await getTrainingDataAdapter().getTrajectoryById(trajId);
+      const trajectory =
+        await getTrainingDataAdapter().getTrajectoryById(trajId);
       if (trajectory) {
         const agentInfo = this.agents.get(trajectory.agentId);
@@ -344,7 +346,7 @@ export class TrajectoryGenerator {
     result.duration = Date.now() - startTime;
     logger.info(
-      'Parallel generation complete',
+      "Parallel generation complete",
       {
         agents: result.agentsCreated.length,
         trajectories: result.trajectoryIds.length,
@@ -352,7 +354,7 @@ export class TrajectoryGenerator {
         durationSeconds: result.duration / 1000,
         errors: result.errors.length,
       },
-      'TrajectoryGenerator'
+      "TrajectoryGenerator",
     );
     return result;
@@ -365,7 +367,7 @@ export class TrajectoryGenerator {
     logger.info(
       `Cleaning up ${this.agents.size} agents...`,
       {},
-      'TrajectoryGenerator'
+      "TrajectoryGenerator",
     );
     const adapter = getTrainingDataAdapter();
@@ -373,7 +375,7 @@ export class TrajectoryGenerator {
       await adapter.deleteUser(agentId);
     }
-    logger.info('Cleanup complete', {}, 'TrajectoryGenerator');
+    logger.info("Cleanup complete", {}, "TrajectoryGenerator");
   }
 }
@@ -381,7 +383,7 @@ export class TrajectoryGenerator {
  * Factory function for creating parallel generator
  */
 export async function createParallelGenerator(
-  config: ParallelGenerationConfig
+  config: ParallelGenerationConfig,
 ): Promise<TrajectoryGenerator> {
   return new TrajectoryGenerator(config);
 }

package/src/generation/index.ts CHANGED Viewed

@@ -9,4 +9,4 @@ export {
   type ParallelGenerationConfig,
   type ParallelGenerationResult,
   TrajectoryGenerator,
-} from './TrajectoryGenerator';
+} from "./TrajectoryGenerator";

package/src/huggingface/HuggingFaceDatasetUploader.ts CHANGED Viewed

@@ -5,15 +5,15 @@
  * Creates dataset cards with visualizations, metrics, and usage examples.
  */
-import { promises as fs } from 'fs';
-import * as path from 'path';
-import type { SimulationMetrics } from '../benchmark/SimulationEngine';
-import { calculateArrayStats, logger } from '../utils';
+import { promises as fs } from "node:fs";
+import * as path from "node:path";
+import type { SimulationMetrics } from "../benchmark/SimulationEngine";
+import { calculateArrayStats, logger } from "../utils";
 import {
   getHuggingFaceToken,
   HuggingFaceUploadUtil,
   requireHuggingFaceToken,
-} from './shared/HuggingFaceUploadUtil';
+} from "./shared/HuggingFaceUploadUtil";
 export interface BenchmarkRecord {
   benchmarkId: string;
@@ -71,7 +71,7 @@ export class HuggingFaceDatasetUploader {
    */
   async uploadDataset(options: UploadOptions): Promise<UploadResult> {
     try {
-      logger.info('Starting HuggingFace dataset upload', {
+      logger.info("Starting HuggingFace dataset upload", {
         datasetName: options.datasetName,
       });
@@ -82,57 +82,57 @@ export class HuggingFaceDatasetUploader {
       // Set defaults
       const version = options.version || this.generateVersion();
       const benchmarkDir =
-        options.benchmarkDir || path.join(process.cwd(), 'benchmarks');
+        options.benchmarkDir || path.join(process.cwd(), "benchmarks");
       const outputDir =
         options.outputDir ||
-        path.join(process.cwd(), 'exports', 'huggingface', version);
+        path.join(process.cwd(), "exports", "huggingface", version);
       // Step 1: Collect benchmark data
-      logger.info('Collecting benchmark data', { benchmarkDir });
+      logger.info("Collecting benchmark data", { benchmarkDir });
       const benchmarks = await this.collectBenchmarkData(benchmarkDir);
       logger.info(`Collected ${benchmarks.length} benchmark records`);
       if (benchmarks.length === 0) {
-        throw new Error('No benchmark data found to upload');
+        throw new Error("No benchmark data found to upload");
       }
       // Step 2: Prepare dataset files
-      logger.info('Preparing dataset files', { outputDir });
+      logger.info("Preparing dataset files", { outputDir });
       await fs.mkdir(outputDir, { recursive: true });
       const metadata = await this.prepareDatasetFiles(benchmarks, outputDir, {
         datasetName: options.datasetName,
         version,
         description:
-          options.description || 'Autonomous agent benchmark results',
+          options.description || "Autonomous agent benchmark results",
       });
       // Step 3: Generate dataset card
-      logger.info('Generating dataset card');
+      logger.info("Generating dataset card");
       await this.generateDatasetCard(metadata, benchmarks, outputDir);
       // Step 4: Create repository if it doesn't exist
-      logger.info('Ensuring repository exists', {
+      logger.info("Ensuring repository exists", {
         datasetName: options.datasetName,
       });
       await this.ensureRepository(
         options.datasetName,
-        options.private ?? false
+        options.private ?? false,
       );
       // Step 5: Upload to HuggingFace
-      logger.info('Uploading to HuggingFace', {
+      logger.info("Uploading to HuggingFace", {
         datasetName: options.datasetName,
       });
       const filesUploaded = await this.uploadToHub(
         options.datasetName,
         outputDir,
-        options.private ?? false
+        options.private ?? false,
       );
       const datasetUrl = `https://huggingface.co/datasets/${options.datasetName}`;
-      logger.info('Dataset uploaded successfully', {
+      logger.info("Dataset uploaded successfully", {
         datasetUrl,
         filesUploaded,
       });
@@ -144,12 +144,12 @@ export class HuggingFaceDatasetUploader {
         filesUploaded,
       };
     } catch (error) {
-      logger.error('Failed to upload dataset', { error });
+      logger.error("Failed to upload dataset", { error });
       return {
         success: false,
-        version: options.version || 'unknown',
+        version: options.version || "unknown",
         filesUploaded: 0,
-        error: error instanceof Error ? error.message : 'Unknown error',
+        error: error instanceof Error ? error.message : "Unknown error",
       };
     }
   }
@@ -158,22 +158,22 @@ export class HuggingFaceDatasetUploader {
    * Collect benchmark data from files
    */
   private async collectBenchmarkData(
-    benchmarkDir: string
+    benchmarkDir: string,
   ): Promise<BenchmarkRecord[]> {
     const records: BenchmarkRecord[] = [];
     // Collect from model-comparison directory
-    const comparisonDir = path.join(benchmarkDir, 'model-comparison');
+    const comparisonDir = path.join(benchmarkDir, "model-comparison");
     if (await this.fileExists(comparisonDir)) {
-      const comparisonFile = path.join(comparisonDir, 'comparison.json');
+      const comparisonFile = path.join(comparisonDir, "comparison.json");
       if (await this.fileExists(comparisonFile)) {
-        const data = JSON.parse(await fs.readFile(comparisonFile, 'utf-8'));
+        const data = JSON.parse(await fs.readFile(comparisonFile, "utf-8"));
         for (const result of data.results || []) {
           if (result.metrics) {
             records.push({
-              benchmarkId: data.benchmark || 'comparison',
+              benchmarkId: data.benchmark || "comparison",
               modelId: result.model.modelId,
-              modelVersion: 'baseline',
+              modelVersion: "baseline",
               modelName: result.model.displayName,
               runAt: data.runAt,
               metrics: result.metrics,
@@ -182,7 +182,7 @@ export class HuggingFaceDatasetUploader {
                 tickInterval: 60,
                 markets: 10,
                 ticks: Math.floor(
-                  (result.metrics.timing?.totalDuration || 0) / 60
+                  (result.metrics.timing?.totalDuration || 0) / 60,
                 ),
               },
             });
@@ -192,13 +192,13 @@ export class HuggingFaceDatasetUploader {
     }
     // Collect from baselines directory
-    const baselinesDir = path.join(benchmarkDir, 'baselines');
+    const baselinesDir = path.join(benchmarkDir, "baselines");
     if (await this.fileExists(baselinesDir)) {
       const files = await fs.readdir(baselinesDir);
       for (const file of files) {
-        if (file.endsWith('.json') && file.startsWith('baseline-')) {
+        if (file.endsWith(".json") && file.startsWith("baseline-")) {
           const filePath = path.join(baselinesDir, file);
-          const data = JSON.parse(await fs.readFile(filePath, 'utf-8'));
+          const data = JSON.parse(await fs.readFile(filePath, "utf-8"));
           // Skip if no metrics
           if (!data.metrics) continue;
@@ -207,13 +207,13 @@ export class HuggingFaceDatasetUploader {
             benchmarkId:
               data.benchmark?.id ||
               data.benchmark?.path ||
-              file.replace('.json', ''),
-            modelId: data.model?.modelId || 'unknown',
-            modelVersion: data.model?.version || 'baseline',
+              file.replace(".json", ""),
+            modelId: data.model?.modelId || "unknown",
+            modelVersion: data.model?.version || "baseline",
             modelName:
               data.model?.displayName ||
               data.model?.name ||
-              file.replace('.json', ''),
+              file.replace(".json", ""),
             runAt: data.runAt || new Date().toISOString(),
             metrics: data.metrics,
             benchmarkSnapshot: {
@@ -226,7 +226,7 @@ export class HuggingFaceDatasetUploader {
               ticks: Math.floor(
                 (data.timing?.totalDuration ||
                   data.metrics.timing?.totalDuration ||
-                  0) / 60
+                  0) / 60,
               ),
             },
           });
@@ -235,21 +235,21 @@ export class HuggingFaceDatasetUploader {
     }
     // Collect from test-baselines directory
-    const testBaselinesDir = path.join(benchmarkDir, 'test-baselines');
+    const testBaselinesDir = path.join(benchmarkDir, "test-baselines");
     if (await this.fileExists(testBaselinesDir)) {
       const subdirs = await fs.readdir(testBaselinesDir);
       for (const subdir of subdirs) {
-        const metricsFile = path.join(testBaselinesDir, subdir, 'metrics.json');
+        const metricsFile = path.join(testBaselinesDir, subdir, "metrics.json");
         if (await this.fileExists(metricsFile)) {
-          const data = JSON.parse(await fs.readFile(metricsFile, 'utf-8'));
+          const data = JSON.parse(await fs.readFile(metricsFile, "utf-8"));
           // Skip if no required fields
           if (!data.totalPnl && !data.predictionMetrics) continue;
           records.push({
-            benchmarkId: data.benchmarkId || 'test-benchmark',
+            benchmarkId: data.benchmarkId || "test-benchmark",
             modelId: subdir,
-            modelVersion: 'test-baseline',
+            modelVersion: "test-baseline",
             modelName: subdir,
             runAt: data.runAt || new Date().toISOString(),
             metrics: data,
@@ -273,11 +273,11 @@ export class HuggingFaceDatasetUploader {
   private async prepareDatasetFiles(
     benchmarks: BenchmarkRecord[],
     outputDir: string,
-    options: { datasetName: string; version: string; description: string }
+    options: { datasetName: string; version: string; description: string },
   ): Promise<DatasetMetadata> {
     // Create data.jsonl with all benchmark records
-    const jsonlPath = path.join(outputDir, 'data.jsonl');
-    const jsonlLines = benchmarks.map((b) => JSON.stringify(b)).join('\n');
+    const jsonlPath = path.join(outputDir, "data.jsonl");
+    const jsonlLines = benchmarks.map((b) => JSON.stringify(b)).join("\n");
     await fs.writeFile(jsonlPath, jsonlLines);
     // Create metadata.json
@@ -289,15 +289,15 @@ export class HuggingFaceDatasetUploader {
       totalBenchmarks: benchmarks.length,
       models: Array.from(new Set(benchmarks.map((b) => b.modelName))),
       benchmarkTypes: Array.from(new Set(benchmarks.map((b) => b.benchmarkId))),
-      license: 'MIT',
+      license: "MIT",
     };
-    const metadataPath = path.join(outputDir, 'metadata.json');
+    const metadataPath = path.join(outputDir, "metadata.json");
     await fs.writeFile(metadataPath, JSON.stringify(metadata, null, 2));
     // Create summary statistics
     const summary = this.calculateSummaryStatistics(benchmarks);
-    const summaryPath = path.join(outputDir, 'summary.json');
+    const summaryPath = path.join(outputDir, "summary.json");
     await fs.writeFile(summaryPath, JSON.stringify(summary, null, 2));
     return metadata;
@@ -309,14 +309,14 @@ export class HuggingFaceDatasetUploader {
   private async generateDatasetCard(
     metadata: DatasetMetadata,
     benchmarks: BenchmarkRecord[],
-    outputDir: string
+    outputDir: string,
   ): Promise<void> {
     const summary = this.calculateSummaryStatistics(benchmarks);
-    const brandName = process.env.TRAINING_BRAND_NAME || 'ElizaOS';
-    const brandOrg = process.env.TRAINING_BRAND_ORG || 'ElizaOS Contributors';
+    const brandName = process.env.TRAINING_BRAND_NAME || "ElizaOS";
+    const brandOrg = process.env.TRAINING_BRAND_ORG || "ElizaOS Contributors";
     const platformName =
-      process.env.TRAINING_PLATFORM_NAME || 'ElizaOS-compatible runtimes';
-    const brandTag = brandName.toLowerCase().replace(/\s+/g, '-');
+      process.env.TRAINING_PLATFORM_NAME || "ElizaOS-compatible runtimes";
+    const brandTag = brandName.toLowerCase().replace(/\s+/g, "-");
     const card = `---
 license: ${metadata.license}
@@ -435,7 +435,7 @@ print(model_performance.sort_values('metrics.totalPnl', ascending=False))
 If you use this dataset in your research, please cite:
 \`\`\`bibtex
-@dataset{${brandTag}_benchmarks_${metadata.version.replace(/\./g, '_')},
+@dataset{${brandTag}_benchmarks_${metadata.version.replace(/\./g, "_")},
   title = {${brandName} Agent Benchmarks},
   author = {${brandOrg}},
   year = {${new Date().getFullYear()}},
@@ -453,7 +453,7 @@ ${metadata.license}
 For questions or issues, please open an issue on the repository.
 `;
-    const cardPath = path.join(outputDir, 'README.md');
+    const cardPath = path.join(outputDir, "README.md");
     await fs.writeFile(cardPath, card);
   }
@@ -494,8 +494,8 @@ For questions or issues, please open an issue on the repository.
       }))
       .sort((a, b) => b.avgPnl - a.avgPnl);
-    let table = '| Rank | Model | Avg P&L | Accuracy | Optimality | Runs |\n';
-    table += '|------|-------|---------|----------|------------|------|\n';
+    let table = "| Rank | Model | Avg P&L | Accuracy | Optimality | Runs |\n";
+    table += "|------|-------|---------|----------|------------|------|\n";
     leaderboard.forEach((entry, index) => {
       table += `| ${index + 1} | ${entry.model} | ${entry.avgPnl.toFixed(2)} | ${(entry.avgAccuracy * 100).toFixed(1)}% | ${entry.avgOptimality.toFixed(1)} | ${entry.runs} |\n`;
@@ -553,17 +553,17 @@ For questions or issues, please open an issue on the repository.
    */
   private async ensureRepository(
     datasetName: string,
-    isPrivate: boolean
+    isPrivate: boolean,
   ): Promise<void> {
     if (!this.huggingFaceToken) {
-      throw new Error('HuggingFace token not configured');
+      throw new Error("HuggingFace token not configured");
     }
     await HuggingFaceUploadUtil.ensureRepository(
       datasetName,
-      'dataset',
+      "dataset",
       this.huggingFaceToken,
-      isPrivate
+      isPrivate,
     );
   }
@@ -574,38 +574,38 @@ For questions or issues, please open an issue on the repository.
   private async uploadToHub(
     datasetName: string,
     localDir: string,
-    _isPrivate: boolean
+    _isPrivate: boolean,
   ): Promise<number> {
     if (!this.huggingFaceToken) {
-      throw new Error('HuggingFace token not configured');
+      throw new Error("HuggingFace token not configured");
     }
     try {
       // Use shared upload utility
       const { HuggingFaceUploadUtil } = await import(
-        './shared/HuggingFaceUploadUtil'
+        "./shared/HuggingFaceUploadUtil"
       );
       return await HuggingFaceUploadUtil.uploadDirectory(
         datasetName,
-        'dataset',
+        "dataset",
         localDir,
-        this.huggingFaceToken
+        this.huggingFaceToken,
       );
     } catch (error) {
-      logger.error('Failed to upload to HuggingFace Hub', { error });
+      logger.error("Failed to upload to HuggingFace Hub", { error });
       // Provide helpful manual upload instructions
       const { HuggingFaceUploadUtil } = await import(
-        './shared/HuggingFaceUploadUtil'
+        "./shared/HuggingFaceUploadUtil"
       );
       const instructions = HuggingFaceUploadUtil.getManualUploadInstructions(
         datasetName,
-        'dataset',
-        localDir
+        "dataset",
+        localDir,
       );
-      logger.info('To upload manually:', { instructions });
+      logger.info("To upload manually:", { instructions });
       throw error;
     }
@@ -617,8 +617,8 @@ For questions or issues, please open an issue on the repository.
   private generateVersion(): string {
     const now = new Date();
     const year = now.getFullYear();
-    const month = String(now.getMonth() + 1).padStart(2, '0');
-    const day = String(now.getDate()).padStart(2, '0');
+    const month = String(now.getMonth() + 1).padStart(2, "0");
+    const day = String(now.getDate()).padStart(2, "0");
     return `${year}.${month}.${day}`;
   }