npm - @langfuse/client - Versions diffs - 4.1.0-alpha.0 → 4.1.0-alpha.2 - Mend

@langfuse/client 4.1.0-alpha.0 → 4.1.0-alpha.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (7) hide show

package/dist/index.cjs CHANGED Viewed

@@ -39,7 +39,7 @@ __export(index_exports, {
   PromptManager: () => PromptManager,
   ScoreManager: () => ScoreManager,
   TextPromptClient: () => TextPromptClient,
-  autoevalsToLangfuseEvaluator: () => autoevalsToLangfuseEvaluator
+  createEvaluatorFromAutoevals: () => createEvaluatorFromAutoevals
 });
 module.exports = __toCommonJS(index_exports);
@@ -302,19 +302,31 @@ var ExperimentManager = class {
     const itemResults = [];
     for (let i = 0; i < data.length; i += batchSize) {
       const batch = data.slice(i, i + batchSize);
-      const promises = batch.map(
-        async (item) => {
-          return this.runItem({
-            item,
-            evaluators,
-            task,
-            experimentName: name,
-            experimentDescription: description,
-            experimentMetadata: metadata
-          });
-        }
+      const promises = batch.map(async (item) => {
+        return this.runItem({
+          item,
+          evaluators,
+          task,
+          experimentName: name,
+          experimentDescription: description,
+          experimentMetadata: metadata
+        });
+      });
+      const settledResults = await Promise.allSettled(promises);
+      const results = settledResults.reduce(
+        (acc, settledResult) => {
+          if (settledResult.status === "fulfilled") {
+            acc.push(settledResult.value);
+          } else {
+            const errorMessage = settledResult.reason instanceof Error ? settledResult.reason.message : String(settledResult.reason);
+            this.logger.error(
+              `Task failed with error: ${errorMessage}. Skipping item.`
+            );
+          }
+          return acc;
+        },
+        []
       );
-      const results = await Promise.all(promises);
       itemResults.push(...results);
     }
     const datasetRunId = itemResults.length > 0 ? itemResults[0].datasetRunId : void 0;
@@ -355,6 +367,7 @@ var ExperimentManager = class {
     return {
       itemResults,
       datasetRunId,
+      datasetRunUrl,
       runEvaluations,
       prettyPrint: async (options) => {
         var _a;
@@ -365,7 +378,7 @@ var ExperimentManager = class {
           runEvaluations,
           name: config.name,
           description: config.description,
-          includeItemResults: (_a = options == null ? void 0 : options.includeItemResults) != null ? _a : true
+          includeItemResults: (_a = options == null ? void 0 : options.includeItemResults) != null ? _a : false
         });
       }
     };
@@ -395,14 +408,24 @@ var ExperimentManager = class {
    * @internal
    */
   async runItem(params) {
-    const { item, evaluators = [], task } = params;
+    const { item, evaluators = [], task, experimentMetadata = {} } = params;
     const { output, traceId } = await (0, import_tracing.startActiveObservation)(
       "experiment-item-run",
       async (span) => {
+        var _a;
         const output2 = await task(item);
         span.update({
           input: item.input,
-          output: output2
+          output: output2,
+          metadata: {
+            experimentName: params.experimentName,
+            ...experimentMetadata,
+            ...(_a = item.metadata) != null ? _a : {},
+            ..."id" in item && "datasetId" in item ? {
+              dataset_id: item["datasetId"],
+              dataset_item_id: item["id"]
+            } : {}
+          }
         });
         return { output: output2, traceId: span.traceId };
       }
@@ -465,7 +488,8 @@ ${JSON.stringify(params2)}
       output,
       evaluations: evals,
       traceId,
-      datasetRunId
+      datasetRunId,
+      item
     };
   }
   /**
@@ -486,7 +510,7 @@ ${JSON.stringify(params2)}
    * @param params.runEvaluations - Results from run-level evaluators
    * @param params.name - Name of the experiment
    * @param params.description - Optional description of the experiment
-   * @param params.includeItemResults - Whether to include individual item details (default: true)
+   * @param params.includeItemResults - Whether to include individual item details (default: false)
    *
    * @returns Promise resolving to formatted string representation
    *
@@ -536,7 +560,7 @@ ${JSON.stringify(params2)}
       runEvaluations,
       name,
       description,
-      includeItemResults = true
+      includeItemResults = false
     } = params;
     if (itemResults.length === 0) {
       return "No experiment results to display.";
@@ -1870,7 +1894,7 @@ var LangfuseClient = class {
 };
 // src/experiment/adapters.ts
-function autoevalsToLangfuseEvaluator(autoevalEvaluator, params) {
+function createEvaluatorFromAutoevals(autoevalEvaluator, params) {
   const langfuseEvaluator = async (langfuseEvaluatorParams) => {
     var _a;
     const score = await autoevalEvaluator({
@@ -1898,6 +1922,6 @@ function autoevalsToLangfuseEvaluator(autoevalEvaluator, params) {
   PromptManager,
   ScoreManager,
   TextPromptClient,
-  autoevalsToLangfuseEvaluator
+  createEvaluatorFromAutoevals
 });
 //# sourceMappingURL=index.cjs.map