npm - @wix/evalforge-types - Versions diffs - 0.35.0 → 0.36.0 - Mend

@wix/evalforge-types 0.35.0 → 0.36.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (9) hide show

package/build/index.js +36 -1
package/build/index.js.map +2 -2
package/build/index.mjs +34 -1
package/build/index.mjs.map +2 -2
package/build/types/assertion/assertion.d.ts +26 -0
package/build/types/assertion/system-assertions.d.ts +1 -0
package/build/types/scenario/assertions.d.ts +12 -0
package/build/types/scenario/test-scenario.d.ts +9 -0
package/package.json +2 -2

package/build/index.js CHANGED Viewed

@@ -1025,6 +1025,8 @@ __export(index_exports, {
   TestSuiteSchema: () => TestSuiteSchema,
   TestType: () => TestType,
   TestTypeSchema: () => TestTypeSchema,
+  TimeAssertionSchema: () => TimeAssertionSchema,
+  TimeConfigSchema: () => TimeConfigSchema,
   TokenUsageSchema: () => TokenUsageSchema,
   ToolTestSchema: () => ToolTestSchema,
   TriggerMetadataSchema: () => TriggerMetadataSchema,
@@ -1482,9 +1484,15 @@ var LlmJudgeAssertionSchema = import_zod20.z.object({
   maxTokens: import_zod20.z.number().int().optional(),
   temperature: import_zod20.z.number().min(0).max(1).optional()
 });
+var TimeAssertionSchema = import_zod20.z.object({
+  type: import_zod20.z.literal("time_limit"),
+  /** Maximum allowed duration in milliseconds */
+  maxDurationMs: import_zod20.z.number().int().positive()
+});
 var AssertionSchema = import_zod20.z.union([
   SkillWasCalledAssertionSchema,
   BuildPassedAssertionSchema,
+  TimeAssertionSchema,
   LlmJudgeAssertionSchema
 ]);
@@ -1530,6 +1538,7 @@ var import_zod22 = require("zod");
 var AssertionTypeSchema = import_zod22.z.enum([
   "skill_was_called",
   "build_passed",
+  "time_limit",
   "llm_judge"
 ]);
 var AssertionParameterTypeSchema = import_zod22.z.enum([
@@ -1570,6 +1579,10 @@ var BuildPassedConfigSchema = import_zod22.z.strictObject({
   /** Expected exit code (default: 0) */
   expectedExitCode: import_zod22.z.number().int().optional()
 });
+var TimeConfigSchema = import_zod22.z.strictObject({
+  /** Maximum allowed duration in milliseconds */
+  maxDurationMs: import_zod22.z.number().int().positive()
+});
 var LlmJudgeConfigSchema = import_zod22.z.object({
   /**
    * Prompt template with placeholders:
@@ -1599,7 +1612,9 @@ var AssertionConfigSchema = import_zod22.z.union([
   LlmJudgeConfigSchema,
   // requires prompt - check first
   SkillWasCalledConfigSchema,
-  // requires skillName
+  // requires skillNames
+  TimeConfigSchema,
+  // requires maxDurationMs, uses strictObject
   BuildPassedConfigSchema,
   // all optional, uses strictObject to reject unknown keys
   import_zod22.z.object({})
@@ -1624,6 +1639,8 @@ function validateAssertionConfig(type, config) {
       return SkillWasCalledConfigSchema.safeParse(config).success;
     case "build_passed":
       return BuildPassedConfigSchema.safeParse(config).success;
+    case "time_limit":
+      return TimeConfigSchema.safeParse(config).success;
     case "llm_judge":
       return LlmJudgeConfigSchema.safeParse(config).success;
     default:
@@ -2127,6 +2144,7 @@ var UpdateTemplateInputSchema = CreateTemplateInputSchema.partial();
 var SYSTEM_ASSERTION_IDS = {
   SKILL_WAS_CALLED: "system:skill_was_called",
   BUILD_PASSED: "system:build_passed",
+  TIME_LIMIT: "system:time_limit",
   LLM_JUDGE: "system:llm_judge"
 };
 function isSystemAssertionId(id) {
@@ -2183,6 +2201,21 @@ var SYSTEM_ASSERTIONS = {
       }
     ]
   },
+  [SYSTEM_ASSERTION_IDS.TIME_LIMIT]: {
+    id: SYSTEM_ASSERTION_IDS.TIME_LIMIT,
+    name: "Time Limit",
+    description: "Check that the scenario completed within a maximum duration",
+    type: "time_limit",
+    parameters: [
+      {
+        name: "maxDurationMs",
+        label: "Max Duration (ms)",
+        type: "number",
+        required: true,
+        defaultValue: 3e5
+      }
+    ]
+  },
   [SYSTEM_ASSERTION_IDS.LLM_JUDGE]: {
     id: SYSTEM_ASSERTION_IDS.LLM_JUDGE,
     name: "LLM Judge",
@@ -2344,6 +2377,8 @@ function getSystemAssertion(id) {
   TestSuiteSchema,
   TestType,
   TestTypeSchema,
+  TimeAssertionSchema,
+  TimeConfigSchema,
   TokenUsageSchema,
   ToolTestSchema,
   TriggerMetadataSchema,