npm - @huydao/karrot - Versions diffs - 0.1.4 → 0.1.6 - Mend

@huydao/karrot 0.1.4 → 0.1.6

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (9) hide show

package/dist/assertions/assertion.js +23 -22
package/dist/executors/execute.d.ts +3 -0
package/dist/executors/execute.js +1 -0
package/dist/executors/executor.d.ts +1 -0
package/dist/executors/executor.js +58 -17
package/dist/reports/report.js +54 -42
package/dist/scenarios/scenario.d.ts +1 -0
package/dist/utils/config.d.ts +1 -0
package/package.json +1 -1

package/dist/assertions/assertion.js CHANGED Viewed

@@ -225,7 +225,7 @@ function evaluateToolCallWithContentAssertion(assertion, logContent) {
         .filter((value) => typeof value === 'string')
         .map((value) => value.trim())
         .filter(Boolean);
-    const matchingToolCallIds = new Set();
+    const toolCallNamesById = new Map();
     const eventPayloadsByToolCallId = new Map();
     const parsedArgumentsByToolCallId = new Map();
     for (const rawLine of logContent.split('\n')) {
@@ -238,25 +238,23 @@ function evaluateToolCallWithContentAssertion(assertion, logContent) {
             if (!event.toolCallId) {
                 continue;
             }
-            if (event.toolCallName === expected.name) {
-                matchingToolCallIds.add(event.toolCallId);
+            eventPayloadsByToolCallId.set(event.toolCallId, [
+                ...(eventPayloadsByToolCallId.get(event.toolCallId) ?? []),
+                line,
+            ]);
+            if (typeof event.toolCallName === 'string' && event.toolCallName.trim()) {
+                toolCallNamesById.set(event.toolCallId, event.toolCallName.trim());
             }
-            if (matchingToolCallIds.has(event.toolCallId)) {
-                eventPayloadsByToolCallId.set(event.toolCallId, [
-                    ...(eventPayloadsByToolCallId.get(event.toolCallId) ?? []),
-                    line,
-                ]);
-                if (typeof event.arguments === 'string' && event.arguments.trim()) {
-                    try {
-                        const parsedArguments = JSON.parse(event.arguments);
-                        parsedArgumentsByToolCallId.set(event.toolCallId, [
-                            ...(parsedArgumentsByToolCallId.get(event.toolCallId) ?? []),
-                            parsedArguments,
-                        ]);
-                    }
-                    catch {
-                        // Ignore unparsable arguments and fall back to raw text matching.
-                    }
+            if (typeof event.arguments === 'string' && event.arguments.trim()) {
+                try {
+                    const parsedArguments = JSON.parse(event.arguments);
+                    parsedArgumentsByToolCallId.set(event.toolCallId, [
+                        ...(parsedArgumentsByToolCallId.get(event.toolCallId) ?? []),
+                        parsedArguments,
+                    ]);
+                }
+                catch {
+                    // Ignore unparsable arguments and fall back to raw text matching.
                 }
             }
         }
@@ -264,7 +262,10 @@ function evaluateToolCallWithContentAssertion(assertion, logContent) {
             continue;
         }
     }
-    if (matchingToolCallIds.size === 0) {
+    const matchingToolCallIds = [...toolCallNamesById.entries()]
+        .filter(([, toolCallName]) => toolCallName === expected.name)
+        .map(([toolCallId]) => toolCallId);
+    if (matchingToolCallIds.length === 0) {
         return {
             kind: assertion.kind,
             matcher: assertion.matcher,
@@ -274,12 +275,12 @@ function evaluateToolCallWithContentAssertion(assertion, logContent) {
             reason: `${buildNormalizedAssertionReason(assertion)} failed. Tool call "${expected.name}" was not found in the run log.`,
         };
     }
-    const combinedPayload = [...matchingToolCallIds]
+    const combinedPayload = matchingToolCallIds
         .flatMap((toolCallId) => eventPayloadsByToolCallId.get(toolCallId) ?? [])
         .join('\n');
     const missingTexts = expectedTexts.filter((text) => !combinedPayload.includes(text));
     const hasPropertiesMatch = expected.hasProperties === undefined ||
-        [...matchingToolCallIds].some((toolCallId) => (parsedArgumentsByToolCallId.get(toolCallId) ?? []).some((parsedArguments) => matchesExpectedProperties(parsedArguments, expected.hasProperties)));
+        matchingToolCallIds.some((toolCallId) => (parsedArgumentsByToolCallId.get(toolCallId) ?? []).some((parsedArguments) => matchesExpectedProperties(parsedArguments, expected.hasProperties)));
     const passed = missingTexts.length === 0 && hasPropertiesMatch;
     return {
         kind: assertion.kind,

package/dist/executors/execute.d.ts CHANGED Viewed

@@ -3,6 +3,9 @@ import { type ScenarioRunResult } from '../reports/report';
 type ExecuteOptions = {
     variables?: Record<string, unknown>;
     scenario: KarrotScenarioSelection;
+    execution?: {
+        concurrency?: number;
+    };
 };
 type ExecuteResult = {
     outputDirectory: string;

package/dist/executors/execute.js CHANGED Viewed

@@ -122,6 +122,7 @@ async function execute(configOrPath, options) {
             ? createAgUiRunner(resolvedConfig)
             : createAgUiPostRunner(resolvedConfig),
         stopOnFailure: resolvedConfig.execution?.stopOnFailure ?? false,
+        concurrency: options.execution?.concurrency ?? resolvedConfig.execution?.concurrency,
     });
     let reportPaths;
     if (resolvedConfig.report?.enabled !== false && resolvedConfig.report) {

package/dist/executors/executor.d.ts CHANGED Viewed

@@ -5,6 +5,7 @@ type BaseScenarioExecutionOptions = {
     env: NodeJS.ProcessEnv;
     outputDirectory: string;
     stopOnFailure?: boolean;
+    concurrency?: number;
     maxDurationMs?: number;
     initialThreadId?: string;
 };

package/dist/executors/executor.js CHANGED Viewed

@@ -10,6 +10,12 @@ function readPositiveTimeoutMs(value) {
     const parsed = Number(value);
     return Number.isFinite(parsed) && parsed > 0 ? parsed : undefined;
 }
+function normalizeConcurrency(value, totalScenarios) {
+    if (!Number.isFinite(value) || (value ?? 0) <= 1) {
+        return 1;
+    }
+    return Math.min(Math.floor(value), Math.max(1, totalScenarios));
+}
 function resolveTurnProcessTimeoutMs(options) {
     const envOverrideMs = readPositiveTimeoutMs(options.env.AI_TURN_TIMEOUT_MS);
     const requestedMs = typeof envOverrideMs === 'number'
@@ -95,6 +101,7 @@ async function runSingleScenario(scenario, context, env, outputDirectory, deadli
                     toolCalls: run.toolCalls,
                     env: turnEnv,
                     outputDirectory,
+                    outputPath: run.outputPath,
                 });
                 const failedAssertions = assertionResults.filter((assertion) => !assertion.passed);
                 const assertionFailureNote = failedAssertions.length > 0
@@ -126,7 +133,11 @@ async function runSingleScenario(scenario, context, env, outputDirectory, deadli
                 result.turns.push(turnResult);
                 turnRecorded = true;
                 if (assertionFailureNote) {
-                    throw new Error(assertionFailureNote);
+                    result.status = 'FAIL';
+                    result.note = [result.note, assertionFailureNote].filter(Boolean).join(' ') || undefined;
+                    if (!scenario.continueOnAssertionFailure) {
+                        throw new Error(assertionFailureNote);
+                    }
                 }
             }
             catch (error) {
@@ -173,31 +184,61 @@ async function runSingleScenario(scenario, context, env, outputDirectory, deadli
 }
 async function runScenario(scenario, options) {
     const scenarios = Array.isArray(scenario) ? scenario : [scenario];
-    const results = [];
     const shouldStopOnFailure = options.stopOnFailure ?? true;
     const deadlineAt = typeof options.maxDurationMs === 'number' ? Date.now() + options.maxDurationMs : undefined;
-    for (const currentScenario of scenarios) {
+    const concurrency = normalizeConcurrency(options.concurrency, scenarios.length);
+    const runScenarioAtIndex = async (currentScenario) => {
         try {
-            results.push(await runSingleScenario(currentScenario, options.context, options.env, options.outputDirectory, deadlineAt, options.messageRunner, options.initialThreadId));
+            return await runSingleScenario(currentScenario, options.context, options.env, options.outputDirectory, deadlineAt, options.messageRunner, concurrency === 1 ? options.initialThreadId : undefined);
         }
         catch (error) {
             if (error instanceof report_1.ScenarioExecutionError) {
-                results.push(error.result);
-            }
-            else {
-                results.push({
-                    id: currentScenario.id,
-                    name: currentScenario.name,
-                    status: 'FAIL',
-                    note: error instanceof Error ? error.message : String(error),
-                    turns: [],
-                    metrics: {},
-                });
+                return error.result;
             }
-            if (shouldStopOnFailure) {
+            return {
+                id: currentScenario.id,
+                name: currentScenario.name,
+                status: 'FAIL',
+                note: error instanceof Error ? error.message : String(error),
+                turns: [],
+                metrics: {},
+            };
+        }
+    };
+    if (concurrency === 1) {
+        const results = [];
+        for (const currentScenario of scenarios) {
+            const result = await runScenarioAtIndex(currentScenario);
+            results.push(result);
+            if (shouldStopOnFailure && result.status === 'FAIL') {
                 break;
             }
         }
+        return Array.isArray(scenario) ? results : results[0];
     }
-    return Array.isArray(scenario) ? results : results[0];
+    const results = new Array(scenarios.length);
+    let nextIndex = 0;
+    let stopScheduling = false;
+    const worker = async () => {
+        while (true) {
+            if (shouldStopOnFailure && stopScheduling) {
+                return;
+            }
+            const currentIndex = nextIndex;
+            nextIndex += 1;
+            if (currentIndex >= scenarios.length) {
+                return;
+            }
+            const result = await runScenarioAtIndex(scenarios[currentIndex]);
+            results[currentIndex] = result;
+            if (shouldStopOnFailure && result.status === 'FAIL') {
+                stopScheduling = true;
+            }
+        }
+    };
+    await Promise.all(Array.from({ length: concurrency }, async () => {
+        await worker();
+    }));
+    const completedResults = results.filter((result) => result != null);
+    return Array.isArray(scenario) ? completedResults : completedResults[0];
 }

package/dist/reports/report.js CHANGED Viewed

@@ -144,7 +144,7 @@ function renderAssertionExpected(expected) {
         return expected.length > 0 ? escapeHtml(expected.join(', ')) : '<span class="muted">[]</span>';
     }
     if (typeof expected === 'object' && expected !== null) {
-        return `<pre>${escapeHtml(stringifyAssertionExpected(expected))}</pre>`;
+        return `<pre class="assertion-expected-object">${escapeHtml(stringifyAssertionExpected(expected))}</pre>`;
     }
     return escapeHtml(expected);
 }
@@ -279,58 +279,70 @@ function buildScenarioRunHtml(payload) {
         '<meta name="viewport" content="width=device-width, initial-scale=1" />',
         `<title>${escapeHtml(`${payload.projectName} AI Scenario Report`)}</title>`,
         '<style>',
-        'body{margin:0;font-family:ui-sans-serif,system-ui,-apple-system,BlinkMacSystemFont,"Segoe UI",sans-serif;background:#f4f7fb;color:#142033;}',
-        '.page{max-width:1280px;margin:0 auto;padding:32px 24px 64px;}',
-        '.hero{background:linear-gradient(135deg,#0f172a,#1d4ed8);color:#fff;padding:28px;border-radius:20px;box-shadow:0 20px 50px rgba(15,23,42,.18);}',
-        '.hero h1{margin:0 0 8px;font-size:32px;}',
-        '.hero p{margin:4px 0;color:rgba(255,255,255,.88);}',
-        '.summary-grid{display:grid;grid-template-columns:repeat(auto-fit,minmax(170px,1fr));gap:14px;margin:22px 0 28px;}',
-        '.summary-card,.panel,.turn-card,.scenario-card{background:#fff;border:1px solid #dbe4f0;border-radius:18px;box-shadow:0 10px 30px rgba(15,23,42,.06);}',
-        '.summary-card{padding:18px;}',
-        '.summary-card .label{display:block;font-size:12px;text-transform:uppercase;letter-spacing:.08em;color:#5b6b84;margin-bottom:8px;}',
-        '.summary-card .value{font-size:28px;font-weight:700;}',
-        '.summary-card .sub{font-size:13px;color:#61728d;}',
-        '.panels{display:grid;grid-template-columns:repeat(auto-fit,minmax(280px,1fr));gap:16px;margin-bottom:28px;}',
-        '.panel{padding:18px;}',
-        '.panel h2{margin:0 0 12px;font-size:18px;}',
-        '.panel pre{margin:0;white-space:pre-wrap;word-break:break-word;background:#f8fbff;border-radius:12px;padding:14px;font-size:13px;}',
+        ':root{--ink:#0b1220;--text:#273247;--muted:#6f7b91;--line:#e3ebf5;--panel:#fff;--panel-soft:#f8fafd;--page:#eaf1f8;--blue:#2f63e5;--blue-dark:#153f9f;--green:#3f9a8f;--red:#dc3d4d;--amber:#b7791f;--shadow:0 14px 34px rgba(21,45,85,.08);}',
+        '*{box-sizing:border-box;}',
+        'body{margin:0;font-family:"Avenir Next","Nunito Sans",ui-sans-serif,system-ui,-apple-system,BlinkMacSystemFont,"Segoe UI",sans-serif;background:radial-gradient(circle at 8% -10%,rgba(47,99,229,.13),transparent 26rem),linear-gradient(180deg,#edf4fb 0%,var(--page) 100%);color:var(--text);font-size:15px;line-height:1.55;}',
+        '.page{max-width:1360px;margin:0 auto;padding:24px 18px 56px;}',
+        '.hero,.summary-card,.panel,.turn-card,.scenario-card{position:relative;background:var(--panel);border:1px solid #d8e3f0;border-radius:10px;box-shadow:var(--shadow);overflow:hidden;}',
+        '.hero::before,.summary-card::before,.panel::before,.turn-card::before,.scenario-card::before{content:"";position:absolute;inset:0 0 auto;height:4px;background:linear-gradient(90deg,#071326 0%,var(--blue) 78%,#4b7cff 100%);}',
+        '.hero{display:grid;grid-template-columns:minmax(0,1fr) auto;gap:18px;padding:26px 30px 24px;margin-bottom:22px;}',
+        '.hero h1{grid-column:1/-1;margin:0 0 2px;color:var(--ink);font-size:29px;line-height:1.16;font-weight:700;letter-spacing:-.02em;}',
+        '.hero p{margin:0;color:var(--muted);font-weight:700;}',
+        '.hero strong{color:var(--ink);font-weight:700;}',
+        '.summary-grid{display:grid;grid-template-columns:repeat(auto-fit,minmax(190px,1fr));gap:16px;margin:0 0 18px;}',
+        '.summary-card{padding:22px 22px 18px;min-height:124px;}',
+        '.summary-card .label,.score-card .label,.meta-label{display:block;font-size:11px;text-transform:uppercase;letter-spacing:.06em;color:var(--muted);font-weight:700;margin-bottom:8px;}',
+        '.summary-card .value{font-size:31px;line-height:1.06;font-weight:700;color:var(--ink);letter-spacing:-.025em;}',
+        '.summary-card .sub{margin-top:8px;font-size:14px;color:var(--muted);font-weight:700;}',
+        '.panels{display:grid;grid-template-columns:repeat(auto-fit,minmax(300px,1fr));gap:16px;margin-bottom:18px;}',
+        '.panel{padding:22px;}',
+        '.panel h2{margin:0 0 14px;color:var(--ink);font-size:17px;line-height:1.22;font-weight:700;letter-spacing:-.01em;}',
+        '.panel pre{margin:0;white-space:pre-wrap;word-break:break-word;background:var(--panel-soft);border:1px solid #edf2f8;border-radius:6px;padding:14px;font-size:13px;color:#334155;}',
         '.scenario-list{display:grid;gap:18px;}',
-        '.scenario-card summary{list-style:none;display:flex;gap:12px;align-items:center;justify-content:space-between;padding:18px 20px;cursor:pointer;}',
+        '.scenario-card summary{list-style:none;display:grid;grid-template-columns:minmax(0,1fr) auto minmax(160px,36%);gap:14px;align-items:center;padding:20px 24px 18px;cursor:pointer;}',
         '.scenario-card summary::-webkit-details-marker{display:none;}',
-        '.scenario-title{font-weight:700;font-size:18px;flex:1;}',
-        '.summary-note{color:#61728d;font-size:14px;max-width:40%;text-align:right;}',
-        '.scenario-body{padding:0 20px 20px;}',
-        '.meta-grid{display:grid;grid-template-columns:repeat(auto-fit,minmax(220px,1fr));gap:12px;margin:8px 0 18px;}',
-        '.meta-grid>div{background:#f8fbff;border-radius:12px;padding:12px;}',
-        '.meta-label{display:block;font-size:12px;color:#61728d;text-transform:uppercase;letter-spacing:.08em;margin-bottom:6px;}',
-        '.turn-card{padding:18px;margin-top:16px;}',
-        '.turn-card h4,.content-block h5{margin:0 0 10px;}',
+        '.scenario-title{font-weight:700;font-size:17px;color:var(--ink);letter-spacing:-.01em;overflow-wrap:anywhere;}',
+        '.summary-note{color:var(--muted);font-size:14px;font-weight:400;text-align:right;overflow-wrap:anywhere;}',
+        '.scenario-body{padding:0 24px 24px;}',
+        '.meta-grid{display:grid;grid-template-columns:repeat(auto-fit,minmax(230px,1fr));gap:12px;margin:8px 0 18px;}',
+        '.meta-grid>div{background:var(--panel-soft);border:1px solid #edf2f8;border-radius:6px;padding:13px 14px;}',
+        '.turn-card{padding:22px;margin-top:16px;border-radius:8px;box-shadow:0 10px 24px rgba(21,45,85,.06);}',
+        '.turn-card h4{margin:0 0 14px;color:var(--ink);font-size:16px;font-weight:700;letter-spacing:0;}',
         '.content-block{margin-top:14px;}',
-        '.content-block pre{margin:0;white-space:pre-wrap;word-break:break-word;background:#f8fbff;border-radius:12px;padding:14px;max-height:420px;overflow:auto;}',
-        '.content-block p{margin:0;background:#f8fbff;border-radius:12px;padding:14px;}',
-        '.assertions,.evaluations{width:100%;border-collapse:collapse;font-size:14px;}',
+        '.content-block h5{margin:0 0 8px;color:var(--ink);font-size:12px;text-transform:uppercase;letter-spacing:.06em;font-weight:700;}',
+        '.content-block pre,.content-block p{margin:0;background:var(--panel-soft);border:1px solid #edf2f8;border-radius:6px;padding:14px;}',
+        '.content-block pre{white-space:pre-wrap;word-break:break-word;max-height:420px;overflow:auto;color:#29364b;}',
+        '.assertions,.evaluations{width:100%;border-collapse:separate;border-spacing:0 8px;font-size:14px;}',
         '.assertions{table-layout:fixed;}',
-        '.assertions th,.assertions td,.evaluations th,.evaluations td{padding:10px 12px;border-bottom:1px solid #e5edf7;vertical-align:top;text-align:left;}',
-        '.assertions th,.evaluations th{font-size:12px;text-transform:uppercase;letter-spacing:.08em;color:#61728d;}',
+        '.assertions th,.assertions td,.evaluations th,.evaluations td{padding:10px 12px;vertical-align:top;text-align:left;}',
+        '.assertions th,.evaluations th{font-size:11px;text-transform:uppercase;letter-spacing:.06em;color:var(--muted);font-weight:700;}',
+        '.assertions tbody tr,.evaluations tbody tr{background:var(--panel-soft);}',
+        '.assertions tbody td,.evaluations tbody td{border-top:1px solid #edf2f8;border-bottom:1px solid #edf2f8;}',
+        '.assertions tbody td:first-child,.evaluations tbody td:first-child{border-left:1px solid #edf2f8;border-radius:6px 0 0 6px;}',
+        '.assertions tbody td:last-child,.evaluations tbody td:last-child{border-right:1px solid #edf2f8;border-radius:0 6px 6px 0;}',
+        '.assertions td{word-break:break-word;overflow-wrap:anywhere;}',
         '.assertions th:nth-child(1),.assertions td:nth-child(1){width:8%;}',
         '.assertions th:nth-child(2),.assertions td:nth-child(2){width:12%;}',
         '.assertions th:nth-child(3),.assertions td:nth-child(3){width:34%;}',
         '.assertions th:nth-child(4),.assertions td:nth-child(4){width:16%;}',
         '.assertions th:nth-child(5),.assertions td:nth-child(5){width:30%;}',
-        '.badge{display:inline-flex;align-items:center;justify-content:center;border-radius:999px;padding:5px 10px;font-size:12px;font-weight:700;min-width:56px;}',
-        '.badge.pass{background:#dcfce7;color:#166534;}',
-        '.badge.fail{background:#fee2e2;color:#991b1b;}',
-        '.badge.skip{background:#e2e8f0;color:#334155;}',
-        '.dimension-chip{display:inline-flex;align-items:center;justify-content:center;border-radius:999px;padding:4px 10px;margin:0 6px 6px 0;background:#eef2ff;color:#3730a3;font-size:12px;font-weight:600;}',
+        '.assertions .assertion-expected-object{margin:0;white-space:pre-wrap;word-break:break-word;overflow-wrap:anywhere;background:#fff;border:1px solid #e5edf7;border-radius:6px;padding:12px;font-size:12px;line-height:1.45;max-height:none;overflow:visible;}',
+        '.badge{display:inline-flex;align-items:center;justify-content:center;border-radius:999px;padding:5px 11px;font-size:12px;font-weight:900;min-width:58px;letter-spacing:.02em;}',
+        '.badge.pass{background:#e4f8ef;color:#157347;}',
+        '.badge.fail{background:#ffe8eb;color:#b42332;}',
+        '.badge.skip{background:#edf2f7;color:#4a5568;}',
+        '.scenario-card.pass::before{background:linear-gradient(90deg,#071326 0%,#22a06b 100%);}',
+        '.scenario-card.fail::before{background:linear-gradient(90deg,#071326 0%,var(--red) 100%);}',
+        '.scenario-card.skip::before{background:linear-gradient(90deg,#071326 0%,#8a94a6 100%);}',
+        '.dimension-chip{display:inline-flex;align-items:center;justify-content:center;border-radius:999px;padding:5px 11px;margin:0 6px 6px 0;background:#eef4ff;color:var(--blue);font-size:12px;font-weight:900;}',
         '.score-grid{display:grid;grid-template-columns:repeat(auto-fit,minmax(160px,1fr));gap:12px;}',
-        '.score-card{background:#f8fbff;border-radius:12px;padding:14px;}',
-        '.score-card .label{display:block;font-size:12px;color:#61728d;text-transform:uppercase;letter-spacing:.08em;margin-bottom:8px;}',
-        '.score-card .value{font-size:24px;font-weight:700;}',
-        '.score-pill{display:inline-flex;align-items:center;justify-content:center;border-radius:999px;padding:4px 10px;background:#dbeafe;color:#1d4ed8;font-weight:700;min-width:58px;}',
-        '.muted{color:#7c8ba1;}',
+        '.score-card{background:var(--panel-soft);border:1px solid #edf2f8;border-radius:6px;padding:14px;}',
+        '.score-card .value{font-size:23px;font-weight:700;color:var(--ink);letter-spacing:-.015em;}',
+        '.score-pill{display:inline-flex;align-items:center;justify-content:center;border-radius:999px;padding:5px 11px;background:#e8f0ff;color:var(--blue);font-weight:900;min-width:58px;}',
+        '.muted{color:#8a95a8;}',
         'code{font-family:ui-monospace,SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono",monospace;font-size:12px;word-break:break-all;}',
-        '.footer{margin-top:28px;color:#61728d;font-size:13px;}',
-        '@media (max-width:900px){.scenario-card summary{flex-direction:column;align-items:flex-start;}.summary-note{max-width:none;text-align:left;}}',
+        '.footer{margin:24px 4px 0;color:var(--muted);font-size:13px;font-weight:700;}',
+        '@media (max-width:900px){.hero{display:block;padding:24px 20px;}.hero p{margin-top:6px;}.scenario-card summary{grid-template-columns:1fr;align-items:start;}.summary-note{text-align:left;}.page{padding:14px 10px 40px;}.assertions,.evaluations{display:block;overflow-x:auto;white-space:normal;}.summary-card .value{font-size:30px;}}',
         '</style>',
         '</head>',
         '<body>',

package/dist/scenarios/scenario.d.ts CHANGED Viewed

@@ -51,6 +51,7 @@ export type AiTurn<TContext extends BaseAiScenarioContext = BaseAiScenarioContex
 export type AiScenario<TContext extends BaseAiScenarioContext = BaseAiScenarioContext> = {
     id: string;
     name: string;
+    continueOnAssertionFailure?: boolean;
     turns: AiTurn<TContext>[];
 };
 export declare class AiScenarioSet<TContext extends BaseAiScenarioContext = BaseAiScenarioContext> {

package/dist/utils/config.d.ts CHANGED Viewed

@@ -79,6 +79,7 @@ export type KarrotConfig = {
     };
     execution?: {
         stopOnFailure?: boolean;
+        concurrency?: number;
     };
     evaluation?: {
         systemPromptPath?: string;

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@huydao/karrot",
-  "version": "0.1.4",
+  "version": "0.1.6",
   "description": "Reusable AI scenario execution, assertion, evaluation, and reporting toolkit",
   "license": "ISC",
   "type": "commonjs",