npm - @yasserkhanorg/e2e-agents - Versions diffs - 1.8.5 → 1.10.0 - Mend

@yasserkhanorg/e2e-agents 1.8.5 → 1.10.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (274) hide show

package/README.md +95 -8
package/dist/adapters/cypress.d.ts +10 -0
package/dist/adapters/cypress.d.ts.map +1 -0
package/dist/adapters/cypress.js +86 -0
package/dist/adapters/framework_adapter.d.ts +41 -0
package/dist/adapters/framework_adapter.d.ts.map +1 -0
package/dist/adapters/framework_adapter.js +152 -0
package/dist/adapters/playwright.d.ts +10 -0
package/dist/adapters/playwright.d.ts.map +1 -0
package/dist/adapters/playwright.js +86 -0
package/dist/adapters/pytest.d.ts +10 -0
package/dist/adapters/pytest.d.ts.map +1 -0
package/dist/adapters/pytest.js +96 -0
package/dist/adapters/supertest.d.ts +12 -0
package/dist/adapters/supertest.d.ts.map +1 -0
package/dist/adapters/supertest.js +85 -0
package/dist/agent/config.d.ts +1 -1
package/dist/agent/config.d.ts.map +1 -1
package/dist/agent/git.d.ts +1 -0
package/dist/agent/git.d.ts.map +1 -1
package/dist/agent/git.js +3 -0
package/dist/agentic/fix_loop.d.ts.map +1 -1
package/dist/agentic/fix_loop.js +5 -4
package/dist/agentic/runner.d.ts +2 -0
package/dist/agentic/runner.d.ts.map +1 -1
package/dist/agentic/runner.js +15 -12
package/dist/agents/cross-impact.d.ts.map +1 -1
package/dist/agents/cross-impact.js +6 -1
package/dist/agents/executor.d.ts.map +1 -1
package/dist/agents/executor.js +6 -1
package/dist/agents/strategist.d.ts.map +1 -1
package/dist/agents/strategist.js +6 -1
package/dist/agents/test-designer.d.ts.map +1 -1
package/dist/agents/test-designer.js +6 -1
package/dist/anthropic_provider.d.ts.map +1 -1
package/dist/anthropic_provider.js +1 -0
package/dist/base_provider.d.ts +56 -0
package/dist/base_provider.d.ts.map +1 -1
package/dist/base_provider.js +123 -1
package/dist/budget_ledger.d.ts +28 -0
package/dist/budget_ledger.d.ts.map +1 -0
package/dist/budget_ledger.js +62 -0
package/dist/cache/cached_provider.d.ts +45 -0
package/dist/cache/cached_provider.d.ts.map +1 -0
package/dist/cache/cached_provider.js +88 -0
package/dist/cache/response_cache.d.ts +79 -0
package/dist/cache/response_cache.d.ts.map +1 -0
package/dist/cache/response_cache.js +177 -0
package/dist/cli/commands/bootstrap.d.ts +3 -0
package/dist/cli/commands/bootstrap.d.ts.map +1 -0
package/dist/cli/commands/bootstrap.js +109 -0
package/dist/cli/commands/cost_report.d.ts +3 -0
package/dist/cli/commands/cost_report.d.ts.map +1 -0
package/dist/cli/commands/cost_report.js +115 -0
package/dist/cli/commands/crew.d.ts.map +1 -1
package/dist/cli/commands/crew.js +118 -1
package/dist/cli/commands/gate.d.ts +3 -0
package/dist/cli/commands/gate.d.ts.map +1 -0
package/dist/cli/commands/gate.js +86 -0
package/dist/cli/commands/init.d.ts.map +1 -1
package/dist/cli/commands/init.js +7 -62
package/dist/cli/commands/train.d.ts.map +1 -1
package/dist/cli/commands/train.js +16 -21
package/dist/cli/defaults.d.ts +35 -0
package/dist/cli/defaults.d.ts.map +1 -0
package/dist/cli/defaults.js +125 -0
package/dist/cli/errors.d.ts +27 -0
package/dist/cli/errors.d.ts.map +1 -0
package/dist/cli/errors.js +57 -0
package/dist/cli/parse_args.d.ts.map +1 -1
package/dist/cli/parse_args.js +24 -2
package/dist/cli/types.d.ts +7 -1
package/dist/cli/types.d.ts.map +1 -1
package/dist/cli.js +47 -2
package/dist/crew/context.d.ts +15 -0
package/dist/crew/context.d.ts.map +1 -1
package/dist/crew/orchestrator.d.ts +14 -0
package/dist/crew/orchestrator.d.ts.map +1 -1
package/dist/crew/orchestrator.js +162 -4
package/dist/crew/protocol.d.ts +13 -0
package/dist/crew/protocol.d.ts.map +1 -1
package/dist/crew/provider.d.ts +15 -1
package/dist/crew/provider.d.ts.map +1 -1
package/dist/crew/provider.js +24 -4
package/dist/custom_provider.d.ts.map +1 -1
package/dist/custom_provider.js +1 -0
package/dist/engine/diff_loader.d.ts.map +1 -1
package/dist/engine/diff_loader.js +3 -14
package/dist/engine/impact_engine.d.ts.map +1 -1
package/dist/engine/impact_engine.js +9 -23
package/dist/esm/adapters/cypress.js +49 -0
package/dist/esm/adapters/framework_adapter.js +114 -0
package/dist/esm/adapters/playwright.js +49 -0
package/dist/esm/adapters/pytest.js +59 -0
package/dist/esm/adapters/supertest.js +48 -0
package/dist/esm/agent/git.js +3 -1
package/dist/esm/agentic/fix_loop.js +5 -4
package/dist/esm/agentic/runner.js +15 -12
package/dist/esm/agents/cross-impact.js +6 -1
package/dist/esm/agents/executor.js +6 -1
package/dist/esm/agents/strategist.js +6 -1
package/dist/esm/agents/test-designer.js +6 -1
package/dist/esm/anthropic_provider.js +1 -0
package/dist/esm/base_provider.js +121 -0
package/dist/esm/budget_ledger.js +58 -0
package/dist/esm/cache/cached_provider.js +82 -0
package/dist/esm/cache/response_cache.js +140 -0
package/dist/esm/cli/commands/bootstrap.js +106 -0
package/dist/esm/cli/commands/cost_report.js +112 -0
package/dist/esm/cli/commands/crew.js +118 -1
package/dist/esm/cli/commands/gate.js +83 -0
package/dist/esm/cli/commands/init.js +3 -58
package/dist/esm/cli/commands/train.js +16 -21
package/dist/esm/cli/defaults.js +118 -0
package/dist/esm/cli/errors.js +52 -0
package/dist/esm/cli/parse_args.js +24 -2
package/dist/esm/cli.js +47 -2
package/dist/esm/crew/orchestrator.js +162 -4
package/dist/esm/crew/provider.js +24 -4
package/dist/esm/custom_provider.js +1 -0
package/dist/esm/engine/diff_loader.js +1 -12
package/dist/esm/engine/impact_engine.js +9 -23
package/dist/esm/index.js +21 -0
package/dist/esm/knowledge/api_surface.js +265 -34
package/dist/esm/knowledge/cluster_utils.js +60 -0
package/dist/esm/knowledge/failure_history.js +121 -0
package/dist/esm/knowledge/kg_bridge.js +381 -0
package/dist/esm/knowledge/kg_types.js +3 -0
package/dist/esm/knowledge/route_families.js +119 -0
package/dist/esm/mcp-server.js +2 -4
package/dist/esm/metrics/prometheus.js +149 -0
package/dist/esm/model_router.js +59 -0
package/dist/esm/ollama_provider.js +1 -0
package/dist/esm/openai_provider.js +1 -0
package/dist/esm/pipeline/orchestrator.js +6 -12
package/dist/esm/pipeline/stage0_preprocess.js +12 -19
package/dist/esm/pipeline/stage1_impact.js +19 -3
package/dist/esm/pipeline/stage2_coverage.js +29 -7
package/dist/esm/pipeline/stage3_generation.js +21 -1
package/dist/esm/progress.js +112 -0
package/dist/esm/prompts/coverage.js +17 -24
package/dist/esm/prompts/cross-impact.js +3 -21
package/dist/esm/prompts/generation.js +201 -45
package/dist/esm/prompts/generation_profile.js +147 -0
package/dist/esm/prompts/heal.js +33 -15
package/dist/esm/prompts/impact.js +3 -22
package/dist/esm/prompts/json_extract.js +36 -0
package/dist/esm/prompts/strategist.js +2 -20
package/dist/esm/prompts/test-designer.js +6 -21
package/dist/esm/provider_factory.js +6 -4
package/dist/esm/reporters/junit.js +86 -0
package/dist/esm/reporters/reporter.js +3 -0
package/dist/esm/reporters/sarif.js +131 -0
package/dist/esm/resilience/circuit_breaker.js +78 -0
package/dist/esm/resilience/retry.js +56 -0
package/dist/esm/sanitize.js +66 -0
package/dist/esm/training/kg_scanner.js +115 -0
package/dist/esm/training/scanner.js +27 -34
package/dist/esm/validation/guardrails.js +5 -0
package/dist/esm/version.js +33 -0
package/dist/index.d.ts +21 -1
package/dist/index.d.ts.map +1 -1
package/dist/index.js +45 -1
package/dist/knowledge/api_surface.d.ts +12 -0
package/dist/knowledge/api_surface.d.ts.map +1 -1
package/dist/knowledge/api_surface.js +268 -34
package/dist/knowledge/cluster_utils.d.ts +28 -0
package/dist/knowledge/cluster_utils.d.ts.map +1 -0
package/dist/knowledge/cluster_utils.js +67 -0
package/dist/knowledge/failure_history.d.ts +39 -0
package/dist/knowledge/failure_history.d.ts.map +1 -0
package/dist/knowledge/failure_history.js +128 -0
package/dist/knowledge/kg_bridge.d.ts +31 -0
package/dist/knowledge/kg_bridge.d.ts.map +1 -0
package/dist/knowledge/kg_bridge.js +388 -0
package/dist/knowledge/kg_types.d.ts +75 -0
package/dist/knowledge/kg_types.d.ts.map +1 -0
package/dist/knowledge/kg_types.js +4 -0
package/dist/knowledge/route_families.d.ts +29 -0
package/dist/knowledge/route_families.d.ts.map +1 -1
package/dist/knowledge/route_families.js +122 -0
package/dist/mcp-server.d.ts.map +1 -1
package/dist/mcp-server.js +2 -4
package/dist/metrics/prometheus.d.ts +37 -0
package/dist/metrics/prometheus.d.ts.map +1 -0
package/dist/metrics/prometheus.js +153 -0
package/dist/model_router.d.ts +28 -0
package/dist/model_router.d.ts.map +1 -0
package/dist/model_router.js +63 -0
package/dist/ollama_provider.d.ts.map +1 -1
package/dist/ollama_provider.js +1 -0
package/dist/openai_provider.d.ts.map +1 -1
package/dist/openai_provider.js +1 -0
package/dist/pipeline/orchestrator.d.ts +2 -0
package/dist/pipeline/orchestrator.d.ts.map +1 -1
package/dist/pipeline/orchestrator.js +6 -12
package/dist/pipeline/stage0_preprocess.d.ts.map +1 -1
package/dist/pipeline/stage0_preprocess.js +11 -18
package/dist/pipeline/stage1_impact.d.ts +1 -1
package/dist/pipeline/stage1_impact.d.ts.map +1 -1
package/dist/pipeline/stage1_impact.js +18 -2
package/dist/pipeline/stage2_coverage.d.ts +2 -0
package/dist/pipeline/stage2_coverage.d.ts.map +1 -1
package/dist/pipeline/stage2_coverage.js +29 -7
package/dist/pipeline/stage3_generation.d.ts +2 -0
package/dist/pipeline/stage3_generation.d.ts.map +1 -1
package/dist/pipeline/stage3_generation.js +21 -1
package/dist/pipeline/stage4_heal.d.ts +2 -0
package/dist/pipeline/stage4_heal.d.ts.map +1 -1
package/dist/progress.d.ts +22 -0
package/dist/progress.d.ts.map +1 -0
package/dist/progress.js +116 -0
package/dist/prompts/coverage.d.ts +2 -0
package/dist/prompts/coverage.d.ts.map +1 -1
package/dist/prompts/coverage.js +17 -24
package/dist/prompts/cross-impact.d.ts +1 -0
package/dist/prompts/cross-impact.d.ts.map +1 -1
package/dist/prompts/cross-impact.js +3 -21
package/dist/prompts/generation.d.ts +4 -2
package/dist/prompts/generation.d.ts.map +1 -1
package/dist/prompts/generation.js +201 -45
package/dist/prompts/generation_profile.d.ts +29 -0
package/dist/prompts/generation_profile.d.ts.map +1 -0
package/dist/prompts/generation_profile.js +151 -0
package/dist/prompts/heal.d.ts +3 -1
package/dist/prompts/heal.d.ts.map +1 -1
package/dist/prompts/heal.js +33 -15
package/dist/prompts/impact.d.ts +1 -0
package/dist/prompts/impact.d.ts.map +1 -1
package/dist/prompts/impact.js +3 -22
package/dist/prompts/json_extract.d.ts +14 -0
package/dist/prompts/json_extract.d.ts.map +1 -0
package/dist/prompts/json_extract.js +39 -0
package/dist/prompts/strategist.d.ts.map +1 -1
package/dist/prompts/strategist.js +2 -20
package/dist/prompts/test-designer.d.ts +2 -0
package/dist/prompts/test-designer.d.ts.map +1 -1
package/dist/prompts/test-designer.js +6 -21
package/dist/provider_factory.d.ts.map +1 -1
package/dist/provider_factory.js +6 -4
package/dist/reporters/junit.d.ts +6 -0
package/dist/reporters/junit.d.ts.map +1 -0
package/dist/reporters/junit.js +89 -0
package/dist/reporters/reporter.d.ts +42 -0
package/dist/reporters/reporter.d.ts.map +1 -0
package/dist/reporters/reporter.js +4 -0
package/dist/reporters/sarif.d.ts +7 -0
package/dist/reporters/sarif.d.ts.map +1 -0
package/dist/reporters/sarif.js +134 -0
package/dist/resilience/circuit_breaker.d.ts +36 -0
package/dist/resilience/circuit_breaker.d.ts.map +1 -0
package/dist/resilience/circuit_breaker.js +82 -0
package/dist/resilience/retry.d.ts +11 -0
package/dist/resilience/retry.d.ts.map +1 -0
package/dist/resilience/retry.js +59 -0
package/dist/sanitize.d.ts +15 -0
package/dist/sanitize.d.ts.map +1 -0
package/dist/sanitize.js +71 -0
package/dist/training/kg_scanner.d.ts +13 -0
package/dist/training/kg_scanner.d.ts.map +1 -0
package/dist/training/kg_scanner.js +118 -0
package/dist/training/scanner.d.ts +7 -2
package/dist/training/scanner.d.ts.map +1 -1
package/dist/training/scanner.js +27 -34
package/dist/validation/guardrails.d.ts +2 -0
package/dist/validation/guardrails.d.ts.map +1 -1
package/dist/validation/guardrails.js +5 -0
package/dist/validation/output_schema.d.ts +3 -0
package/dist/validation/output_schema.d.ts.map +1 -1
package/dist/version.d.ts +6 -0
package/dist/version.d.ts.map +1 -0
package/dist/version.js +36 -0
package/package.json +7 -2
package/schemas/route-families.schema.json +31 -1

package/dist/esm/adapters/playwright.js ADDED Viewed

@@ -0,0 +1,49 @@
+// Copyright (c) 2015-present Mattermost, Inc. All Rights Reserved.
+// See LICENSE.txt for license information.
+/**
+ * Playwright Adapter — FrameworkAdapter implementation for @playwright/test.
+ */
+import * as fs from 'node:fs';
+import * as path from 'node:path';
+export class PlaywrightAdapter {
+    constructor() {
+        this.name = 'playwright';
+        this.specGlob = '**/*.spec.{ts,js}';
+        this.extractTestPattern = /\btest(?:\.describe)?\s*\(/g;
+        this.configFileNames = ['playwright.config.ts', 'playwright.config.js'];
+    }
+    detect(projectRoot) {
+        const pkgPath = path.join(projectRoot, 'package.json');
+        if (!fs.existsSync(pkgPath)) {
+            return false;
+        }
+        try {
+            const raw = fs.readFileSync(pkgPath, 'utf-8');
+            const pkg = JSON.parse(raw);
+            const allDeps = {
+                ...pkg.dependencies,
+                ...pkg.devDependencies,
+            };
+            return '@playwright/test' in allDeps;
+        }
+        catch {
+            return false;
+        }
+    }
+    buildRunCommand(specPath, options) {
+        const args = ['playwright', 'test', specPath];
+        if (options?.headed) {
+            args.push('--headed');
+        }
+        if (options?.browser) {
+            args.push('--browser', options.browser);
+        }
+        if (options?.project) {
+            args.push('--project', options.project);
+        }
+        if (options?.timeout != null) {
+            args.push('--timeout', String(options.timeout));
+        }
+        return { executable: 'npx', args };
+    }
+}

package/dist/esm/adapters/pytest.js ADDED Viewed

@@ -0,0 +1,59 @@
+// Copyright (c) 2015-present Mattermost, Inc. All Rights Reserved.
+// See LICENSE.txt for license information.
+/**
+ * Pytest adapter for Python API testing.
+ */
+import * as fs from 'node:fs';
+import * as path from 'node:path';
+export class PytestAdapter {
+    constructor() {
+        this.name = 'pytest';
+        this.specGlob = '**/test_*.py';
+        this.extractTestPattern = /def\s+(test_\w+)/g;
+        this.configFileNames = ['pytest.ini', 'pyproject.toml', 'setup.cfg', 'conftest.py'];
+    }
+    detect(projectRoot) {
+        // Check for common pytest indicator files
+        const indicators = ['pyproject.toml', 'pytest.ini', 'conftest.py', 'setup.cfg'];
+        for (const file of indicators) {
+            const filePath = path.join(projectRoot, file);
+            if (!fs.existsSync(filePath))
+                continue;
+            // For setup.cfg, only match if it contains a [tool:pytest] or [pytest] section
+            if (file === 'setup.cfg') {
+                try {
+                    const content = fs.readFileSync(filePath, 'utf-8');
+                    if (content.includes('[tool:pytest]') || content.includes('[pytest]')) {
+                        return true;
+                    }
+                }
+                catch {
+                    continue;
+                }
+            }
+            else if (file === 'pyproject.toml') {
+                try {
+                    const content = fs.readFileSync(filePath, 'utf-8');
+                    if (content.includes('pytest')) {
+                        return true;
+                    }
+                }
+                catch {
+                    continue;
+                }
+            }
+            else {
+                // pytest.ini or conftest.py existence is sufficient
+                return true;
+            }
+        }
+        return false;
+    }
+    buildRunCommand(specPath, options) {
+        const args = ['-m', 'pytest', specPath, '-v'];
+        if (options?.timeout) {
+            args.push(`--timeout=${Math.ceil(options.timeout / 1000)}`);
+        }
+        return { executable: 'python', args };
+    }
+}

package/dist/esm/adapters/supertest.js ADDED Viewed

@@ -0,0 +1,48 @@
+// Copyright (c) 2015-present Mattermost, Inc. All Rights Reserved.
+// See LICENSE.txt for license information.
+/**
+ * Supertest + Vitest/Jest adapter for Node.js API testing.
+ */
+import * as fs from 'node:fs';
+import * as path from 'node:path';
+export class SupertestAdapter {
+    constructor(runner = 'vitest') {
+        this.name = 'supertest';
+        this.specGlob = '**/*.{test,spec}.{ts,js}';
+        this.extractTestPattern = /(?:it|test)\s*\(\s*(['"`])(.*?)\1/g;
+        this.configFileNames = ['vitest.config.ts', 'vitest.config.js', 'jest.config.ts', 'jest.config.js'];
+        this.runner = runner;
+    }
+    detect(projectRoot) {
+        const pkgPath = path.join(projectRoot, 'package.json');
+        if (!fs.existsSync(pkgPath)) {
+            return false;
+        }
+        try {
+            const raw = fs.readFileSync(pkgPath, 'utf-8');
+            const pkg = JSON.parse(raw);
+            const allDeps = {
+                ...pkg.dependencies,
+                ...pkg.devDependencies,
+            };
+            return 'supertest' in allDeps;
+        }
+        catch {
+            return false;
+        }
+    }
+    buildRunCommand(specPath, options) {
+        if (this.runner === 'jest') {
+            const args = ['jest', specPath];
+            if (options?.timeout) {
+                args.push(`--testTimeout=${options.timeout}`);
+            }
+            return { executable: 'npx', args };
+        }
+        const args = ['vitest', 'run', specPath];
+        if (options?.timeout) {
+            args.push(`--testTimeout=${options.timeout}`);
+        }
+        return { executable: 'npx', args };
+    }
+}

package/dist/esm/agent/git.js CHANGED Viewed

@@ -98,7 +98,7 @@ function isRelevantFile(file) {
     }
     return true;
 }
-function runGitRaw(args, cwd) {
+export function runGitRaw(args, cwd) {
     const result = spawnSync('git', args, {
         cwd,
         encoding: 'utf-8',
@@ -182,8 +182,10 @@ function isCommentOnlyDiff(file, repoRoot, baseRef) {
 export function isTestFile(file) {
     const normalized = file.replace(/\\/g, '/');
     return /\.(spec|test)\.(ts|tsx|js|jsx)$/.test(normalized) ||
+        /\.snap$/.test(normalized) ||
         /_test\.go$/.test(normalized) ||
         normalized.includes('__tests__/') ||
+        normalized.includes('__snapshots__/') ||
         normalized.includes('/tests/') ||
         normalized.includes('/test/');
 }

package/dist/esm/agentic/fix_loop.js CHANGED Viewed

@@ -1,17 +1,18 @@
 // Copyright (c) 2015-present Mattermost, Inc. All Rights Reserved.
 // See LICENSE.txt for license information.
+import { sanitizeForPrompt } from '../crew/sanitize.js';
 export function buildFixPrompt(ctx) {
     const isCompileError = ctx.failures.some((f) => f.testTitle === '(compile)');
     const failuresBlock = ctx.failures.map((f) => {
-        const lines = [`  Test: ${f.testTitle}`, `  Error: ${f.error}`];
+        const lines = [`  Test: ${sanitizeForPrompt(f.testTitle)}`, `  Error: ${sanitizeForPrompt(f.error)}`];
         if (f.stack)
-            lines.push(`  Stack: ${f.stack}`);
+            lines.push(`  Stack: ${sanitizeForPrompt(f.stack)}`);
         if (f.line)
             lines.push(`  Line: ${f.line}`);
         if (f.expected)
-            lines.push(`  Expected: ${f.expected}`);
+            lines.push(`  Expected: ${sanitizeForPrompt(f.expected)}`);
         if (f.actual)
-            lines.push(`  Actual: ${f.actual}`);
+            lines.push(`  Actual: ${sanitizeForPrompt(f.actual)}`);
         return lines.join('\n');
     }).join('\n\n');
     const errorType = isCompileError ? 'COMPILE ERROR' : 'TEST FAILURE';

package/dist/esm/agentic/runner.js CHANGED Viewed

@@ -6,17 +6,20 @@ import { runPlaywrightSpec } from './playwright_runner.js';
 import { generateFix } from './fix_loop.js';
 import { parseGenerationResponse } from '../prompts/generation.js';
 import { formatApiSurfaceForPrompt } from '../knowledge/api_surface.js';
-function buildGeneratePrompt(scenario, apiSurfaceHint) {
+import { sanitizeForPrompt } from '../crew/sanitize.js';
+function buildGeneratePrompt(scenario, apiSurfaceHint, profile) {
+    const projectName = profile?.projectName || 'Mattermost';
+    const importSource = profile?.importStatement || '@mattermost/playwright-lib';
     const scenariosBlock = scenario.scenarios
-        .map((s, i) => `  ${i + 1}. ${s}`)
+        .map((s, i) => `  ${i + 1}. ${sanitizeForPrompt(s)}`)
         .join('\n');
     return [
-        'Generate a Mattermost Playwright E2E test file.',
+        `Generate a ${projectName} Playwright E2E test file.`,
         '',
-        `FLOW: ${scenario.name}`,
+        `FLOW: ${sanitizeForPrompt(scenario.name)}`,
         `Route Family: ${scenario.routeFamily}`,
         `Priority: ${scenario.priority}`,
-        scenario.evidence ? `Evidence: ${scenario.evidence}` : '',
+        scenario.evidence ? `Evidence: ${sanitizeForPrompt(scenario.evidence)}` : '',
         '',
         'SCENARIOS TO IMPLEMENT:',
         scenariosBlock,
@@ -25,14 +28,14 @@ function buildGeneratePrompt(scenario, apiSurfaceHint) {
         apiSurfaceHint || 'Use page.getByRole() or page.getByTestId() for selectors.',
         '',
         'MANDATORY RULES:',
-        '1. Import ONLY from "@mattermost/playwright-lib" — no other test framework imports.',
+        `1. Import ONLY from "${importSource}" — no other test framework imports.`,
         '2. Every test must call `await pw.initSetup()` first.',
         '3. Use `await pw.testBrowser.login(user)` to log in — never hardcode credentials.',
         '4. Use ONLY page object methods listed above. Do NOT invent methods.',
         '5. If a method is not available, use `page.getByRole()` or `page.getByTestId()`.',
         `6. Tag every test: {tag: '@${scenario.routeFamily}'}`,
         '7. Write one test per scenario with a descriptive name.',
-        '8. Use `expect` from "@mattermost/playwright-lib".',
+        `8. Use \`expect\` from "${importSource}".`,
         '9. Include the copyright header.',
         '10. NEVER fabricate test IDs (MM-TXXXX). Use descriptive names only.',
         '',
@@ -41,7 +44,7 @@ function buildGeneratePrompt(scenario, apiSurfaceHint) {
         '// Copyright (c) 2015-present Mattermost, Inc. All Rights Reserved.',
         '// See LICENSE.txt for license information.',
         '',
-        "import {expect, test} from '@mattermost/playwright-lib';",
+        `import {expect, test} from '${importSource}';`,
         '',
         'test(',
         "    'user can post a message in channel',",
@@ -80,13 +83,13 @@ function resolveSpecPath(scenario, testsRoot) {
     }
     return specPath;
 }
-async function generateInitialSpec(provider, scenario, specPath, apiSurfaceHint) {
-    const prompt = buildGeneratePrompt(scenario, apiSurfaceHint);
+async function generateInitialSpec(provider, scenario, specPath, apiSurfaceHint, profile) {
+    const prompt = buildGeneratePrompt(scenario, apiSurfaceHint, profile);
     const response = await provider.generateText(prompt, {
         maxTokens: 8000,
         temperature: 0.1,
         timeout: 60000,
-        systemPrompt: 'You are an expert Playwright test writer for Mattermost. Return only TypeScript code.',
+        systemPrompt: `You are an expert Playwright test writer for ${profile?.projectName || 'Mattermost'}. Return only TypeScript code.`,
     });
     // Reuse existing parsing logic from prompts/generation.ts
     const parsed = parseGenerationResponse(response.text, specPath, 'create_spec', scenario.id);
@@ -105,7 +108,7 @@ async function runSingleScenario(scenario, options) {
     // Step 1: Generate initial spec
     let specCode;
     try {
-        specCode = await generateInitialSpec(provider, scenario, specPath, apiHint);
+        specCode = await generateInitialSpec(provider, scenario, specPath, apiHint, options.generationProfile);
     }
     catch (error) {
         const msg = error instanceof Error ? error.message : String(error);

package/dist/esm/agents/cross-impact.js CHANGED Viewed

@@ -30,7 +30,12 @@ export class CrossImpactAgent {
         ctx.crossImpacts.push(...deterministicCrossImpacts);
         // Then: LLM-enriched analysis for semantic cross-impacts
         try {
-            const provider = await getCrewProvider(ctx.providerOverride);
+            const provider = await getCrewProvider(ctx.providerOverride, ctx.budgetUSD, {
+                agentRole: 'cross-impact',
+                modelRoutingProviderType: ctx.modelRoutingProviderType,
+                modelRoutingOverrides: ctx.modelRoutingOverrides,
+                budgetLedger: ctx.budgetLedger,
+            });
             const prompt = buildCrossImpactPrompt({
                 changedFiles: ctx.changedFiles,
                 families: ctx.routeFamilies,

package/dist/esm/agents/executor.js CHANGED Viewed

@@ -35,7 +35,12 @@ export class ExecutorAgent {
             };
         });
         try {
-            const provider = await getCrewProvider(ctx.providerOverride);
+            const provider = await getCrewProvider(ctx.providerOverride, ctx.budgetUSD, {
+                agentRole: 'executor',
+                modelRoutingProviderType: ctx.modelRoutingProviderType,
+                modelRoutingOverrides: ctx.modelRoutingOverrides,
+                budgetLedger: ctx.budgetLedger,
+            });
             const summary = await runAgenticGeneration({
                 scenarios,
                 config: {

package/dist/esm/agents/strategist.js CHANGED Viewed

@@ -28,7 +28,12 @@ export class StrategistAgent {
             regressionRisks: ctx.regressionRisks,
         });
         try {
-            const provider = await getCrewProvider(ctx.providerOverride);
+            const provider = await getCrewProvider(ctx.providerOverride, ctx.budgetUSD, {
+                agentRole: 'strategist',
+                modelRoutingProviderType: ctx.modelRoutingProviderType,
+                modelRoutingOverrides: ctx.modelRoutingOverrides,
+                budgetLedger: ctx.budgetLedger,
+            });
             const response = await provider.generateText(prompt, {
                 maxTokens: 4000,
                 temperature: 0,

package/dist/esm/agents/test-designer.js CHANGED Viewed

@@ -30,7 +30,12 @@ export class TestDesignerAgent {
         }
         let provider;
         try {
-            provider = await getCrewProvider(ctx.providerOverride);
+            provider = await getCrewProvider(ctx.providerOverride, ctx.budgetUSD, {
+                agentRole: 'test-designer',
+                modelRoutingProviderType: ctx.modelRoutingProviderType,
+                modelRoutingOverrides: ctx.modelRoutingOverrides,
+                budgetLedger: ctx.budgetLedger,
+            });
         }
         catch (error) {
             const message = error instanceof Error ? error.message : String(error);

package/dist/esm/anthropic_provider.js CHANGED Viewed

@@ -68,6 +68,7 @@ export class AnthropicProvider extends BaseProvider {
         this.model = config.model || 'claude-sonnet-4-5-20250929';
     }
     async generateText(prompt, options) {
+        this.checkBudget();
         const startTime = Date.now();
         try {
             // SECURITY: Validate prompt length to prevent resource exhaustion

package/dist/esm/base_provider.js CHANGED Viewed

@@ -1,14 +1,110 @@
 // Copyright (c) 2015-present Mattermost, Inc. All Rights Reserved.
 // See LICENSE.txt for license information.
+import { withRetry } from './resilience/retry.js';
+import { CircuitBreaker } from './resilience/circuit_breaker.js';
 /**
  * Abstract base class for all LLM providers
  * Eliminates 240+ lines of duplicate stats management code
  * Provides common functionality for token tracking, cost calculation, and stats management
  */
+export class BudgetExceededError extends Error {
+    constructor(currentCost, budgetUSD) {
+        super(`Budget exceeded: $${currentCost.toFixed(4)} >= $${budgetUSD} limit`);
+        this.currentCost = currentCost;
+        this.budgetUSD = budgetUSD;
+        this.name = 'BudgetExceededError';
+    }
+}
 export class BaseProvider {
     constructor() {
+        /** Tracks the current in-flight budget reservation for this provider instance. */
+        this._activeReservation = 0;
         this.initializeStats();
     }
+    /** Lazily get-or-create a circuit breaker shared across all instances of this provider type. */
+    get circuitBreaker() {
+        let cb = BaseProvider._sharedBreakers.get(this.name);
+        if (!cb) {
+            cb = new CircuitBreaker({
+                shouldCount: (error) => {
+                    if (error instanceof BudgetExceededError)
+                        return false;
+                    if (!(error instanceof Error))
+                        return true;
+                    const msg = error.message.toLowerCase();
+                    return msg.includes('429') || msg.includes('rate limit') ||
+                        msg.includes('500') || msg.includes('502') || msg.includes('503') || msg.includes('504') ||
+                        msg.includes('econnreset') || msg.includes('econnrefused') || msg.includes('etimedout') ||
+                        msg.includes('overloaded') || msg.includes('socket hang up') || msg.includes('network error');
+                },
+            });
+            BaseProvider._sharedBreakers.set(this.name, cb);
+        }
+        return cb;
+    }
+    /**
+     * Set a hard budget limit. Once totalCost reaches this value,
+     * subsequent calls will throw BudgetExceededError.
+     */
+    setBudget(usd) {
+        this._budgetUSD = usd;
+    }
+    get budgetUSD() {
+        return this._budgetUSD;
+    }
+    /**
+     * Attach a shared budget ledger so aggregate cost across all providers
+     * in a crew run is checked before each LLM call.
+     */
+    setBudgetLedger(ledger) {
+        this._ledger = ledger;
+    }
+    /**
+     * Check budget and pre-reserve estimated cost for the upcoming LLM call.
+     *
+     * When a shared ledger exists, reserves an estimate derived from the provider's
+     * output token cost × maxTokens (default 4096). This blocks parallel agents from
+     * spending into the same headroom — like a credit card authorization hold.
+     *
+     * Self-healing: if a prior call failed without reaching updateStats(), the stale
+     * reservation is released here before placing the new one.
+     */
+    checkBudget() {
+        if (this._ledger) {
+            // Release stale reservation from a prior failed call that never hit updateStats
+            if (this._activeReservation > 0) {
+                this._ledger.release(this._activeReservation);
+                this._activeReservation = 0;
+            }
+            // Reserve estimated cost for the upcoming call
+            const estimate = this.estimateCallCost();
+            this._ledger.reserve(estimate);
+            this._activeReservation = estimate;
+            try {
+                this._ledger.check();
+            }
+            catch (err) {
+                // Budget exceeded — release reservation immediately so it doesn't leak
+                this._ledger.release(estimate);
+                this._activeReservation = 0;
+                throw err;
+            }
+            return;
+        }
+        if (this._budgetUSD !== undefined && this.stats.totalCost >= this._budgetUSD) {
+            throw new BudgetExceededError(this.stats.totalCost, this._budgetUSD);
+        }
+    }
+    /**
+     * Conservative cost estimate for the upcoming call.
+     * Uses maxTokens (or 4096 default) × output cost rate.
+     * Overestimating is safe — the reservation is replaced with actual cost in updateStats.
+     */
+    estimateCallCost() {
+        const outputTokenEstimate = 4096;
+        const costRate = this.capabilities?.costPer1MOutputTokens ?? 15; // default to ~Sonnet
+        return (outputTokenEstimate / 1000000) * costRate;
+    }
     /**
      * Initialize stats object with default values
      */
@@ -35,6 +131,14 @@ export class BaseProvider {
         this.stats.totalOutputTokens += usage.outputTokens;
         this.stats.totalTokens += usage.totalTokens;
         this.stats.totalCost += cost;
+        if (this._ledger) {
+            // Settle: release the estimate, record actual
+            if (this._activeReservation > 0) {
+                this._ledger.release(this._activeReservation);
+                this._activeReservation = 0;
+            }
+            this._ledger.record(cost);
+        }
         // Update rolling average response time
         const totalRequests = this.stats.requestCount;
         this.stats.averageResponseTimeMs =
@@ -53,6 +157,17 @@ export class BaseProvider {
     resetUsageStats() {
         this.initializeStats();
     }
+    /**
+     * Wrap an async call with circuit breaker + retry logic.
+     * Circuit breaker protects against cascading failures from a down provider;
+     * retry handles transient failures within a healthy circuit.
+     *
+     * Non-transient errors (budget, auth, validation) are thrown directly and
+     * bypass the circuit breaker so they don't incorrectly trip it.
+     */
+    retryCall(fn) {
+        return this.circuitBreaker.call(() => withRetry(fn, { maxRetries: 2, baseDelayMs: 1000, maxDelayMs: 10000, jitter: true }), () => { throw new Error(`${this.name} provider circuit open — too many consecutive failures`); });
+    }
     /**
      * Calculate cost for token usage, accounting for prompt caching discounts
      * Cached tokens cost 90% less than regular tokens
@@ -75,3 +190,9 @@ export class BaseProvider {
         return inputCost + outputCost;
     }
 }
+/**
+ * Shared circuit breakers keyed by provider name (e.g., "anthropic", "openai").
+ * All instances of the same provider type share one breaker, so if Anthropic is
+ * down, ALL agents discover it after 3 total failures instead of 3 × N.
+ */
+BaseProvider._sharedBreakers = new Map();

package/dist/esm/budget_ledger.js ADDED Viewed

@@ -0,0 +1,58 @@
+// Copyright (c) 2015-present Mattermost, Inc. All Rights Reserved.
+// See LICENSE.txt for license information.
+/**
+ * Shared budget ledger — tracks aggregate cost across all provider instances
+ * in a single crew run. Prevents parallel agents from each seeing only 1/N
+ * of actual spend and overshooting the budget by N×limit.
+ *
+ * Usage: create one BudgetLedger per crew run, pass it to getCrewProvider(),
+ * which attaches it to each provider via setBudgetLedger().
+ */
+import { BudgetExceededError } from './base_provider.js';
+export class BudgetLedger {
+    constructor(limitUSD) {
+        this._totalCost = 0;
+        this._reserved = 0;
+        this._limitUSD = limitUSD;
+    }
+    get totalCost() {
+        return this._totalCost;
+    }
+    get limitUSD() {
+        return this._limitUSD;
+    }
+    /**
+     * Record actual cost from a completed LLM call.
+     */
+    record(cost) {
+        if (!Number.isFinite(cost) || cost < 0)
+            return;
+        this._totalCost += cost;
+    }
+    /**
+     * Pre-reserve estimated cost before an LLM call begins.
+     * Blocks parallel agents from spending into the same headroom.
+     * Like a credit card authorization hold.
+     */
+    reserve(estimate) {
+        if (!Number.isFinite(estimate) || estimate <= 0)
+            return;
+        this._reserved += estimate;
+    }
+    /**
+     * Release a prior reservation (after API response or on error).
+     */
+    release(estimate) {
+        this._reserved = Math.max(0, this._reserved - estimate);
+    }
+    /**
+     * Throws BudgetExceededError if committed cost + in-flight reservations
+     * have reached the limit.
+     */
+    check() {
+        const effective = this._totalCost + this._reserved;
+        if (effective >= this._limitUSD) {
+            throw new BudgetExceededError(effective, this._limitUSD);
+        }
+    }
+}

package/dist/esm/cache/cached_provider.js ADDED Viewed

@@ -0,0 +1,82 @@
+// Copyright (c) 2015-present Mattermost, Inc. All Rights Reserved.
+// See LICENSE.txt for license information.
+import { ResponseCache, TTL } from './response_cache.js';
+/**
+ * Decorator that adds transparent response caching to any LLMProvider.
+ *
+ * - `generateText()` checks the cache first and returns a cached response on hit.
+ *   On a miss it delegates to the inner provider, stores the result, and returns it.
+ * - All other methods (analyzeImage, streamText, capabilities, usage stats)
+ *   delegate directly to the wrapped provider.
+ *
+ * The TTL is selected based on the agent role: agents whose name contains
+ * "generat" use the shorter GENERATION TTL; all others use ANALYSIS.
+ */
+export class CachedProvider {
+    constructor(inner, cache, cacheContext) {
+        this.inner = inner;
+        this.cache = cache;
+        this.ctx = cacheContext;
+        this.name = inner.name;
+        this.capabilities = inner.capabilities;
+        // Pick TTL based on agent role
+        this.ttlMs = cacheContext.agent.toLowerCase().includes('generat')
+            ? TTL.GENERATION
+            : TTL.ANALYSIS;
+        // Wire optional methods only when the inner provider supports them
+        if (inner.analyzeImage) {
+            this.analyzeImage = (images, prompt, options) => inner.analyzeImage(images, prompt, options);
+        }
+        if (inner.streamText) {
+            this.streamText = (prompt, options) => inner.streamText(prompt, options);
+        }
+    }
+    /**
+     * Generate text with cache-through semantics.
+     * On a cache hit the inner provider is never called, saving tokens and latency.
+     */
+    async generateText(prompt, options) {
+        const { agent, family, fileHashes } = this.ctx;
+        const model = this.inner.name;
+        // Check cache
+        const cached = this.cache.get(agent, family, fileHashes, model);
+        if (cached) {
+            return {
+                text: cached.response,
+                usage: {
+                    inputTokens: cached.usage.inputTokens,
+                    outputTokens: cached.usage.outputTokens,
+                    totalTokens: cached.usage.inputTokens + cached.usage.outputTokens,
+                    cachedTokens: cached.usage.inputTokens,
+                },
+                cost: 0, // No cost on cache hit
+            };
+        }
+        // Cache miss - call inner provider
+        const response = await this.inner.generateText(prompt, options);
+        // Store in cache
+        const key = ResponseCache.buildKey({ agent, family, fileHashes, model });
+        const entry = {
+            key,
+            family,
+            response: response.text,
+            usage: {
+                inputTokens: response.usage.inputTokens,
+                outputTokens: response.usage.outputTokens,
+                cost: response.cost,
+            },
+            createdAt: new Date().toISOString(),
+            ttlMs: this.ttlMs,
+        };
+        this.cache.set(entry);
+        return response;
+    }
+    getUsageStats() {
+        return this.inner.getUsageStats();
+    }
+    resetUsageStats() {
+        this.inner.resetUsageStats();
+    }
+}
+// Re-export for convenience
+export { ResponseCache, TTL } from './response_cache.js';