npm - keystone-cli - Versions diffs - 0.8.0 → 1.0.1 - Mend

keystone-cli 0.8.0 → 1.0.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (105) hide show

package/README.md +486 -54
package/package.json +8 -2
package/src/__fixtures__/index.ts +100 -0
package/src/cli.ts +809 -90
package/src/db/memory-db.ts +35 -1
package/src/db/workflow-db.test.ts +24 -0
package/src/db/workflow-db.ts +469 -14
package/src/expression/evaluator.ts +68 -4
package/src/parser/agent-parser.ts +6 -3
package/src/parser/config-schema.ts +38 -2
package/src/parser/schema.ts +192 -7
package/src/parser/test-schema.ts +29 -0
package/src/parser/workflow-parser.test.ts +54 -0
package/src/parser/workflow-parser.ts +153 -7
package/src/runner/aggregate-error.test.ts +57 -0
package/src/runner/aggregate-error.ts +46 -0
package/src/runner/audit-verification.test.ts +2 -2
package/src/runner/auto-heal.test.ts +1 -1
package/src/runner/blueprint-executor.test.ts +63 -0
package/src/runner/blueprint-executor.ts +157 -0
package/src/runner/concurrency-limit.test.ts +82 -0
package/src/runner/debug-repl.ts +18 -3
package/src/runner/durable-timers.test.ts +200 -0
package/src/runner/engine-executor.test.ts +464 -0
package/src/runner/engine-executor.ts +489 -0
package/src/runner/foreach-executor.ts +30 -12
package/src/runner/llm-adapter.test.ts +282 -5
package/src/runner/llm-adapter.ts +581 -8
package/src/runner/llm-clarification.test.ts +79 -21
package/src/runner/llm-errors.ts +83 -0
package/src/runner/llm-executor.test.ts +258 -219
package/src/runner/llm-executor.ts +226 -29
package/src/runner/mcp-client.ts +70 -3
package/src/runner/mcp-manager.test.ts +52 -52
package/src/runner/mcp-manager.ts +12 -5
package/src/runner/mcp-server.test.ts +117 -78
package/src/runner/mcp-server.ts +13 -4
package/src/runner/optimization-runner.ts +48 -31
package/src/runner/reflexion.test.ts +1 -1
package/src/runner/resource-pool.test.ts +113 -0
package/src/runner/resource-pool.ts +164 -0
package/src/runner/shell-executor.ts +130 -32
package/src/runner/standard-tools-integration.test.ts +36 -36
package/src/runner/standard-tools.test.ts +18 -0
package/src/runner/standard-tools.ts +110 -37
package/src/runner/step-executor.test.ts +176 -16
package/src/runner/step-executor.ts +530 -86
package/src/runner/stream-utils.test.ts +14 -0
package/src/runner/subflow-outputs.test.ts +103 -0
package/src/runner/test-harness.ts +161 -0
package/src/runner/tool-integration.test.ts +73 -79
package/src/runner/workflow-runner.test.ts +492 -15
package/src/runner/workflow-runner.ts +1438 -79
package/src/runner/workflow-subflows.test.ts +255 -0
package/src/templates/agents/keystone-architect.md +19 -14
package/src/templates/agents/tester.md +21 -0
package/src/templates/batch-processor.yaml +1 -1
package/src/templates/child-rollback.yaml +11 -0
package/src/templates/decompose-implement.yaml +53 -0
package/src/templates/decompose-problem.yaml +159 -0
package/src/templates/decompose-research.yaml +52 -0
package/src/templates/decompose-review.yaml +51 -0
package/src/templates/dev.yaml +134 -0
package/src/templates/engine-example.yaml +33 -0
package/src/templates/fan-out-fan-in.yaml +61 -0
package/src/templates/loop-parallel.yaml +1 -1
package/src/templates/memory-service.yaml +1 -1
package/src/templates/parent-rollback.yaml +16 -0
package/src/templates/robust-automation.yaml +1 -1
package/src/templates/scaffold-feature.yaml +29 -27
package/src/templates/scaffold-generate.yaml +41 -0
package/src/templates/scaffold-plan.yaml +53 -0
package/src/types/status.ts +3 -0
package/src/ui/dashboard.tsx +4 -3
package/src/utils/assets.macro.ts +36 -0
package/src/utils/auth-manager.ts +585 -8
package/src/utils/blueprint-utils.test.ts +49 -0
package/src/utils/blueprint-utils.ts +80 -0
package/src/utils/circuit-breaker.test.ts +177 -0
package/src/utils/circuit-breaker.ts +160 -0
package/src/utils/config-loader.test.ts +100 -13
package/src/utils/config-loader.ts +44 -17
package/src/utils/constants.ts +62 -0
package/src/utils/error-renderer.test.ts +267 -0
package/src/utils/error-renderer.ts +320 -0
package/src/utils/json-parser.test.ts +4 -0
package/src/utils/json-parser.ts +18 -1
package/src/utils/mermaid.ts +4 -0
package/src/utils/paths.test.ts +46 -0
package/src/utils/paths.ts +70 -0
package/src/utils/process-sandbox.test.ts +128 -0
package/src/utils/process-sandbox.ts +293 -0
package/src/utils/rate-limiter.test.ts +143 -0
package/src/utils/rate-limiter.ts +221 -0
package/src/utils/redactor.test.ts +23 -15
package/src/utils/redactor.ts +65 -25
package/src/utils/resource-loader.test.ts +54 -0
package/src/utils/resource-loader.ts +158 -0
package/src/utils/sandbox.test.ts +69 -4
package/src/utils/sandbox.ts +69 -6
package/src/utils/schema-validator.ts +65 -0
package/src/utils/workflow-registry.test.ts +57 -0
package/src/utils/workflow-registry.ts +45 -25
/package/src/expression/{evaluator.audit.test.ts → evaluator-audit.test.ts} +0 -0
/package/src/runner/{mcp-client.audit.test.ts → mcp-client-audit.test.ts} +0 -0

package/src/runner/mcp-manager.test.ts CHANGED Viewed

@@ -3,13 +3,31 @@ import * as child_process from 'node:child_process';
 import { EventEmitter } from 'node:events';
 import { Readable, Writable } from 'node:stream';
 import { ConfigLoader } from '../utils/config-loader';
-import { MCPClient, type MCPResponse } from './mcp-client';
-import { MCPManager } from './mcp-manager';
+import type { MCPClient } from './mcp-client';
+import { type MCPClientFactory, MCPManager } from './mcp-manager';
 import type { Config } from '../parser/config-schema';
 describe('MCPManager', () => {
   let spawnSpy: ReturnType<typeof spyOn>;
+  const createMockClient = (initializeImpl?: () => Promise<unknown>) => {
+    const initialize = mock(
+      initializeImpl ||
+        (async () => ({
+          result: { protocolVersion: '1.0' },
+          jsonrpc: '2.0',
+          id: 0,
+        }))
+    );
+    const stop = mock(() => undefined);
+    const client = { initialize, stop } as unknown as MCPClient;
+    return { client, initialize, stop };
+  };
+  const createMockFactory = (client: MCPClient): MCPClientFactory => ({
+    createLocal: mock(async () => client),
+    createRemote: mock(async () => client),
+  });
   beforeEach(() => {
     ConfigLoader.clear();
@@ -46,8 +64,9 @@ describe('MCPManager', () => {
       providers: {},
       model_mappings: {},
       default_provider: 'openai',
-      storage: { retention_days: 30 },
-      workflows_directory: 'workflows',
+      storage: { retention_days: 30, redact_secrets_at_rest: true },
+      engines: { allowlist: {}, denylist: [] },
+      concurrency: { default: 10, pools: { llm: 2, shell: 5, http: 10, engine: 2 } },
     } as unknown as Config);
     const manager = new MCPManager();
@@ -68,43 +87,32 @@ describe('MCPManager', () => {
       providers: {},
       model_mappings: {},
       default_provider: 'openai',
-      storage: { retention_days: 30 },
-      workflows_directory: 'workflows',
+      storage: { retention_days: 30, redact_secrets_at_rest: true },
+      engines: { allowlist: {}, denylist: [] },
+      concurrency: { default: 10, pools: { llm: 2, shell: 5, http: 10, engine: 2 } },
     } as unknown as Config);
-    const initSpy = spyOn(MCPClient.prototype, 'initialize').mockResolvedValue({
-      result: { protocolVersion: '1.0' },
-      jsonrpc: '2.0',
-      id: 0,
-    });
-    const stopSpy = spyOn(MCPClient.prototype, 'stop').mockReturnValue(undefined);
-    const manager = new MCPManager();
+    const { client: mockClient, initialize, stop } = createMockClient();
+    const clientFactory = createMockFactory(mockClient);
+    const manager = new MCPManager(undefined, clientFactory);
     const client = await manager.getClient('test-server');
     expect(client).toBeDefined();
-    expect(initSpy).toHaveBeenCalled();
+    expect(initialize).toHaveBeenCalled();
     // Should reuse client
     const client2 = await manager.getClient('test-server');
     expect(client2).toBe(client);
-    expect(initSpy).toHaveBeenCalledTimes(1);
+    expect(initialize).toHaveBeenCalledTimes(1);
     await manager.stopAll();
-    expect(stopSpy).toHaveBeenCalled();
-    initSpy.mockRestore();
-    stopSpy.mockRestore();
+    expect(stop).toHaveBeenCalled();
   });
   it('should get client for ad-hoc server config', async () => {
-    const initSpy = spyOn(MCPClient.prototype, 'initialize').mockResolvedValue({
-      result: { protocolVersion: '1.0' },
-      jsonrpc: '2.0',
-      id: 0,
-    });
-    const manager = new MCPManager();
+    const { client: mockClient, initialize } = createMockClient();
+    const clientFactory = createMockFactory(mockClient);
+    const manager = new MCPManager(undefined, clientFactory);
     const client = await manager.getClient({
       name: 'adhoc',
       type: 'local',
@@ -112,9 +120,7 @@ describe('MCPManager', () => {
     });
     expect(client).toBeDefined();
-    expect(initSpy).toHaveBeenCalled();
-    initSpy.mockRestore();
+    expect(initialize).toHaveBeenCalled();
   });
   it('should return undefined if global server not found', async () => {
@@ -134,23 +140,24 @@ describe('MCPManager', () => {
       providers: {},
       model_mappings: {},
       default_provider: 'openai',
-      storage: { retention_days: 30 },
-      workflows_directory: 'workflows',
+      storage: { retention_days: 30, redact_secrets_at_rest: true },
+      engines: { allowlist: {}, denylist: [] },
+      concurrency: { default: 10, pools: { llm: 2, shell: 5, http: 10, engine: 2 } },
     } as unknown as Config);
     // Mock initialize to take some time
     let initCalls = 0;
-    const initSpy = spyOn(MCPClient.prototype, 'initialize').mockImplementation(async () => {
+    const { client: mockClient, initialize } = createMockClient(async () => {
       initCalls++;
       await new Promise((resolve) => setTimeout(resolve, 50));
       return {
         result: { protocolVersion: '1.0' },
         jsonrpc: '2.0',
         id: 0,
-      } as MCPResponse;
+      };
     });
-    const manager = new MCPManager();
+    const clientFactory = createMockFactory(mockClient);
+    const manager = new MCPManager(undefined, clientFactory);
     // Fire off multiple requests concurrently
     const p1 = manager.getClient('concurrent-server');
@@ -163,8 +170,7 @@ describe('MCPManager', () => {
     expect(c1).toBe(c2);
     expect(c1).toBe(c3);
     expect(initCalls).toBe(1); // Crucial: only one initialization
-    initSpy.mockRestore();
+    expect(initialize).toHaveBeenCalledTimes(1);
   });
   it('should handle connection failure', async () => {
@@ -178,24 +184,18 @@ describe('MCPManager', () => {
       providers: {},
       model_mappings: {},
       default_provider: 'openai',
-      storage: { retention_days: 30 },
-      workflows_directory: 'workflows',
+      storage: { retention_days: 30, redact_secrets_at_rest: true },
+      engines: { allowlist: {}, denylist: [] },
+      concurrency: { default: 10, pools: { llm: 2, shell: 5, http: 10, engine: 2 } },
     } as unknown as Config);
-    const createLocalSpy = spyOn(MCPClient, 'createLocal').mockImplementation(
-      async (_cmd: string) => {
-        const client = Object.create(MCPClient.prototype);
-        spyOn(client, 'initialize').mockRejectedValue(new Error('Connection failed'));
-        spyOn(client, 'stop').mockReturnValue(undefined);
-        return client;
-      }
-    );
-    const manager = new MCPManager();
+    const { client: mockClient } = createMockClient(async () => {
+      throw new Error('Connection failed');
+    });
+    const clientFactory = createMockFactory(mockClient);
+    const manager = new MCPManager(undefined, clientFactory);
     const client = await manager.getClient('fail-server');
     expect(client).toBeUndefined();
-    createLocalSpy.mockRestore();
   });
 });

package/src/runner/mcp-manager.ts CHANGED Viewed

@@ -1,6 +1,8 @@
 import { ConfigLoader } from '../utils/config-loader';
 import { ConsoleLogger, type Logger } from '../utils/logger.ts';
-import { MCPClient } from './mcp-client';
+import { MCPClient, validateRemoteUrl } from './mcp-client';
+export type MCPClientFactory = Pick<typeof MCPClient, 'createLocal' | 'createRemote'>;
 export interface MCPServerConfig {
   name: string;
@@ -21,9 +23,11 @@ export class MCPManager {
   private connectionPromises: Map<string, Promise<MCPClient | undefined>> = new Map();
   private sharedServers: Map<string, MCPServerConfig> = new Map();
   private logger: Logger;
+  private clientFactory: MCPClientFactory;
-  constructor(logger: Logger = new ConsoleLogger()) {
-    this.logger = logger;
+  constructor(logger?: Logger, clientFactory: MCPClientFactory = MCPClient) {
+    this.logger = logger || new ConsoleLogger();
+    this.clientFactory = clientFactory;
     this.loadGlobalConfig();
     // Ensure cleanup on process exit
@@ -83,6 +87,9 @@ export class MCPManager {
         if (config.type === 'remote') {
           if (!config.url) throw new Error('Remote MCP server missing URL');
+          // SSRF Protection: Validate URL before connecting
+          await validateRemoteUrl(config.url);
           const headers = { ...(config.headers || {}) };
           if (config.oauth) {
@@ -99,7 +106,7 @@ export class MCPManager {
             headers.Authorization = `Bearer ${token}`;
           }
-          client = await MCPClient.createRemote(config.url, headers, config.timeout, {
+          client = await this.clientFactory.createRemote(config.url, headers, config.timeout, {
             logger: activeLogger,
           });
         } else {
@@ -124,7 +131,7 @@ export class MCPManager {
             env.MCP_TOKEN = token;
           }
-          client = await MCPClient.createLocal(
+          client = await this.clientFactory.createLocal(
             config.command,
             config.args || [],
             env,

package/src/runner/mcp-server.test.ts CHANGED Viewed

@@ -1,24 +1,38 @@
-import { beforeEach, describe, expect, it, mock, spyOn } from 'bun:test';
+import { afterEach, beforeEach, describe, expect, it, mock, spyOn } from 'bun:test';
 import { WorkflowDb } from '../db/workflow-db';
 import { WorkflowParser } from '../parser/workflow-parser';
+import { ConsoleLogger } from '../utils/logger';
 import { WorkflowRegistry } from '../utils/workflow-registry';
 import { MCPServer } from './mcp-server';
 import { WorkflowSuspendedError } from './step-executor';
-import { WorkflowRunner } from './workflow-runner';
+import type { WorkflowRunner } from './workflow-runner';
 describe('MCPServer', () => {
   let db: WorkflowDb;
   let server: MCPServer;
+  const activeSpies: Array<{ mockRestore: () => void }> = [];
+  const trackSpy = <T extends { mockRestore: () => void }>(spy: T): T => {
+    activeSpies.push(spy);
+    return spy;
+  };
   beforeEach(() => {
     db = new WorkflowDb(':memory:');
     server = new MCPServer(db);
-    mock.restore();
+  });
+  afterEach(() => {
+    for (const spy of activeSpies) {
+      spy.mockRestore();
+    }
+    activeSpies.length = 0;
   });
-  const handleMessage = (msg: unknown) => {
+  const createServerWithRunner = (runner: WorkflowRunner) =>
+    new MCPServer(db, process.stdin, process.stdout, new ConsoleLogger(), () => runner);
+  const handleMessage = (msg: unknown, targetServer: MCPServer = server) => {
     // @ts-ignore
-    return server.handleMessage(msg);
+    return targetServer.handleMessage(msg);
   };
   it('should handle initialize request', async () => {
@@ -44,7 +58,7 @@ describe('MCPServer', () => {
   });
   it('should call list_workflows tool', async () => {
-    spyOn(WorkflowRegistry, 'listWorkflows').mockReturnValue([
+    trackSpy(spyOn(WorkflowRegistry, 'listWorkflows')).mockReturnValue([
       { name: 'test-wf', description: 'Test Workflow' },
     ]);
@@ -59,76 +73,90 @@ describe('MCPServer', () => {
   });
   it('should call run_workflow tool successfully', async () => {
-    spyOn(WorkflowRegistry, 'resolvePath').mockReturnValue('test.yaml');
+    trackSpy(spyOn(WorkflowRegistry, 'resolvePath')).mockReturnValue('test.yaml');
     // @ts-ignore
-    spyOn(WorkflowParser, 'loadWorkflow').mockReturnValue({
+    trackSpy(spyOn(WorkflowParser, 'loadWorkflow')).mockReturnValue({
       name: 'test-wf',
       steps: [],
     });
-    // Mock WorkflowRunner
     const mockRun = mock(() => Promise.resolve({ result: 'ok' }));
-    // @ts-ignore
-    spyOn(WorkflowRunner.prototype, 'run').mockImplementation(mockRun);
-    const response = await handleMessage({
-      jsonrpc: '2.0',
-      id: 4,
-      method: 'tools/call',
-      params: {
-        name: 'run_workflow',
-        arguments: { workflow_name: 'test-wf', inputs: {} },
+    const runner = { run: mockRun } as unknown as WorkflowRunner;
+    const testServer = createServerWithRunner(runner);
+    const response = await handleMessage(
+      {
+        jsonrpc: '2.0',
+        id: 4,
+        method: 'tools/call',
+        params: {
+          name: 'run_workflow',
+          arguments: { workflow_name: 'test-wf', inputs: {} },
+        },
       },
-    });
+      testServer
+    );
     expect(JSON.parse(response?.result?.content?.[0]?.text || '{}').status).toBe('success');
   });
   it('should handle run_workflow failure', async () => {
-    spyOn(WorkflowRegistry, 'resolvePath').mockReturnValue('test.yaml');
+    trackSpy(spyOn(WorkflowRegistry, 'resolvePath')).mockReturnValue('test.yaml');
     // @ts-ignore
-    spyOn(WorkflowParser, 'loadWorkflow').mockReturnValue({
+    trackSpy(spyOn(WorkflowParser, 'loadWorkflow')).mockReturnValue({
       name: 'test-wf',
       steps: [],
     });
-    spyOn(WorkflowRunner.prototype, 'run').mockRejectedValue(new Error('workflow failed'));
-    const response = await handleMessage({
-      jsonrpc: '2.0',
-      id: 5,
-      method: 'tools/call',
-      params: {
-        name: 'run_workflow',
-        arguments: { workflow_name: 'test-wf' },
+    const runner = {
+      run: mock(() => Promise.reject(new Error('workflow failed'))),
+    } as unknown as WorkflowRunner;
+    const testServer = createServerWithRunner(runner);
+    const response = await handleMessage(
+      {
+        jsonrpc: '2.0',
+        id: 5,
+        method: 'tools/call',
+        params: {
+          name: 'run_workflow',
+          arguments: { workflow_name: 'test-wf' },
+        },
       },
-    });
+      testServer
+    );
     expect(response?.result?.isError).toBe(true);
     expect(response?.result?.content?.[0]?.text).toContain('Workflow failed');
   });
   it('should handle workflow suspension in run_workflow', async () => {
-    spyOn(WorkflowRegistry, 'resolvePath').mockReturnValue('test.yaml');
+    trackSpy(spyOn(WorkflowRegistry, 'resolvePath')).mockReturnValue('test.yaml');
     // @ts-ignore
-    spyOn(WorkflowParser, 'loadWorkflow').mockReturnValue({
+    trackSpy(spyOn(WorkflowParser, 'loadWorkflow')).mockReturnValue({
       name: 'test-wf',
       steps: [],
     });
     const suspendedError = new WorkflowSuspendedError('Input needed', 'step1', 'text');
-    spyOn(WorkflowRunner.prototype, 'run').mockRejectedValue(suspendedError);
-    spyOn(WorkflowRunner.prototype, 'getRunId').mockReturnValue('run123');
-    const response = await handleMessage({
-      jsonrpc: '2.0',
-      id: 6,
-      method: 'tools/call',
-      params: {
-        name: 'run_workflow',
-        arguments: { workflow_name: 'test-wf' },
+    const runner = {
+      run: mock(() => Promise.reject(suspendedError)),
+      getRunId: mock(() => 'run123'),
+    } as unknown as WorkflowRunner;
+    const testServer = createServerWithRunner(runner);
+    const response = await handleMessage(
+      {
+        jsonrpc: '2.0',
+        id: 6,
+        method: 'tools/call',
+        params: {
+          name: 'run_workflow',
+          arguments: { workflow_name: 'test-wf' },
+        },
       },
-    });
+      testServer
+    );
     const result = JSON.parse(response?.result?.content?.[0]?.text || '{}');
     expect(result.status).toBe('paused');
@@ -142,26 +170,29 @@ describe('MCPServer', () => {
     await db.updateRunStatus(runId, 'paused');
     await db.createStep('step-exec-1', runId, 's1');
-    spyOn(WorkflowRegistry, 'resolvePath').mockReturnValue('test.yaml');
+    trackSpy(spyOn(WorkflowRegistry, 'resolvePath')).mockReturnValue('test.yaml');
     // @ts-ignore
-    spyOn(WorkflowParser, 'loadWorkflow').mockReturnValue({
+    trackSpy(spyOn(WorkflowParser, 'loadWorkflow')).mockReturnValue({
       name: 'test-wf',
       steps: [{ id: 's1', type: 'human' }],
     });
     const mockRun = mock(() => Promise.resolve({ result: 'resumed' }));
-    // @ts-ignore
-    spyOn(WorkflowRunner.prototype, 'run').mockImplementation(mockRun);
-    const response = await handleMessage({
-      jsonrpc: '2.0',
-      id: 7,
-      method: 'tools/call',
-      params: {
-        name: 'answer_human_input',
-        arguments: { run_id: runId, input: 'my response' },
+    const runner = { run: mockRun } as unknown as WorkflowRunner;
+    const testServer = createServerWithRunner(runner);
+    const response = await handleMessage(
+      {
+        jsonrpc: '2.0',
+        id: 7,
+        method: 'tools/call',
+        params: {
+          name: 'answer_human_input',
+          arguments: { run_id: runId, input: 'my response' },
+        },
       },
-    });
+      testServer
+    );
     expect(JSON.parse(response?.result?.content?.[0]?.text || '{}').status).toBe('success');
@@ -223,8 +254,8 @@ describe('MCPServer', () => {
     // Create a new server for this test to use the streams
     const testServer = new MCPServer(db, input, outputStream);
-    const writeSpy = spyOn(outputStream, 'write').mockImplementation(() => true);
-    const consoleSpy = spyOn(console, 'error').mockImplementation(() => {});
+    const writeSpy = trackSpy(spyOn(outputStream, 'write')).mockImplementation(() => true);
+    const consoleSpy = trackSpy(spyOn(console, 'error')).mockImplementation(() => {});
     const startPromise = testServer.start();
@@ -245,36 +276,37 @@ describe('MCPServer', () => {
     input.end();
     await startPromise;
-    writeSpy.mockRestore();
-    consoleSpy.mockRestore();
   });
   it('should call start_workflow tool and return immediately', async () => {
-    spyOn(WorkflowRegistry, 'resolvePath').mockReturnValue('test.yaml');
+    trackSpy(spyOn(WorkflowRegistry, 'resolvePath')).mockReturnValue('test.yaml');
     // @ts-ignore
-    spyOn(WorkflowParser, 'loadWorkflow').mockReturnValue({
+    trackSpy(spyOn(WorkflowParser, 'loadWorkflow')).mockReturnValue({
       name: 'test-wf',
       steps: [],
     });
-    // Mock WorkflowRunner - simulate a slow workflow
     const mockRun = mock(
       () => new Promise((resolve) => setTimeout(() => resolve({ result: 'ok' }), 100))
     );
-    // @ts-ignore
-    spyOn(WorkflowRunner.prototype, 'run').mockImplementation(mockRun);
-    spyOn(WorkflowRunner.prototype, 'getRunId').mockReturnValue('async-run-123');
-    const response = await handleMessage({
-      jsonrpc: '2.0',
-      id: 10,
-      method: 'tools/call',
-      params: {
-        name: 'start_workflow',
-        arguments: { workflow_name: 'test-wf', inputs: {} },
+    const runner = {
+      run: mockRun,
+      getRunId: mock(() => 'async-run-123'),
+    } as unknown as WorkflowRunner;
+    const testServer = createServerWithRunner(runner);
+    const response = await handleMessage(
+      {
+        jsonrpc: '2.0',
+        id: 10,
+        method: 'tools/call',
+        params: {
+          name: 'start_workflow',
+          arguments: { workflow_name: 'test-wf', inputs: {} },
+        },
       },
-    });
+      testServer
+    );
     const result = JSON.parse(response?.result?.content?.[0]?.text || '{}');
     expect(result.status).toBe('running');
@@ -366,4 +398,11 @@ describe('MCPServer', () => {
     expect(response?.error?.message).toContain('not found');
   });
+  it('should close database connection when stop is called', () => {
+    const dbCloseSpy = spyOn(db, 'close');
+    server.stop();
+    expect(dbCloseSpy).toHaveBeenCalled();
+    dbCloseSpy.mockRestore();
+  });
 });

package/src/runner/mcp-server.ts CHANGED Viewed

@@ -16,22 +16,31 @@ interface MCPMessage {
   id?: string | number;
 }
+type WorkflowRunnerFactory = (
+  workflow: ConstructorParameters<typeof WorkflowRunner>[0],
+  options: ConstructorParameters<typeof WorkflowRunner>[1]
+) => WorkflowRunner;
 export class MCPServer {
   private db: WorkflowDb;
   private input: Readable;
   private output: Writable;
   private logger: Logger;
+  private runnerFactory: WorkflowRunnerFactory;
   constructor(
     db?: WorkflowDb,
     input: Readable = process.stdin,
     output: Writable = process.stdout,
-    logger: Logger = new ConsoleLogger()
+    logger: Logger = new ConsoleLogger(),
+    runnerFactory: WorkflowRunnerFactory = (workflow, options) =>
+      new WorkflowRunner(workflow, options)
   ) {
     this.db = db || new WorkflowDb();
     this.input = input;
     this.output = output;
     this.logger = logger;
+    this.runnerFactory = runnerFactory;
   }
   async start() {
@@ -235,7 +244,7 @@ export class MCPServer {
               debug: (msg: string) => logs.push(`DEBUG: ${msg}`),
             };
-            const runner = new WorkflowRunner(workflow, {
+            const runner = this.runnerFactory(workflow, {
               inputs,
               logger,
               preventExit: true,
@@ -417,7 +426,7 @@ export class MCPServer {
               debug: (msg: string) => logs.push(`DEBUG: ${msg}`),
             };
-            const runner = new WorkflowRunner(workflow, {
+            const runner = this.runnerFactory(workflow, {
               resumeRunId: run_id,
               resumeInputs: { [pendingStep.step_id]: { __answer: output } },
               logger,
@@ -513,7 +522,7 @@ export class MCPServer {
               debug: () => {},
             };
-            const runner = new WorkflowRunner(workflow, {
+            const runner = this.runnerFactory(workflow, {
               inputs: inputs || {},
               logger,
               preventExit: true,